Seminaire Bourbaki: Volume 2018/2019 Exposes 1151-1165 285629930X, 9782856299302

"Ce 71e volume du Séminaire Bourbaki contient les textes des quinze exposés de survol présentés pendant l'anné

242 86 10MB

English; French Pages 599 [618] Year 2020

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

Seminaire Bourbaki: Volume 2018/2019 Exposes 1151-1165
 285629930X, 9782856299302

Table of contents :
1. Introduction
2. Réduction des réseaux euclidiens
3. Les inégalités de Banaszczyk
4. Fibrés vectoriels sur les courbes: filtrations de Harder-Narasimhan et pentes
5. L'analogie entre réseaux euclidiens et fibrés vectoriels sur les courbes
6. À propos de la démonstration du théorème 1.3
7. La conjecture de Kannan-Lovász 2
Appendice A. Le formalisme des pentes
Références
Introduction
1. Théorie classique du potentiel
2. Théorie du pluripotentiel dans Cn
3. La propriété de Bernstein-Markov
4. Fibrés positifs et théorie globale du pluripotentiel
5. Équidistribution
6. Grandes déviations et mesures canoniques
Références
Introduction
1. Processus typique
2. Théorie spectrale des ondes invariantes
3. Une stratégie entropique
4. Inégalité entropique pour les ondes typiques
5. Minimum de l'entropie invariante
6. Maximum de l'entropie invariante
Références
1. Introduction
2. Basic notions
3. Covers and walls
4. A non-exact group with the Haagerup property
References
1. Introduction
2. Préliminaires
3. Dimension 1
4. Squelettes
5. Finitude du corps des traces
6. Un théorème de Bertini (galoisien)
7. Théorème de reconstruction de Drinfeld et existence de compagnons -adiques
8. Semi-anneaux
9. Systèmes locaux cohomologiquement rigides et intégralité (d'après Esnault-Groechenig)
Références
1. Main results
2. Notation, standard facts and known results
3. b-Divisors and generalized pairs
4. Boundedness of complements
5. Effective birationality
6. Bounds for volumes
7. Bounds for lc thresholds
8. Application to the Jordan property
References
Introduction
1. Réduction semi-stable et réduction stable
2. Stabilité
3. Le théorème de réduction stable
4. Construction de l'espace de modules
Références
Introduction
1. Teichmüller theory
2. Higher rank Teichmüller theories
3. Metric properties of the associated locally symmetric spaces: analogies and differences with Teichmüller space
4. Minimal surfaces
5. Relations with geometric structures
References
Introduction
1. Algebraic links
2. Punctual Hilbert schemes and nested Hilbert schemes
3. Knots and links and the homfly-pt polynomial
4. The conjecture of Oblomkov–Shende
5. A colored refinement: The conjecture of Diaconescu, Hua and Soibelman
6. A sketch of the proof
7. A homological version
References
Introduction
1. Basic principles
2. General landscape of the values of zeta
3. The conjecture of Fyodorov–Hiary–Keating
4. Progress towards the conjecture
References
Introduction
1. Le modèle de percolation
2. Une transition de phase abrupte
3. L'inégalité OSSS
4. La preuve
5. Applications de cette méthode
Références
Introduction
I. La construction de géodésiques par minmax
II. L'infinité de géodésiques dans une variété fermée
III. Existence de surfaces minimales fermées : l'approche paramétrique
IV. Les variations de l'aire en théorie de la mesure géométrique
V. Spectres non linéaires et largeurs de Gromov
VI. La loi de Weyl de Liokumovich, Marques et Neves
VII. La propriété de Frankel
VIII. La preuve de Song
IX. Conclusion
Références
Table par noms d'auteurs

Citation preview

422

ASTÉRISQUE

XXXXXXXXXXFIRSTPAGEXXXXXXXXXX

2020

SÉMINAIRE BOURBAKI VOLUME 2018/2019 EXPOSÉS 1151–1165 Avec table par noms d’auteurs de 1948/49 à 2018/19

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Astérisque est un périodique de la Société Mathématique de France. Numéro 422

Comité de rédaction Marie-Claude Arnaud

Fanny Kassel

Christophe Breuil

Alexandru Oancea

Damien Calaque

Nicolas Ressayre

Philippe Eyssidieux

Sylvia Serfaty

Nicolas Burq (dir.) Diffusion Maison de la SMF Case 916 - Luminy 13288 Marseille Cedex 9 France [email protected]

AMS P.O. Box 6248 Providence RI 02940 USA http://www.ams.org

Tarifs Vente au numéro: 80 e ($ 120) Abonnement Europe: 665 e, hors Europe: 718 e ($ 1 077) Des conditions spéciales sont accordées aux membres de la SMF. Secrétariat Astérisque Société Mathématique de France Institut Henri Poincaré, 11, rue Pierre et Marie Curie 75231 Paris Cedex 05, France Fax: (33) 01 40 46 90 96 [email protected]



http://smf.emath.fr/

© Société Mathématique de France 2020 Tous droits réservés (article L 122–4 du Code de la propriété intellectuelle). Toute représentation ou reproduction intégrale ou partielle faite sans le consentement de l’éditeur est illicite. Cette représentation ou reproduction par quelque procédé que ce soit constituerait une contrefaçon sanctionnée par les articles L 335–2 et suivants du CPI.

ISSN: 0303-1179 (print) 2492-5926 (electronic) ISBN 978-2-85629-930-2 doi:10.24033/ast.1129 Directeur de la publication: Fabien Durand

422

ASTÉRISQUE 2020

SÉMINAIRE BOURBAKI VOLUME 2018/2019 EXPOSÉS 1151–1165 Avec table par noms d’auteurs de 1948/49 à 2018/19

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Association des collaborateurs de Nicolas Bourbaki. Institut Henri Poincaré 11 rue Pierre-et-Marie-Curie 75231 Paris Cedex 05, France. URL : http://www.bourbaki.fr

Mots-clefs et classification mathématique par sujets (2000) Exposé no 1151. — Réseaux euclidiens, séries thêta, pentes — 11F27, 11H31, 94B75. Exposé no 1152. — Théorie du pluripotentiel, géométrie kählerienne, équidistribution, grandes déviations — 32U15, 32U20, 32Q15, 32L05, 60G55. Exposé no 1153. — Graphes réguliers aléatoires, vecteurs propres, fonctions propres aléatoires gaussiennes — 05C80; 60B20. Exposé no 1154. — Théorie de la petite simplification, groupes non exacts, plongements grossiers, propriété A, propriété de Haagerup — 20F69, 20F06, 46B85, 20F65, 05C25. Exposé no 1155. — Géométrie arithmétique sur les corps finis, faisceaux `-adiques, isocristaux, motifs, représentations automorphes — 14F20. Exposé no 1156. — Discrete group, reduced group C*-algebra, simplicity, Furstenberg boundary, Koopman representation — 46L35; 20F65, 37A55, 43A07. Exposé no 1157. — Fano variety, singularities of the minimal model program, Cremona group — 14J45, 14E30, 14C20, 14E05, 14E07. Exposé no 1158. — Espaces de modules, variétés stables, géométrie birationnelle, singularités — 14J10, 14D22, 14E30, 14B05. Exposé no 1159. — Discrete subgroups of semisimple Lie groups, higher Teichmüller theory, Anosov representations — 53C15, 32G15, 37F30. Exposé no 1160. — Plane curve singularities, Hilbert scheme, Stable pairs. Algebraic links, HOMFLY polynomials, Skein algebra — 14C05, 14H20, 57M25, 57M27. Exposé no 1161. — Riemann zeta function, Euler product, large values, Fyodorov-Hiary-Keating conjecture, logarithmic correlations — 11M06; 11-02, 11K99, 60G70. Exposé no 1162. — Percolation, transition de phase abrupte, décroissance exponentielle, algorithme randomisé — 60K35. Exposé no 1163. — Triangulations, homology cobordism group, Seiberg-Witten invariants — 57Q15, 57R58. Exposé no 1164. — Hurwitz space, Braid groups, arithmetic statistics, homological stability, groupcompletion, Koszul duality — 11G20, 11S31, 55R80, 20J05, 14H10. Exposé no 1165. — Surfaces minimales, géodésiques, méthodes de ninmax en géométrie, spectres non linéaires, largeurs de Gromov, lois de Weyl non linéaires, varifolds stationnaires presque minimisants, surfaces minimales à bords libres, conjecture de Yau sur les surfaces minimales — 49Q05, 53C42, 49Q20, 53C22, 58E10, 58E05, 58Exx.

SÉMINAIRE BOURBAKI VOLUME 2018/2019 EXPOSÉS 1151-1165

Résumé. — Ce 71e volume du Séminaire Bourbaki contient les textes des quinze exposés de survol présentés pendant l’année 2018/2019 : réseaux euclidiens et séries thêta, théorie du pluripotentiel, graphes réguliers aléatoires, espaces et groupes non exacts, conjecture des compagnons, C ∗ -simplicité, géométrie birationnelle des variétés de Fano, réduction stable en dimension supérieure, théorie de Teichmüller supérieure, polynômes HOMFLY et schémas de Hilbert, fonction zêta de Riemann et probabilités, transition de phase en percolation, conjecture de triangulation, homologie des espaces de Hurwitz, hypersurfaces minimales. Abstract (Séminaire Bourbaki, volume 2018/2019, exposés 1151–1165) This 71st volume of the Bourbaki Seminar gathers the texts of the fifteen survey lectures delivered during the year 2018/2019. Among the topics addressed the reader will find: Euclidean lattices and theta series, pluripotential theory, random regular graphs, non-exact groups and spaces, the companion conjecture, C ∗ -simplicity, birational geometry of Fano varieties, stable reduction in higher dimension, higher rank Teichmüller theories, HOMFLY polynomials and Hilbert schemes, Riemann zeta function and probability, phase transition in percolation, triangulation conjecture, homology of Hurwitz spaces, minimal hypersurfaces.

© Astérisque 422, SMF 2010

TABLE DES MATIÈRES

Résumés des exposés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

v

vii

OCTOBRE 2018 1151

1152

1153

1154

Jean-Benoît BOST — Réseaux euclidiens, séries thêta et pentes (d’après W. Banaszczyk, O. Regev, D. Dadush, N. StephensDavidowitz, ...) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1

Romain DUJARDIN — Théorie globale du pluripotentiel, équidistribution et processus ponctuels (d’après Berman, Boucksom, Witt Nyström, ...) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

61

Charles BORDENAVE — Normalité asymptotique des vecteurs propres d’un graphe régulier aléatoire (d’après Ágnes Backhausz et Balázs Szegedy) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

109

Ana KHUKHRO — Espaces et groupes non exacts admettant un plongement grossier dans un espace de Hilbert (d’après Arzhantseva, Guentner, Osajda, Špakula) . . . . . . . . . . . . . . . . . . . . . .

149

JANVIER 2019 1155 1156 1157

1158

Anna CADORET — La conjecture des compagnons (d’après Deligne, Drinfeld, L. Lafforgue, T. Abe, ...) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

173

Sven RAUM — C∗ -simplicity (after Breuillard, Haagerup, Kalantar, Kennedy and Ozawa) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

225

Stefan KEBEKUS — Boundedness results for singular Fano varieties, and applications to Cremona groups (following Birkar and Prokhorov-Shramov) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

253

Olivier BENOIST — Réduction stable en dimension supérieure (d’après Kollár, Hacon-Xu, ...) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

291

MARS 2019 1159

Maria Beatrice POZZETTI — Higher rank Teichmüller theories . .

327

1160

Luca MIGLIORINI — HOMFLY polynomials from the Hilbert schemes of a planar curve (after D. Maulik, A. Oblomkov, V. Shende, ...) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

355

Adam J. HARPER — The Riemann zeta function in short intervals (after Najnudel, and Arguin, Belius, Bourgade, Radziwiłł and Soundararajan) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

391

1161

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

vi

TABLE DES MATIÈRES

JUIN 2019 1162

1163 1164

1165

Marie THÉRET — Transition de phase abrupte en percolation via des algorithmes randomisés (d’après Duminil-Copin, Raoufi et Tassion) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

415

András I. STIPSICZ — Manolescu’s work on the Triangulation Conjecture . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

437

Oscar RANDAL-WILLIAMS — Homology of Hurwitz spaces and the Cohen-Lenstra heuristic for function fields (after Ellenberg, Venkatesh, and Westerland) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

469

Tristan RIVIÈRE — Infinité d’hypersurfaces minimales en basses dimensions (d’après F. C. Marques, A. A. Neves et A. Song) . .

499

ASTÉRISQUE 422

RÉSUMÉS DES EXPOSÉS

vii

Jean-Benoît BOST — Réseaux euclidiens, séries thêta et pentes (d’après W. Banaszczyk, O. Regev, D. Dadush, N. Stephens-Davidowitz, ...) Au début des années 1990, Banaszczyk a introduit une technique puissante pour étudier les invariants classiques des réseaux euclidiens (tels que leurs minima successifs ou leur rayon de recouvrement) reposant sur l’utilisation des séries thêta qui leur sont associées. Cette technique a joué un rôle important dans les constructions cryptographiques faisant appel à des réseaux euclidiens de grande dimension, notamment dans les travaux de Regev. Les travaux récents de ce dernier, en collaboration avec Dadush et Stephens-Davidowitz, établissent des inégalités remarquables entre certains invariants classiques des réseaux euclidiens, leurs séries thêta et leurs pentes. Romain DUJARDIN — Théorie globale du pluripotentiel, équidistribution et processus ponctuels (d’après Berman, Boucksom, Witt Nyström, ...) La théorie du pluripotentiel est un analogue dans Cn de la théorie classique du potentiel dans C, qui prend ses racines dans l’électrostatique. Sa version globale, qui concerne les variétés complexes compactes, a connu un développement spectaculaire depuis une quinzaine d’années. Les allers-retours entre ces deux points de vue ont récemment permis de résoudre des problèmes classiques sur l’électrostatique et l’interpolation polynomiale dans Cn et inversement d’envisager une approche par la mécanique statistique de la construction de métriques canoniques en géométrie algébrique complexe. Charles BORDENAVE — Normalité asymptotique des vecteurs propres d’un graphe régulier aléatoire (d’après Ágnes Backhausz et Balázs Szegedy) Soit P l’ensemble des matrices symétriques de taille n avec des entrées dans {0, 1}, nulles sur la diagonale et dont la somme de chaque ligne est égale à d (avec dn pair). Un élément de P est la matrice d’adjacence d’un graphe simple à n sommets et d-régulier. Soient A une matrice aléatoire uniforme sur P et v un vecteur propre orthogonal au vecteur constant. Dans l’asymptotique où d est fixé et n tend vers l’infini, Backhausz et Szegedy ont notamment montré que la distribution des entrées du vecteur v est proche en loi d’une gaussienne. Leur preuve se base sur la convergence locale des graphes et la théorie de l’information. Ana KHUKHRO — Espaces et groupes non exacts admettant un plongement grossier dans un espace de Hilbert (d’après Arzhantseva, Guentner, Osajda, Špakula) Dans l’étude des espaces métriques, c’est souvent la structure géométrique grossière qui joue un rôle important. Depuis sa naissance dans les années 80, la théorie géométrique des groupes a permis d’étudier efficacement les groupes en tant qu’objets géométriques via leurs graphes de Cayley et dès lors, les propriétés géométriques grossières des groupes ont eu des implications profondes sur plusieurs conjectures importantes en topologie et en analyse. Une façon de créer des exemples de groupes intéressants pour ces conjectures est d’utiliser la théorie de la petite simplification pour plonger dans les graphes de Cayley de ces groupes des suites de graphes finis dont on peut contrôler la géométrie. Pour ce faire, il est crucial d’avoir une source riche d’exemples de suites de graphes finis avec des propriétés particulières. Ces dernières peuvent également être construites à l’aide de groupes, en prenant une suite de graphes de Cayley de quotients finis d’un groupe et en utilisant les liens entre les propriétes du groupe et les propriétés géométriques de ces graphes. Une telle construction d’ArzhantsevaGuentner-Špakula utilisant les revêtements et les espaces à murs a été utilisée par Osajda, se basant sur les travaux de Arzhantseva-Osajda, pour montrer l’existence de groupes non exacts ayant la propriété de Haagerup.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

viii

RÉSUMÉS DES EXPOSÉS

Anna CADORET — La conjecture des compagnons (d’après Deligne, Drinfeld, L. Lafforgue, T. Abe, . . . ) La conjecture de Deligne dite des compagnons (1980) décrit l’image essentielle des foncteurs de réalisation `-adiques (on autorise ` = p) sur la catégorie hypothétique des motifs purs de Grothendieck lorsque le corps de base est fini de caractéristique p. Pour les courbes, c’est une conséquence de la correspondance de Langlands pour les corps de fonctions (le rôle des motifs étant joué par certaines représentations automorphes) démontrée par Drinfeld en rang 2, Lafforgue en rang quelconque, et Abe pour ` = p. En dimension supérieure, il n’y a pas d’analogue de la correspondance de Langlands et la stratégie est plutôt de se ramener au cas des courbes par des méthodes géométriques. De telles méthodes ont été développées dans des travaux récents de Deligne, Drinfeld et, pour ` = p, de Abe-Esnault/Kedlaya permettant de compléter en grande partie la preuve de la conjecture en dimension supérieure. L’exposé présentera un état des lieux de la conjecture en s’attachant plus particulièrement à décrire ces méthodes géométriques. Sven RAUM — C∗ -simplicity (after Breuillard, Haagerup, Kalantar, Kennedy and Ozawa) A group is said to be C∗ -simple if its reduced C∗ -algebra is simple. This talk will start with a short history of C∗ -simplicity before 2014, the year of the discovery by Kalantar-Kennedy that two boundaries of a group are exactly the same: the Furstenberg boundary, coming from topological dynamics, and the Hamana boundary, coming from operator algebras. This discovery supplies the main tool in the work of Breuillard-Kalantar-Kennedy-Ozawa that solves most classical problems in the domain of C∗ -simplicity. The fascinating interaction between groups, operator algebras, representation theory, and topological dynamics is present in this work. The talk ends with an explanation of the work of Kennedy and Haagerup which makes the connection between these recent developments and original ideas in the area around Dixmier’s property and the amenable radical. Stefan KEBEKUS — Boundedness results for singular Fano varieties, and applications to Cremona groups (following Birkar and Prokhorov-Shramov) A normal, projective variety is called Fano if a negative multiple of its canonical divisor class is Cartier and if the associated line bundle is ample. Fano varieties appear throughout geometry and have been studied intensely. The Minimal Model Programme predicts in an appropriate sense that Fanos are one of the fundamental classes of varieties, out of which all other varieties are built. We report on work of Birkar, who confirmed a long-standing conjecture of Alexeev and Borisov-Borisov, asserting that Fano varieties with mild singularities form a bounded family once their dimension is fixed. This has immediate consequences for our understanding of Cremona groups. Following Prokhorov-Shramov, we explain how Birkar’s boundedness result implies that birational automorphism groups of projective spaces satisfy the Jordan property; this answers a question of Serre in the positive. Olivier BENOIST — Réduction stable en dimension supérieure (d’après Kollár, HaconXu, ...) L’espace de modules des courbes stables de Deligne et Mumford est une compactification de l’espace de modules des courbes lisses de genre > 2, paramétrant certaines courbes nodales. C’est un outil puissant pour l’étude des courbes algébriques. Des analogues en dimension supérieure ont été construits par Kollár, Shepherd-Barron et Alexeev en dimension 2, et par Viehweg dans le cas des variétés lisses. Nous expliquerons les idées récentes ayant permis

ASTÉRISQUE 422

ix

RÉSUMÉS DES EXPOSÉS

la construction de ces espaces de modules en général, notamment le théorème de réduction stable en dimension supérieure, qui reflète leur compacité. Maria Beatrice POZZETTI — Higher rank Teichmüller theories Let Γ be the fundamental group of a compact surface S with negative Euler characteristic, and G denote PSL(2, R), the group of isometries of the hyperbolic plane. Goldman observed that the Teichmüller space, the parameter space of marked complex structures on S can be identified with a connected component of the character variety Hom(Γ, G)/G, which can be selected by means of a characteristic invariant. Thanks to the work of Labourie, Burger-IozziWienhard, Fock-Goncharov, Guichard-Wienhard we now know that, surprisingly, this is a much more general phenomenon: there are many higher rank semisimple Lie groups G admitting components of the character variety only consisting of injective homomorphisms with discrete image, the so-called higher Teichmüller theories. The richness of these theories is partially due to the fact that, as for the Teichmüller space, truly different techniques can be used to study them: bounded cohomology, Higgs bundles, positivity, harmonic maps, incidence structures, geodesic currents, real algebraic geometry. . . In my talk I will overview a number of recent results in the field (following Labourie, Burger-Iozzi-Wienhard, Fock-Goncharov, Guichard-Wienhard, Bonahon-Dreyer, Li, Zhang, Martone-Zhang, Baraglia, Alessandrini-Li, Collier-Tholozan-Toulisse). Luca MIGLIORINI — HOMFLY polynomials from the Hilbert schemes of a planar curve (after D. Maulik, A. Oblomkov, V. Shende, ...) Among the most interesting invariants one can associate with a link L ⊂ S 3 is its HOMFLY polynomial P (L , v, s) ∈ Z[v ±1 , (s − s−1 )±1 ]. A. Oblomkov and V. Shende conjectured that this polynomial can be expressed in algebraic geometric terms when L is obtained as the intersection of a plane curve singularity (C, p) ⊂ C2 with a small sphere [n] centered at p: if f = 0 is the local equation of C, its Hilbert scheme Cp is the algebraic variety whose points are the length n subschemes of C supported at p, or, equivalently, the [n] ideals I ⊂ C[[x, y]] containing f and such that dim C[[x, y]]/I = n. If m : Cp → Z is the function associating with the ideal I the minimal number Rm(I) of its generators, they conP 2n 2 m(I) dχ(I) coincides, jecture that the generating function Z(C, v, s) = [n] (1 − v ) ns C p

up to a renormalization, with P (L , v, s). In the formula the integral is done with respect to the Euler characteristic measure dχ. A more refined version of this surprising identity, involving a “colored” variant of P (L , v, s), was conjectured to hold by E. Diaconescu, Z. Hua and Y. Soibelman. The seminar will illustrate the techniques used by D. Maulik to prove this conjecture. Adam J. HARPER — The Riemann zeta function in short intervals (after Najnudel, and Arguin, Belius, Bourgade, Radziwiłł and Soundararajan) A classical idea for studying the behaviour of complicated functions, like the Riemann zeta function ζ(s), is to investigate averages of them. For example, the integrals over T ≤ t ≤ 2T of various powers of ζ(1/2+it), sometimes multiplied by some other cleverly chosen function, have been investigated extensively to deduce upper and lower bounds for the maximum size of ζ(1/2 + it). More recently, Fyodorov and Keating have proposed the investigation of much shorter integrals over T ≤ t ≤ T + 1. This turns out to lead to interesting connections between various issues in number theory, analysis, mathematical physics and probability, such as branching random walk and multiplicative chaos. I will try to explain some of these connections, ideas from the proofs, and what they tell us about the zeta function.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

x

RÉSUMÉS DES EXPOSÉS

Marie THÉRET — Transition de phase abrupte en percolation via des algorithmes randomisés (d’après Duminil-Copin, Raoufi et Tassion) Le modèle de percolation classique est le suivant : pour un paramètre p ∈ [0, 1] fixé, chaque arête du graphe Zd est conservée (resp. supprimée) avec probabilité p (resp. 1 − p), indépendamment des autres. Il présente une transition de phase à un paramètre pc : si p < pc alors p.s. toutes les composantes connexes sont bornées, tandis que si p > pc alors p.s. il existe une unique composante connexe infinie. Cette transition de phase est abrupte, au sens où pour p < pc , la probabilité que l’origine du graphe soit reliée à un point à distance n décroît vers 0 exponentiellement vite en n. Ce résultat fondamental est connu depuis les années 80 grâce aux travaux de Menshikov et d’Aizenman et Barsky. Dans cet exposé, nous présenterons une nouvelle preuve proposée par Duminil-Copin, Raoufi et Tassion et qui utilise des arbres de décisions. Leur approche est très robuste et peut s’adapter à de nombreuses variantes du modèle dans lesquelles le caractère abrupt de la transition de phase n’était pas encore prouvé. András I. STIPSICZ — Manolescu’s work on the Triangulation Conjecture The triangulation conjecture (asking whether a manifold is necessarily a simplicial complex) has been recently resolved in the negative by Ciprian Manolescu. His proof is based on work of Galweski-Stern and Matumoto, reducing the problem to three- and four-dimensional topology. Manolescu solved the low-dimensional problem by developing a new version of Floer homology, resting on the Seiberg-Witten equations and a symmetry of these equations. The resulting Pin(2)-equivariant theory turned out to be a rich source of invariants, and similar ideas have been applied in Heegaard Floer homology. In the lecture we intend to put the problems into context, indicate the solution of Manolescu and draw attention to further developments based on these ideas. Oscar RANDAL-WILLIAMS — Homology of Hurwitz spaces and the Cohen-Lenstra heuristic for function fields (after Ellenberg, Venkatesh, and Westerland) Ellenberg, Venkatesh, and Westerland have established a weak form of the function field analogue of the Cohen-Lenstra heuristic, on the distribution of imaginary number fields with `-parts of their class groups isomorphic to a fixed group. They first explain how this follows from an asymptotic point count for certain Hurwitz schemes, and then establish this asymptotic by using the Grothendieck-Lefschetz trace formula to translate it into a difficult homological stability problem in algebraic topology, which they nonetheless solve. I will explain their argument, focussing on their remarkable homological stability theorem for Hurwitz spaces. Tristan RIVIÈRE — Infinité d’hypersurfaces minimales en basses dimensions (d’après F. C. Marques, A. A. Neves et A. Song) Une conjecture de Shing Tung Yau du début des années 80 pose le problème de l’existence d’une infinité de surfaces minimales (points critiques de la fonctionnelle d’aire) immergées dans une variété riemannienne tridimensionnelle compacte et sans bord donnée. En explorant des problèmes de minmax sur les cycles Z2 , posés par Misha Gromov et Larry Guth, au moyen de la théorie des varifolds presque minimisants de Frederick Almgren et Jon Pitts, Fernando Codá Marques et Andrá Neves ont apporté une réponse positive á la conjecture de Yau et sa généralisation aux hypersurfaces minimales dans le cas des variétés de dimensions inférieures ou égales à 7, tout d’abord sous des hypothèses de courbures de Ricci strictement positives puis, en collaboration avec Kei Irie, pour des métriques génériques. Enfin, en 2018, Antoine

ASTÉRISQUE 422

RÉSUMÉS DES EXPOSÉS

xi

Song a résolu la conjecture dans sa plus grande généralité, pour des métriques quelconques, en dimension inférieure ou égale à 7. Dans cet exposé, nous nous efforcerons de décrire l’ensemble de ces travaux ainsi que les perspectives futures dans le calcul des variations de l’aire.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

Séminaire BOURBAKI 71e année, 2018–2019, no 1151, p. 1 à 59 doi:10.24033/ast.1130

Octobre 2018

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES [d’après W. Banaszczyk, O. Regev, D. Dadush, N. Stephens-Davidowitz, ...] par Jean-Benoît BOST

1. INTRODUCTION 1.1. Réseaux euclidiens Soit V un R-vectoriel de dimension finie n. Un réseau Λ de V est un sous-groupe discret de V tel que le groupe topologique quotient V /Λ soit compact, ou de façon Ln équivalente, tel qu’il existe une base (ei )1≤i≤n de V telle que Λ = i=1 Zei . Le R-vectoriel V s’identifie alors à ΛR := Λ ⊗ R. Un réseau euclidien est la donnée (V, Λ, k.k) d’un R-vectoriel de dimension finie V , d’un réseau Λ dans V et d’une structure euclidienne sur V de norme associée k.k. De manière équivalente, un réseau euclidien est la donnée E := (E, k.k) d’un Z-module libre de rang fini E et d’une norme euclidienne k.k sur le R-vectoriel ER := E ⊗ R. (On identifie E à son image par l’injection canonique (E,−→ER , v 7−→ v ⊗ 1), qui constitue un réseau dans ER .) Les réseaux euclidiens de dimension 3 constituent un modèle mathématique pour la configuration des atomes ou des molécules dans un solide cristallin, et ont été considérés pour cette raison depuis le dix-septième siècle (notamment par Huyghens dans son Traité de la lumière, publié en 1690). À partir de la fin du dix-huitième siècle, le développement de la théorie des nombres a conduit à étudier les réseaux euclidiens dans une perspective « mathématique pure » : Lagrange, dans ses travaux sur les formes quadratiques entières à deux variables, considère les réseaux euclidiens de dimension 2 et leurs propriétés de « réduction » ; l’étude des formes quadratiques entières en un nombre de variables arbitraires et des corps de nombres de degré quelconque conduisent, notamment Gauss puis Hermite, à s’intéresser aux propriétés des réseaux euclidiens de rang 3, puis de rang quelconque.

© Astérisque 422, SMF 2020

2

J.-B. BOST

À la fin du dix-neuvième siècle, l’étude des réseaux euclidiens est devenu un domaine mathématique à part entière, avec des contributions majeures de Korkin, Zolotarev, Minkowski (qui introduisit la terminologie de « géométrie des nombres » ), puis Voronoï. Pour une présentation des résultats classiques de ce domaine, nous renvoyons aux ouvrages et articles d’exposition [14], [57], [36], et [42]. 1.2. Les invariants classiques des réseaux euclidiens On dispose d’une notion évidente d’isomorphisme entre réseaux euclidiens : un isomorphisme entre deux réseaux euclidiens E 1 := (E1 , k.k1 et E 2 := (E2 , k.k2 ) est ∼ un isomorphisme ϕ : E1 −→ E2 de Z-modules tels que l’isomorphisme de R-vectoriels ∼ qui s’en déduit ϕR : E1,R −→ E2,R soit une isométrie entre les R-vectoriels euclidiens (E1,R , k.k1 ) et (E2,R , k.k2 ). On attache classiquement à un réseau euclidien E := (E, k.k) des invariants ne dépendant que de sa classe d’isomorphisme : – son rang : rk E = dimR ER ∈ N; – son covolume : si mE désigne la mesure de Lebesgue (1) sur l’espace vectoriel euclidien (ER , k.k) et si ∆ est un domaine fondamental (2) pour l’action par translation de E sur ER , le covolume de E est défini comme covol(E) := mE (∆) ∈ R∗+ . On observera que, si rk E = 0, alors covol(E) = 1. – son premier minimum, lorsque rk E > 0 : λ1 (E) :=

min kek ∈ R∗+ .

e∈E\{0}

Plus généralement, on introduit les minima successifs (λi (E))1≤i≤rk E de E définis par :  λi (E) := min r ∈ R+ | E ∩ B k.k (0, r) contient i éléments linéairement indépendants , où B k.k (0, r) désigne la boule fermée de centre 0 et rayon r dans l’espace vectoriel euclidien (ER , k.k). (1) Elle est définie comme l’unique mesure borélienne invariante par translation sur ER telle que, pour P toute base orthonormée (vi )1≤i≤n de l’espace euclidien (ER , k.k), on ait : mE ( n i=1 [0, 1[vi ) = 1. R 2 Une condition de normalisation équivalente est la suivante : E e−πkxk dmE (x) = 1. R (2) C’est-à-dire une partie borélienne de ER telle que (∆ + e)e∈E soit une partition de ER . On vérifie aisément qu’il existe un tel domaine fondamental et que la mesure mE (∆) est indépendante du choix de ∆.

ASTÉRISQUE 422

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

3

– son rayon de recouvrement (3), lorsque rk E > 0 : Rcov (E) := max min kx − ek = min{r ∈ R+ | E + B k.k (0, r) = ER }. x∈ER e∈E

De nombreux résultats de la théorie des réseaux euclidiens prennent la forme d’inégalités reliant ces divers invariants. Par exemple, un résultat classique, qui remonte à Hermite et joue un rôle central en théorie algébrique des nombres, est la majoration suivante du premier minimum d’un réseau euclidien en fonction de son covolume : Théorème 1.1 (Hermite, Minkowski). — Pour tout entier n > 0, il existe C(n) dans R∗+ tel que, pour tout réseau euclidien E de rang n, (1.1)

λ1 (E) ≤ C(n)(covol(E))1/n .

Si vn désigne la mesure de Lebesgue de la boule unité dans Rn , on peut prendre : (1.2)

C(n) = 2vn−1/n .

Comme vn = π n/2 /Γ(n/2 + 1), on déduit de la formule de Stirling que, lorsque n tend vers l’infini, » (1.3) C(n) ∼ 2n/eπ. Hermite a établi ce théorème par récurrence sur le rang n, en initiant ce que l’on appelle aujourd’hui la théorie de la réduction, dont nous rappelons les rudiments dans la section 2. Sa méthode lui permettait d’établir la majoration (1.1) avec C(n) = (4/3)(n−1)/4 . (voir paragraphe 2.4, infra). Minkowski a donné dans sa Geometrie der Zahlen ([49], p. 73-76) une preuve élégante de l’inégalité de Hermite (1.1), preuve qui conduit à la valeur (1.2) pour C(n) et admet une interprétation physique simple. Pensons au réseau euclidien E := (E, k.k) comme modélisant un cristal situé dans l’espace euclidien (ER , k.k) de dimension n, dont les molécules sont représentées par les points du réseau E. ˚k.k (v, λ1 (E)/2) de rayon λ1 (E)/2 centrées en ces points Comme les boules ouvertes B sont deux à deux disjointes, la densité du cristal — définie comme le nombre de ses molécules par unité de volume — est au plus l’inverse du volume de ces boules, lequel vaut vn (λ1 (E)/2)n . (3)

En anglais covering radius. Celui-ci est noté µ(E) dans les articles de Banaszczyk et de Regev et ses collaborateurs qui font l’objet de cet exposé. Nous le notons Rcov (E), en nous inspirant de [19], pour éviter la confusion avec les diverses pentes µ b(E), µ bi (E), µ bKL (E) associées à E.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

4

J.-B. BOST

Or cette densité n’est autre que l’inverse du covolume de E. Il vient donc : covol(E)−1 ≤ [vn (λ1 (E)/2)n ]−1 . Cette inégalité est précisément (1.1) avec C(n) donnée par (1.2). De même, en observant que la boule B k.k (0, Rcov (E)) contient un domaine fondamental pour l’action de E sur ER , on obtient que vn Rcov (E)n ≥ covol(E), ou encore : (1.4)

Rcov (E) ≥ vn−1/n covol(E)1/n .

Le carré γn = C(n)2 de la meilleure constante dans l’inégalité d’Hermite (1.1) est classiquement appelée constante d’Hermite. Sa valeur exacte n’est connue que pour de petites valeurs de n (voir [19], [18]). Toutefois Minkowski a montré que l’estimation asymptotique γn = O(n), conséquence de (1.3), est essentiellement optimale — à savoir, lorsque n tend vers l’infini, on a : log γn = log n + O(1). Par comparaison, l’argument de « théorie de la réduction » d’Hermite prouvait seulement la majoration : » log γn ≤ (n − 1) log 4/3. Cette discussion illustre un thème central de la théorie des réseaux euclidiens, depuis Hermite et ses successeurs Korkin et Zolotarev : l’investigation des « meilleures constantes » figurant dans les inégalités comparant les invariants des réseaux, et notamment la détermination de leur comportement asymptotique lorsque ce rang tend vers l’infini. Les travaux discutés dans cet exposé apportent des progrès spectaculaires sur ce type de question.

1.3. Quelques rappels Avant d’en présenter les résultats, il nous faut rappeler diverses constructions classiques concernant les réseaux euclidiens.

ASTÉRISQUE 422

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

5

1.3.1. Suites exactes et dualité. — Soit E := (E, k.k) un réseau euclidien. Pour tout sous-Z-module F de E, l’inclusion F ,→ E détermine, par extension des scalaires, une injection canonique FR ,→ ER . Muni de la restriction à FR de k.k, F (qui est encore un Z-module libre de rang fini) définit un réseau euclidien : F := (F, k.k|FR ). Si de plus F est saturé dans E — c’est-à-dire si le Z-module E/F est sans torsion, ou de façon équivalente, si F = FR ∩ E — alors E/F est un Z-module libre de rang fini. En outre, la suite exacte i

p

0 −→ F −→ E −→ E/F −→ 0 (où i et p désignent le morphisme d’inclusion et le morphisme quotient) devient, par extension des scalaires, une suite exacte de R-vectoriels : pR

i

R 0 −→ FR −→ ER −→ (E/F )R −→ 0.

Ainsi le R-vectoriel (E/F )R s’identifie-t-il au quotient de ER par FR . En particulier, on peut le munir de la norme euclidienne quotient k.kquot déduite de la norme euclidienne k.k sur ER . On définit ainsi un réseau euclidien E/F := (E/F, k.kquot ). On résumera souvent cette construction en disant que le diagramme (1.5)

i

p

0 −→ F −→ E −→ E/F −→ 0

est une suite exacte courte admissible de réseaux euclidiens. Remarquons qu’un sous-Z-module saturé F de E est déterminé par le sousR-vectoriel FR de ER , et aussi par le sous-Q-vectoriel FQ := F ⊗ Q de EQ := E ⊗ Q, puisque F = FR ∩ E = FQ ∩ E. L’application (F 7→ FQ ) établit en fait une bijection entre sous-Z-modules saturés de E et sous-Q-vectoriels de EQ . Si F est un sous-Z-module (non nécessairement saturé) de E, on pose : F sat := FQ ∩ E. C’est le sous-module saturé de E associé à FQ par la bijection précédente. On a F ⊂ F sat et le quotient F sat /F est fini. Par ailleurs, à tout réseau euclidien E := (E, k.k) est attaché le réseau euclidien dual ∨ E := (E ∨ , k.k∨ ) défini comme suit. Son Z-module sous-jacent E ∨ est le Z-module dual E ∨ := HomZ (E, Z),

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

6

J.-B. BOST

qui est un Z-module libre de même rang que E. Le R-vectoriel (E ∨ )R := E ∨ ⊗ R s’identifie canoniquement à (ER )∨ := HomR (ER , R); on le notera ER∨ . On définit la norme euclidienne k.k∨ comme la norme duale (4) de la norme k.k sur ER . ∨∨ ∼ On dispose d’un isomorphisme de bidualité canonique E −→ E . En outre, toute suite exacte courte admissible (1.5) détermine par dualité un diagramme 0 −→ E/F



t

i



t

p

−→ E −→ F



−→ 0

qui s’identifie à la suite exacte courte admissible ⊥

0 −→ F −→E−→E ∨ /F ⊥ −→ 0 associée au sous-module saturé F ⊥ := {ξ ∈ E ∨ | ξ|F = 0} de E ∨ . Enfin, l’application (F 7→ F ⊥ ) met en bijection les sous-modules saturés de E et E ∨ . 1.3.2. Degré d’Arakelov et pente. — Plutôt que le covolume, il est souvent plus naturel d’utiliser le degré d’Arakelov d’un réseau euclidien E, défini comme le logarithme de sa « densité » covol(E)−1 : d E := − log covol(E), deg

(1.6) et, lorsque rk E > 0, sa pente

dE deg = log(covol(E)−1/rk E ). rk E Par exemple, on vérifie aisément que, pour toute suite exacte courte admissible de réseaux euclidiens (1.5), les covolumes E, F et E/F satisfont à :

(1.7)

(1.8)

µ b(E) :=

covol(E) = covol(F ). covol(E/F )

Les degrés d’Arakelov satisfont donc à la propriété d’additivité (1.9)

d E = deg d F + deg d E/F , deg

analogue à celle satisfaite par le rang : rk E = rk F + rk E/F. De même, les covolumes d’un réseau euclidien E et du réseau dual satisfont à la relation ∨ covol(E ) = covol(E)−1 , que l’on peut récrire sous la forme : d E ∨ = − deg d E. deg (4)

Ainsi, pour tout ξ ∈ ER∨ , kξk∨ := max{|ξ(x)|; x ∈ B k.k (0, 1)}.

ASTÉRISQUE 422

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

7

1.3.3. Formule de Poisson et séries thêta. — La notion de réseau dual joue en rôle central en cristallographie, depuis le développement de l’étude des cristaux au moyen de la diffraction des rayons X : les figures de diffraction produites par un cristal ∨ modélisé par un réseau euclidien E fournissent une image du réseau dual E (Ewald, von Laue, Bragg, 1912). Cela est une manifestation physique de la formule de Poisson pour le réseau euclidien E, qui peut s’énoncer de la manière suivante pour un réseau euclidien de rang n arbitraire E := (E, k.k). La transformation de Fourier établit un isomorphisme d’espaces vectoriels topologiques F



: S (ER ) −→ S (ER∨ )

entre les espaces de Schwartz de ER et de son dual ER∨ , défini par la formule, valable pour toute f ∈ S (ER ) et tout ξ ∈ ER∨ : Z f (x)e−2πiξ(x) dmE (x). F (f )(ξ) := ER

Elle se prolonge en un isomorphisme d’espaces vectoriels topologiques entre espaces de distributions tempérées : F



: S 0 (ER ) −→ S 0 (ER∨ ).

P La formule de Poisson affirme que les « mesures de comptage » v∈E δv P ∨ et δ — qui sont des distributions tempérées sur E et sur E R R — se ξ∈E ∨ ξ déduisent l’une de l’autre par transformation de Fourier : X X δξ . (1.10) F( δv ) = (covol(E))−1 ξ∈E ∨

v∈E

De façon équivalente, pour toute f ∈ S (ER ) et tout x ∈ ER , on a : X X 2πiξ(x) (1.11) f (x − v) = (covol(E))−1 F (f )(ξ)e . v∈E

ξ∈E ∨

(Ce n’est autre que le développement en série de Fourier de la fonction E-périodique P v∈E f (· − v).) Pour tout t ∈ R∗+ , on peut appliquer (1.11) à la fonction ft ∈ S (ER ) définie par 2

ft (x) := e−πtkxk , dont la transformée de Fourier est donnée par : −1

(F ft )(ξ) = t−n/2 e−πt

kξk2

.

On obtient ainsi l’identité, valable pour tout x ∈ ER : X X 2 −1 2 (1.12) e−πtkx−vk = (covol(E))−1 t−n/2 e−πt kξk +2πiξ(x) . v∈E

ξ∈E ∨

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

8

J.-B. BOST

En particulier, lorsque x = 0, la formule de Poisson (1.12) s’écrit : θE (t) = (covol(E))−1 t−n/2 θE ∨ (t−1 ),

(1.13)

où la fonction thêta θE associée à un réseau euclidien E est définie, pour tout t ∈ R∗+ , par la série : X 2 (1.14) θE (t) := e−πtkvk . v∈E

1.4. Les inégalités de transférence de Banaszczyk Les énoncés reliant les invariants de géométrie des nombres attachés à un réseau et à son réseau dual sont classiquement connus sous le nom de théorèmes de transférence (5). En 1993, dans son article [5], Banaszczyk établit de remarquables inégalités de transférence, concernant les minima successifs et le rayon de recouvrement : Théorème 1.2 (Banaszczyk). — Pour tout réseau euclidien E de rang n > 0 et pour tout i ∈ {1, . . . , n}, on a : ∨

λi (E).λn+1−i (E ) ≤ n.

(1.15) De plus,



Rcov (E).λ1 (E ) ≤ n/2.

(1.16)

Comme l’observe Banaszczyk, ces majorations sont optimales, à un terme d’erreur multiplicatif borné uniformément en n près. Cela découle de l’existence, établie par Conway et Thompson, d’une suite de réseaux euclidiens CTn tels que rk CTn = n, ∨



CTn −→ CTn

(1.17) et : λ1 (CTn ) ≥

»

n/2πe (1 + o(n)) lorsque n −→ +∞.

(Voir [48], Chapter II, Theorem 9.5. Les réseaux CTn sont en fait des réseaux entiers unimodulaires, dont l’existence découle de la « formule de masse » de MinkowskiSiegel.) Les réseaux CTn satisfont à : ∨

λ1 (CTn ).λn (CTn ) ≥ λ1 (CTn )2 ≥ (n/2πe)(1 + o(n)) lorsque n −→ +∞. De plus, d’après (1.17), on a : covol(CTn ) = 1 et donc, d’après (1.4) : Rcov (CTn ) ≥ σn−1/n = (5)

»

n/2πe (1 + o(n)) lorsque n −→ +∞.

Originellement, Übertragungssätze ; voir par exemple [14], Chapter XI.

ASTÉRISQUE 422

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

9

Par conséquent, ∨

λ1 (CTn ).Rcov (CTn ) ≥ (n/2πe)(1 + o(n)) lorsque n −→ +∞. Pour établir le théorème 1.2, Banaszczyk introduit une méthode originale, fondée sur les propriétés analytiques des séries thêta (1.14) associées aux réseaux euclidiens et sur la formule de Poisson (1.12). Les approches antérieures aux inégalités de transférence telles que (1.15) et (1.16) reposaient sur la théorie de la réduction et conduisaient à des majorations par des constantes de l’ordre de n3/2 et non pas de n (voir par exemple [37]). Le rôle des séries thêta θE associées aux réseaux entiers — les réseaux euclidiens E dont le produit scalaire euclidien prend sur E × E des valeurs dans Z — n’est plus à souligner : les fonctions θE définissent alors des formes modulaires et, via ce type de construction, la théorie des formes modulaires joue un rôle central dans l’étude et la classification des réseaux entiers (on pourra consulter [23] pour une présentation récente de ces questions et des références). La méthode de Banaszczyk met en évidence l’importance des fonctions θE pour l’étude fine des réseaux euclidiens généraux. Nous présentons cette méthode en section 3. 1.5. Les théorèmes de Dadush, Regev et Stephens-Davidowitz Au cours des dernières décennies, les réseaux euclidiens sont devenus l’objet d’importants travaux en informatique théorique. Leur point de départ ont été les travaux d’Ajtai en 1996, qui a montré comment on pouvait construire des algorithmes de chiffrement à clé publique à partir de constructions mettant en jeu des réseaux euclidiens de grande dimension, pourvu que l’on sache établir la « difficulté » de certains problèmes naturels de théorie des réseaux. Parmi ces problèmes figurent les suivants : – un réseau E := (E, k.k) étant donné par une base de ER = Rn muni de la norme standard (6) k.k = k.kst , déterminer une famille dans E de générateurs de EQ de normes ≤ anc λn (E), où a et c désignent deux réels > 0 fixés ; – construire, pour un point x de ER = Rn , un point v de E tel que kx − vk ≤ anc Rcov (E). Ces questions de cryptographie ont donné un regain d’intérêt considérable à l’étude des « meilleures constantes » dans les inégalités mettant en jeu les invariants des réseaux euclidiens de dimension arbitrairement grande. (6) ou de façon équivalente, avec les notations du paragraphe 2.6 infra, comme le réseau définissant le point ιn ([g]) associé à un élément g de GLn (R).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

10

J.-B. BOST

Les techniques de Banaszczyk, reposant sur les propriétés des séries thêta (1.14) et sur la formule de Poisson (1.12), ont joué un rôle central dans les travaux suscités par ces questions, notamment dans les travaux de D. Micciancio, O. Regev, S. Dadush et N. Stephens-Davidowitz. Ces trois derniers auteurs ont obtenu de remarquables résultats sur les invariants des réseaux et sur les inégalités qui les relient dans une série de travaux récents, notamment dans [21], [54] et [55]. Cet exposé a pour ambition de les présenter à des mathématiciens non-spécialistes. Nous n’en discuterons pas les motivations, ni les applications liées à la « lattice based cryptography » — questions sur lesquelles l’ouvrage [45] et les articles d’exposition [47] et [51] constituent des références accessibles à tout mathématicien de bonne volonté. Nous tenterons plutôt d’apporter un éclairage original sur ces résultats en expliquant comment ils peuvent se comprendre du point de vue de la géométrie arithmétique, dans le cadre de l’analogie entre corps de nombres et corps de fonctions d’une variable. Les résultats principaux des articles [21] et [55] peuvent s’énoncer de la manière suivante : Théorème 1.3 (Regev, Stephens-Davidowitz ; conjecture de Dadush) Soit E := (E, k.k) un réseau euclidien de rang n > 0 tel que, pour tout sousZ-module F non nul de E, covol(F, k.k) ≥ 1. Alors, si t(n) := 10(log n + 2), on a : (1.18)

θE (t(n)−2 ) :=

X

e−πkvk

2

/t(n)2

≤ 3/2.

v∈E

Théorème 1.4 (Dadush, Regev, Stephens-Davidowitz ; conjecture de KannanLovász `2 ) Pour tout réseau euclidien E := (E, k.k) de rang n > 0, on pose : µ bKL (E) :=

min

F =F sat (E

[b µ(E/F ) − (1/2) log rk E/F ].

On a alors : (1.19)

−c≤µ bKL (E) − log R(E)−1 ≤ c(n),

où c désigne une constante universelle et où c(n) désigne une fonction de n telle que c(n) = O(log log n)

ASTÉRISQUE 422

lorsque n −→ +∞.

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

11

Plus précisément, les majorations (1.19) sont satisfaites avec √ c = log 2πe et c(n) = log[10(log n + 10)3/2 ] = (3/2) log log n + o(1). L’intérêt d’un énoncé comme le théorème 1.3 n’est peut-être pas clair au premier regard. Formulons donc quelques commentaires à son sujet. Tout d’abord, le théorème 1.3 est un élément essentiel de la démonstration de la conjecture de Kannan-Lovász établie dans le théorème 1.4. Le choix de la valeur 3/2 dans le membre de droite de (1.18) est largement arbitraire. On pourrait y remplacer 3/2 par 1 + ε, où ε désigne un quelconque élément de R∗+ , et l’inégalité (1.18) resterait valable avec t(n) remplacé par un certain tε (n) dans R∗+ , satisfaisant log tε (n) = O(log log n) lorsque n −→ +∞. De plus, pour ε > 0 arbitraire, cette variante du théorème 1.3 permettrait d’établir le théorème 1.4. Soulignons enfin que, dans ce dernier théorème, la première inégalité est une conséquence facile de la minoration (1.4). La contribution fondamentale de Dadush, Regev et Stephens-Davidowitz est d’établir la seconde inégalité dans (1.19) avec une constante c(n) bornée en O(log log n). Dans l’article original [35] de Kannan et Lovász, où est conjecturé (entre autres) le théorème 1.4, les majorations (1.19) étaient établies avec c(n) = (1/2) log n. Le passage d’une majoration en log n à une majoration en log log n — dont l’ordre de grandeur lorsque n tend vers l’infini est optimal — constitue un progrès spectaculaire. Nous renvoyons aux articles originaux [55] et [21] pour une discussion plus approfondie des applications des théorèmes 1.3 et 1.4. Je remercie chaleureusement Antoine Chambert-Loir, François Charles, Javier Fresán et Vincent Lafforgue pour leurs remarques sur une première version de ce texte.

2. RÉDUCTION DES RÉSEAUX EUCLIDIENS La théorie classique de la réduction des réseaux euclidiens a pour objet la construction de bases remarquables de réseaux euclidiens, les bases « réduites », adaptées à la détermination de leurs minima successifs (ou de ceux des réseaux duaux) et essentiellement uniques. Il s’agit là d’un sujet notoirement technique, et nous renvoyons à [70], [57] Chapter IV, [37] et [36] Section 2 pour des présentations synthétiques et des références.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

12

J.-B. BOST

Dans cette section, nous présentons dans un langage géométrique une version simple d’un résultat central de cette théorie — à savoir qu’un réseau euclidien de rang n > 0 peut être « approché » par un réseau euclidien de la forme L1 ⊕· · ·⊕Ln , où L1 , . . . , Ln désignent des réseaux euclidiens de rang 1, avec une erreur contrôlée en fonction de n, d Li . et est donc approximativement déterminé par les n nombres réels µi := deg Puisque que les minima successifs, le rayon de recouvrement, ou la pente de Kannan-Lovász µ bKL d’une telle somme directe L1 ⊕ · · · ⊕ Ln s’expriment aisément en termes de (µ1 , . . . , µn ), cette forme simple de la théorie de la réduction implique aussitôt des versions grossières des inégalités (1.15), (1.16) et (1.19) dans les théorèmes 1.2 et 1.4, où les constantes dans les membres de droite sont remplacées par des fonctions du rang n beaucoup plus grandes. Même si les résultats quantitatifs que permet d’atteindre la théorie classique de la réduction sont souvent dépassés par les méthodes qui font l’objet de cet exposé, les notions qui s’introduisent naturellement dans cette théorie continuent à jouer un rôle central dans l’étude des réseaux euclidiens, dans la forme raffinée des pentes de Stuhler-Grayson (cf. [33], et Section 5.1 infra). En outre, la théorie de la réduction reste la voie d’accès aux énoncés classiques de compacité dans les espaces de réseaux euclidiens, énoncés qui jouent un rôle crucial dans la démonstration du théorème 1.3. 2.1. Opérations sur les réseaux euclidiens Les opérations de somme directe et de produit tensoriel sur les Z-modules et sur les R-vectoriels euclidiens permettent de définir des opérations analogues sur les réseaux euclidiens. Ainsi, si E 1 := (E1 , k.k1 ) et E 2 := (E2 , k.k2 ) sont deux réseaux euclidiens, on pose E 1 ⊕ E 2 := (E1 ⊕ E2 , k.k⊕ ) et E 1 ⊗ E 2 := (E1 ⊗ E2 , k.k⊗ ), où la norme euclidienne k.k⊕ sur (E1 ⊕ E2 )R ' E1,R ⊕ E2,R est définie par kx1 ⊕ x2 k2⊕ := kx1 k21 + kx2 k22 , et où la norme k.k⊗ sur (E1 ⊗ E2 )R ' E1,R ⊗R E2,R est caractérisée par le fait que, si (e1α )1≤α≤n1 (resp. (e2β )1≤β≤n2 ) est une base orthonormée de l’espace euclidien (E1,R , k.k1 ) (resp. de (E2,R , k.k2 )), alors (e1α ⊗ e2β )1≤α,β≤n1 ,n2 est une base orthonormée de l’espace euclidien (E1,R ⊗R E2,R , k.k⊗ ). L’inclusion canonique i : E1 −→ E1 ⊕ E2 et la projection p : E1 ⊕ E2 −→ E2 font du diagramme (2.1)

ASTÉRISQUE 422

i

p

0 −→ E 1 −→ E 1 ⊕ E 2 −→ E 2 −→ 0

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

13

une suite exacte courte admissible (7). En particulier, on a : d E 1 + deg d E2. d (E 1 ⊕ E 2 ) = deg deg Pour tout t ∈ R, on introduit le réseau euclidien de rang 1 O (t)

:= (Z, k.kt ),

où k.kt désigne la norme sur ZR = R définie par kxkt := e−t |x|. Il est immédiat qu’un réseau euclidien L de rang 1 est isomorphe à O (t) où d L. Pour tout réseau euclidien E := (E, k.k), le produit tensoriel E ⊗ O (t) t := deg peut être identifié au réseau euclidien (E, e−t k.k), déduit de E par un « changement d’échelle » e−t . 2.2. Sommes directes de réseaux de rang 1 Les invariants des réseaux euclidiens sommes directs de réseaux de rang 1 s’évaluent facilement. Considérons en effet n M E := O (ti ), i=1

où n est un entier > 0 et où t1 ≥ · · · ≥ tn sont des réels en ordre décroissant. On vérifie aisément que t1 + · · · + tn d E = t1 + · · · + tn et µ b(E) = deg , n (2.2)

λi (E) = e−ti

et

pour tout i ∈ {1, . . . , n},

n X Rcov (E) = (1/2)( e−2ti )1/2 . i=1

En particulier,

√ Rcov (E) ∈ [(1/2)e−tn , ( n/2)e−tn ].

Par ailleurs, ∨

E '

n M

O (−ti ).

i=1

Par suite : ∨

λi (E ) = etn+1−i

pour tout i ∈ {1, . . . , n}.

(7) On prendra garde que, en général, une suite exacte courte admissible de réseaux euclidiens n’est pas isomorphe à une telle suite exacte : l’obstruction à ce que la suite exacte courte admissible (1.5) soit scindée, c’est-à-dire isomorphe à une suite exacte courte admissible de la forme (2.1), est un élément d’un groupe d’extensions associé aux réseaux F et E/F dont les propriétés sont étroitement liées à la théorie de la réduction ; voir [12].

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

14

J.-B. BOST

2.3. Isomorphismes non-isométriques et invariants des réseaux euclidiens 0

Soient E := (E, k.k) et E := (E 0 , k.k0 ) deux réseaux euclidiens de même rang ∼ n et soit ϕ : E −→ E 0 un isomorphisme des réseaux sous-jacents. L’application ϕR := ϕ ⊗ IdR : ER −→ ER0 est un isomorphisme de R-vectoriels, mais n’est pas nécessairement isométrique. Le « défaut d’isométrie » de ϕR est contrôlé par les −1 normes d’opérateurs kϕR k et kϕR k définies au moyen des normes k.k et k.k0 sur ER 0 et ER , et l’on vérifie aisément que le covolume, les minima successifs ou le rayon de 0 recouvrement de E et E peuvent se comparer en termes de ces normes : 0

−n kϕ−1 R k

covol(E ) = kΛn ϕR k ≤ kϕR kn , ≤ covol(E)

−1 kϕ−1 R k

λi (E ) ≤ ≤ kϕR k pour tout i ∈ {1, . . . , n}, λi (E)

−1 kϕ−1 R k

Rcov (E ) ≤ kϕR k. ≤ Rcov (E)

0

0

On peut reformuler ces relations comme suit : −1 Proposition 2.1. — Si ψ désigne l’un des invariants µ b, log λ−1 i , or log Rcov , on a : 0

− log kϕR k ≤ ψ(E ) − ψ(E) ≤ log kϕ−1 R k.

(2.3)

En particulier, pour tout λ ∈ R, ψ(E ⊗ O (λ)) = ψ(E) + λ.

(2.4) 2.4. Théorie de la réduction

Théorème 2.2. — Pour tout entier n > 0, il existe D(n) ∈ R∗+ tel que, pour tout réseau euclidien E := (E, k.k) de rang n, le Z-module E admette une base (v1 , . . . , vn ) de E telle que n Y

(2.5)

kvi k ≤ D(n) covol E.

i=1

On peut prendre en fait : C(n) = (4/3)n(n−1)/4 .

(2.6)

On remarquera que, avec les notations du théorème 2.2, il vient aussitôt : λ1 (E) ≤ max kvi k ≤ ( 1≤i≤n

n Y

kvi k)1/n ≤ D(n)1/n covol E

i=1

On a ainsi retrouvé l’inégalité de Hermite (1.1), avec C(n) = D(n)1/n = (4/3)(n−1)/4 .

ASTÉRISQUE 422

1/n

.

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

15

Démonstration. — Le théorème se démontre par récurrence sur l’entier n. Soit donc E un réseau euclidien de rang n > 0. Choisissons un élément s ∈ E tel que ksk = λ1 (E). Le sous-module Zs est alors saturé dans E. Si n = 1, alors E = Zs. Ainsi covol(E) = λ1 (E) et la majoration (2.5) est satisfaite par v1 := s et D(1) = 1. Si n > 1, on peut considérer le réseau euclidien quotient E/Zs := (E/Zs, k.kquot ), de rang n − 1. Par récurrence, il existe une base (w1 , . . . , wn−1 ) de E/Zs telle que n−1 Y

(2.7)

kwi kquot ≤ D(n − 1) covol E/Zs.

i=1

Si, pour tout i ∈ {0, . . . , n−1}, on choisit un élément vi dans la préimage p−1 (wi ) de wi par l’application quotient p : E −→ E/Zs et si l’on pose vn := s, alors (v1 , . . . , vn ) est une base de E. De plus, pour i ∈ {0, . . . , n − 1}, on peut choisir pour vi un élément de p−1 (wi ) de norme minimale. On a alors : kvi k ≤ kvi − sk et kvi k ≤ kvi + sk.

(2.8) Par ailleurs, on a :

kvi k ≥ λ1 (E) = ksk.

(2.9)

Soit vi⊥ l’élément de p−1 R (wi ) orthogonal à s. Par définition de k.kquot , on a : kvi⊥ k = kwi kquot .

(2.10) De plus, on peut écrire :

vi = vi⊥ + ηi s avec ηi ∈ R ; on a alors : kvi k2 = kvi⊥ k2 + ηi2 ksk2

et kvi ± sk2 = kvi⊥ k2 + (ηi ± 1)2 ksk2 .

D’après (2.8), on a |ηi | ≤ 1/2. On en déduit : kvi k2 ≤ kvi⊥ k2 + (1/4)ksk2 , puis, compte tenu de (2.9) et (2.10), (2.11)

kvi k2 ≤ (4/3)kwi k2quot .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

16

J.-B. BOST

Les majorations (2.11) et (2.7), jointes à la multiplicativité du covolume (1.8), montrent que : n Y

kvi k ≤ (4/3)

(n−1)/2

i=1

n−1 Y

kwi kquot .ksk

i=1

≤ (4/3)(n−1)/2 D(n − 1) covol(E/Zs). covol(Zs) = (4/3)(n−1)/2 D(n − 1) covol(E). Cela établit l’existence d’une base (v1 , . . . , vn ) de E satisfaisant à l’inégalité (2.5) avec D(n) = (4/3)(n−1)/2 D(n − 1), puis avec D(n) donné par (2.6). On remarquera que la démonstration précédente fournit un algorithme (8) pour construire la base (v1 , . . . , vn ) : les bases produites par cet algorithme sont dites réduites au sens de Korkin-Zolotarev (voir par exemple [37]). 2.5. Théorie de la réduction et inégalités de transférence Il est commode, dans les applications, de combiner le théorème 2.2 avec les observations suivantes. Soit E un réseau euclidien de rang n > 0 et soient L1 , . . . , Ln des sous-Z-modules de rang 1 de E dont E soit la somme directe. Considérons l’application somme : ∼

Σ : L1 ⊕ · · · ⊕ Ln −→ E et le réseau euclidien L1 ⊕ · · · ⊕ Ln . On peut considérer les normes d’opérateurs kΣR k, kΛn ΣR k et kΣ−1 R k définies à partir des structures euclidiennes sur L1 ⊕ . . . ⊕ Ln et E. Enfin, on peut poser : n

(2.12)

δ(E; L1 , . . . , Ln ) := µ b(E) −

1Xd deg Li n i=1

=µ b(E) − µ b(L1 ⊕ · · · ⊕ Ln ).

(2.13)

Proposition 2.3. — Avec les notations précédentes, on a : (2.14) (2.15)

1 log kΛn ΣR k ≥ 0, n log kΣR k ≤ (1/2) log n,

δ(E; L1 , . . . , Ln ) = −

et (2.16) (8)

log kΣ−1 R k≤

n−1 log n + nδ(E; L1 , . . . , Ln ). 2

Pourvu que l’on dispose d’algorithmes pour déterminer les vecteurs de plus petite norme non nulle d’un réseau euclidien, etc.

ASTÉRISQUE 422

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

17

Démonstration. — Les inégalités (2.14) et (2.15) découlent aisément des définitions. On en déduit (2.16) grâce aux « formules de Cramer » pour Σ−1 , qui identifient Σ−1 à Λn−1 Σ ⊗ (Λn Σ)−1 et montrent que : n−1 log kΣ−1 ΣR k − log kΛn ΣR k R k = log kΛ

≤ (n − 1) log kΣR k + nδ(E; L1 , . . . , Ln ). Avec les notations du théorème 2.2, on peut poser Li := Zvi , pour 1 ≤ i ≤ n. On a alors : nδ(E; L1 , . . . , Ln ) = − log covol E +

n X

log kvi k ≤ log D(n).

i=1

En appliquant la proposition (2.3) à ϕ = Σ, on obtient que, si ψ désigne l’un des −1 invariants log λ−1 ou log Rcov , on a alors : i (2.17)



n M n−1 log n − log D(n) ≤ ψ( Zvi ) − ψ(E) ≤ (1/2) log n. 2 i=1

On peut également appliquer la proposition (2.3) à l’isomorphisme : t



∨ Σ : E ∨ −→ L∨ 1 ⊕ · · · ⊕ Ln ,

et on obtient ainsi : (2.18)

− (1/2) log n ≤ ψ(

n M





Zvi ) − ψ(E ) ≤

i=1

n−1 log n + log D(n). 2

Les calculs du paragraphe 2.2 permettent d’exprimer les invariants des réseaux Ln Ln ∨ euclidiens i=1 Zvi et i=1 Zvi en termes de la suite (ti )1≤i≤n := (log kvi k−1 )i≤i≤n , où les kvi k sont ordonnés par ordre croissant. Combinés avec les majorations précédentes, ils conduisent à des inégalités de transférence comparant les invariants ∨ de E et de E , où toutefois les constantes dépendant de n sont excessivement grandes. −1 Par exemple, en appliquant (2.17) avec ψ = log Rcov et (2.18) avec ψ = log λ−1 1 , on obtient l’inégalité : ∨

| log Rcov (E) + log λ1 (E )| ≤ E(n), avec E(n) =

n+1 log n + D(n) = O(n2 ). 2

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

18

J.-B. BOST

2.6. Les espaces Rn et Rn0 On vérifie aisément que, pour tout entier naturel n, les classes d’isomorphismes de réseaux euclidiens de rang n constituent un ensemble et que l’on définit une bijection ∼

ιn : GLn (Z)\GLn (R)/On (R) −→ Rn en envoyant la (double) classe [g] d’un élément g de GLn (R) sur le réseau euclidien (Rn , k.kst , g −1 Zn ), défini par le R-vectoriel V = Rn muni de la norme euclidienne standard k.kst (définie par k(x1 , . . . , xn )k2st := x21 + · · · + x2n ) et du réseau Λ := g −1 Zn . Ce réseau euclidien est isomorphe, via g, à (Rn , kg −1 .kst , Zn ), et l’on a donc : ιn ([g]) := [(Rn , k.kst , g −1 Zn )] = [(Rn , kg −1 .kst , Zn )]. Si Sym+ n désigne l’ouvert des matrices symétriques définies positives dans Mn (R), on dispose d’un difféomorphisme entre variétés R-analytiques ∼

GLn (R)/On (R) −→ Sym+ n g 7−→ g.tg. Ainsi Rn s’identifie au quotient GLn (Z)\Sym+ n par l’action du sous-groupe GLn (Z) de GLn (R), qui agit à gauche sur l’espace Sym+ n des formes quadratiques définies positives sur Rn par le « changement de variables » qui envoie (γ, h) ∈ GLn (Z)×Sym+ n sur tγ −1 hγ −1 . Rappelons que cette action de GLn (Z) sur Sym+ n est propre et que, après restriction à un sous-groupe d’indice fini assez petit, elle est libre. On munira + + Rn ' GLn (Z)\Symn de la topologie quotient de la topologie usuelle de Symn vu comme ouvert du R-vectoriel des matrices symétriques. C’est un espace localement compact. Davantage, c’est le quotient d’une variété analytique réelle par un groupe fini d’automorphismes ; en tant que tel, Rn possède une structure naturelle « d’orbifold » . Dans la pratique, cela signifie que l’on peut grosso modo travailler sur Rn comme sur une variété différentiable, et faire comme si l’application quotient p : Sym+ n −→ Rn était un revêtement : les fonctions C ∞ sur un ouvert U de Rn s’identifient aux fonctions C ∞ sur l’ouvert p−1 (U ) qui sont GLn (Z)-invariantes, etc. Le degré d’Arakelov des réseaux euclidiens définit une application analytique réelle : d : Rn −→ R. deg On pose : 0

Rn

ASTÉRISQUE 422

d −1 (0). := deg

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

19

C’est une hypersurface lisse de Rn , et l’on dispose d’un isomorphisme analytique réel : 0

Rn



× R −→ Rn

([E], λ) 7−→ [E ⊗ O (λ)]. Une partie de Rn est compacte si et seulement si c’est l’image p(K) d’une partie compacte de Sym+ n . Cette observation, jointe au théorème 2.2 et à la proposition 2.3, conduit au critère de compacité suivant : Théorème 2.4 (Critère de Mahler). — Soit n un entier > 0. Une partie A de Rn est relativement compacte si et seulement s’il existe α et β dans R∗+ tel que, pour tout élément [E] de A, covol(E) ≤ α

et

λ1 (E) ≥ β.

On peut résumer le théorème d’Hermite 1.1 et le critère de Mahler 2.4 dans l’assertion suivante : la fonction continue λ−1 : Rn0 −→ R+ est une fonction 1 d’exhaustion, c’est-à-dire une application propre de l’espace topologique Rn0 vers R+ . Une contribution majeure à l’étude des espaces Rn , de la fonction λ1 et des constantes de Hermite γn = maxRn0 λ21 est due à Voronoï. Dans son mémoire [68], il étudie notamment les réseaux euclidiens parfaits, à savoir les réseaux euclidiens E tels que l’image de {v ∈ E | kvkE = λ1 (E)} par l’application (x 7→ x⊗2 ) soit une partie génératrice du R-vectoriel S 2 ER . Non seulement les réseaux euclidiens parfaits contiennent les réseaux euclidiens extrêmes, qui correspondent aux points de Rn0 où la fonction λ1 atteint un maximum local, mais ils permettent à Voronoï de construire par dualité une remarquable décomposition cellulaire de Rn , qui peut apparaître comme une forme raffinée de la théorie de la réduction (voir [57], [42] et [61] pour des expositions modernes de ces constructions). Dans son second mémoire ([67] et [69]), il étudie une autre décomposition de Rn0 , associée à la combinatoire des domaines de Voronoï des réseaux euclidiens : si E := (E, k.k) est un réseau euclidien, son domaine de Voronoï est défini comme le polytope convexe symétrique : V (E)

:= {x ∈ ER | ∀e ∈ E, kxk ≤ kx − ek},

formé des points x de ER tels que l’origine appartienne à l’ensemble (fini) des points de E minimisant la distance de x à E dans l’espace euclidien (ER , k.k). La notion de domaine de Voronoï est bien naturelle, et apparaît dès les premiers travaux mathématiques sur les réseaux euclidiens : ainsi les domaines de Voronoï apparaissent encore dans la littérature sous le nom de domaine de Dirichlet. Ils jouent

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

20

J.-B. BOST

aussi un rôle central en cristallographie et en physique du solide, domaines où ils apparaissent sous le nom de première zone de Brillouin ou de cellule de Wigner-Seitz. Ils jouent aussi un rôle fondamental dans la preuve des théorèmes 1.3 et 1.4. La profondeur et la quantité des résultats présentés dans les mémoires de Voronoï ont fait qu’ils sont restés longtemps mal étudiés, tout particulièrement le second. L’interface entre l’étude à la Voronoï des espaces Rn0 et des invariants classiques des réseaux et l’étude de leurs invariants définis à l’aide de séries thêta, qui font l’objet de cet exposé, apparaît comme un champ d’investigation fascinant.

3. LES INÉGALITÉS DE BANASZCZYK Dans cette section, logiquement indépendante de la précédente, nous présentons la méthode introduite par Banaszczyk dans son article fondateur [5] pour établir les inégalités de transférence optimales énoncées dans le théorème 1.2. Nous nous concentrerons sur la seconde inégalité (1.16) ; la démonstration des inégalités (1.15) utilise des arguments similaires à ceux qui conduisent à (1.16), et nous renvoyons à [5], p. 631-632, pour les détails. Signalons aussi que Banaszczyk a appliqué ce type de technique à des questions voisines dans les articles [6] et [7]. 3.1. Les majorations clés Soit E := (E, k.k) un réseau euclidien de rang n > 0. Sa fonction thêta θE est clairement une fonction décroissante. Il en va de même de θE ∨ et l’équation fonctionelle (1.13) reliant θE et θE ∨ montre donc que tn/2 θE (t) est une fonction croissante de t ∈ R∗+ . Par ailleurs, la formule de Poisson (1.12) montre que, pour tout x ∈ ER et tout t ∈ R+ , on a : X X 2 2 (3.1) e−πtkx−vk ≤ e−πtkvk , v∈E

v∈E

avec égalité si et seulement si x ∈ E. Le point de départ de la méthode de Banaszczyk est la majoration suivante, qui découle aisément des observations qui précédent : Lemme 3.1. — Pour tout x ∈ ER , tout r ∈ R+ et tout t ∈ ]0, 1], on a : X 2 2 X 2 (3.2) e−πkv−xk ≤ t−n/2 e−π(1−t)r e−πkvk . v∈E,kv−xk≥r

ASTÉRISQUE 422

v∈E

(1151)

21

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

Démonstration. — Il vient : X 2 e−πkv−xk = v∈E,kv−xk≥r

2

X

e−π(1−t)kv−xk e−πtkv−xk

2

v∈E,kv−xk≥r

≤ e−π(1−t)r

2

≤ e−π(1−t)r

2

X

e−πtkv−xk

2

v∈E,kv−xk≥r

(3.3)

X

2

e−πtkvk

v∈E

≤e

(3.4)

−π(1−t)r 2 −n/2

t

X

2

e−πkvk .

v∈E

En effet, la majoration (3.3) découle de (3.1), et (3.4) de l’inégalité tn/2 θE (t) ≤ θE (1).

Compte tenu de (3.1), la majoration (3.2) n’a d’intérêt que pour les valeurs de r telles que 2

inf t−n/2 e−π(1−t)r < 1. t∈]0,1]

Un calcul élémentaire montre que cette inégalité est satisfaite précisément lorsque p p r > n/2π, puis que, lorsque cela a lieu, si l’on pose r = n/2π r˜ avec r˜ ∈ ]1, +∞[, 2 alors le minimum de t−n/2 e−π(1−t)r sur ]0, 1] est atteint en t = tmin := r˜−2 et prend comme valeur : 2

−n/2

2

tmin e−π(1−tmin )r = [˜ re−(1/2)(˜r

−1) n

] .

Ces considérations montrent que le lemme 3.1 peut se reformuler comme la proposition suivante, mieux adaptée aux applications, où l’on a posé : 2

β(˜ r) := r˜e−(1/2)(˜r

(3.5)

−1)

.

Proposition 3.2. — Soit E un réseau euclidien de rang n > 0 et soit x un élément de ER . Pour tout r˜ ∈ [1, +∞[, si l’on pose … n r= r˜, 2π alors on a : (3.6)

2

X

e−πkv−xk ≤ β(˜ r)n

X

2

e−πkvk .

v∈E

v∈E,kv−xk≥r

On observera que l’on définit par la formule (3.5) un homéomorphisme décroissant : ∼

β : [1, +∞[ −→ ]0, 1].

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

22

J.-B. BOST

On remarquera aussi que la formule de Poisson (1.12) implique les identités : X X X 2 2 2 e−πkξk [1 + cos(2πξ(x))] e−πkx−vk + e−πkvk = (covol E)−1 v∈E

ξ∈E ∨

v∈E

= 2(covol E)−1

X

2

e−πkξk cos2 (πξ(x)),

ξ∈E ∨

On en déduit : Proposition 3.3. — Pour tout réseau euclidien E et tout point x ∈ ER , on a : X X 2 2 (3.7) e−πkx−vk + e−πkvk ≥ 2(covol E)−1 . v∈E

v∈E

3.2. Démonstration de l’inégalité de transférence (1.16) Commençons par énoncer deux corollaires des propositions 3.2 et 3.3. En appliquant la proposition 3.2 avec x = 0 et r = λ1 (E), on obtient : Corollaire 3.4. — Soit E un réseau euclidien de rang n > 0 et de premier p minimum λ1 (E) > n/2π. p ˜ ∈ ]1, +∞[ par l’égalité λ1 (E) = n/2π λ, ˜ alors on a : Si l’on définit λ X 2 ˜ n )−1 . (3.8) θE (1) := e−πkvk ≤ (1 − β(λ) v∈E

Par ailleurs, par définition même de Rcov (E), il existe x ∈ ER tel que kv − xk ≥ ρ(E) pour tout v dans E. Si l’on applique la proposition 3.2 à un tel point x et à r = Rcov (E), on obtient la première assertion du corollaire suivant : Corollaire 3.5. — Soit E un réseau euclidien de rang n > 0 et de rayon de p ˜ ∈ [1, +∞[ par l’égalité Rcov (E) = recouvrement Rcov (E) ≥ n/2π. On définit R p ˜ n/2π R, Il existe x ∈ ER tel que P −πkv−xk2 v∈E e ˜ n. P (3.9) ≤ β(R) −πkvk2 e v∈E Par conséquent, (3.10)

˜ n ≥ 2θ ∨ (1)−1 − 1. β(R) E

Pour établir (3.10), il suffit d’observer que, d’après la proposition 3.3, le membre de gauche de l’inégalité (3.9) est minoré par 2 covol(E)−1 θE (1)−1 − 1, puis de faire appel à l’équation fonctionnelle (1.13) reliant θE et θE ∨ , qui montre que : θE (1) = (covol(E))−1 θE ∨ (1).

ASTÉRISQUE 422

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

23

Nous sommes maintenant à même de démontrer l’inégalité de transférence (1.16) : ∨

Rcov (E).λ1 (E ) ≤ n/2. ˜ ∨ par les égalités ˜ et λ Soit donc E un réseau euclidien de rang n > 0 et définissons R » » ˜∨. ˜ et λ1 (E ∨ ) = n/2π λ Rcov (E) = n/2π R ˜ ∨ , R) ˜ > 1, on a : Lemme 3.6. — Lorsque min(λ ˜ ∨ )n ≥ 1. ˜ n + 2β(λ β(R)

(3.11)



Démonstration. — Le corollaire 3.4, appliqué à E , montre que : ˜ ∨ )n ≤ θ ∨ (1)−1 . 1 − β(λ E

(3.12)

La majoration (3.11) découle des inégalités (3.10) et (3.12). Pour tout entier n > 0, posons : tn := β −1 (3−1/n ) ∈ ]1, +∞[. Un calcul élémentaire montre que tn ≤ 1 + et que

» tn = 1 +

» (log 3)/n

(log 3)/n + O(1/n) lorsque n −→ +∞.

À partir du lemme 3.6, on dérive une version plus précise de l’inégalité de Banaszczyk (1.16) : Proposition 3.7. — Pour tout réseau euclidien E de rang n > 0, on a : ∨

Rcov (E).λ1 (E ) ≤ t2n n/2π. √ En fait, pour n ≥ 3, tn ≤ t3 = 1, 605 . . . < π = 1, 772 . . . et donc t2n n/2π < n/2. Ainsi l’inégalité (3.13) implique (1.16) lorsque n ≥ 3. Lorsque n = 1, (1.16) est triviale, et lorsque n = 2, elle découle de considérations élémentaires sur les bases réduites des réseaux euclidiens dans le plan.

(3.13)

Démonstration de la proposition 3.7. — Supposons d’abord que (3.14)



Rcov (E) = λ1 (E ) =: t.

D’après le lemme 3.6, si t > 1, alors β(t) ≥ 3−1/n et donc t ≤ tn . Comme tn > 1, cette majoration est encore vrai lorsque t ≤ 1. L’inégalité (3.13) en découle aussitôt. La validité de (3.13) en général découle de sa validité sous l’hypothèse (3.14). En effet, lorsque l’on remplace le réseau euclidien E par E ⊗ O (δ) avec δ ∈ R (c’est-à-dire lorsque l’on multiplie la norme euclidienne définissant E par le facteur e−δ ), le produit

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

24

J.-B. BOST



Rcov (E).λ1 (E ) reste inchangé, alors, que par un choix convenable de δ, la condition (3.14) est satisfaite par E ⊗ O (δ). En effet, d’après (2.4) : log Rcov (E ⊗ O (δ)) = log Rcov (E) − δ

et





log λ1 (E ⊗ O (−δ)) = log λ1 (E ) + δ.

4. FIBRÉS VECTORIELS SUR LES COURBES : FILTRATIONS DE HARDER-NARASIMHAN ET PENTES Dans cette section, nous rappelons divers résultats classiques concernant les fibrés vectoriels sur les courbes algébriques. Ces résultats jouent un rôle central dans l’étude des espaces de modules classifiant ces fibrés vectoriels, et l’on pourra se reporter à [39] pour une présentation synthétique et des références sur ce sujet. Nous présentons ici ces résultats en tant que « modèles » pour l’étude des réseaux euclidiens dans la suite de cet exposé. Notamment les propositions 4.1 et 4.2 ont été formulées explicitement parce qu’elles apparaîtront comme les analogues géométriques du théorème 1.3. Soit C une courbe projective lisse et géométriquement connexe sur un corps k. On notera K := k(C) le corps des fonctions rationnelles sur C. Un fibré vectoriel E sur C est un faisceau cohérent localement libre sur C. Tout sous-faisceau cohérent F de E est encore un fibré vectoriel sur C. On dira que F est un sous-fibré vectoriel de E lorsque le faisceau quotient E/F est sans torsion, et définit donc un fibré vectoriel. La fibre EK de E au point générique de C — à savoir, l’espace des sections rationnelles de E sur C — est un K-vectoriel de dimension finie. Si F est un sousfaisceau cohérent de E, FK est un sous-K-vectoriel de EK , et cette construction met en bijection les sous-fibrés vectoriel de E et les sous-K-vectoriels de EK . Le sous-fibré vectoriel de E ainsi associé à FK ets noté F sat . C’est l’unique sous-fibré vectoriel de E contenant F tel que le faisceau cohérent F/F sat soit de torsion. On dispose d’opérations tensorielles sur les fibrés vectoriels : si E est un fibré vectoriel sur C, on peut définir le fibré dual E ∨ et, pour tout n ∈ N, la puissance Vn tensorielle E ⊗n et extérieure E ; à deux fibrés vectoriels E et F sur C, on peut associer leur somme directe, leur produit tensoriel E ⊗ F et le fibré vectoriel Hom(E, F ) ' E ∨ ⊗ F. 4.1. Invariants des fibrés vectoriels À un fibré vectoriel E sur C sont associés les invariants suivants : – son rang rk E := dimK EK ∈ N;

ASTÉRISQUE 422

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

25

– son degré (9) deg E ∈ Z. – lorsque rk E > 0, sa pente : deg E ∈ Q. rk E Ces invariants satisfont aux propriétés suivantes : (i) Pour tout fibré vectoriel E sur C et tout sous-fibré vectoriel F de E, µ(E) :=

(4.1)

deg E = deg F + deg E/F ;

(ii) Si E est un fibré vectoriel de rang > 0 et L un fibré en droites sur C, on a : µ(E ⊗ L) = µ(E) + deg L. Plus généralement, si E et F sont deux fibrés vectoriels de rang > 0 sur C, on a : µ(E ⊗ F ) = µ(E) + µ(F ). (iii) Si ϕ : E −→ E 0 est un morphisme de faisceaux de OC -modules entre deux fibrés vectoriels qui est un isomorphisme au point générique : ∼

0 ϕK : EK −→ EK ,

alors deg E ≤ deg E 0 , et l’égalité a lieu si et seulement si ϕ est un isomorphisme. En particulier, pour tout sous-faisceau cohérent F de E, on a deg F ≤ deg F sat , avec égalité si et seulement si F est un sous-fibré vectoriel de E. (iv) Soient F1 et F2 deux sous-faisceaux cohérents d’un fibré vectoriel E sur C. On peut alors considérer les sous-faisceaux cohérents F1 ∩ F2 et F1 + F2 de F et l’on a : (4.2)

deg(F1 ∩ F2 ) + deg(F1 + F2 ) = deg F1 + deg F2 .

Si de plus F1 et F2 sont des sous-fibrés vectoriels de E, le faisceau F1 ∩ F2 en est un aussi (mais pas nécessairement F1 + F2 ) et l’on a : (4.3)

deg(F1 ∩ F2 ) + deg(F1 + F2 )sat ≥ deg F1 + deg F2 .

(9) Rappelons que, lorsque E est de rang 1 (un fibré en droites), donc isomorphe au faisceau OC (D) P associé au diviseur D = i∈I ni Pi d’une section rationnelle non-nulle de E (défini par une famille (Pi )i∈I de points fermés de C, affectés de multiplicités (ni )i∈I ∈ ZI ), on a : deg E = deg OC (D) = P deg D := i∈I ni [κ(Pi ) : k]. Pour un fibré E de rang quelconque, on se ramène aux fibrés en droites V en considérant sa puissance extérieure maximale : deg E := deg rk E E.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

26

J.-B. BOST

(v) Pour tout fibré vectoriel E sur C, il existe c(E) dans R tel que, pour tout sous-faisceau cohérent F de E, deg F ≤ c(E). De plus, si F désigne un sous-fibré vectoriel de E et si F ⊥ ⊂ E ∨ est l’annulateur de F dans E ∨ , on dispose d’un isomorphisme canonique : ∼

F ⊥ −→ (E/F )∨ ; on en déduit : (4.4)

deg F ⊥ = deg F − deg E.

4.2. Filtration canonique et pentes d’un fibré vectoriel On dit qu’un fibré vectoriel E de rang non nul est semi-stable lorsque, pour tout sous-fibré vectoriel (ou, de façon équivalente, pour tout sous-faisceau) non nul F de E, on a : µ(F ) ≤ µ(E). Harder et Narasimhan ont montré que les propriétés (i) à (v) du degré permettent d’attacher à tout fibré vectoriel E sur C de rang non nul une filtration canonique — la filtration de Harder-Narasimhan — de E, E0 = 0 ( E1 ( · · · ( EN = E. C’est l’unique filtration de longueur N ∈ N>0 , par des sous-fibrés vectoriels Ei de E tels que les quotients Ei /Ei−1 soient semi-stables, de pentes strictement décroissantes : (4.5)

µ(E1 ) > µ(E2 /E1 ) > · · · > µ(EN /EN −1 ).

(Voir [32] ; cette construction est étroitement liée à la théorie de la réduction sur les corps de fonctions développée par Harder dans [31]. Tjurin avait introduit une construction analogue dans [66].) Nous rappelons dans l’appendice A la construction de ces filtrations canoniques, dans un cadre formel général, concernant un ensemble ordonné muni d’une fonction « rang » r et d’une fonction « degré » d idoines. On retrouve la construction de [32] en appliquant cette construction générale à l’ensemble ordonné (E (E), ⊆) des sousfaisceaux cohérents de E munis de l’inclusion, et aux fonctions r := rk et d := deg. On la retrouve également en appliquant le formalisme des pentes au sous-ensemble Esat (E) de E (E) défini par les sous-fibrés vectoriels de E. Les hypothèses (2) et (3) de sousadditivité et de finitude sur lesquelles s’appuie la construction générale de l’appendice sont satisfaites ici d’après les points (iv) et (v) du paragraphe précédent. En utilisant l’additivité (4.1) du degré dans les suites exactes courtes, on vérifie que la filtration de Harder-Narasimhan peut aussi se décrire, comme ci-dessus, en

ASTÉRISQUE 422

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

27

terme des sous-quotients Ei /Ei−1 et que les pentes successives du polygone canonique de E, construit comme dans l’appendice A en termes de l’envoppe convexe des points (rk F, deg F ) associés aux sous-fibrés vectoriels F de E, sont précisément les pentes (4.5). En particulier, la fonction P de [0, rk E] vers R associée par la construction de l’appendice A à (E (E), ⊂, rk , deg) — son graphe est le polygone canonique de E — est affine sur chaque intervalle [rk Ei , rk Ei−1 ] (i ∈ {1, . . . , N }) et satisfait P (rk Ei ) = deg Ei

pour tout i ∈ {0, . . . , N }.

On observera que E est semi-stable précisément lorsque sa filtration de HarderNarasimhan est triviale (N = 1), ou encore lorsque son polygone canonique est un segment de droite. En outre, on vérifie aisément que µmax (E) := µ(E1 ) = max µ(F ), 06=F ⊂E

µmin (E) := µ(EN /EN −1 ) =

min

F =F sat (E

µ(E/F ),

et que, si L est un fibré en droites sur C, µmax (E ⊗ L) = µmax (E) + deg L, µmin (E ⊗ L) = µmin (E) + deg L. Enfin, comme l’application (F 7−→ F ⊥ ) établit une bijection entre sous-fibrés vectoriels de E et sous-fibrés vectoriels de E ∨ , l’égalité (4.4) montre que, pour tout x ∈ [0, rk E], on a : (4.6)

PE ∨ (x) = PE (rk E − x) − deg E.

En particulier, les pentes de E ∨ sont les opposés des pentes de E ; notamment : µmin (E) = −µmax (E ∨ ). 4.3. Groupes de cohomologie et pentes Si E est un fibré vectoriel sur C, les groupes de cohomologie H i (C, E) sont des k-vectoriels de dimension finie, nuls si i > 1. On pose : hi (C, E) := dimk H i (C, E). Si ωC := Ω1C/k désigne le fibré en droite canonique de C, on dispose des isomorphismes de dualité de Serre : H i (C, E) ' Homk (H 1−i (C, E ∨ ⊗ ωC ), k) et donc des égalités de dimension : (4.7)

hi (C, E) = h1−i (C, E ∨ ⊗ ωC ),

où i = 0 ou 1.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

28

J.-B. BOST

Si g désigne le genre de C, défini comme g := h1 (C, OC ), la caractéristique d’EulerPoincaré de E est donnée par la formule de Riemann-Roch : (4.8) χ(C, E) := h0 (C, E) − h1 (C, E) = h0 (C, E) − h0 (C, E ∨ ⊗ ωC ) = deg E + rk E (1 − g). La formule de Riemann-Roch implique notamment la minoration (inégalité de Riemann) : (4.9)

h0 (C, E) ≥ deg E + rk E (1 − g).

En particulier, si E est non nul et si µ(E) + 1 − g > 0, alors H 0 (C, E) 6= {0}. On en déduit aussitôt que si E est un fibré vectoriel non nul sur C tel que µmax (E) > g − 1, alors H 0 (C, E) 6= {0}. Inversement, si H 0 (C, E) 6= {0}, c’est-à-dire s’il existe un morphisme injectif de faisceaux de OC -modules s : OC −→ E, on a alors : µmax (E) ≥ µ(OC ) = 0. Supposons maintenant que C est muni d’un diviseur D de degré 1 (10). Pour tout n ∈ Z, nous pouvons considérer le fibré vectoriel E(nD) := E ⊗ OC (nD). Il satisfait à µmax (E(nD)) = µmax (E) + n. Les observations précédentes, appliquées aux fibrés vectoriels E(nD), impliquent aussitôt : Proposition 4.1. — Pour tout fibré vectoriel E de rang non nul sur C, il existe un entier s0 (E) tel que, pour tout k ∈ Z, H 0 (C, E(−kD)) = {0} ⇐⇒ k > s0 (E). De plus, (4.10)

µmax (E) − g ≤ s0 (E) ≤ µmax (E).

On en déduit, par dualité de Serre : Proposition 4.2. — Pour tout fibré vectoriel E de rang non nul sur C, il existe un entier s1 (E) tel que, pour tout k ∈ Z, H 1 (C, E(kD)) = {0} ⇐⇒ k > s1 (E). On a : s1 (E) = s0 (E ∨ ⊗ ωC ) (10)

Un tel diviseur existe notamment lorsque le corps k est algébriquement clos (il suffit alors de prendre pour D le diviseur défini par un point de C(k)) et lorsque k est fini.

ASTÉRISQUE 422

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

29

et −µmin (E) + g − 2 ≤ s1 (E) ≤ −µmin (E) + 2g − 2. On observera que, d’après la formule de Riemann-Roch, pour tout entier k > s1 (E), on a : (4.11)

h0 (C, E(kD)) = rk E(k + 1 − g) + deg E.

En outre, pour tout k ∈ Z, s0 (E(kD)) = s0 (E) + k

et s1 (E(kD)) = s1 (E) − k.

5. L’ANALOGIE ENTRE RÉSEAUX EUCLIDIENS ET FIBRÉS VECTORIELS SUR LES COURBES L’un des avatars de l’analogie entre corps de nombres et corps de fonctions algébriques d’une variable est l’analogie entre réseaux euclidiens et fibrés vectoriels sur une courbe C, projective, lisse et géométriquement irréductible sur un corps k. Dans cette analogie, le corps Q tient la place du corps K := k(C), et l’ensemble des places de Q (qui s’identifie à la réunion disjointe des points fermés de Spec Z — autrement dit, des nombres premiers — et de la place archimédienne de Q, définie par la valeur absolue usuelle) tient le rôle de l’ensemble des points fermés de C. En particulier, le Q-vectoriel EQ associé à un réseau euclidien E tient la place de la fibre EK d’un fibré vectoriel E au point générique de C ; les réseaux euclidiens F associés à des sous-Z-modules F de E (resp. à des sous-Z-modules saturés) jouent le rôle des sous-faisceaux cohérents (resp. des sous-fibrés vectoriels) de E, et les suites exactes courtes admissibles de réseaux euclidiens (1.5) celui des suites exactes courtes de fibrés vectoriels sur C. Sous une forme parfois vague, ces analogies sont très anciennes (voir par exemple [71] et [24], Chapter I). Il est remarquable qu’elles puissent être étendue dans diverses directions, et, dans cette section, nous décrivons comment les diverses constructions discutées dans la section 4 admettent des analogues, souvent étonnamment précis, concernant les réseaux euclidiens. Il s’avère que l’invariant s1 (E) associé à un fibré vectoriel E dans le paragraphe 4.3 possède comme avatar dans le monde des réseaux euclidiens l’invariant ηε (E) introduit par Micciancio et Regev ([46]) sous le nom de smoothing parameter, ou plutôt une version logarithmique de ce dernier : (5.1)

s1θ,ε (E) := log ηε (E).

Ces auteurs étaient motivés, non par l’analogie entre corps de nombres et corps de fonctions, mais par les applications des réseaux euclidiens à la cryptographie : le

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

30

J.-B. BOST

smoothing parameter ηε (E) d’un réseau euclidien E := (E, k.k) est le réel λ tel que la mesure X covol(E) δv v∈E

sur ER devienne, à un seuil ε > 0 fixé, « indiscernable » de la mesure de Lebesgue après convolution avec la mesure gaussienne centrée de variance λ−2 k.k2 sur ER . Formellement, ηε (E) est défini par l’égalité : (5.2)

θE ∨ (ηε (E)2 ) = 1 + ε.

L’article [46] montre aussi comment ce nouvel invariant intervient naturellement lorsque l’on étudie les invariants classiques des réseaux euclidiens par les techniques de Banaszczyk présentées dans la section 3. Le « smoothing parameter » ηε (E) s’est ensuite imposé comme un invariant fondamental dans les travaux consacrés aux réseaux euclidiens dans une perspective cryptographique (voir [16], [22], [21], [55], et notamment [1] pour des résultats et des références récentes). 5.1. Degré, pentes et semi-stabilité des réseaux euclidiens Dans l’analogie entre réseaux euclidiens et fibrés vectoriels sur une courbe C, le rang des premiers correspond évidemment au rang des seconds, et le degré d’Arakelov (1.6) (resp. la pente (1.7)) au degré (resp. à la pente). L’additivité (1.9) du degré d’Arakelov dans les suites exactes courtes admissibles est analogue à l’additivité (4.1) du degré des fibrés vectoriels sur les courbes. Aux morphismes ϕ : E1 −→ E2 de faisceaux de OC -modules entre deux fibrés vectoriels E1 et E2 sur C correspondent, deux réseaux euclidiens E 1 := (E1 , k.k1 ) et E 2 := E 2 , k.k2 ) étant donnés, les morphismes de Z-modules ϕ : E1 −→ E2 tels que, pour tout x ∈ E1,R , on ait : kϕ(x)k2 ≤ kxk1 . L’existence d’un tel morphisme tel que ϕQ : E1,Q −→ E2,Q soit un isomorphisme implique l’inégalité d E 1 ≤ deg d E2 deg entre degrés d’Arakelov. Bien entendu, alors que le degré des fibrés vectoriels prend des valeurs entières, le degré d’Arakelov des réseaux prend des valeurs réelles arbitraires. Dans sa note [64], Stuhler a observé que le degé d’Arakelov satisfait aussi à une propriété de sous-addivité analogue à (4.3) et que cela permet d’associer à tout réseau euclidien une filtration canonique, à la Harder-Narasimhan. Précisément, si E := (E, k.k) est un réseau euclidien, alors, pour tout couple (F1 , F2 ) de sous-Z-modules de E, l’inégalité suivante est satisfaite : (5.3)

ASTÉRISQUE 422

d F1 ∩ F2 + deg d F1 + F2 ≥ deg d F 1 + deg d F 2. deg

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

31

En effet, la suite exacte courte de Z-modules 0 −→ F1 ∩ F2 −→ F1 ⊕ F2 −→ F1 + F2 −→ 0, définie par l’application somme de F1 ⊕ F2 vers F1 + F2 , détermine un isomorphisme de Z-modules libres de rang 1 : ∼

ϕ : Λmax F1 ⊗ Λmax F2 ' Λmax (F1 ⊕ F2 ) −→ Λmax (F1 ∩ F2 ) ⊗ Λmax (F1 + F2 ), et par définition du degré d’Arakelov, on a : d F1 ∩ F2 + deg d (F1 + F2 ) − deg d F 1 + deg d F 2 = log kϕR k−1 , deg où kϕR k désigne la norme de l’isomorphisme ∼

ϕR : Λmax F1,R ⊗R Λmax F2,R −→ Λmax (F1,R ∩ F2,R ) ⊗R Λmax (F1,R + F2,R ) lorsque l’on muni les puissances extérieures de F1,R , . . . des structures euclidiennes qui se déduisent de celles définies par la norme euclidienne k.k sur ER . Or cette norme (11) est toujours ≤ 1, comme on le voit en l’exprimant au moyen de bases orthonormées idoines de F1,R et F2,R . Lorsque les sous-Z-modules F1 et F2 sont saturés dans E, F1 ∩ F2 l’est encore et (5.3) implique aussitôt : (5.4)

d (F1 + F2 )sat ≥ deg d F 1 + deg d F 2. d F1 ∩ F2 + deg deg

Si E est un réseau euclidien de rang n > 0, on peut alors appliquer le formalisme des pentes présenté dans l’appendice A à l’ensemble ordonné (E (E), ⊆) des sousd F ). La Z-modules de E muni de l’inclusion et aux fonctions r := rk et d := (F 7→ deg propriété de monotonie (1) de l’appendice A est en effet immédiate ; l’inégalité (5.3) d F, établit la sous-additivité (2), et la finitude (3) découle de l’interprétation de − deg pour un sous-Z-module saturé F de E, comme hauteur logarithmique du point de Plücker dans P(Λrk F EQ ) associé au sous-Q-vectoriel FQ de EQ . On attache ainsi à E une application PE : [0, n] −→ R concave et affine sur chaque intervalle [i − 1, i], 1 ≤ i ≤ rk E. Le graphe de E est le d ) des polygone canonique de E ; ses sommets sont les images par l’application (rk , deg sous-réseaux E i , 0 ≤ i ≤ N, associés à une filtration canonique de E, E0 = 0 ( E1 ( · · · ( EN = E, (11)

Lorsque F1 et F2 sont de rang 1 et que F1 ∩ F2 = {0}, cette norme est | sin α|, où α désigne l’angle des deux droites F1,R et F2,R dans l’espace euclidien (ER , k.k). En général, kϕR k admet une interprétation géométrique analogue ; cf. [60], Part II.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

32

J.-B. BOST

par des sous-Z-modules saturés. On obtient encore PE et la filtration canonique en appliquant le formalisme des pentes au sous-ensemble Esat (E) de E (E) défini comme l’ensemble des sous-Z-modules saturés de E. Comme dans la situation géométrique, le réseau euclidien E est dit semi-stable lorsque tout sous-Z-module (ou de façon équivalente, tout sous-Z-module saturé) non nul F de E satisfait à µ b(F ) ≤ µ b(E), c’est-à-dire lorsque la filtration canonique de E est triviale, ou encore lorsque son polygone canonique est un segment de droite. La semi-stabilité d’un réseau euclidien E est inchangée par changement d’échelle, c’est-à-dire lorsque l’on remplace E par E ⊗ O (λ), λ ∈ R. Ici encore, l’additivité du degré d’Arakelov dans les suites exactes courtes admissibles (1.9) montre que les réseaux euclidiens sous-quotients Ei /Ei−1 attachés à la filtration canonique de E sont semi-stables, de pentes strictement décroissantes : µ b(E 1 ) > µ b(E2 /E1 ) > · · · > µ(EN /EN −1 ). Pour tout k ∈ {1, . . . , n}, la k-ième pente de E est la pente de PE sur [k − 1, k] : µ bk (E) := PE (k) − PE (k − 1). On a par construction (12) : µ b1 (E) ≥ · · · ≥ µ bn (E) et

n X

d E. µ bi (E) = deg

i=i

On définit encore : b1 (E) = µ b(E 1 ) = max µ b(F ) µ bmax (E) := µ 06=F ⊂E

et µ bmin (E) := µ bn (E) = µ b(E N /E N −1 ) =

min

F =F sat (E

µ b(E/F ).

On voit facilement, en utilisant encore l’additivité du degré d’Arakelov, qu’une somme directe de réseaux euclidiens semi-stables de même pente µ est encore semistable de pente µ. Les pentes des sommes directes de réseaux euclidiens de rang 1 se calculent aisément. Avec les notations du paragraphe 2.2, il vient : n M O (ti )) = tk . (5.5) µ bk ( i=1 (12) Cette suite est la suite des pentes µ b(Ei /Ei−1 ) de la filtration canonique, chacune répétée rk (Ei /Ei−1 )-fois.

ASTÉRISQUE 422

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

33

Les égalités (2.2) et (5.5) montrent ainsi que, lorsque E est une somme directe de réseaux euclidiens de rang 1, µ bk (E) et log λk (E)−1 coincident. Par ailleurs, la validité de la proposition 2.1 lorsque ψ = µ b entraîne aisément sa validité pour chacune des pentes µ bi , 1 ≤ i ≤ n. En faisant appel à la théorie de la réduction, comme dans le paragraphe 2.5, on en déduit que pour tout entier n > 0, il existe c(n) ∈ R+ , tel que, pour tout réseau euclidien E de rang n et tout i ∈ {1, . . . , n}, on ait : |b µi (E) − log λi (E)−1 | ≤ c(n).

(5.6)

(Voir par exemple [10].) Les pentes successives de E apparaissent ainsi comme des avatars des (logarithmes des inverses) de ses minima successifs. Les propriétés formelles des pentes sont toutefois plus satisfaisantes que celles de ces derniers. Par exemple, en utilisant la compatibilité du degré d’Arakelov et des suites exactes courtes admissibles à la dualité (cf. 1.3.1 et 1.3.2), on obtient par un argument analogue à celui conduisant à (4.6) : d E. PE ∨ (x) = PE (n − x) − deg Ainsi les inégalités de transférence du type (1.15) reliant les minima successifs d’un réseau euclidien et de son dual prennent la forme d’égalités entre pentes : ∨

µn+1−i (E) pour tout i ∈ {1, . . . , n}. µ bi (E ) = −b En particulier, en faisant i = n, on trouve : ∨

µ bmin (E ) = −b µmax (E). Il est immédiat que, pour tout entier n > 0, la partie S tn de Rn paramètrant les réseaux euclidiens semi-stables est fermée. Compte-tenu de (5.6) (avec i = 1), le critère de Mahler (théorème 2.4) montre que l’intersection 0

S tn

:= S tn ∩ Rn0 ,

qui paramètre les réseaux euclidiens semi-stables de rang n et de pente nulle, est compacte. Il est facile de décrire le bord de S tn dans Rn (voir par exemple [28]) : Proposition 5.1. — Soit E un réseau euclidien de rang n > 0 semi-stable. Les conditions suivantes sont équivalentes : (1) La classe [E] de E dans Rn appartient au bord ∂ S tn := S tn \S˚tn du fermé S tn . (2) Il existe un sous-Z-module saturé F dans E tel que 0 < rk F < rk E

et

µ b(F ) = µ b(E).

Lorsque ces conditions sont réalisées, F et E/F sont des réseaux euclidiens semistables (de même pente µ b(E)).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

34

J.-B. BOST

Cet énoncé reste valable lorsque l’on remplace Rn (resp. S tn ) par Rn0 (resp. S t0n ). (On a alors µ b(E) = µ b(E/F ) = µ b(E) = 0.) Signalons aussi que les domaines de l’espace Rn définis par des inégalités sur les pentes des réseaux euclidiens apparaissent dans les travaux sur la formule des traces d’Arthur-Selberg, dans le contexte plus général des quotients arithmétiques associés à des Q-groupes réductifs arbitraires. En fait, les constructions géométriques qui sous-tendent les opérations de troncature mises en oeuvre dans la formule des traces apparaissent comme une généralisation du formalisme des pentes décrit dans ce paragraphe (voir notamment [4], Section 6, et comparer à [29] et [33] ; voir aussi [13]). Mentionnons enfin les beaux résultats de Shapira et Weiss ([62], [63]) concernant les propriétés géométriques et dynamiques du lieu semi-stable S t0n dans Rn0 et leurs applications à des questions classiques de géométrie des nombres. 5.2. Les invariants h0Ar (E), h0θ (E) et h1θ (E) Dans la littérature apparaissent plusieurs invariants des réseaux euclidiens qui jouent le rôle de la dimension h0 (C, E) de l’espace des sections d’un fibré vectoriel E sur une courbe C ou de la dimension h1 (C, E) de son premier groupe de cohomologie. 5.2.1. L’invariant h0Ar (E). — Avec les notations de la section 4, le k-vectoriel H 0 (C, E) s’identifie au k-vectoriel HomOC (OC , E) des morphismes de faisceaux de OC -modules de OC vers E. Lorsque le corps k est fini, de cardinal q, c’est un ensemble fini et l’on a : log | HomOC (OC , E)| h0 (C, E) = dimk HomOC (OC , E) = . log q Cela conduit à considérer l’ensemble des morphismes de O (0) = (Z, |.|) vers un réseau euclidien E := (E, k.k) — il s’identifie à l’ensemble fini E ∩ B k.k (0, 1) des points du réseau dans la boule unité de (ER , k.k) — puis à poser : h0Ar (E) := log |E ∩ B k.k (0, 1)|.

(5.7)

Cette définition apparaît implicitement chez Weil [71] et Arakelov [3] et plus explicitement dans les présentations de la géométrie d’Arakelov dans [65] et [41] (voir aussi [27]). 5.2.2. Les invariants h0θ (E) et h1θ (E). — On peut aussi former la série thêta θE associée à un réseau euclidien E := (E, k.k) : X 2 θE (t) := e−πtkvk pour tout t ∈ R∗+ , v∈E

(cf. 1.3.3 supra) et poser : (5.8)

h0θ (E) := log θE (1) = log

X v∈E

ASTÉRISQUE 422

2

e−πkvk ∈ R+ .

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

35

Le fait que l’invariant h0θ (E) ainsi associé à un réseau euclidien soit l’analogue de l’invariant h0 (C, E) associé à un fibré vectoriel sur une courbe est une découverte de l’école de théorie des nombres allemande, et remonte au moins à F. K. Schmidt. En effet, si l’on compare les démonstrations, dues respectivement à Hecke ([34]) et à Schmidt ([59]) du prolongement analytique et de l’équation fonctionnelle de la fonction zêta associée à un corps de nombres et au corps de fonctions K := k(C) associé à une courbe (projective, lisse, géométriquement connexe) sur un corps fini de cardinal q, on voit que les quantités X 2 e−πkvk v∈E

associées à une réseau euclidien E := (E, k.k) jouent le même rôle que les expressions 0

qh

(C,E)

.

Un point clé de la démonstration de Schmidt est en fait que la formule de RiemannRoch pour un fibré (en droites) sur une courbe y joue un rôle comparable à la formule de Poisson (1.13), qui relie θE et θE ∨ . Cette formule, évaluée en t = 1, devient en effet : θE (1) = (covol(E))−1 θE ∨ (1) et peut encore s’écrire : (5.9)

∨ d E. h0θ (E) − h0θ (E ) = deg

Cette égalité est formellement analogue à la formule de Riemann-Roch sur une courbe C de genre 1 (donc de fibré canonique trivial), et conduit à poser : ∨

h1θ (E) := h0θ (E ), de sorte que (5.9) devienne la formule de « Poisson-Riemann-Roch » : (5.10)

d E. h0θ (E) − h1θ (E) = deg

Au cours des dernières décennies, ces définitions sont apparues notamment dans le journal mathématique de Quillen [53] (voir les entrées des 24/12/1971, 26/04/1973 et 01/04/1983), dans [56], [50], et plus récemment dans les articles de van der Geer et Schoof [26] et Groenewegen [30]. 5.2.3. Varia. — Il est rassurant de savoir que l’on peut réconcilier les définitions (5.7) et (5.8) des invariants h0Ar (E) et h0θ (E), l’un et l’autre candidats à tenir la place de h0 (C, E) pour les réseaux euclidiens. En premier lieu, pour tout réseau euclidien E de rang n > 0, on peut établir les inégalités : −π ≤ h0θ (E) − h0Ar (E) ≤ (n/2) log n + log(1 − 1/2π)−1 .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

36

J.-B. BOST

La première inégalité est immédiate, et la seconde se démontre au moyen des techniques de Banaszczyk présentées en section 3 (voir [11], section 3). En outre, on peut relier h0θ (E) à une version « stable » de l’invariant h0Ar (E) et établir l’énoncé suivant par un argument de grandes déviations : Proposition 5.2 ([11], Theorem 3.4.5). — Pour tout t ∈ R∗+ , posons : h0Ar (E, t) := log |{v ∈ E | kvk2 ≤ t}|. Alors, pour tout t ∈ R∗+ , la limite suivante existe dans R+ : ˜ 0 (E, t) := lim 1 h0 (E ⊕n , nt). h Ar Ar n→+∞ n ˜ 0 (E, t) se déduisent De plus, les fonctions log θE (β)(= h0θ (E ⊗ O ((1/2) log β −1 )) et h Ar l’une de l’autre par dualité de Legendre ; à savoir, pour tout x ∈ R∗+ , on a : ˜ 0 (E, x) = inf (πβx + log θ (β)) h Ar E β>0

et, pour tout β ∈ R∗+ : ˜ 0 (E, x) − πβx). log θE (β) = sup(h Ar x>0

Nous renvoyons à [11], Chapter 3 et Appendix A, pour la démonstration et pour divers développements de ce résultat. Rappelons aussi que les réseaux euclidiens ne sont que le cas particulier, correspondant au corps K = Q, des fibrés vectoriels hermitiens sur Spec OK , attachés à un corps de nombres K. L’analogie entre fibrés vectoriels sur une courbe et réseaux euclidiens s’étend en une analogie entre fibrés vectoriels sur une courbe et fibrés vectoriels hermitiens sur Spec OK , où K est un corps de nombres arbitraire. Cela constitue en fait son cadre naturel : travailler avec des corps de nombres K arbitraires correspond à considérer des courbes C de genre g ≥ 1 quelconques. Les invariants hiθ (E) s’étendent à ce cadre (qui était déjà en substance celui de [34]). Nous renvoyons à [11], Chapter 2, pour leur étude dans cette situation plus générale. Soulignons enfin que les séries thêta (1.14) associées aux réseaux euclidiens apparaissent dans divers domaines des mathématiques et de la physique mathématique, et ont donné lieu à de multiples travaux, dans des perspectives très diverses. Citons par exemple les travaux sur les valeurs extrémales des fonctions thêta, inspirés par la théorie classique des formes modulaires ou automorphes (sur lesquels on pourra consulter [58] et ses références), les travaux sur le « Gaussian core model » , motivés par l’étude des empilements de sphères et la physique statistique ([17]) et divers travaux de cristallographie et de physique du solide (voir par exemple [8]).

ASTÉRISQUE 422

(1151)

37

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

5.3. Les analogies entre h0θ (E) et h0 (C, E) Une différence, qui peut sembler de taille, entre les invariants h0θ (E) et h1θ (E) des réseaux euclidiens et des dimensions h0 (C, E) et h1 (C, E) des groupes de cohomologie des fibrés vectoriels est que les premiers sont réels, alors que ces derniers sont entiers, et que, lorsque E est de rang non nul, les premiers ne sont jamais nuls. Ceci étant, les analogies entre les propriétés des uns et des autres sont particulièrement frappantes. Nous allons en décrire trois, par ordre chronologique et de difficulté croissante. 5.3.1. Comportement asymptotique de log θE . — À partir de l’égalité Z 2 e−πkxk dmE (x) = 1, ER

en approchant l’intégrale par des « sommes de Riemann » sur le réseau t ∈ R∗+ tend vers 0, on obtient : X √ rk E 2 lim t covol(E) e−πtkvk = 1, t−→0+



tE, où

v∈E

ou encore : (5.11)

d E + o(1) quand t −→ 0+ . log θE (t) = −(rk E)/2 log t + deg

En posant λ = −1/2 log t, on obtient donc : d E + ε(λ) avec limλ→+∞ ε(λ) = 0. h0θ (E ⊗ O (λ)) = rk E λ + deg Ainsi reformulée, l’expression asymptotique (5.11) de θE (t) près de 0 devient l’analogue de l’expression (4.11) pour le « polynôme de Hilbert » d’un fibré vectoriel sur une courbe de genre g = 1. L’expression (5.11) est aussi une conséquence de la formule de Poisson (1.13), qui montre en outre que le terme d’erreur ε(λ) décroit extrêmement rapidement à l’infini : il existe c ∈ R∗+ tel que, lorsque λ −→ +∞, 2λ

ε(λ) = O(e−ce ). 5.3.2. Suites exactes courtes admissibles et invariants thêta. — Une seconde analogie entre les propriétés de h0θ (E) et de h0 (C, E) concerne leur compatibilité avec les sommes directes et, plus généralement, les suites exactes courtes : Proposition 5.3. — (1) Si E 1 et E 2 sont deux réseaux euclidiens, on a : (5.12)

h0θ (E 1 ⊕ E 2 ) = h0θ (E 1 ) + h0θ (E 2 ).

(2) Pour toute suite exacte courte admissible de réseaux euclidiens i

p

0 −→ F −→ E −→ E/F −→ 0,

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

38

J.-B. BOST

on a : h0θ (E) ≤ h0θ (F ) + h0θ (E/F ).

(5.13)

L’égalité (5.12) est immédiate. L’inégalité (5.13) découle aisément de (3.1), qui montre que, pour tout α ∈ E/F , X

2

e−πkvkE ≤ e

−πkαk2E/F

v∈p−1 (α)

X

2

e−πkf kF

f ∈F

et a été observée par Quillen ([53], entrée du 26/04/1973) et Groenewegen ([30], Lemma 5.3). 5.3.3. Un théorème de Regev et Stephens-Davidowitz. — Reprenons les notations de la section 4. Soient E un fibré vectoriel sur C et F1 et F2 deux sous-faisceaux cohérents de E. On peut former une suite exacte courte de fibrés vectoriels sur C : 0 −→ F1 ∩ F2 −→ F1 ⊕ F2 −→ F1 + F2 −→ 0, où le morphisme de F1 ⊕ F2 vers F1 + F2 est l’application l’application somme. On en déduit aussitôt une suite exacte de k-vectoriels de dimension finie : 0 −→ H 0 (C, F1 ∩ F2 ) −→ H 0 (C, E1 ) ⊕ H 0 (C, E2 ) −→ H 0 (C, F1 + F2 ), puis l’inégalité suivante entre leurs dimensions : h0 (C, F1 ) + h0 (C, F2 ) ≤ h0 (C, F1 ∩ F2 ) + h0 (C, F1 + F2 ). En réponse à une question de McMurray Price (voir [44]), Regev et StephensDavidowitz ont montré qu’un telle inégalité reste valide ne varietur pour les réseaux euclidiens et leurs invariants h0θ : Théorème 5.4 ([54]). — Soit E un réseau euclidien et soit F1 et F2 deux sousZ-modules de E. On a alors : h0θ (F 1 ) + h0θ (F 2 ) ≤ h0θ (F1 ∩ F2 ) + h0θ (F1 + F2 ). Nous renvoyons à [54] pour la démonstration, élémentaire mais extrêmement ingénieuse.

ASTÉRISQUE 422

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

39

5.4. Les invariants s0θ,ε (E) et s1θ,ε (E) 5.4.1. Définitions. — Soit E un réseau euclidien de rang > 0. Il est immédiat que la fonction θE est un difféomorphisme analytique décroissant de R∗+ sur ]1, +∞[. Pour tout ε > 0, on peut donc définir 1 −1 s0θ,ε (E) := log θE (1 + ε) 2 et 1 −1 s1θ,ε (E) := log θE ∨ (1 + ε), 2 −1 où θE ∨ désigne le difféomorphisme inverse de θE ∨ pour la composition. Ainsi, pour tout λ ∈ R, on a : λ > s0θ,ε (E) ⇐⇒ θE (e2λ ) < 1 + ε ⇐⇒ h0θ (E ⊗ O (−λ)) < log(1 + ε) et λ > s1θ,ε (E) ⇐⇒ θE ∨ (e2λ ) < 1 + ε ⇐⇒ h1θ (E ⊗ O (λ)) < log(1 + ε). De plus on a : ∨

s1θ,ε (E) = s0θ,ε (E ) et, pour tout δ ∈ R, s0θ,ε (E ⊗ O (δ)) = s0θ,ε (E) + δ

et s1θ,ε (E ⊗ O (δ)) = s1θ,ε (E) − δ.

Comme indiqué dans l’introduction de cette section, l’invariant s1θ,ε (E) est une version logarithmique du « smoothing parameter » ηε (E) introduit par Micciancio et Regev dans [46] (cf. (5.1) et (5.2) supra). Les invariants ηε (E) et siθ,ε dépendent du paramètre ε. Le choix de ce paramètre est anodin, du moins pour les applications de ces invariants décrites dans cet exposé. En effet, si ε et ε0 sont deux réels dans ]0, 1[, il existe c(ε, ε0 ) ∈ R+ tel que, pour tout réseau euclidien E de rang non nul, on ait : |siθ,ε0 (E) − siθ,ε (E)| ≤ c(ε, ε0 ). Cela résulte de l’énoncé plus précis suivant : Proposition 5.5 ([16], Section 2). — Pour tout réseau euclidien E de rang non nul, siθ,ε est une fonction décroissante de ε ∈ R∗+ , et siθ,ε −(1/2) log log ε−1 est une fonction croissante de ε ∈ ]0, 1[. Démonstration. — La première assertion est évidente. La seconde découle de l’inégalité, valable pour tout x ∈ R∗+ et tout t ∈ [1, +∞[, θE (tx) − 1 ≤ (θE (x) − 1)t . Dans la suite, comme dans [55], nous choisirons ε = 1/2.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

40

J.-B. BOST

5.4.2. Reformulation du théorème 1.3. — En terme des invariants s0θ ,1/2 (E) et s1θ ,1/2 (E), on peut reformuler le théorème 1.3 de la manière suivante : Théorème 5.6. — Pour tout réseau euclidien E de rang n > 0, on a : bmax (E) + t(n), s0θ ,1/2 (E) ≤ µ

(5.14)

où l’on a posé t(n) := log[10(log n + 2)]. De façon équivalente, on a : s1θ ,1/2 (E) ≤ −b µmin (E) + t(n).

(5.15)

Le théorème 1.3 apparaît ainsi comme un avatar, concernant les réseaux euclidiens, de la seconde inégalité dans l’encadrement (4.10) de l’invariant s0 (E) associé à une fibré vectoriel E sur une courbe. Observons que la première inégalité dans (4.10) se transpose aussitôt, en mimant sa démonstration, aux réseaux euclidiens : de la minoration h0θ (E) ≥ µ bmax (E)+ , conséquence de la « formule de Poisson-Riemann-Roch » (5.10) valable pour tout réseau euclidien E de rang > 0, on déduit aisément que, pour tout ε ∈ R∗+ , (5.16)

µ bmax (E) − log(1 + ε) ≤ s0θ,ε (E).

Par dualité, on en déduit : −b µmin (E) − log(1 + ε) ≤ s1θ,ε (E). La dépendance en la dimension n du réseau E dans l’inégalité (5.14) est asymptotiquement d’un ordre de grandeur optimal. En effet, lorsque E est le « réseau euclidien trivial de rang n » O (0)⊕n , défini par le réseau Zn dans Rn muni de la norme standard k.kst , on voit aisément que µ bmax (E) = 0 (E est un réseau semi-stable de pente nulle) et que s0θ ,1/2 (E) = (1/2) log log n + O(1) lorsque n −→ +∞. 5.4.3. Les invariants s0θ,ε (E) et s1θ,ε (E) et la méthode de Banaszczyk. — Les ∨

invariants ηε (E) et ηε (E ), ou de façon équivalente s1θ,ε (E) et s0θ,ε (E), se révèlent particulièrement utiles pour formuler les inégalités sur les invariants classiques des réseaux euclidiens obtenues par la méthode de Banaszczyk. Les deux propositions suivantes illustrent ce principe. Proposition 5.7 ([46], Lemma 3.2). — Pour tout réseau euclidien de rang n > 0, on a : (5.17)

ASTÉRISQUE 422



s1θ,2−n (E) ≤ (1/2) log n + log λ1 (E )−1 .

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

41

Démonstration. — Si l’on pose ∨

λ := (1/2) log n + log λ1 (E )−1 , l’inégalité (5.17) est équivalente à : θE ∨ ⊗O(−µ) (1) ≤ 1 + 2−n . Or ∨



λ1 (E ⊗ O (−λ)) = eλ λ1 (E ) =



n>

» n/2π. ∨

Le corollaire (3.4) s’applique donc au réseau euclidien E ⊗ O (−λ) et montre donc que : √ θE ∨ ⊗O(−λ) (1) ≤ (1 − β( 2π)n )−1 . On conclut en observant que √ √ β( 2π) = 2πe e−π = 0, 1786 . . . < 1/4. Proposition 5.8 ([55], Lemma 6.1). — Pour tout réseau euclidien E de rang n > 0, on a : » (5.18) log Rcov (E) ≤ log(1 + n/2π) + s1θ ,1/2 (E). Démonstration. — Comme log Rcov (E ⊗ O (δ)) = log Rcov (E) − δ et s1θ,ε (E ⊗ O (δ)) = s1θ,ε (E) − δ, il suffit de montrer que » Rcov (E) ≤ 1 + n/2π lorsque s1θ ,1/2 (E) ≤ 0, c’est-à-dire lorsque θE ∨ (1) ≤ 3/2, ce que nous supposons désormais. p n/2π, puis poser Clairement, nous pouvons aussi supposer que Rcov (E) ≥ p ˜ ˜ Rcov (E) = n/2π R, avec R ∈ [1, +∞[. L’inégalité (3.10) du corollaire (3.5) montre alors que ˜ n ≥ 2θ ∨ (1)−1 − 1 ≥ 1/3. β(R) E

Avec les notations du paragraphe 3.2, on en déduit que » ˜ ≤ β −1 (3−1/n ) =: tn ≤ 1 + (log 3)/n. R On déduit que Rcov (E) ≤

»

» n/2π +

log 3/2π ≤ 1 +

» n/2π.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

42

J.-B. BOST

6. À PROPOS DE LA DÉMONSTRATION DU THÉORÈME 1.3 Dans cette section, nous présentons les grandes lignes de la démonstration du théorème 1.3. Cette démonstration fait intervenir des résultats profonds de « géométrie gaussienne » concernant les propriétés des mesures gaussiennes des domaines convexes de Rn , notamment leurs propriétés d’isopérimétrie. Nous renvoyons à l’article [38] et l’exposé [43] dans ce séminaire pour des présentations générales de ce sujet. 6.1. Préliminaires 6.1.1. Mesures gaussiennnes et parties G-isotropes de Rn . — Pour tout entier naturel n et pour tout s ∈ R∗+ , on définit la mesure de probabilité gaussienne γs sur Rn par l’égalité suivante, pour toute partie borélienne S de ER : Z 2 2 γs (S) := s−n e−πkxk /s dm(x), S

où m désigne la mesure de Lebesgue sur Rn . L’inégalité e−πkxk

2

/s2 −πkyk2 /s2

e

≤ (1/2)(e−πky−xk

2

/s2

+ e−πky+xk

2

/s2

)

montre que, pour toute partie borélienne symétrique par rapport à l’origine S dans Rn et tout y ∈ Rn , on a : γs (S + y) ≥ e−πkyk

(6.1)

2

/s2

γs (S).

Si x = (xi )1≤i≤n est un élément de Rn , vu comme vecteur colonne, on peut former la matrice symétrique x · t x = (xi xj ) ∈ Mn (R). On dira qu’une partie borélienne S de Rn est G-isotrope de paramètre s lorsque Z Z 2 2 x · t x dγs (x) := s−n e−πkxk /s x · t x dm(x) ∈ R∗+ In , S

S

où In := (δij )1≤i,j≤n . Cette notion est notamment étudiée dans [9]. 6.1.2. Domaines de Voronoï. — Rappelons que le domaine de Voronoï V (E) d’un réseau euclidien E est le polytope convexe symétrique V (E)

:= {x ∈ ER | ∀e ∈ E, kxk ≤ kx − ek}.

La géométrie de ces polytopes est l’un des objets d’étude des mémoires [67] et [69]. Soulignons leur complexité lorsque n := rk E est grand : comme le montre Voronoï, V (E) possède au plus (n + 1)! sommets et 2(2n − 1) faces de dimension n − 1, et ces bornes sont atteintes. Le nombre de types combinatoires possibles pour ces polytopes, même dans la situation primitive considérée par Voronoï, augmente rapidement avec n.

ASTÉRISQUE 422

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

43

Si F est une face de dimension n−1 de V (E), il existe un unique vecteur v ∈ E \{0} tel que F soit inclus dans l’hyperplan affine médiateur de 0 et v, Hv := {x ∈ ER | kxk = kx − vk} = {x ∈ ER | 2hv, xi = kvk2 }. La face F contient v/2 ; la face opposée −F est associée au vecteur −v : −F ⊂ −Hv = H−v et se déduit aussi de F par la translation (x 7→ x − v) : F − v = −F. Cela montre que F est invariante par la symétrie (x 7→ v − x) de centre v/2. À un ensemble Lebesgue-négligeable (contenu dans ∂ V (E)) près, le domaine de Voronoï V (E) est un domaine fondamental pour l’action de E sur ER . De plus, si σ : ER /E −→ V (E) est une section borélienne de la restriction à V (E) de l’application quotient q : ER −→ ER /E, on a : kσ ◦ q(x)k ≤ kxk pour tout x ∈ ER . On en déduit : Proposition 6.1 ([55], Corollary 2.8). — Pour tout domaine fondamental ∆ pour l’action de E sur ER et toute fonction ϕ : R+ −→ R+ borélienne décroissante, on a : Z Z ϕ(kxk2 ) dmE (x) ≥ ϕ(kxk2 ) dmE (x). V (E)



Il découle aussitôt de la définition du rayon de recouvrement que Rcov (E) = max kxk. x∈V (E)

Ce maximum est atteint en un sommet de V (E). La construction de V (E) est clairement compatible aux sommes directes de réseaux euclidiens : si E 1 et E 2 sont deux réseaux euclidiens, alors V (E 1

⊕ E 2 ) = V (E 1 ) ⊕ V (E 2 ).

En particulier, on a : Rcov (E 1 ⊕ E 2 )2 = Rcov (E 1 )2 + Rcov (E 2 )2 . Considérons enfin une suite exacte courte de réseaux euclidiens i

p

0 −→ F ,−→ E −→ E/F −→ 0

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

44

J.-B. BOST

et notons s⊥ la section de pR : ER −→ ER /FR d’image le supplémentaire orthogonal de FR dans l’espace euclidien (ER , k.kE ). L’isomorphisme ∼

FR ⊕ (E/F )R −→ ER (x, y) 7−→ i(x) + s⊥ (y) est une isométrie qui envoie V (F ) × V (E/F ) sur le polytope ∆ := i(V (F )) + s⊥ (V (E/F )),

(6.2)

qui constitue ainsi un domaine fondamental (à une partie négligeable près) pour l’action de E sur ER . Cette construction montre en outre que (6.3) Rcov (E)2 ≤ max kzk2 = max kxk2 + max z∈∆

x∈V (F )

kyk2 = Rcov (F )2 + Rcov (E/F )2 .

y∈V (E/F )

6.2. Mesure gaussienne des domaines de Voronoï Les mesures gaussiennes γs et la notion de G-isotropie se transportent aussitôt sur l’espace euclidien sous-jacent à un réseau euclidien. Soit en effet E := (E, k.k) un réseau euclidien. On définit la mesure de probabilité gaussienne γs sur ER par l’égalité suivante, pour toute partie borélienne S de ER : Z 2 2 γs (S) := s−n e−πkxk /s dmE (x). S

Pour tout x ∈ ER , on note x · x l’élément x ⊗ hx, .iE de EndR (ER ) ' ER ⊗ ER∨ , et l’on dit que S est G-isotrope de paramètre s lorsque Z x · t x dγs (x) ∈ R∗+ IdER . t

S

La masse γs (V (E)) du domaine de Voronoï V (E) de E relativement à la mesure γs est un invariant remarquable de E, qui joue un rôle central dans la démonstration du théorème 1.3. Il a été considéré classiquement dans l’étude du « Gaussian channel coding problem » (voir [19], Chapter 3, Sections 1.3 and 1.4). Dans [16], Chung, Dadush, Liu et Peikert ont mis en évidence comment les mesures γs (V (E)) permettent ∨ de contrôler la fonction θE , ou de manière équivalente les invariantsηε (E ). Ils ont notamment établi l’inégalité suivante : Proposition 6.2 ([16], Lemma 3.4). — Pour tout réseau euclidien E et pour tout s ∈ R∗+ , on a : (6.4)

ASTÉRISQUE 422

θE (s−2 ).γs (V (E)) ≤ 1.

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

45

Démonstration. — L’inégalité (6.1) montre que, pour tout v ∈ E, on a : −2

e−πs

kvk2

γs (V (E)) ≤ γs (V (E) + v).

L’inégalité (6.4) en découle en sommant sur v ∈ E ; en effet, comme V (E) est un domaine fondamental pour l’action de E sur ER , on a : X γs (V (E) + v) = γs (Rn ) = 1. v∈E

Les mesures γs (V (E)) sont par ailleurs « surmultiplicatives » relativement aux suites courtes admissibles : Proposition 6.3 ([55], Proof of Prop. 4.14). — Pour toute suite exacte courte admissible de réseaux euclidiens 0 −→ F −→ E −→ E/F −→ 0 et pour tout s ∈ R∗+ , on a : (6.5)

γs (V (E)) ≥ γs (V (F )).γs (V (E/F )).

Démonstration. — Appliquer la proposition 6.1 avec pour ∆ le domaine fondamental 2 (6.2) et pour ϕ la fonction (t 7→ e−πt/s ). Le théorème 1.3 découlera de la minoration suivante de l’invariant γs−1 (V (E)) des réseaux euclidiens semi-stables : Théorème 6.4. — Pour tout réseau euclidien E de rang n > 0 semi-stable tel d (E) = 0, on a : que deg (6.6)

γt(n)−1 (V (E)) ≥ 2/3,

où l’on a posé : t(n) := 10(log n + 2). La démonstration de ce théorème fait l’objet des trois prochains paragraphes. La démonstration du théorème 1.3 à partir du théorème 6.4 sera enfin exposée au paragraphe 6.6.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

46

J.-B. BOST

6.3. Différentiation des intégrales sur les domaines de Voronoï Soit n un entier > 0 et soit f : R+ −→ R une fonction de classe C 1 . À tout réseau euclidien E de rang n, on peut associer le nombre réel Z F (E) := covol(E)−1 f (kxk2 )dmE (x). V (E)

Si νE désigne la mesure de Haar sur le groupe de Lie compact ER /E normalisée par νE (ER /E) = 1 et si δE : ER /E −→ R+ est la fonction définie par δE ([x]) := min kx − vk2 v∈E

pour tout x ∈ ER , on peut encore écrire : Z (6.7) F (E) = ER /E

f ◦ δE dνE .

Regev et Stephens-Davidowitz montrent que la fonction F ainsi définie est de classe C 1 sur Rn et calculent sa différentielle. Notons m la mesure de Lebesgue et k.kst la norme euclidienne standard sur Rn . Tout réseau Λ dans Rn défini un réseau euclidien (Rn , Λ, k.kst ), et nous poserons : covol(Λ) := covol(Rn , Λ, k.kst ) et V (Λ)

:= V (Rn , Λ, k.kst ).

En termes élémentaires, le résultat de différentiabilité mentionné plus haut s’énonce ainsi : Proposition 6.5. — Soit Λ un réseau de Rn . La fonction FΛ : GLn (R) −→ R définie par FΛ (g) := F (Rn , g.Λ, k.kst ) (6.8)

= covol(Λ)

−1

|det g|

−1

Z

f (kxk2st ) dm(x)

V (g.Λ)

est de classe C 1 . Sa différentielle en g ∈ GLn (R) est donnée par : Z (6.9) DFΛ (g).h = 2 covol(Λ)−1 |det g|−1 f 0 (kxk2st ) t x.hg −1 .x dm(x). V (g.Λ)

ASTÉRISQUE 422

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

47

Regev et Stephens-Davidowitz établissent ce résultat par une démonstration utilisant l’expression (6.8) de FΛ . La différentiabilité de FΛ écrite sous cette forme est délicate à établir, car le domaine d’intégration V (g.Λ) varie avec g. Il s’avère toutefois que les « contributions du bord » dans la variation première de FΛ (g) se compensent, grâce aux propriétés de symétrie des faces de V (g.Λ) que nous avons évoquées au paragraphe 6.1.2. Il est possible d’éviter ces arguments délicats en utilisant l’expression (6.7) de F (E) comme intégrale sur la variété compacte sans bord ER /E. Une difficulté pour établir la différentiabilité de F (ou encore de FΛ ) est que la fonction δE n’est pas de classe C 1 . On s’en affranchit en observant que FΛ est continue, puis en montrant que sa différentielle au sens des distributions est effectivement donnée par la formule (6.9) (on utilise pour cela que δE est lipschitzienne), puis en remarquant que cette différentielle est elle aussi continue sur GLn (R). Dans la suite, nous ferons appel à la proposition (6.5) avec pour f la fonction 2 (x 7→ e−πx/s ), où s ∈ R∗+ . Elle implique aussitôt : Corollaire 6.6. — Pour tout t ∈ R∗+ et tout entier n > 0, l’invariant γt−1 (V (E)), considéré comme fonction de [E] décrivant Rn , est une fonction de classe C 1 sur Rn . Si [E] est un point critique de la restriction de cette fonction à Rn0 , alors V (E) est G-isotrope de paramètre t dans (ER , k.kE ). 6.4. Mesures gaussiennes des parties compactes convexes symétriques G-isotropes Soit n un entier > 0 et soit t(n) := 10(log n + 2). Théorème 6.7. — Soit K une partie compacte convexe symétrique de Rn telle que m(K) ≥ 1. Si s ∈ ]0, t(n)−1 ] et si K est G-isotrope de paramètre s, alors γs (K) ≥ 2/3. Cet énoncé découle de résultats profonds de géométrie gaussienne. Nous nous contenterons de brèves indications sur sa démonstration, en renvoyant à [55], Section 4.1, pour les détails. D’une part, la G-isotropie de K implique que la mesure γs prend sur l’orbite de K sous SLn (R) une valeur maximale au point K : Proposition 6.8 ([9], Prop. 3.1). — Soit K une partie compacte convexe symétrique de Rn et soit s ∈ R∗+ tel que K soit G-isotrope de paramètre s. Alors, pour tout g ∈ SLn (R), γs (K) ≥ γs (g.K).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

48

J.-B. BOST

Cet énoncé est une conséquence du théorème de Cordero-Erausquin, Fradelizi et Maurey ([20]) affirmant, qui si l’on pose, pour t = (t1 , . . . , tn ) ∈ Rn , alors pour toute partie compacte convexe symétrique K de Rn , la mesure γs (exp ∆(t).K) est une fonction log-concave de t ∈ Rn . (Cet énoncé établit et généralise une conjecture proposée par Banaszczyk et popularisée dans [38] sous le nom de « (B) conjecture » ). On conclut la démonstration du théorème 6.7 au moyen du « théorème ``∗ » ([25], [40], [52]) qui permet de montrer que pour toute partie compacte convexe symétrique de Rn tel que m(K) = 1, il existe g ∈ SLn (R) tel que γt(n)−1 (g.K) ≥ 2/3. 6.5. Démonstration du théorème 6.4 Comme précédemment, on désigne encore par n un entier > 0 et l’on pose t(n) := 10(log n + 2). L’énoncé suivant découle immédiatement du corollaire 6.6 et du théorème 6.7. Corollaire 6.9. — Soit [E] un point de Rn0 en lequel γt(n)−1 (V (E)) atteint un extremum local. On a alors : γt(n)−1 (V (E)) ≥ 2/3.

(6.10)

La démonstration du théorème 6.4 va procéder par récurrence sur n. L’étape de récurrence fait encore appel à un résultat de géométrie gaussienne, à savoir à la conséquence suivante de l’inégalité isopérimérique gaussienne : Lemme 6.10. — Soit K une partie compacte convexe symétrique de Rn et soient t et r dans R∗+ tels que γt−1 (K) ≥ 2/3

et

B k.kst (0, r) ⊂ K.

Alors, pour tout τ ∈ R+ , γ(t+τ )−1 (K) ≥ 1 −

1 −πr2 τ 2 e . 3

Nous renvoyons à [55], Lemma 4.11, pour la preuve. Démonstration du théorème 6.4. — On considère la restriction de la fonction différentiable de [E] ∈ Rn0 définie par γt(n)−1 (V (E)) à la partie compacte S t0n de Rn0 . Il suffit d’établir la minoration (6.6) lorsque cette fonction atteint son minimum en [E], ce que nous supposons désormais. Lorsque [E] est un point intérieur de S t0n (considéré comme une partie de Rn0 ), cette minoration est un cas particulier du corollaire 6.9. Lorsque [E] est un point du bord de S t0n , il existe un sous-Z-module saturé F de E tel que 0 < rk F < rk E et que F et E/F soient semi-stables de pente nulle (cf. proposition 5.1). En particulier n > 1. On complète alors la démonstration par récurrence, en utilisant la surmultiplicativité (6.5) de γs (V (E)) et en faisant appel

ASTÉRISQUE 422

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

49

au lemme 6.10 pour contrôler γt(n)−1 (F ) et γt(n)−1 (E/F ) à partir de γt(rk F )−1 (F ) et γt(rk (E/F ))−1 (E/F ). 6.6. Démonstration du théorème 1.3 Expliquons maintenant comment déduire le théorème 1.3 du theorème 6.4. Soit donc E un réseau euclidien de rang n > 0. Nous devons montrer que, lorsque µ bmax (E) ≤ 0, alors on a : θE (t(n)2 ) ≤ 3/2, ou encore, de façon équivalente : h0θ (E ⊗ O (− log t(n))) ≤ log 3/2. Dans le cas particulier où E est semi-stable de pente 0, cela découle du théorème 6.4 et de l’inégalité (6.4). En général, on considère la filtration canonique de E, E0 = {0} ⊂ E1 ⊂ · · · ⊂ En = E, puis les réseaux euclidiens qui s’en déduisent comme sous-quotients et leurs pentes : F i := Ei /Ei−1

et µi := µ b(Ei /Ei−1 ),

i ∈ {1, . . . , N }.

Par hypothèse, on a : 0 ≥ µ1 > · · · > µN . D’après les propriétés de sous-additivité (Proposition 5.3) et de croissance de h0θ , il vient alors, pour tout λ ∈ R : h0θ (E ⊗ O (λ)) ≤

N X

h0θ (F i ⊗ O (λ))

i=1



N X

h0θ (F i

⊗ O (λ − µi )) ≤

! N M O (λ) ⊗ (F i ⊗ O (−µi )) .

h0θ

i=1

i=1

Comme le réseau euclidien de rang n défini par la somme directe N M (F i ⊗ O (−µi )) i=1

est semi-stable de pente nulle, on est ramené au cas particulier précédent.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

50

J.-B. BOST

7. LA CONJECTURE DE KANNAN-LOVÁSZ `2 Dans cette section, nous expliquons comment le théorème 1.3 implique la seconde inégalité (13) dans le théorème 1.4 : log Rcov (E) ≤ −b µKL (E) + log[10(log n + 10)3/2 ]

(7.1)

Cette implication fait l’objet de l’article [21] (où elle est établie avec des constantes moins précises) ; nous en exposons la présentation simplifiée qui figure dans [55], Section 6. Commençons par énoncer une conséquence immédiate de la proposition 5.8 et du théorème 1.3, sous la forme de l’inégalité (5.15) : Corollaire 7.1. — Pour tout réseau euclidien E de rang n > 0, on a : » µmin (E) + log[10(log n + 2)] + log(1 + n/2π). log Rcov (E) ≤ −b Pour tout entier n > 0, on pose : ccov (n) := max

max (log Rcov (E) − (1/2) log d).

1≤d≤n [E]∈S t0

n

Le corollaire 7.1 montre que : Ä √ √ ä ccov (n) ≤ max log[10(log d + 2)] + log(1/ 2π + 1/ n) 1≤d≤n

≤ log[4(log n + 2)]. L’inégalité (7.1) est une conséquence immédiate de cette majoration de ccov (n) et de la proposition suivante : Proposition 7.2. — Pour tout réseau euclidien de rang n > 0, on a : log Rcov (E) ≤ (1/2)(1 + log 2) + (1/2) logdlog(2n)e + ccov (n) − µ bKL (E). La proposition 7.2 va découler de la sous-addivité du (carré du) du rayon de recouvrement (6.3) et du lemme suivant, qui constitue une forme inversée de l’inégalité entre moyenne arithmétique et moyenne géométrique : Lemme 7.3. — Soit N un entier > 0. Pour tout (a1 , . . . , aN ) ∈ RN tel que 0 < a1 < · · · < aN et tout (d1 , . . . , dn ) ∈ NN , on a : N X i=1

di ai ≤ 2edlog(2m1 )e max mj ( 1≤j≤N

où, pour tout j ∈ {1, . . . , N }, on a posé mj := (13)

Y

adi i )1/mj ,

j≤i≤N

P

j≤i≤N

di .

Comme déjà observé, la première inégalité est une conséquence facile de la minoration (1.4).

ASTÉRISQUE 422

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

51

Pour établir ce lemme, on écrit {1, . . . , N } comme réunion disjointe [ Sl {1, . . . , N } = l∈N>0

où Sl := {j ∈ N

mod 1 ≤ j ≤ N et b− log ai /an c = l},

et l’on observe que, si Sl 6= ∅ et j(l) := min Sl , alors : X Y di ai ≤ emj(l) ( adi i )1/mj(l) , i∈Sl

j(l)≤i≤N

puis qu’il existe l ∈ N>0 tel que : dlog(2m1 )e

X

di ai ≥

N X

di ai .

i=1

i∈Sl

Démonstration de la proposition 7.2. — De nouveau, on considère la filtration canonique de E, E0 = {0} ⊂ E1 ⊂ · · · ⊂ En = E, et l’on pose : F i := Ei /Ei−1

et µi := µ b(Ei /Ei−1 ),

i ∈ {1, . . . , N }.

D’après la sous-additivité du carré du rayon de recouvrement dans les suites exactes courtes admissibles (cf. (6.3)), on a : Rcov (E)2 ≤

(7.2)

N X

Rcov (F i )2 .

i=1

Par ailleurs, comme chacun des réseaux euclidiens F i ⊗ O (−µi ) est semi-stable de pente nulle, on trouve : R(F i )2 ≤ eccov (n) rk Fi e−2µi

(7.3)

En appliquant le lemme 7.3 avec ai := e−2µi et di := rk Fi , on obtient : N X

(7.4)

i=1

rk Fi e−2µi ≤ 2edlog(2n)e max rk (E/Ej−1 ) exp(−2b µ(E/Ej−1 )) 1≤j≤N

≤ 2edlog(2n)e exp(−b µKL (E)). La proposition découle de la conjonction de (7.2), (7.3) et (7.4).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

52

J.-B. BOST

On observera que l’on a établi une version légèrement plus précise de l’inégalité (7.1) : on peut y remplacer µ bKL (E) par min (b µ(E/Ei−1 ) − (1/2) log rk E/Ei−1 ).

1≤i≤N

Cet invariant n’est fonction que du polygone canonique de E. Signalons enfin que l’on peut aisément calculer la pente de Kannan-Lovasz des réseaux euclidiens sommes directes de réseaux de rang 1, et montrer que la constante fonction de n dans le membre de droite de (7.1) (ou encore la constante c(n) dans (1.19)) croit au moins comme log log n lorsque n tend vers l’infini. En effet, si n est un entier > 0 et si λ1 ≤ · · · ≤ λn est une suite croissante de n nombres réels, on vérifie que : n k M X µ bKL ( O (λi )) = min ((1/k) λi − (1/2) log k). 1≤k≤n

i=1

i=1

Par ailleurs, on sait que : n n X M 2 O (λi )) = (1/4) e−2λi . Rcov ( i=1

i=1

La suite de réels (ti )i≥1 définie par les égalités : k X

ti = (k/2) log k

pour tout k ≥ 1

i=1

est croissante et satisfait : 2ti = log i + 1 + O(1/i)

lorsque i −→ +∞,

et par conséquent : (1/4)

n X

e−2ti = (1/4e) log n + O(1)

lorsque n −→ +∞.

i=1

Ainsi, si pour tout entier n > 0, on pose E n := µ bKL (E n ) = 0

et

Ln

i=1 O (tn ),

on a :

log Rcov (E n ) = (1/2) log log n + O(1)

lorsque n −→ +∞.

APPENDICE A LE FORMALISME DES PENTES Dans cet appendice, nous décrivons un formalisme de pentes, qui s’applique notamment aux fibrés vectoriels sur les courbes (Tjurin, Harder-Narasimhan) et aux réseaux euclidiens (Stuhler, Grayson). Ce formalisme est rudimentaire et nous

ASTÉRISQUE 422

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

53

renvoyons aux articles d’André [2] et Chen [15] pour des formalismes plus sophistiqués et pour des références et des applications supplémentaires. Soit (E , ) un ensemble ordonné réticulé. En d’autres termes, l’ensemble ordonné (E , ) possède un élément minimal O et un élément maximal X, et tout couple (X1 , X2 ) ∈ E admet une borne inférieure X1 ∧ X2 et une borne supérieure X1 ∨ X2 dans (E , ). Soient en outre r : E −→ Z et d : E −→ R deux applications (14) satisfaisant aux conditions suivantes : (1) monotonie : lorsque l’on munit Z × R de l’ordre lexicographique, l’application (r, d) : E −→ Z × R est strictement croissante. En d’autres termes, si X1 et X2 sont des éléments de E tels que X1  X2 , alors r(X1 ) ≤ r(X2 ); si de plus r(X1 ) = r(X2 ), alors d(X1 ) ≤ d(X2 ) avec égalité (si et) seulement si X1 = X2 . (2) (sous)-additivité : pour tout (X1 , X2 ) ∈ E 2 , on a : r(X1 ) + r(X2 ) = r(X1 ∧ X2 ) + r(X1 ∨ X2 ) et d(X1 ) + d(X2 ) ≤ d(X1 ∧ X2 ) + d(X1 ∨ X2 ). (3) finitude : pour tout c ∈ R, l’intersection d(E ) ∩ [c, +∞] est finie. On observera que, d’après (1), l’image r(E ) est contenue dans l’intervalle [r(O), r(X)] ∩ Z et donc finie. Supposons de plus que r(O) < r(X). On peut alors procéder à la construction suivante. Soit C l’ensemble des fonctions concaves c : [r(O), r(X)] −→ R telles que, pour tout Y ∈ E , d(Y ) ≤ c(r(Y )). Il découle aussitôt de l’hypothèse de finitude (3) que C possède un plus petit élément (15) P , qui est une fonction affine sur chaque intervalle [i − 1, i], où i ∈ ]r(0), r(X)] ∩ Z. De plus, il existe N ∈ N>0 et (X0 , . . . , XN ) dans E N +1 tels que : (14) (15)

L’application r est souvent appelé rang et l’application d degré. En d’autres termes, pour tout c ∈ C et tout x ∈ [r(O), r(X)], on a : P (x) ≤ c(x).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

54

J.-B. BOST

– r(X0 ) = r(O) < r(X1 ) < · · · < r(XN ) = r(X); – pour tout i ∈ {0, . . . , N }, P ((r(Xi )) = d(Xi ), et, si i ≥ 1, la fonction P est affine sur [r(Xi−1 ), r(Xi )] ; on notera : µi :=

d(Xi ) − d(Xi−1 ) r(Xi ) − r(Xi−1 )

la pente de P sur cet intervalle ; – la suite des pentes est strictement décroissante : µ1 > µ2 > · · · > µN . En faisant appel aux propriétés (1) et (2), on établit alors aisément : Proposition A.1. — Avec les notations ci-dessus, la suite (X0 , . . . , XN ) est uniquement déterminée et croissante : X0  X1  · · ·  XN . De plus, l’élément X0 est maximal dans r−1 (r(O)) et XN = X. Le graphe de P est le polygone canonique associé à l’ensemble ordonné (E , ) muni des fonctions rang et degré r et d. La proposition affirme que les sommets du polygone canonique sont les images par l’application (r, d) d’une « filtration » bien déterminée de X, sa filtration canonique. Souvent, dans les applications, on a r−1 (0) = {O} et d(O) = 0 ; en particulier, r prend ses valeurs dans N. On peut alors attacher à tout élément Y de E \{O} sa pente µ(Y ) :=

d(Y ) , r(Y )

et l’on a alors : µ1 =

max µ(Y ).

Y ∈E \{O}

RÉFÉRENCES [1] N. Alamati, C. Peikert & N. Stephens-Davidowitz – New (and old) proof systems for lattice problems, in Public-key cryptography—PKC 2018. Part II, Lecture Notes in Comput. Sci., vol. 10770, Springer, 2018, p. 619–643. [2] Y. André – Slope filtrations, Confluentes Math. 1 (2009), no 1, p. 1–85. [3] S. J. Arakelov – Theory of intersections on the arithmetic surface, in Proceedings of the International Congress of Mathematicians (Vancouver, B.C., 1974), Vol. 1, 1975, p. 405–408.

ASTÉRISQUE 422

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

55

[4] J. G. Arthur – A trace formula for reductive groups. I. Terms associated to classes in G(Q), Duke Math. J. 45 (1978), no 4, p. 911–952. [5] W. Banaszczyk – New bounds in some transference theorems in the geometry of numbers, Math. Ann. 296 (1993), no 4, p. 625–635. [6]

, Inequalities for convex bodies and polar reciprocal lattices in Rn , Discrete Comput. Geom. 13 (1995), no 2, p. 217–231.

[7]

, Inequalities for convex bodies and polar reciprocal lattices in Rn . II. Application of K-convexity, Discrete Comput. Geom. 16 (1996), no 3, p. 305– 311.

[8] L. Bétermin & M. Petrache – Dimension reduction techniques for the minimization of theta functions on lattices, J. Math. Phys. 58 (2017), no 7, 071902, 40. [9] S. G. Bobkov – On Milman’s ellipsoids and M -position of convex bodies, in Concentration, functional inequalities and isoperimetry, Contemp. Math., vol. 545, Amer. Math. Soc., 2011, p. 23–33. [10] T. Borek – Successive minima and slopes of Hermitian vector bundles over number fields, J. Number Theory 113 (2005), no 2, p. 380–388. [11] J.-B. Bost – Theta invariants of Euclidean lattices and infinite-dimensional Hermitian vector bundles over arithmetic curves, Progress in Math., vol. 334, Birkhaüser, 2020. [12] J.-B. Bost & K. Künnemann – Hermitian vector bundles and extension groups on arithmetic schemes. I. Geometry of numbers, Adv. Math. 223 (2010), no 3, p. 987–1106. [13] B. Casselman – Stability of lattices and the partition of arithmetic quotients, Asian J. Math. 8 (2004), no 4, p. 607–637. [14] J. W. S. Cassels – An introduction to the geometry of numbers, Grundl. math. Wiss., vol. 99, Springer, 1971. [15] H. Chen – Harder-Narasimhan categories, J. Pure Appl. Algebra 214 (2010), no 2, p. 187–200. [16] K.-M. Chung, D. Dadush, F.-H. Liu & C. Peikert – On the lattice smoothing parameter problem, in 2013 IEEE Conference on Computational Complexity—CCC 2013, IEEE Computer Soc., Los Alamitos, CA, 2013, p. 230– 241. [17] H. Cohn & M. de Courcy-Ireland – The Gaussian core model in high dimensions, Duke Math. J. 167 (2018), no 13, p. 2417–2455. [18] H. Cohn & A. Kumar – Optimality and uniqueness of the Leech lattice among lattices, Ann. of Math. 170 (2009), no 3, p. 1003–1050.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

56

J.-B. BOST

[19] J. H. Conway & N. J. A. Sloane – Sphere packings, lattices and groups, Grundl. math. Wiss., vol. 290, Springer, 1999. [20] D. Cordero-Erausquin, M. Fradelizi & B. Maurey – The (B) conjecture for the Gaussian measure of dilates of symmetric convex sets and related problems, J. Funct. Anal. 214 (2004), no 2, p. 410–427. [21] D. Dadush & O. Regev – Towards strong reverse Minkowski-type inequalities for lattices, in 57th Annual IEEE Symposium on Foundations of Computer Science—FOCS 2016, IEEE Computer Soc., Los Alamitos, CA, 2016, p. 447– 456. [22] D. Dadush, O. Regev & N. Stephens-Davidowitz – On the closest vector problem with a distance guarantee, in IEEE 29th Conference on Computational Complexity—CCC 2014, IEEE Computer Soc., Los Alamitos, CA, 2014, p. 98– 109. [23] W. Ebeling – Lattices and codes, third éd., Advanced Lectures in Mathematics, Springer Spektrum, Wiesbaden, 2013. [24] M. Eichler – Introduction to the theory of algebraic numbers and functions, Translated from the German by George Striker. Pure and Applied Mathematics, vol. 23, Academic Press, 1966. [25] T. Figiel & N. Tomczak-Jaegermann – Projections onto Hilbertian subspaces of Banach spaces, Israel J. Math. 33 (1979), no 2, p. 155–171. [26] G. van der Geer & R. Schoof – Effectivity of Arakelov divisors and the theta divisor of a number field, Selecta Math. (N.S.) 6 (2000), no 4, p. 377–398. [27] H. Gillet, B. Mazur & C. Soulé – A note on a classical theorem of Blichfeldt, Bull. London Math. Soc. 23 (1991), no 2, p. 131–132. [28] D. R. Grayson – Reduction theory using semistability, Comment. Math. Helv. 59 (1984), no 4, p. 600–634. [29] , Reduction theory using semistability. II, Comment. Math. Helv. 61 (1986), no 4, p. 661–676. [30] R. P. Groenewegen – An arithmetic analogue of Clifford’s theorem, vol. 13, 2001, 21es Journées Arithmétiques (Rome, 2001), p. 143–156. [31] G. Harder – Minkowskische Reduktionstheorie über Funktionenkörpern, Invent. math. 7 (1969), p. 33–54. [32] G. Harder & M. S. Narasimhan – On the cohomology groups of moduli spaces of vector bundles on curves, Math. Ann. 212 (1974/75), p. 215–248. [33] G. Harder & U. Stuhler – Trieste lectures on reduction theory, University of Bonn, 1997. [34] E. Hecke – Über die Zetafunktion beliebiger algebraischer Zahlkörper, Nachr. Ges. Wiss. Göttingen, Math.-Phys. Kl. (1917), p. 77–89.

ASTÉRISQUE 422

(1151)

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

57

[35] R. Kannan & L. Lovász – Covering minima and lattice-point-free convex bodies, Ann. of Math. 128 (1988), no 3, p. 577–602. [36] J. C. Lagarias – Point lattices, in Handbook of combinatorics, Vol. 1, 2, Elsevier Sci. B. V., 1995, p. 919–966. [37] J. C. Lagarias, H. W. Lenstra, Jr. & C.-P. Schnorr – Korkin-Zolotarev bases and successive minima of a lattice and its reciprocal lattice, Combinatorica 10 (1990), no 4, p. 333–348. [38] R. Latał a – On some inequalities for Gaussian measures, in Proceedings of the International Congress of Mathematicians, Vol. II (Beijing, 2002), Higher Ed. Press, 2002, p. 813–822. [39] J. Le Potier – Variété de modules de fibrés stables sur une surface de Riemann : résultats d’Atiyah et Bott, in Moduli of stable bundles over algebraic curves (Paris, 1983), Progr. Math., vol. 54, Birkhäuser, 1985, p. 5–28. [40] D. R. Lewis – Ellipsoids defined by Banach ideal norms, Mathematika 26 (1979), no 1, p. 18–29. [41] Y. I. Manin – New dimensions in geometry, in Workshop Bonn 1984 (Bonn, 1984), Lecture Notes in Math., vol. 1111, Springer, 1985, p. 59–101. [42] J. Martinet – Perfect lattices in Euclidean spaces, Grundl. math. Wiss., vol. 327, Springer, 2003. [43] B. Maurey – Inégalité de Brunn-Minkowski-Lusternik, et autres inégalités géométriques et fonctionnelles, no 299, 2005, p. 95–113. [44] T. McMurray Price – Numerical cohomology, Algebr. Geom. 4 (2017), no 2, p. 136–159. [45] D. Micciancio & S. Goldwasser – Complexity of lattice problems, The Kluwer International Series in Engineering and Computer Science, vol. 671, Kluwer Academic Publishers, 2002. [46] D. Micciancio & O. Regev – Worst-case to average-case reductions based on Gaussian measures, SIAM J. Comput. 37 (2007), no 1, p. 267–302. [47]

, Lattice-based cryptography, in Post-quantum cryptography, Springer, 2009, p. 147–191.

[48] J. Milnor & D. Husemoller – Symmetric bilinear forms, Ergebn. Math. Grenzg., vol. 73, Springer, 1973. [49] H. Minkowski – Geometrie der Zahlen, Teubner, 1896. [50] M. Morishita – Integral representations of unramified Galois groups and matrix divisors over number fields, Osaka J. Math. 32 (1995), no 3, p. 565–576. [51] C. Peikert – A decade of lattice cryptography, Found. Trends Theor. Comput. Sci. 10 (2014), no 4, p. i—283–424.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

58

J.-B. BOST

[52] G. Pisier – Holomorphic semigroups and the geometry of Banach spaces, Ann. of Math. 115 (1982), no 2, p. 375–392. [53] D. Quillen – Quillen notebooks, Clay Mathematics Institute, 1968–2003, http: //www.claymath.org/publications/quillen-notebooks. [54] O. Regev & N. Stephens-Davidowitz – An inequality for Gaussians on lattices, SIAM J. Discrete Math. 31 (2017), no 2, p. 749–757. [55] , A reverse Minkowski theorem, in STOC’17—Proceedings of the 49th Annual ACM SIGACT Symposium on Theory of Computing, ACM, 2017, p. 941– 953. [56] D. Roessler – The Riemann-Roch theorem for arithmetic curves, Diplomarbeit, ETH Zürich, 1993. [57] S. S. Ryškov & E. P. Baranovski˘ı – Classical methods of the theory of lattice packings, Uspekhi Mat. Nauk 34 (1979), no 4(208), p. 3–63, 256. [58] P. Sarnak & A. Strömbergsson – Minima of Epstein’s zeta function and heights of flat tori, Invent. math. 165 (2006), no 1, p. 115–151. [59] F. K. Schmidt – Analytische Zahlentheorie in Körpern der Charakteristik p, Math. Z. 33 (1931), no 1, p. 1–32. [60] W. M. Schmidt – On heights of algebraic subspaces and diophantine approximations, Ann. of Math. 85 (1967), p. 430–472. [61] A. Schürmann – Enumerating perfect forms, in Quadratic forms—algebra, arithmetic, and geometry, Contemp. Math., vol. 493, Amer. Math. Soc., 2009, p. 359–377. [62] U. Shapira & B. Weiss – A volume estimate for the set of stable lattices, C. R. Math. Acad. Sci. Paris 352 (2014), no 11, p. 875–879. [63] , Stable lattices and the diagonal group, J. Eur. Math. Soc. (JEMS) 18 (2016), no 8, p. 1753–1767. [64] U. Stuhler – Eine Bemerkung zur Reduktionstheorie quadratischer Formen, Arch. Math. 27 (1976), no 6, p. 604–610. [65] L. Szpiro – Degrés, intersections, hauteurs, vol. 127, 1985, p. 11–28. [66] A. N. Tjurin – Classification of n-dimensional vector bundles over an algebraic curve of arbitrary genus, Izv. Akad. Nauk SSSR Ser. Mat. 30 (1966), p. 1353– 1366. [67] G. Voronoï – Nouvelles applications des paramètres continus à la théorie des formes quadratiques. Deuxième mémoire. Recherches sur les parallélloèdres primitifs, J. reine angew. Math. 134 (1908), p. 198–287. , Nouvelles applications des paramètres continus à la théorie des formes [68] quadratiques. Premier mémoire. Sur quelques propriétés des formes quadratiques positives parfaites, J. reine angew. Math. 133 (1908), p. 97–102.

ASTÉRISQUE 422

(1151)

[69]

RÉSEAUX EUCLIDIENS, SÉRIES THÊTA ET PENTES

59

, Nouvelles applications des paramètres continus à théorie des formes quadratiques. Deuxième Mémoire. Recherches sur les paralléloèdres primitifs, J. reine angew. Math. 136 (1909), p. 67–182.

[70] B. L. van der Waerden – Die Reduktionstheorie der positiven quadratischen Formen, Acta Math. 96 (1956), p. 265–309. [71] A. Weil – Sur l’analogie entre les corps de nombres algébriques et les corps de fonctions algébriques, Rev. Sci. 77 (1939), p. 104–106.

Jean-Benoît BOST Département de Mathématiques Université Paris-Saclay Faculté des Sciences d’Orsay Bâtiment 307 91405 Orsay cedex France E-mail : [email protected]

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

Séminaire BOURBAKI 71e année, 2018–2019, no 1152, p. 61 à 107 doi:10.24033/ast.1131

Octobre 2018

THÉORIE GLOBALE DU PLURIPOTENTIEL, ÉQUIDISTRIBUTION ET PROCESSUS PONCTUELS [d’après Berman, Boucksom, Witt Nyström, . . .] par Romain DUJARDIN

INTRODUCTION

0.1. — La théorie du potentiel logarithmique dans C a des liens profonds et directs avec l’analyse complexe et l’étude des propriétés analytiques des polynômes. Dans les années 1980-90, la théorie du pluripotentiel dans Cn s’est attachée à étendre les idées de la théorie classique du potentiel au cas de plusieurs variables complexes. Ses outils clefs sont les fonctions plurisousharmoniques et l’opérateur de Monge-Ampère, qui jouent respectivement le rôle des fonctions (sous)harmoniques et du laplacien. Ont été ainsi généralisées des notions classiques comme la capacité logarithmique, le diamètre transfini, etc. Parallèlement, se développaient des méthodes transcendantes en géométrie algébrique complexe utilisant peu ou prou les mêmes outils. La véritable convergence entre ces deux domaines de recherche a eu lieu dans les années 2000, et a mené à des résultats spectaculaires (voir par exemple l’exposé de J.-P. Demailly dans ce séminaire [26]). À la suite des travaux d’auteurs comme notamment V. Guedj, A. Zeriahi, R. Berman, S. Boucksom, il apparaît qu’un cadre naturel pour la théorie du pluripotentiel est celui d’une variété complexe compacte munie d’un fibré en droites possédant des propriétés de positivité. De manière remarquable, ce point de vue « global » a permis la résolution de problèmes anciens en théorie du pluripotentiel, comme celui de l’équidistribution des points de Fekete — ce sont les configurations de points qui réalisent le diamètre transfini, analogues à la distribution à l’équilibre d’une famille finie de particules chargées électriquement. Inversement, la théorie classique du potentiel, via son interprétation électrostatique, interagit naturellement avec la mécanique statistique et les probabilités, et ceci permet en retour d’envisager une approche probabiliste de certains problèmes de géométrie algébrique complexe.

© Astérisque 422, SMF 2020

62

R. DUJARDIN

0.2. — Notre objectif dans cet exposé est de rendre compte de manière pédagogique de certains résultats dans cette thématique, principalement dus à R. Berman, S. Boucksom, et D. Witt Nyström. D’autres auteurs fréquemment cités sont T. Bloom et N. Levenberg. Nous avons choisi de partir de la théorie classique du potentiel et d’augmenter progressivement le degré de généralité afin de comprendre les objets mis en jeu ainsi que le cheminement intellectuel (supposé !) qui a mené à ces idées. Le texte est par ailleurs clairsemé de résultats d’équidistribution. Il y a une intersection substantielle avec l’exposé récent de J.-P. Serre à ce séminaire [41] (principalement au § 1), et surtout avec celui de J.-P. Demailly [26] qui se situe résolument en géométrie kählerienne. Notre texte s’adressera ainsi peut-être plus aux analystes qu’aux géomètres (1). Nous présentons d’abord de manière relativement informelle quelques points de théorie du potentiel et du pluripotentiel aux §§ 1 et 2, puis la discussion se formalise aux §§ 3, 4 et 5 qui constituent le cœur de l’exposé. Nous concluons au § 6 par un aperçu de certains résultats plus récents de R. Berman en lien avec la théorie probabiliste des grandes déviations.

0.3. — Introduisons quelques notations. On désignera par M (X) l’ensemble des mesures de probabilité sur un espace mesurable (X, A). En général X sera un ensemble compact muni de sa tribu borélienne et M (X) sera muni de sa topologie faible qui en fait un compact (la convergence faible des mesures sera notée *). Si E est un P sous-ensemble fini de X on note [E] = x∈E δx . L’espace des polynômes de degré d à n variables sera noté Pd (Cn ) (nous omettons la mention de Cn quand il n’y a pas de risque de confusion). On notera |·| la norme hermitienne standard dans Cn ; cette notation sera aussi celle utilisée pour une métrique sur un fibré en droites. La norme uniforme sur un ensemble E sera notée k·kE . Enfin, on pose classiquement 1 dc = 2iπ (∂ − ∂), de sorte que ddc = πi ∂∂. Nous utiliserons les abréviations classiques suivantes : psh pour plurisousharmonique, sci (resp. scs) pour semi-continu inférieurement (resp. supérieurement), p.p. pour presque partout.

0.4. — Je tiens à remercier Sébastien Boucksom, Serge Cantat et Charles Favre pour leurs commentaires sur ce texte.

(1)

Dans le même esprit on peut signaler les notes de N. Levenberg [37] qui présentent les résultats de [10] et [12] sans quitter le cadre de la théorie du pluripotentiel pondérée dans Cn .

ASTÉRISQUE 422

(1152)

THÉORIE GLOBALE DU PLURIPOTENTIEL

63

1. THÉORIE CLASSIQUE DU POTENTIEL La théorie du potentiel dans C est classiquement liée à des questions d’interpolation et d’approximation polynomiale. Dans cette section nous passons en revue certains de ces résultats, en nous appuyant sur l’approche par l’électrostatique qui est très parlante. 1.1. Capacité et diamètre transfini. — (Voir [49, 40] pour plus de détails.) Soit K un compact du plan. L’objet de l’électrostatique est de déterminer la répartition d’un ensemble de particules chargées (disons négativement) astreintes à rester sur K, que nous modéliserons par une mesure positive µ à support dans K. En l’absence de champ extérieur (nous y reviendrons), ces particules interagissent selon la loi de Coulomb qui (dans le plan) met en jeu des forces répulsives proportionnelles à l’inverse de la distance. On introduit donc l’énergie Z − I (µ) = − log |z − w| dµ(z)dµ(w) (qui peut valoir +∞, par exemple si µ a un atome) et l’objet est de chercher une distribution µ à support dans K minimisant cette énergie. Comme il est d’usage en plusieurs variables complexes de travailler avec des fonctions sousharmoniques plutôt que surharmoniques, nous inversons le signe et chercherons plutôt à maximiser I(µ) = −I − (µ). On pose également V (K) = sup {I(µ), µ probabilité sur K} . Par définition −V (K) est la constante de Robin de K et sa capacité électrostatique est cap(K) = exp(V (K)). Alors ou bien pour toute probabilité µ sur K on a I(µ) = −∞ (K est alors dit polaire) ou bien il existe une unique mesure de probabilité µK maximisant l’énergie I. Noter que la capacité d’un ensemble polaire est 0. Par définition µK est la mesure d’équilibre de K. Son potentiel logarithmique UµK est la fonction définie par Z UµK (z) =

log |z − w| dµK (w).

Elle satisfait les propriétés suivantes 1. 2. 3. 4.

UµK > V (K) ; UµK = V (K) « quasi-partout » sur K ; UµK (z) = log |z| + o(1) quand z → ∞ dans C ; ∆UµK = 2πµK au sens des distributions.

Un mot sur la notion générale de capacité et le terme « quasi-partout » : une capacité (au sens de Choquet) sur un espace topologique séparé X est une fonction réelle positive définie sur l’ensemble des parties de X qui est croissante par inclusion,

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

64

R. DUJARDIN

continue par limites croissantes, et continue pour les limites décroissantes de compacts. Le théorème de capacitabilité de Choquet affirme que si cap est une capacité sur X séparable et localement compact et si E est un borélien alors cap(E) = sup {cap(K), K compact, K ⊂ E} . Une propriété a lieu quasi-partout si elle est vraie hors d’un ensemble de capacité nulle. Bien entendu la capacité électrostatique définie ci-dessus se prolonge aux sousensembles du plan en une capacité en ce sens. Si maintenant E est un sous-ensemble fini de K, la définition de l’énergie ci-dessus impose que I([E]) = −∞. Il est donc naturel de supprimer les termes diagonaux et de poser X 2 e I(E) = log |z − w| . k(k − 1) 2 (z,w)∈E z6=w

Un ensemble maximisant cette énergie parmi tous les ensembles de cardinal k donné est appelé configuration de Fekete. Les configurations de Fekete ne sont pas uniques en général (penser au cas d’un cercle). On a coutume de travailler multiplicativement et d’introduire le k-diamètre é2/(k(k−1)) Ñ Y δk (K) = sup |xj − xi | . x1 ,...,xk ∈K

16i log(cap(K)), alors

1 ek [Fk ]

converge vers µK .

1.2. Norme uniforme. — Les résultats précédents ont des applications plus ou moins directes à des questions d’approximation polynomiale uniforme. Remarquons déjà Q que la quantité 16i δ∞ (K) est fournie par le Lemme 1.4 (Inégalité de Bernstein-Walsh). — Si P est un polynôme de degré d > 1 alors pour tout z ∈ C on a ãd Å exp (UµK (z)) |P (z)| 6 kP kK exp (d(UµK (z) − V (K))) = kP kK . cap(K) Voir ci-après pour la preuve. Supposons maintenant P unitaire et réécrivons cette 1/d 1/d inégalité sous la forme kP kK > |P (z)| e−UµK (z) cap(K). En faisant z → ∞ on 1/k obtient kP kK > cap(K) et par suite τ (K) > cap(K) = δ∞ (K). Pour l’inégalité inverse, plutôt que de travailler directement avec les polynômes de Tchebycheff, on introduit « les » polynômes de Fekete (qui ne sont pas uniques) Fk (z) =

k Y

(z − xi ) où {x1 , . . . , xk } est une configuration de Fekete.

i=1

Pour tout z ∈ K, comme {z, x1 , . . . , xk } est une configuration de (k + 1) points on a l’inégalité k Y Y |z − xi | |xj − xi | 6 δk+1 (K)k(k+1)/2 , i=1

i 1. Avec les notations du § 1.1 e · αk ) > 0 pour tout k. Par conséquent la proposition 1.2 s’applique et on a donc I(G l’on obtient I(ν) > 0. Ainsi cap(K) = 1 et ν est d’énergie I(ν) = 0 = log cap(K), on conclut donc que ν = µK . Le théorème de Rumely s’énonce plus précisément en termes de points de petite hauteur. L’énoncé est un peu plus sophistiqué mais la preuve est essentiellement la même. 1.4. Version pondérée. — La plupart des résultats des § 1.1 et 1.2 admettent des versions pondérées où l’énergie I(µ) est remplacée par Z Z IQ (µ) = log |z − w| dµ(z)dµ(w) + Qdµ.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

68

R. DUJARDIN

Physiquement, cela revient à introduire un champ électrique externe. Mathématiquement, cette généralisation intervient dans de nombreux problèmes comme par exemple la distribution des zéros des matrices aléatoires gaussiennes (voir par exemple [25]). Nous verrons également que c’est un cadre très naturel si l’on pense la théorie du potentiel dans C comme restriction d’une théorie du potentiel sur P1 . La référence standard du sujet est le livre de Saff et Totik [40].

2. THÉORIE DU PLURIPOTENTIEL DANS Cn Restons dans l’espace affine pour le moment et voyons comment la théorie du potentiel s’adapte à l’analyse à plusieurs variables complexes. Cette généralisation est l’objet de la théorie du pluripotentiel, qui est maintenant classique et bien documentée [33, 27, 32]. Nous nous contenterons de présenter rapidement les concepts basiques et quelques généralisations des résultats de la section précédente. Une différence essentielle avec la dimension 1 (ou avec la théorie du potentiel dans Rd ) est que l’on ne dispose pas de l’interprétation électrostatique (même si des notions d’énergie entreront en jeu plus loin). Le point clef est ici le problème de Dirichlet pour les fonctions plurisousharmoniques. Pour ne pas alourdir l’exposition, nous nous limiterons au cadre classique, non pondéré. La théorie pondérée sera évoquée lors de l’extension de ces concepts au cadre kählerien. 2.1. Fonctions plurisousharmoniques et opérateur de Monge-Ampère 2.1.1. — Une (1, 1)-forme ω dans un ouvert de Cn est dite positive si elle s’écrit P en coordonnées ω = i j,k ωj,k dzj ∧ d¯ zk et si en tout point la matrice (ωj,k ) est hermitienne et positive. C’est une notion invariante par biholomorphisme. Il existe également une (en fait plusieurs) notion(s) de positivité pour les formes différentielles de bidegré (k, k) pour tout k 6 n (cf. [27, Chap. 3]). Rappelons qu’un courant est une forme différentielle dont les coefficients sont des distributions, et que la notion de positivité peut être étendue aux courants. Soit Ω un ouvert connexe de Cn . On rappelle qu’une fonction u : Ω → R ∪ {−∞} est plurisousharmonique (psh) si u est semi-continue supérieurement (scs) et sousharmonique en restriction à toute droite complexe. Si u est de classe C 2 , elle est psh si et seulement si la (1, 1) forme ddc u =

i X ∂2u zk ¯ k dzj ∧ d¯ π ∂zj ∂z j,k

est positive. Plus généralement, si u est psh et non identiquement égale à −∞ alors elle est localement intégrable et le courant ddc u est positif au sens des distributions.

ASTÉRISQUE 422

(1152)

THÉORIE GLOBALE DU PLURIPOTENTIEL

69

Réciproquement une fonction u ∈ L1loc (Ω) ayant cette propriété est presque partout égale à une fonction psh. En particulier la plurisousharmonicité est invariante par biholomorphisme donc elle fait sens sur les variétés complexes. On notera PSH(Ω) le cône des fonctions psh sur Ω. Une fonction u est pluriharmonique si u et −u sont psh. Une limite décroissante de fonctions psh est psh. Si {uα , α ∈ A} est une famille localement uniformément majorée de fonctions psh, alors u = (sup uα )∗ est psh, où l’astérisque désigne la régularisée scs, i. e. v ∗ (x) = lim supy→x v(y). En outre il existe une suite (αj ) sur laquelle le sup est réalisé (lemme de Choquet). On a des propriétés de compacité utiles. Si (uj ) est une suite localement uniformément majorée de fonctions psh, alors elle admet des sous-suites (ujk ) convergentes dans L1loc et en outre si on note u = limk ujk on a la convergence « semi-uniforme » suivante : pour tout compact K de Ω, limk→∞ supK ujk 6 supK u. Ce dernier point est connu sous le nom de lemme de Hartogs. 2.1.2. — Une observation fondamentale est que si u1 , . . . , uk sont des fonctions psh on peut donner un sens au produit extérieur ddc u1 ∧ · · · ∧ ddc uk sous des hypothèses assez faibles sur la régularité des uj . D’après Bedford et Taylor [4] il suffit par exemple que les uj soient localement bornées (i. e. localement minorées). La démonstration se fait par récurrence sur k : si ddc uk ∧ · · · ∧ ddc u1 est bien défini comme courant positif de bidegré (k, k), alors ses coefficients sont des mesures qui intègrent uk+1 (noter qu’une fonction psh a une valeur bien définie en chaque point) et donc uk+1 ddc uk ∧ · · · ∧ ddc u1 est également un courant de bidegré (k, k). On peut alors poser ddc uk+1 ∧ · · · ∧ ddc u1 := ddc (uk+1 ddc uk ∧ · · · ∧ ddc u1 ). En particulier on peut considérer l’opérateur de Monge-Ampère complexe (ddc u)n , un (n, n)-courant positif que l’on peut donc identifier à une mesure positive sur Ω. Ces produits extérieurs ne sont pas continus relativement à la topologie L1loc sur leurs facteurs, ce qui est une source importante de difficultés techniques dans le sujet, néanmoins ils le sont notamment vis-à-vis des suites monotones. De nombreuses généralisations de [4] montrent que l’on peut aller au-delà des fonctions bornées, toutefois il n’est pas possible d’étendre « raisonnablement » la définition de l’opérateur de Monge-Ampère à toutes les fonctions psh. En effet un théorème de Kiselman montre qu’on ne peut pas définir un opérateur (ddc )n sur le cône des fonctions psh qui soit continu par limite décroissante. Un ensemble E est pluripolaire si pour tout point de E il existe un voisinage connexe Ω et une fonction psh u sur Ω non identiquement −∞ telle que E ∩ Ω ⊆ {u = −∞}. Ce sont les ensembles « négligeables » de la théorie du pluripotentiel. Par exemple si v = sup uα est l’enveloppe supérieure d’une famille de fonctions psh, un résultat profond de [4] affirme que E = {v < v ∗ } est pluripolaire. Si u est psh et localement bornée, la mesure (ddc u)n ne charge pas les ensembles pluripolaires.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

70

R. DUJARDIN

2.1.3. — La résolution de l’équation de Monge-Ampère est un chapitre important du sujet, qui s’est ouvert avec les travaux de Bedford et Taylor [3]. Le problème est de résoudre (ddc u)n = µ dans un domaine Ω avec condition de Dirichlet u = ϕ au bord, où µ est une mesure positive sur Ω et ϕ est une fonction (disons) continue sur ∂Ω. La méthode utilisée en général est inspirée de la méthode dite de Perron pour la résolution du problème de Dirichlet ∆u = f , qui consiste à chercher les solutions comme enveloppes supérieures de fonctions psh satisfaisant (ddc u)n > µ et u| 6 ϕ. ∂Ω Un cas particulièrement intéressant est le cas µ = 0, dont la résolution remonte à Bremermann [21]. En particulier nous aurons besoin du résultat suivant : Théorème 2.1. — Soit Ω un domaine de Cn et u une fonction dans PSH(Ω) ∩ L∞ loc (Ω). Soit p ∈ Ω et r > 0 tel que B(p, r) ⊂ Ω. Alors il existe une unique fonction u e ∈ PSH(Ω)∩L∞ e hors de B(p, r), u e > u sur B(p, r) et (ddc u e)n = 0 loc (Ω) telle que u = u sur B(p, r). On dit qu’une fonction psh sur Ω est maximale si pour tout ouvert Ω0 relativement compact dans Ω et toute fonction psh sur Ω0 et scs sur Ω0 telle que u > v sur ∂Ω0 on a u > v sur Ω0 . Si n = 1 les fonctions sousharmoniques maximales sont les fonctions harmoniques. En dimension supérieure le théorème précédent implique c n que u ∈ PSH(Ω) ∩ L∞ loc (Ω) est maximale si et seulement si (dd u) = 0. On voit que la condition est plus faible que la pluriharmonicité (ddc u = 0) : par exemple n’importe quelle fonction psh ne dépendant que d’une variable est maximale. Dans le même esprit on a le principe de comparaison suivant qui jouera un rôle fondamental dans la suite. Théorème 2.2 ([4]). — Soit Ω un domaine de Cn et u, v ∈ PSH(Ω) ∩ L∞ loc (Ω). Supposons que u > v sur ∂Ω au sens où lim inf z→∂Ω (u(z) − v(z)) > 0. Alors Z Z (ddc v)n 6 (ddc u)n . {u 0 et VK | 6 0 donc VK | = 0. Par définition de VK on K K a une inégalité de Bernstein-Walsh : (1)

+

∀z ∈ Cn , |P (z)| 6 kP kK · (VK (z))deg(P ) .

La fonction VK est positive donc par la théorie de Bedford-Taylor on peut considérer la mesure µK = (ddc VK∗ )n qui est par définition la mesure d’équilibre de K au sens de la théorie du pluripotentiel. C’est une mesure de probabilité grâce à la normalisation choisie pour ddc . Pour n = 1 on retombe bien entendu sur la définition électrostatique (voir les propriétés du potentiel UµK ). La fonction VK est automatiquement semi-continue inférieurement : en effet dans la définition de VK , comme on peut régulariser les fonctions psh par des suites décroissantes de fonctions psh lisses, on peut se restreindre à des compétiteurs u continus. On dit que K est régulier (resp. régulier en z0 ) si VK = VK∗ (resp. VK (z0 ) = VK∗ (z0 )), autrement dit si VK est continue (resp. continue en z0 ). C’est le cas par exemple si K est à bord lisse de classe C 1 . On a plus généralement le critère suivant : K est régulier si tout point de K est accessible par un chemin réel-analytique contenu dans l’intérieur de K. Cela découle du fait suivant : toute fonction sousharmonique définie au voisinage de [0, 1] dans C satisfait u(1) = lim sup[0,1]3z→1 u(z). (voir [33, §5.3] ; on dit que [0, 1] n’est pas effilé en 1). Inversement si K est régulier et L est pluripolaire ∗ et non inclus dans K, alors K ∪ L n’est pas régulier en général : en effet VK∪L = VK∗ peut être positive aux points de L \ K. Comme VK appartient à L , on peut définir la constante de Robin γK := lim sup(VK (z) − log |z|) z→∞

et comme en dimension 1, c : E 7→ exp(−γE ) définit une capacité [34]. Contrairement à la dimension 1, il y a beaucoup de flexibilité dans cette définition : on a en fait une fonction de Robin γK (z) = lim supλ→∞ (VK (λz) − log |λz|) qui est définie sur Pn−1 (i. e. l’espace des directions à l’infini) et donc des constantes de Robin directionnelles, et autant de capacités que de manières de les moyenner et de les estimer. Antérieurement à VK avait été introduite la fonction extrémale de Siciak : ¶ © 1/ deg(P ) ΦK : z 7→ ΦK (z) = sup |P (z)| , P polynôme, kP kK 6 1 . Théorème 2.3 (Siciak [43]). — Si K est compact alors VK = log ΦK .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

72

R. DUJARDIN

Remarquer que pour démontrer ce résultat il faut trouver le moyen de passer des fonctions psh aux fonctions holomorphes. Ceci se fait par exemple grâce aux estimées L2 de Hörmander (voir par exemple [32, Thm 9.24] pour un argument concis). De même que pour la généralisation à plusieurs variables de la constante de Robin, on peut définir diverses constantes de Tchebycheff pour K. La variété de ces constantes vient ici de ce qu’il n’y a pas à plusieurs variables de notion univoque de polynôme unitaire. Attardons-nous un peu sur ce point. Les résultats qui suivent sont essentiellement dus à Zaharjuta [52], et la présentation est issue de [15]. Si α ∈ Nn est Pn un multi-indice on note comme à l’accoutumée z α = z1α1 · · · znαn et |α| = i=1 αi . Ordonnons ces multi-indices de la manière suivante : α 6 β si et seulement si ou bien |α| < |β| ou bien |α| = |β| et α est inférieur à β pour l’ordre lexicographique. Pour α ∈ Nn on définit alors une constante de Tchebycheff Υα     X Υα = inf kP kK , P (z) = z α + aβ z β ,   β 0, θj = 1 ¶ © Q et Σ0 le simplexe ouvert correspondant Σ0 = θ ∈ Σ, j θj > 0 . Le lemme suivant découle uniquement de la propriété de sous-multiplicativité Υα+β 6 Υα Υβ . Lemme 2.4 ([52]). — Pour tout θ ∈ Σ0 , la limite τK,θ =

lim α/|α|→θ |α|→∞

τK,α

existe et définit une fonction continue et log-convexe sur Σ0 .  Si on note h(k, n) = n−1+k le nombre de monômes de degré k à n variables alors k Å Y ã1/h(k,n) ÅZ ã (2) lim τK,α = exp log(τK,θ ) dθ := τ (K), k→∞

|α|=d

Σ

où dθ désigne la mesure de Lebesgue normalisée sur Σ, définit une constante de Tchebycheff moyenne que nous retrouverons au paragraphe suivant. Nous concluons ce paragraphe avec deux résultats importants. D’abord un critère de compacité pour la classe L (voir par exemple [33, 5.2.1 et 5.2.4]) : Théorème 2.5. — Soient U une famille de fonctions de L et u = sup {v, v ∈ U }. Si {u < +∞} n’est pas pluripolaire, alors U est localement uniformément majorée et u∗ ∈ L .

ASTÉRISQUE 422

(1152)

THÉORIE GLOBALE DU PLURIPOTENTIEL

73

Et ensuite le principe de domination : Théorème 2.6 ([5]). — Soient u ∈ L et v ∈ L + localement bornées et supposons que u 6 v p.p. relativement à la mesure (ddc v)n . Alors u 6 v. 2.3. Diamètre transfini et configurations de Fekete. — L’extension à plusieurs variables de la notion de diamètre transfini est due à F. Leja dans les années 1950. Énumérons les monômes à k variables selon l’ordre établi au § 2.2 pour obtenir une  Pk suite (αj )j>1 et posons ej (z) = z αj . Notons Nk = d=0 h(d, n) = n+k le nombre k Pk n de monômes de degré au plus k et Σk = d=0 dh(d, k) = n+1 kNk la somme de leurs degrés. Étant donnés q points ζ1 , . . . , ζq dans K, le calcul de l’interpolation en les ζi fait intervenir le déterminant de Vandermonde généralisé det(ej (ζi ))qi,j=1 . On appelle k-diamètre de K la quantité 1/Σk n+1 Nk nkNk k (3) δk (K) = sup = sup (x )) det(ej (xi ))N det(e j i i,j=1 i,j=1 x1 ,...,xNk ∈K

x1 ,...,xNk ∈K

et le diamètre transfini est défini par (4)

δ∞ (K) = lim sup δk (K). n→∞

Théorème 2.7 ([52]). — Si K est un compact de Cn , la limite dans (4) existe et δ∞ (K) = τ (K), où τ (K) est comme en (2). En particulier si K est non pluripolaire δ∞ (K) > 0. L’existence de cette limite est non triviale et la démonstration de Zaharjuta repose sur les idées de sous-multiplicativité du paragraphe précédent. Nous en donnerons une autre preuve au §5.3. Une configuration de Fekete est un sous-ensemble de Nk points de K réalisant le maximum dans (3) et il est naturel de se demander si on a un résultat d’équidistribution pour les configurations de Fekete analogue au théorème 1.1, le candidat naturel pour la limite étant bien sûr la mesure d’équilibre µK . La théorie du pluripotentiel « classique » n’a pas su répondre à cette question, qui est restée ouverte pendant longtemps. La réponse, positive, sera expliquée au § 5.3 et nécessite de travailler dans un cadre plus général. Remarque 2.8. — Même si on ne peut plus interpréter les configurations de Fekete en termes électrostatiques, on peut tout de même introduire une énergie d’interaction déterminantale 1 k log det(ej (xi ))N ENk (x1 , . . . , xNk ) = − i,j=1 Σk

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

74

R. DUJARDIN

et voir les configurations de Fekete comme minimisant cette énergie. Nous reviendrons brièvement sur ce point de vue au §6 2.4. Version pondérée. — Comme à une variable, il y a une version pondérée de la théorie du pluripotentiel qui jouera un rôle important dans la suite. En un mot, il s’agit dans les résultats précédents de multiplier la norme hermitienne |·| de Cn par une fonction w positive dite poids. On notera également Q = − log w de sorte que w = e−Q . Plus précisément, si K est un compact comme précédemment, on se donne une fonction scs w définie sur K telle que {z ∈ K, w(z) > 0} est non pluripolaire (on peut également supposer K fermé et non borné modulo une hypothèse sur la décroissance de w à l’infini : w(z) = o(1/ |z|)). On pose alors par exemple n ∗ VK,Q (z) := sup {u(z), u ∈ L , u 6 Q sur K} et µK,Q = ddc VK,Q ainsi que n



1/ deg(P ) ΦK,Q (z) := sup |P (z)| , P ∈ Pk , wdeg(P ) P

K

61

o

et on aura un analogue du théorème 2.3. On définit de manière analogue un diamètre transfini δ∞,Q = limk→∞ δk,Q , où δk,Q est défini de manière analogue à (3). L’existence de cette limite est obtenue par Berman et Boucksom dans [10] (et indépendamment par Bloom et Levenberg [15]).

3. LA PROPRIÉTÉ DE BERNSTEIN-MARKOV Au cours des sections précédentes nous nous sommes à plusieurs reprises intéressés à la norme uniforme de familles de polynômes sur un compact. Techniquement, il est également utile de pouvoir travailler avec la norme L2 . Cela permet en outre de faire le lien avec la théorie des polynômes orthogonaux. La propriété de Bernstein-Markov est une condition technique importante qui permet de comparer les deux points de vue. Par souci de légèreté des notations, nous nous limitons une fois encore au cadre non pondéré. Toutefois les deux critères que nous présentons (proposition 3.3 et théorème 3.7) sont valables en présence d’un poids w continu. 3.1. Définitions. — Soit K un compact de Cn et µ une mesure de probabilité telle que Supp(µ) = K. Afin d’éviter certaines trivialités nous supposerons dans toute cette section que µ ne charge pas les ensembles pluripolaires (et donc K n’est pas pluripolaire). En particulier P | = 0 implique P = 0 donc que k·kK et k·kL2 (µ) K définissent des normes sur Pd (Cn ) pour tout d. Bien sûr pour tout P ∈ Pd on a kP kL2 (µ) 6 kP kK .

ASTÉRISQUE 422

(1152)

THÉORIE GLOBALE DU PLURIPOTENTIEL

75

On dit que µ satisfait la propriété de Bernstein-Markov si la distortion entre ces normes est sous-exponentielle en le degré, c’est-à-dire qu’il existe une suite (Md )d>0 telle que pour tout P ∈ Pd , kP kK 6 Md kP kL2 (µ) et lim (Md )1/d = 1. d→∞

On peut reformuler cette condition de plusieurs manières : Lemme 3.1. — Soit (K, µ) comme ci-dessus. Les conditions suivantes sont équivalentes : (i) la mesure µ satisfait la propriété de Bernstein-Markov ; (ii) pour tout ε > 0 il existe une constante C(ε) telle que pour tout polynôme P on a (5)

kP kK 6 C(ε)(1 + ε)deg(P ) kP kL2 (µ) ;

(iii) pour toute suite de polynômes Pj de degré tendant vers l’infini on a Ç å1/ deg(Pj ) kPj kK (6) lim sup 6 1. kPj kL2 (µ) j→∞ Remarque 3.2. — L’étude de l’asymptotique des constantes Md peut être également intéressante sur certains ensembles pluripolaires : par exemple si K est un sousensemble relativement non polaire dans une courbe transcendante, alors Md est une mesure du degré de transcendance de cette courbe (voir [24, 22]). Nous allons donner des conditions suffisantes pour que la propriété de BernsteinMarkov soit satisfaite. L’idée est que la mesure µ ne doive pas être trop singulière (§3.2) et/ou qu’elle « remplisse bien » K au sens de la théorie du pluripotentiel (§3.3). Une observation intéressante de Bloom et Levenberg est que tout compact de Cn porte une mesure de Bernstein-Markov (voir [16, Cor 3.7] ; de manière un peu surprenante la mesure construite par Bloom et Levenberg est atomique). 3.2. Un critère de densité pour Bernstein-Markov. — Rappelons qu’un compact de Cn est dit régulier si sa fonction extrémale VK est continue. Le résultat suivant est tiré de [17] : Proposition 3.3. — Soit K un compact de Cn régulier au sens de la théorie du pluripotentiel et µ une mesure de probabilité telle que K = Supp(µ). On suppose que µ satisfait la condition suivante : il existe C > 0 et α > 0 telles que pour tout z ∈ K, on a µ(B(z, r)) > Crα . Alors µ satisfait la condition de Bernstein-Markov.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

76

R. DUJARDIN

Démonstration. — Fixons ε > 0. Comme VK est continue il existe δ = δ(ε) tel que si d(y, K) 6 2δ on a VK (y) 6 ε. Soit P un polynôme de degré d, et fixons x ∈ K tel que |P (x)| = kP kK . Affirmation. — Pour r = δe−dε /4, pour tout y ∈ B(x, r), on a |P (y)| >

1 1 |P (x)| = kP kK . 2 2

En effet par l’inégalité de Bernstein-Walsh (1) et les estimées de Cauchy on a k∇P kB(x,δ) 6

2 2 2 kP kB(x,2δ) 6 kP kK edkVK kB(x,2δ) 6 |P (x)| edε δ δ δ

et donc pour tout y ∈ B(x, r) on a |P (y) − P (x)| 6

2r |P (x)| |P (x)| edε 6 , δ 2

d’où le résultat. Minorons maintenant la norme L2 de P sur B(x, r) en utilisant l’hypothèse de densité locale faite sur µ : ÇZ å 21 α 1 1 |P (x)| C 2 δ 2 − α dε 2 kP kL2 (µ) > > (Crα ) 2 = e 2 kP kK , |P (y)| dµ(y) 2 2α B(x,r) ce qui est exactement une inégalité de type (5), et le résultat est ainsi démontré. Ce type d’estimation pour la densité locale d’une mesure est très courant en dynamique, et plus généralement dans le cas de mesures portées par des ensembles fractals. Il est en fait trop restrictif de demander que l’hypothèse µ(B(z, r)) > Crα soit vraie pour tout z ∈ K, il suffit qu’elle soit vraie sur un ensemble de capacité pleine [17, Thm 3.4]. 3.3. Mesures déterminantes. — Le concept suivant remonte semble-t-il à Ullman [50]. Définition 3.4. — Soit K un compact non pluripolaire de Cn et µ une mesure finie sur K. On dit que µ est déterminante pour K si pour tout borélien E ⊂ K de mesure totale on a VE∗ = VK∗ . Remarquer que cette notion ne dépend que de la classe de la mesure µ. L’existence de mesure déterminante est intimement liée à la régularité au sens de la théorie du pluripotentiel, comme l’indiquent les deux résultats suivants. Lemme 3.5. — Si K est un compact de Cn et µ est une mesure déterminante sur K ne chargeant pas les polaires, alors K est régulier.

ASTÉRISQUE 422

(1152)

THÉORIE GLOBALE DU PLURIPOTENTIEL

77

Démonstration. — Observons d’abord que si V est une fonction psh telle que V 6 0 µ-p.p, alors V 6 0 sur K. En effet, si l’on pose E = {V 6 0} ∩ K on a V 6 VE donc V 6 VK car µ est déterminante, et finalement V 6 0 sur K. Ensuite, l’ensemble {VK < VK∗ } est pluripolaire, donc E := {VK∗ 6 0} est un borélien de µ-mesure totale, donc d’après l’observation précédente on a VK∗ 6 0 sur K, qui est la définition de la régularité. Un exemple important de mesure déterminante est la mesure d’équilibre : Proposition 3.6. — Soit K un compact non pluripolaire de Cn . Alors K est régulier si et seulement si sa mesure d’équilibre µK est déterminante. Démonstration. — Supposons K régulier. Soit E un borélien tel que µK (E) = 1. Comme VE 6 0 sur E et {VE < VE∗ } est pluripolaire, on voit que VE∗ 6 0 µK -p.p. Le principe de domination (théorème 2.6) implique alors que VE∗ 6 VK∗ = VK . Comme l’inégalité inverse est vraie par définition, on conclut VE∗ = VK∗ , i. e. µK est déterminante. La réciproque découle du lemme précédent. Le théorème suivant est dû à Siciak [44] et une nouvelle démonstration est donnée dans [12]. La preuve ci-dessous est inspirée de [13]. Théorème 3.7. — Soit K un compact de Cn et µ une mesure déterminante pour K ne chargeant pas les pluripolaires. Alors µ satisfait la propriété de Bernstein-Markov. Lemme 3.8. — Soit (Pj ) une suite de polynômes dont le degré tend vers l’infini. Sous les hypothèses du théorème 3.7, pour tout z ∈ Cn on a (7)

lim sup j→∞

1 |Pj (z)| log 6 VK (z). deg(Pj ) kPj kL2 (µ)

Démonstration. — Quitte à remplacer Pj par

Pj kPj kL2 (µ)

on peut supposer que

kPj kL2 (µ) = 1. Supposons que pour un z0 ∈ Cn l’inégalité (7) soit violée. On a donc une extraction (ϕ(j)) telle que (8)

lim

j→∞

1 log Pϕ(j) (z0 ) > VK (z0 ). deg(Pϕ(j) )

Le résultat suivant est une conséquence facile du lemme de Borel-Cantelli. Lemme 3.9. — Si (fk ) est une suite bornée dans L1 (µ) et (mk ) est une suite réelle 1/mnk tendant vers l’infini, il existe une sous-suite telle que lim supk |fnk | 6 1 µ-p.p.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

78

R. DUJARDIN

Si on applique le lemme à la suite (Pϕ(j) ) qui est bornée dans L2 (µ) donc dans L1 (µ) et à (mϕ(j) ) = (deg(Pϕ(j) )) on obtient une sous-suite (ψ(j)) extraite de (ϕ(j)) telle que 1 (9) lim sup log Pψ(j) 6 0 µ-p.p. j→∞ deg(Pψ(j) ) Posons v = lim sup j→∞

1 log Pψ(j) . deg(Pψ(j) )

D’après (9) on a v 6 0 µ-p.p. donc d’après le théorème 2.5, v ∗ appartient à L . Comme {v < v ∗ } est pluripolaire on a ainsi également v ∗ 6 0 µ-p.p. Alors si l’on pose E = {z ∈ K, v ∗ (z) 6 0} on a donc µ(E) = µ(K) et v ∗ 6 VE . Mais comme d’après le lemme 3.5 K est régulier et µ est déterminante on a VK∗ = VK 6 VE 6 VE∗ = VK∗ . Finalement, v(z0 ) 6 VE (z0 ) 6 VK (z0 ) ce qui contredit (8). Démonstration du théorème. — Soit (Pj ) une suite de polynômes dont le degré tend vers l’infini et posons 1 |Pj (z)| uj = log . deg(Pj ) kPj kL2 (µ) D’après le lemme précédent la suite (uj ) est localement uniformément majorée (sinon on aurait une sous-suite tendant uniformément vers +∞, contredisant (7)), donc on peut en extraire des sous-suites convergentes dans L1loc . Si (ujk ) est une telle soussuite, et u sa limite dans L1loc , on a u = (lim supk ujk )∗ et u = lim supk ujk hors d’un polaire, donc u 6 VK hors d’un polaire et donc partout. Finalement d’après le lemme de Hartogs on a lim supk supK ujk 6 0. Comme ceci est vrai pour toute sous-suite (jk ), on conclut que lim supj supK uj 6 0, c’est-à-dire å1/ deg(Pj ) Ç kPj kK 6 1, lim sup kPj kL2 (µ) j→∞ ce qu’il fallait démontrer. 3.4. Une application : équidistribution des zéros de polynômes aléatoires En guise d’interlude, nous présentons un joli résultat d’équidistribution pour une classe de polynômes aléatoires, dû à Bloom et Shiffman [18], qui est beaucoup plus simple que l’équidistribution des points de Fekete, et sera l’occasion d’évoquer quelques idées utiles. Il s’agit d’une proche variante de travaux récemment exposés dans ce séminaire par N. Anantharaman [2]. Pour tout n > 1, considérons l’espace Pk des polynômes de degré 6 k muni de la structure hermitienne induite par la norme L2 (µ). C’est un espace hermitien  de dimension complexe Nk = n+k . Fixons une base orthonormale (pj ) de cet k espace, par exemple l’orthonormalisée de la base des monômes (eα )|α|6d ordonnés

ASTÉRISQUE 422

(1152)

THÉORIE GLOBALE DU PLURIPOTENTIEL

79

lexicographiquement comme au §2.3. On peut alors définir des polynômes aléatoires PNk gaussiens par p = j=1 cj pj , où les cj sont des variables aléatoires indépendantes suivant la loi normale N (0, 1). On notera γk la loi gaussienne correspondante sur Pk , qui ne dépend pas de (pj ). On définit ainsi une suite de mesures de probabilité Pk sur l’espace des polynômes à n variables. Si f est un polynôme de degré d on note Zf l’hypersurface {f = 0} et si f = (f1 , . . . , fn ) est un n-uplet de polynômes de degré k, on note Zf = Zf1 ∩ · · · ∩ Zfn . Le théorème de Bertini implique que presque sûrement cette intersection est transverse et donc Zf est un ensemble de k n points (sans multiplicité). Rappelons que [Zf ] désigne la somme des masses de Dirac en ces points. Finalement nous noterons Ek ([Zf ]) l’espérance de cette mesure lorsque f = (f1 , . . . , fn ) est un n-uplet de polynômes indépendants de loi γk . Théorème 3.10 (Bloom-Shiffman). — Soit µ une mesure de probabilité à support compact K ⊂ Cn , ne chargeant pas les pluripolaires. On suppose que K est un compact régulier de Cn et que µ satisfait la propriété de Bernstein Markov. Alors quand k tend vers l’infini k1n Ek ([Zf ]) converge vers la mesure d’équilibre µK . En outre, si (fk ) est une suite de n-uplets de polynômes aléatoires de degré k, indépendants et de lois respectives γk⊗n , alors presque sûrement on a k1n [Zfk ] → µK . En dimension 1, ce théorème couvre nombre de familles classiques de polynômes aléatoires (voir [2]). On a également un énoncé valable en codimension intermédiaire : 1 c q kq Ek ([Zfk,1 ∩ · · · ∩ Zfk,q ]) converge vers (dd VK ) pour 1 6 q 6 n. La deuxième assertion du théorème découle du calcul de l’espérance asymptotique et d’un calcul de variance général (voir Shiffman [42]), donc nous nous concentrons sur la première assertion. La première étape de la preuve est un renforcement du théorème 2.3. Soit ¶ © 1/k ΦK,k (z) := sup |P (z)| , P ∈ Pk , kP kK 6 1 . Lemme 3.11. — Si K est un compact régulier, la suite k1 log ΦK,k converge uniformément sur les compacts vers VK quand k tend vers l’infini. Démonstration. — Les ΦK,k sont des fonctions sci, qui convergent en croissant vers la fonction continue VK . Le résultat découle alors du premier théorème de Dini. On forme alors le noyau de Bergman (3) Sk (z, w) =

Nk X

pj (z)pj (w).

j=1

(3)

Étonnamment Bloom et Shiffman l’appellent noyau de Szegő.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

80

R. DUJARDIN

Il est bien connu que Sk est le noyau associé à l’évaluation en z, i. e. on a la formule Z ∀f ∈ Pk , ∀z ∈ Cn , f (z) = Sk (z, w)f (w)dµ(w) qui se vérifie très simplement. Le lien entre Sk et les polynômes aléatoires est le suivant : Lemme 3.12. — Pour tout k > 1 et tout 1 6 q 6 n on a Ä ääq Ä Ek ([Zf1 ∩ · · · ∩ Zfq ]) = ddc log Sk (z, z)1/2 . Démonstration. — Supposons d’abord que q = 1. On écrit f = les cj sont des gaussiennes centrées réduites. Ainsi pour tout z on a X Z Nk (10) E (log |f (z)|) = log cj pj (z) dγ(c).

PNk

j=1 cj pj ,



j=1

Dans C

Nk

on a la formule Z

X Nk log cj xj dγ(c) = log kxk , j=1

où la norme du membre de droite est la norme euclidienne. En effet si u désigne le membre de gauche, c’est une fonction psh invariante par rotation, donc une fonction convexe de log kxk, et comme on a par ailleurs u(λx) = log λ + u(x) on conclut que u(x) = log kxk (voir également la formule de Crofton dans [27, III.7]). En appliquant (10) on en déduit que ÅX ã1/2 Nk 2 E (log |f (z)|) = log |pj (z)| . j=1 c

En prenant le dd et en appliquant la formule de Lelong-Poincaré, on conclut que Ä ä E([Zf ]) = ddc log Sk (z, z)1/2 comme annoncé. Pour les autres valeurs de q, on utilise le cas q = 1 et on raisonne par récurrence en écrivant Ek ([Zf1 ∩· · ·∩Zfq +1 ]) = Ek ([Zf1 ∩· · ·∩Zfq ]∧[Zfq+1 ]) = Ek ([Zf1 ∩· · ·∩Zfq ])∧Ek ([Zfq+1 ]) où la première égalité vient de ce que génériquement les Zfj sont transverses et la deuxième provient de l’indépendance des fj et du théorème de Fubini. Le dernier lemme fait le lien entre les ΦK,n (liés à la structure uniforme) et les Sk (associés à L2 (µ)).

ASTÉRISQUE 422

(1152)

THÉORIE GLOBALE DU PLURIPOTENTIEL

81

Lemme 3.13. — Pour tout ε > 0 il existe C(ε) tel que pour tout z ∈ Cn on a 1 Sk (z, z) 6 C(ε)(1 + ε)2k Nk . 6 Nk ΦK,k (z)2 Démonstration. — Soit f ∈ Pk tel que kf kK 6 1. Alors pour tout z ∈ K on a Z Z |f (z)| = Sk (z, w)f (w)dµ(w) 6 |S(z, w)| dµ(w) Z 1/2 6 Sk (z, z)1/2 S(w, w) dµ(w) ÅZ 6 Sk (z, z)1/2

ã1/2 S(w, w)dµ(w) = Sk (z, z)1/2 (Nk )1/2 .

En prenant le sup en f on obtient bien ΦK,k (z) 6 Sk (z, z)1/2 (Nk )1/2 . Pour l’inégalité de droite on applique l’inégalité de Bernstein-Markov aux vecteurs de base pj : pour tout ε > 0 il existe C(ε) telle que kpj kK 6 C(ε)(1 + ε)k kpj kL2 (µ) = C(ε)(1 + ε)k . Comme

|pj (z)| kpj kK

6 ΦK,k (z) par définition de ΦK,k , on en déduit que

|pj (z)| 6 C(ε)(1 + ε)k ΦK,k (z) et donc S(z, z) 6 Nk C(ε)2 (1 + ε)2k ΦK,k (z)2 qui est l’inégalité voulue. Démonstration du théorème 3.10. — On déduit des lemmes 3.11 et 3.13 que 1 2k log Sk (z, z) converge uniformément sur les compacts vers VK . Comme le produit extérieur des courants est continu pour la convergence uniforme de leurs potentiels, en utilisant le lemme 3.12 on obtient que Å ãn 1 1 c Ek ([Zf ]) = dd log Sk (z, z) * (ddc VK )n = µK n→∞ kn 2k ce qui conclut la preuve.

4. FIBRÉS POSITIFS ET THÉORIE GLOBALE DU PLURIPOTENTIEL 4.1. Cadre et définitions 4.1.1. — Soit X une variété complexe compacte de dimension n, munie d’un fibré en droites L. Pour fixer les idées, donnons-nous une métrique lisse de référence h0 = |·|h0 sur ce fibré. Si s est une trivialisation locale de L, on peut écrire |s|h0 = e−φ0 où φ0 : X → R et la (1, 1) forme ddc φ0 ne dépend pas du choix de s, donc a un sens global sur X : c’est la forme de courbure Θh0 de la métrique. La fonction φ0 s’appelle

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

82

R. DUJARDIN

le poids de la métrique (4). Si h0 est une autre métrique alors

|·|h0 |·|h 0 c

= e−u où u est

une fonction globalement définie sur X et donc Θh − Θh0 = dd u. Ainsi la classe de cohomologie {Θh0 } ∈ H 2 (X, R) ne dépend pas de la métrique et la normalisation du ddc fait que celle-ci appartient naturellement à H 2 (X, Z) : c’est la première classe de Chern de L. On voit que h0 étant fixée, l’ensemble des autres métriques s’identifie à un espace vectoriel de fonctions sur L. Nous serons naturellement amenés à considérer des métriques singulières, où la fonction u est de classe L1loc . Un cas particulièrement intéressant est celui où le courant de courbure de ces métriques est positif : on parle de métrique semi-positive. Ceci mène naturellement à la définition suivante : soit θ une (1, 1)-forme lisse sur X . Une fonction ϕ de classe L1loc sur X est dite θ-psh si elle est scs et θ+ddc ϕ > 0 au sens des courants. Ces fonctions héritent de la plupart des propriétés des fonctions psh. On notera PSH(X, θ) l’ensemble des fonctions θ-psh. En particulier, on a la propriété de compacité suivante : une famille normalisée de fonctions ω-psh est compacte dans L1loc . La normalisation peut être donnée par supX ϕ = 0, ou bien R ϕdµ = 0, où µ est une mesure « raisonnable ». 4.1.2. — Un exemple fondamental est celui du fibré O (1) sur l’espace projectif Pn , qui est le dual du fibré tautologique induit par la projection Cn+1 \ {0} → Pn . On peut aussi le décrire de la manière suivante : on se donne un système de coordonnées homogènes [z0 : · · · : zn ] et sur l’ouvert de carte Ui = {zi 6= 0} ' Cn une section de O (1) est donnée par une expression de la forme Pi (z0 /zi , . . . , zn /zi ) où les Pi satisfont les relations de compatibilité ∀i, j, zi Pi (z0 /zi , . . . , zn /zi ) = zj Pj (z0 /zj , . . . , zn /zj ). On voit que ces données se recollent en un unique polynôme homogène de degré 1 sur Cn+1 et également qu’un polynôme de degré au plus 1 dans Cn peut être vu comme la restriction d’une section de O (1) au complémentaire d’un hyperplan. De même l’espace des sections de O (k) = O (1)⊗k s’identifie naturellement à l’espace des polynômes homogènes de degré k en n + 1 variables, ou à celui des polynômes de degré au plus k dans une carte affine. 2 Un calcul explicite montre que le poids φ0 (z) = log(1 + |z| ) sur Cn définit une métrique h0 sur O (1)| n qui s’étend à Pn en une métrique lisse et (strictement) positive C sur O (1) (dont la courbure est la forme de Fubini-Study). Si maintenant on considère une métrique h semi-positive arbitraire sur O (1), alors on a h = h0 e−ϕ où ϕ est une fonction scs sur Pn et Θh0 -psh. Dans la carte Cn on obtient donc une fonction psh 2 2 ψ := ϕ + log(1 + |·| ) telle que ψ(z) 6 log(1 + |z| ) + O(1) à l’infini, c’est-à-dire (4)

Qui n’est bien sûr pas une fonction bien définie. Nous n’adopterons pas le formalisme des poids utilisé dans [10] et [12] et tâcherons de définir les objets directement en termes de métriques.

ASTÉRISQUE 422

(1152)

THÉORIE GLOBALE DU PLURIPOTENTIEL

83

une fonction de L . (Remarquer que si ϕ est continue alors ψ ∈ L + .) Réciproquement 2 si ψ ∈ L alors ϕ = ψ − log(1 + |·| ) s’étend à travers l’hyperplan à l’infini en une fonction Θh0 -psh, et définit donc une métrique semi-positive sur O (1). L’étude des métriques semi-positives sur (Pn , O (1)) est donc équivalente à celle de la classe L . 4.1.3. — L’espace des sections H 0 (X, L) de L est un C-espace vectoriel de dimension finie h0 (X, L), et le taux de croissance de h0 (X, Lk ) est une caractéristique importante de L (nous notons classiquement Lk := L⊗k ). Par exemple ! k+n kn 0 n n h (P , O (k)) = dim(Pk (C )) = ∼ . n! k On dit que L est gros si ce taux de croissance est maximal, c’est-à-dire de l’ordre de k dim(X) . Dans ce cas le volume de L est défini par vol(L) = lim sup k→∞

n! 0 h (X, Lk ) > 0. kn

C’est le cadre dans lequel travaillent Berman, Boucksom et Witt Nyström dans [10, 12]. Un thème classique en géométrie complexe est de lier la croissance de h0 (X, Lk ) et les propriétés de positivité de L. On dit que L est positif (5) s’il admet une métrique lisse h dont la forme de courbure Θh est définie positive (en tout point) : c’est alors une R R forme de Kähler. Un fibré positif est gros et dans ce cas vol(L) = c1 (L)n = X Θnh . Si L admet des sections et (s1 , . . . , sN ) désigne une base de H 0 (X, L), on définit une application méromorphe ιL : x 7→ [s1 (x) : · · · : sN (x)] ∈ P(H 0 (X, L)) qui ne dépend que de L à transformations projectives près. Le théorème de plongement de Kodaira (voir [27, Chap. VII]) affirme que L est positif si et seulement si ιLk est un plongement pour k assez grand (i. e. L est ample au sens de la géométrie algébrique). Remarquer que le sens réciproque est facile : si ιLk est un plongement, alors Lk est isomorphe via ι∗Lk (O (1)) qui est positif, et si h est une métrique positive sur Lk , alors h1/k est une métrique positive sur L. Un théorème fameux de Tian [47] affirme que le plongement de Kodaira est asymptotiquement isométrique, au sens suivant : si (L, h) est ample, la métrique h induit une structure hermitienne sur H 0 (X, L) dont la norme associée est R 2 2 ksk = X |s(x)|h Θnh . Pour tout k > 1, hk est une métrique positive sur Lk , donc il en est de même pour H 0 (X, Lk ). Choisissons maintenant pour tout k une base orthonormale de H 0 (X, Lk ) et soit ιk le plongement associé ιk : X → P(H 0 (X, L)). (5)

Il y a ici une incohérence entre les terminologies française et anglo-saxonne relatives à la positivité. Nous préférerons dans la suite le vocable « ample » pour éviter les confusions.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

84

R. DUJARDIN

Sur PN (C) on a la forme de Fubini-Study ωFS définie en coordonnées homogènes par ωFS = ddc log |z|. Théorème 4.1 (Tian). — Avec les notations précédentes, on a

1 ∗ ι (ωFS ) −→ Θh . k→∞ k k

Supposons maintenant que L est gros. Il admet alors une métrique singulière telle que Θh domine une forme strictement positive, et pour k grand les applications ιLk sont biméromorphes (mais pas holomorphes car sinon L serait ample). Ces singularités correspondent au lieu base où toutes les sections s’annulent. Une motivation importante pour travailler dans ce cadre est que cette propriété est invariante par modification propre, et permet donc par résolution des singularités de traiter le cas de variétés singulières. En contrepartie la théorie du pluripotentiel des métriques sur les fibrés gros est sensiblement plus délicate car on y est naturellement amené à travailler avec des poids non bornés. Nous ne nous attarderons pas sur ces difficultés et discuterons essentiellement dans la suite le cas ample. 4.1.4. — Nous allons maintenant généraliser à ce contexte certaines idées du § 2.2. Supposons pour le moment que L est ample et fixons une fois pour toutes une métrique lisse h0 sur L dont la forme de courbure ω est définie positive (c’est donc une forme de Kähler). Soit K un sous-ensemble non pluripolaire de X (en général supposé compact) et h une métrique continue sur L| . Nous parlerons dans ce cas de compact pondéré. K Alors h = h0 e−Q sur K et on définit la fonction extrémale pondérée ¶ © (11) (PK,ω Q)(x) = sup u(x), u ∈ PSH(X, ω), u| 6 Q . K Il faut penser (PK,ω Q)∗ comme une projection : C 0 (K) → PSH(X, ω) (en particulier si K = X et Q est ω-psh alors PX,ω Q = Q). En général nous supprimerons la mention de ω dans la notation. La discussion du 4.1.2 montre que cette définition étend celle de la fonction extrémale pondérée VK,Q dans Cn . Cette fonction dépend du choix de h0 mais on vérifie simplement que ω + ddc (PK Q) ne dépend que de h. On voit également que le cadre pondéré s’impose ici naturellement puisque le cas Q = 0 n’a pas de signification particulière. ∗ La régularisée semi-continue PK Q est ω-psh et bornée. En effet elle est minorée car si on fixe une fonction ω-psh lisse u (il en existe car L est ample) on a (u − C)| 6 Q K pour un certain C. Elle est majorée car la borne u| 6 Q sur un ensemble non K polaire implique une borne supérieure uniforme (ceci découle des propriétés locales des fonctions psh, cf. le theorème 2.5). On dit que (K, Q) est régulier si PK Q = PK Q∗ et que K est régulier s’il est régulier pour tout poids Q continu. Dans le cas ample une fonction ω-psh est limite décroissante de fonctions ω-psh lisses, donc on peut choisir des compétiteurs continus dans (11) et il suit que PK Q est également sci, donc continue.

ASTÉRISQUE 422

(1152)

THÉORIE GLOBALE DU PLURIPOTENTIEL

85

Voici quelques propriétés simples à établir. ∗ Lemme 4.2. — L’application Q 7→ PK Q est croissante, concave, et Lipschitz pour la norme uniforme : ∗ ∗ kPK Q1 − PK Q2 kX 6 kQ1 − Q2 kK .

(12)

On définit la mesure d’équilibre µeq (K, h) par µeq (K, h) =

1 n ∗ ∗ (ω + ddc PK Q) = MAω (PK Q) vol(L)

où MAω (ou plus simplement MA) est l’opérateur de Monge-Ampère complexe associé à (L, h0 ), c’est-à-dire que MAω (ϕ) = (ω + ddc ϕ)n . L’ingrédient principal du lemme suivant est le théorème 2.1 : Lemme 4.3. — La mesure µeq (K, h) est une mesure de probabilité à support dans K ∗ Q = Q, µeq (K, h)-p.p. et on a PK 4.1.5. — Si L est seulement gros on peut poser les mêmes définitions, mais plusieurs ∗ Q n’a plus de raison difficultés techniques apparaissent, liées au fait que la fonction PK d’être localement minorée. En particulier pour définir l’opérateur de Monge-Ampère ∗ on commence par le définir sur le lieu où PK Q est localement bornée, et on l’étend trivialement à travers les pôles. Il faut alors montrer que la masse totale a la valeur attendue, à savoir vol(L) : ceci a été fait dans [20] (voir l’exposé de J.-P. Demailly [26] pour une présentation succincte). 4.2. Énergie à l’équilibre 4.2.1. Définitions. — Supposons toujours L ample et soit ω la forme de courbure d’une métrique lisse positive h0 sur L. Si ϕ est une fonction ω-psh localement bornée on pose n Z X 1 Eω (ϕ) = E (ϕ) = ϕ(ω + ddc ϕ)j ∧ ω n−j . (n + 1) vol(L) j=0 X est par définition l’énergie de Monge-Ampère. C’est une fonctionnelle qui apparaît sous diverses formes en géométrie kählerienne. Elle a les propriétés suivantes (voir [26]) : E

Proposition 4.4. — (i) E est une primitive de l’opérateur de Monge-Ampère au sens suivant : si ϕ et ψ sont des fonctions ω-psh bornées alors Z d E (ϕ + t(ψ − ϕ)) = (ψ − ϕ)MA(ϕ). dt t=0

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

86

R. DUJARDIN

(ii) Sous les mêmes hypothèses, on a n

X 1 E (ψ) − E (ϕ) = (n + 1) vol(L) j=0

Z

(ψ − ϕ)(ω + ddc ϕ)j ∧ (ω + ddc ψ)n−j .

X

(iii) E est concave et croissante. (iv) E (ϕ + c) = E (ϕ) + c. Replaçons-nous maintenant dans le cadre du §4.1.4. Avec les mêmes notations on définit l’énergie à l’équilibre du compact pondéré (K, h) par Eeq (K, h)

= E (PK Q∗ ).

Cette quantité dépend du choix de h0 mais la formule (ii) de la proposition précédente montre que si (K1 , h1 ) et (K2 , h2 ) sont deux tels compacts, la différence Eeq (K2 , h2 ) − Eeq (K1 , h1 ) est intrinsèquement définie. Tous ces résultats s’étendent au cas de fibrés gros, modulo un certain nombre de difficultés techniques (à commencer par la définition de E ). 4.2.2. Différentiabilité. — Le premier résultat principal de [10] est la différentiabilité ∗ . C’est un au sens de Gâteaux (c’est-à-dire dans toutes les directions) de E ◦ PK analogue complexe d’un théorème d’Alexandrov en géométrie convexe [1]. Noter que ce résultat est non trivial car PK n’est en général pas différentiable. Il est la clef de la plupart des résultats des sections suivantes, et a également trouvé de nombreuses applications en géométrie kählerienne (notamment dans les travaux de Berman, Boucksom, Guedj et Zeriahi [11], voir [26]). Théorème 4.5 (Berman-Boucksom). — Avec les notations précédentes, l’application ∗ Q 7→ E (PK Q) est Gâteaux différentiable sur l’espace des poids continus. Plus précisément, si Q et v sont des fonctions continues sur K on a Z d ∗ ∗ (E ◦ PK (Q + tv)) = v MA(PK Q). dt t=0

Démonstration. — Nous suivons ici Lu et Nguyen (voir [38, Lemma 6.13]) qui ont grandement simplifié la démonstration originale. Comme d’habitude il est plus simple de se limiter au cas ample pour lequel les fonctions extrémales sont continues et les définitions de MA et E ne posent pas de problèmes. ∗ Observons d’abord que d’après le lemme 4.2 et la proposition 4.4, E ◦PK est concave et continue donc elle admet des dérivées dans toutes les directions. Le point est donc d’identifier cette dérivée. Quitte à changer v en −v, il suffit de s’intéresser à la dérivée à droite. Par concavité de E et E 0 = MA, pour t > 0 on a Z ∗ ∗ ∗ ∗ ∗ E (PK (Q + tv)) − E (PK (Q)) 6 (PK (Q + tv) − PK Q) MA(PK Q).

ASTÉRISQUE 422

(1152)

THÉORIE GLOBALE DU PLURIPOTENTIEL

87

∗ ∗ Ensuite par le lemme 4.3 on a PK Q = Q, MA(PK Q)-p.p., et par définition on a ∗ PK (Q + tv) 6 (Q + tv) sur K et donc PK (Q + tv) 6 (Q + tv) quasi-partout sur K, ainsi Z Z Z ∗ ∗ ∗ ∗ ∗ (PK (Q + tv) − PK Q) MA(PK Q) 6 ((Q + tv) − Q) MA(PK Q) = t vMA(PK Q).

Toujours par concavité on a également Z ∗ ∗ ∗ ∗ ∗ E (PK (Q + tv)) − E (PK (Q)) > (PK (Q + tv) − PK Q) MA(PK (Q + tv)) Z ∗ > ((Q + tv) − Q) MA(PK (Q + tv)) ∗ ∗ où dans la deuxième inégalité on a utilisé de même PK (Q + tv) = Q + tv et PK Q6Q ∗ MA(PK (Q + tv))-p.p. Finalement, Z Z 1 ∗ ∗ ∗ ∗ (Q + tv)) − E (PK (Q))) 6 vMA(PK (Q + tv)) vMA(PK Q)) 6 (E (PK t

et le résultat suit, car par le lemme 4.2 et la continuité de l’opérateur de Monge∗ ∗ Q)) quand (Q + tv)) * MA(PK Ampère pour la convergence uniforme on a MA(PK t tend vers 0. 4.3. Volume des boules dans les espaces de sections. — Les constantes de Tchebycheff définies aux §§ 1.2 et 2.2 peuvent être vues comme donnant des informations géométriques sur la boule unité de (Pk (Cn ), k·kK ), qui asymptotiquement définissent la capacité. Nous allons ici nous intéresser au volume de cette boule unité. Comme il n’y a pas de normalisation naturelle pour la mesure de Haar sur H 0 (X, Lk ), il sera plutôt question de quotients de volumes. Soit comme précédemment K un compact non pluripolaire et h une métrique continue sur L| . Pour tout k > 1, hk induit une métrique continue sur Lk | K K et on peut définir une norme sur H 0 (X, Lk ) par kskL∞ (K,hk ) = supK |s|hk . De même si µ est une mesure sur K ne chargeant pas les pluripolaires, on définit R 2 2 kskL2 (µ,hk ) = |s|hk dµ. À ces normes correspondent des boules unité respectives B ∞ (K, hk ) et B 2 (µ, hk ) dans H 0 (X, Lk ). Le deuxième théorème principal de [10] est le suivant. Théorème 4.6 (Berman-Boucksom). — Soient L un fibré gros sur une variété complexe X, et pour j = 1, 2, Kj un compact non pluripolaire et hj une métrique continue sur Kj . Alors (13)

vol(B ∞ (K1 , hk1 )) 1 −→ Eeq (K1 , h1 ) − Eeq (K2 , h2 ). log 2kh0 (X, Lk ) vol(B ∞ (K2 , hk2 )) k→∞

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

88

R. DUJARDIN

De même si pour j = 1, 2, µj est une mesure de probabilité satisfaisant la propriété de Bernstein-Markov relativement à (Kj , hj ) on a (14)

1 vol(B 2 (µ1 , hk1 )) log −→ Eeq (K1 , h1 ) − Eeq (K2 , h2 ). 2kh0 (X, Lk ) vol(B 2 (µ2 , hk2 )) k→∞

Dans ces énoncés le volume est relatif à n’importe quelle mesure de Haar sur H 0 (X, Lk ) et comme remarqué plus haut le quotient est bien défini. Comme à la section 3 on dit que µ a la propriété de Bernstein-Markov relativement à (K, h) s’il existe une suite (Mk ) telle que pour toute section s ∈ H 0 (X, Lk ) on a (15)

kskL2 (µ,hk ) 6 kskL∞ (K,hk ) 6 Mk kskL2 (µ,hk ) et lim (Mk )1/k = 1. k→∞

On a dans le cas global des critères analogues à ceux des §§ 3.2 et 3.3 (avec essentiellement les mêmes démonstrations) qui montrent que cette condition est fréquemment satisfaite. Par exemple la mesure d’équilibre de tout compact régulier muni d’un poids continu est de Bernstein-Markov, de même que toute mesure à densité continue et strictement positive sur X. Alors comme dimR H 0 (X, Lk ) = 2h0 (X, Lk ) on en déduit que 1 2kh0 (X, Lk )

log

vol(B ∞ (K, hk )) −→ 0, vol(B 2 (µ, hk )) k→∞

par conséquent les assertions (13) et (14) sont équivalentes. 4.3.1. Noyau de Bergman. — Soient L un fibré en droites sur X et h une métrique quelconque sur L ; on dispose donc de la métrique hk sur Lk . Soit également µ une mesure de probabilité sur X. Elle induit une structure hermitienne sur H 0 (X, Lk ) 2 dont la norme associée est kskL2 (µ,hk ) . Le noyau de Bergman associé est défini comme P précédemment par K(x, y) = sj (x) ⊗ sj (y), où (sj ) est une base orthonormale quelconque de cet espace hermitien. C’est une section du fibré L  L sur X × X (on rappelle que LL = π1∗ L⊗π2∗ L, où π1 et π2 sont les projections naturelles de X ×X). La fonction de Bergman associée à (X, Lk ) est par définition Bk (µ, h) =

Nk X

2

|sj |hk

j=1

où l’on a noté Nk = h0 (X, Lk ). Un exercice très simple de géométrie hermitienne montre que Bk (µ, h) mesure la distortion ponctuelle de la norme L2 (µ, hk ), i. e. (le carré de) la norme de l’opérateur d’évaluation en x : 2

Bk (µ, h)(x) =

sup s∈H 0 (X,Lk )\{0}

ASTÉRISQUE 422

|s(x)|h 2

kskL2 (µ,hk )

.

(1152)

THÉORIE GLOBALE DU PLURIPOTENTIEL

89

On définit finalement la mesure de Bergman associée à (X, Lk ) par : (16)

βk (µ, h) =

1 Bk (µ, h)µ, Nk

qui est clairement une mesure de probabilité. On a le théorème de convergence suivant, qui est en fait l’ingrédient technique principal du théorème 4.1. Théorème 4.7. — Si L est ample, h est une métrique lisse et positive sur L, et µ une mesure à densité lisse et strictement positive sur X, la suite des mesures de 1 Bergman βk (µ, h) converge faiblement vers vol(L) Θnh . Noter la parenté de ce résultat avec les méthodes du §3.4. On constate également comme au théorème 3.10 que la limite ne dépend pas du choix (raisonnable) de µ. L’argument montre en effet la convergence en tout point en employant un argument de changement d’échelle qui gomme le choix de la mesure (lisse) de départ. On peut 1 Θnh = µeq (X, h). Sous cette forme l’énoncé se généralise également observer que vol(L) comme suit : Théorème 4.8 (Berman [6]). — Si L est gros, h est une métrique lisse arbitraire sur L et µ une mesure à densité lisse et strictement positive sur X, la suite des mesures de Bergman βk (µ, h) converge faiblement vers µeq (X, h). 4.3.2. Démonstration du théorème 4.6. — Supposons pour simplifier que L est ample et K est régulier. Observons d’abord qu’en prenant des différences, il suffit de montrer (13) et (14) dans le cas où K2 = X, h2 est lisse et (strictement) positive, et µ2 est à densité lisse et strictement positive. Observons qu’il existe une métrique semi-positive continue h1,K telle que pour tout k > 0 et toute section s ∈ H 0 (X, Lk ) on a kskL∞ (K,hk ) = kskL∞ (K,hk ) . On 1 1,K peut alors remplacer (K1 , h1 ) par (X, h1,K ) dans l’énoncé. En effet, avec les notations du § 4.1.4, h0 étant une métrique auxiliaire positive fixée (par exemple h2 ), notons h1 = h0 e−Q . Si s ∈ H 0 (X, L), la fonction log |s|h0 est ω-psh, donc par définition de la fonction extrémale si |s|h1 6 c sur K on a log |s|h0 −c 6 Q sur K et donc log |s|h0 −c 6 PK Q sur X. On en déduit que supK (log |s|h0 − Q) = supX (log |s|h0 − PK Q). Le raisonnement pour Lk est identique et il suffit donc de poser h1,K = h0 e−PK Q , qui est continue car K est supposé régulier. On peut maintenant appliquer le théorème de régularisation de Richberg pour les fonctions psh continues (voir par exemple [27, I.5.E]), qui implique qu’il existe une suite de métriques lisses et strictement psh (h1,j ) convergeant uniformément vers h1,K . On a alors par convergence uniforme Eeq (X, h1,K )

= E (X, h1,K ) = lim E (X, h1,j ). j→∞

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

90

R. DUJARDIN

On se convainc par ailleurs aisément que vol(B ∞ (X, hk1,K )) 1 −→ 0, log 2kh0 (X, Lk ) vol(B ∞ (X, hk1,j )) j→∞ uniformément par rapport à k. En effet si εj est une suite telle que e−εj 6 on a e−kεj B ∞ (X, hk1,j ) ⊂ B ∞ (X, hk1,K ) ⊂ ekεj B ∞ (X, hk1,j )

|·|h

1,j

|·|h

6 e εj ,

1,K

et donc

vol(B ∞ (X, hk1,K )) 1 log 6 εj . 2kh0 (X, Lk ) vol(B ∞ (X, hk1,j )) Ceci montre que pour démontrer le théorème, on peut également supposer que K1 = X et que h1 est lisse et strictement positive. Comme on l’a déjà remarqué, les assertions (13) et (14) sont équivalentes, et nous allons maintenant passer au point de vue L2 . Prenons µ1 = µ2 = µ. Nous devons montrer que −εj 6

1 2kh0 (X, Lk )

log

vol(B 2 (µ, hk1 )) −→ E (X, h1 ) − E (X, h2 ). vol(B 2 (µ, hk2 )) k→∞

La preuve est basée sur le fait suivant : si V est un espace vectoriel complexe muni de deux produits scalaires hermitiens h·, ·i1 et h·, ·i2 , alors le quotient des volumes des boules unités correspondantes s’exprime comme un déterminant de Gram. Plus précisément, si N = dim(V ) et e1 , . . . , eN est une base orthonormale relativement à h·, ·i2 , on a vol(Bh·,·i2 (0, 1)) = det Gram1 (e1 , . . . , eN ) = det(hei , ej i1 )i,j=1,...,N . vol(Bh·,·i1 (0, 1)) En dérivant ce déterminant on peut ainsi par un calcul simple déterminer la différentielle de la fonctionnelle h 7→ vol(B 2 (µ, h)) : Lemme 4.9. — Les dérivées directionnelles de la fonctionnelle 1 h 7→ log vol(B 2 (µ, hk )) 2kNk sont données par l’intégration contre la mesure de Bergman βk (µ, h), i. e. si v est une fonction lisse sur X alors Z d 1 2 k −ktv log vol(B (µ, h e )) = v dβk (µ, h). dt 2kNk X t=0 Démonstration. — Fixons une base orthonormale (s1 , . . . , sNk ) de sections de Lk relativement à (µ, hk ). On a ÅZ ã vol(B 2 (µ, hk e−ktv )) −2ktv log s | = − log det(hs , s i ) = − log det |s e dµ k −ktv i j h e i,j i j hk vol(B 2 (µ, hk )) i,j

ASTÉRISQUE 422

(1152)

THÉORIE GLOBALE DU PLURIPOTENTIEL

91

et en utilisant d(log ◦ det)Id = trace (17)

ÅZ ã 1 d 1 d 2 k −ktv −2ktv log vol(B (µ, h e )) = − trace |si sj |hk e dµ 2kNk dt t=0 2kNk dt t=0 i,j Z X Z Nk 1 2 =− |si |hk (−2kv)dµ = vdβk (µ, h), 2kNk i=1

d’où le résultat. Nous pouvons maintenant conclure la preuve du théorème 4.6 dans le cas ample. Si pour t ∈ [0, 1] on pose ht = ht1 h1−t = h2 e−tv on a 2 Z 1 ÅZ ã 1 vol(B 2 (µ, hk1 )) log = v dβ (µ, h ) dt d’après (17) k t 2kh0 (X, Lk ) vol(B 2 (µ, hk2 )) 0 X Z 1 ÅZ ã 1 n vΘht dt par le théorème 4.7 −→ k→∞ vol(L) 0 X Z 1 d 1 E(X, ht )dt par la proposition 4.4 = vol(L) 0 dt 1 = (E(X, h1 ) − E(X, h2 )) vol(L) ce qui est le résultat annoncé. Dans le cas où L est supposé simplement gros, l’argument est similaire excepté que dans le dernier calcul on remplace le théorème 4.7 par le théorème 4.8 et la proposition 4.4 par le théorème 4.5.

5. ÉQUIDISTRIBUTION Nous allons voir dans cette section comment la combinaison des théorèmes 4.5 et 4.6 ont permis à Berman, Boucksom et Witt Nyström de démontrer plusieurs résultats importants d’équidistribution. Supposons que L est un fibré gros au-dessus de X et fixons K0 un compact non pluripolaire de X muni d’une métrique h0 continue et d’une mesure µ0 de BernsteinMarkov relativement à (K0 , h0 ). Quitte à multiplier la métrique par une constante, on peut normaliser l’énergie de Monge-Ampère par Eeq (K0 , h0 ) = 0. On normalise également la mesure de Lebesgue sur H 0 (X, Lk ) de sorte que vol(B 2 (µ0 , hk0 )) = 1. Ceci a pour effet d’éliminer la différence dans (14). On peut penser à prendre K0 = X et h0 et µ0 lisses, mais pour les applications au diamètre transfini dans Cn par exemple il vaut mieux prendre pour K0 le tore unité de Cn et µ0 sa mesure de Haar.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

92

R. DUJARDIN

Si (K, h) est un compact pondéré muni d’une mesure de Bernstein-Markov µ, nous noterons Lk (µ, h)

= (2kh0 (Lk ))−1 log vol B 2 (µ, hk ),

de sorte qu’avec les normalisations précédentes, par le théorème 4.6, quand k → ∞ on a Lk (µ, h) → Eeq (K, h). 5.1. Schéma général. — Les résultats d’équidistribution qui suivent sont tous basés sur le même schéma, qui est une abstraction de l’argument de convergence de [46]. On se donne une suite de fonctionnelles Fk définies sur un voisinage de h dans l’espace des métriques continues sur L| . Noter que celui-ci est simplement un espace affine K modelé sur C 0 (K) puisque toute métrique sur L| s’écrit sous la forme he−v . Faisons K les hypothèses suivantes : (i) l’application C 0 (K) 3 v 7→ Fk (he−v ) est concave sur un voisinage de l’origine et Gâteaux différentiable en 0 ; (ii) pour v ∈ C 0 (K) au voisinage de 0 on a lim inf k→∞ Fk (he−v ) > Eeq (K, he−v ) ; (iii) limk→∞ Fk (h) = Eeq (K, h). Alors pour tout v ∈ C 0 (K) on a lim dFh (v) = hµeq(K,h) , vi.

k→∞

La preuve est très simple et découle directement du lemme élémentaire suivant : Lemme 5.1. — Soient U un voisinage de 0 dans R, (fk ) une suite de fonctions réelles concaves sur U et g une fonction définie sur U , toutes dérivables en 0. On suppose que – lim inf k→∞ fk > g ; – limk→∞ fk (0) = g(0). Alors limk→∞ fk0 (0) = g 0 (0). 5.2. Mesures de Bergman. — L’application la plus directe de cette méthode concerne les fonctionnelles Lk elles-mêmes. On obtient ainsi le théorème suivant issu de [12], qui est une généralisation des théorèmes 4.7 et 4.8. Théorème 5.2. — Soient L un fibré en droites gros sur une variété complexe X et (K, h) un compact pondéré sur X muni d’une mesure µ satisfaisant la propriété de Bernstein-Markov. Alors la suite des mesures de Bergman βk (µ, h) (définies en (16)) converge quand k → ∞ vers µeq (K, h).

ASTÉRISQUE 422

(1152)

93

THÉORIE GLOBALE DU PLURIPOTENTIEL

Démonstration. — Il faut vérifier que les fonctionnelles Lk (µ, h) vérifient les hypothèses du §5.1. Les hypothèses (ii) et (iii) sont satisfaites par le théorème 4.6. La différentiabilité de Lk (µ, h) par rapport à h a été démontrée en (17), reste donc à établir sa concavité. Cela peut se faire par un calcul direct un peu pénible (voir [14, Lem. 3.6]) ou en utilisant le calcul suivant qui va jouer un rôle important dans la suite. Fixons une base orthonormale (si )16i6Nk de sections de H 0 (Lk ) relativement à (µ0 , h0 ). Avec la normalisation que nous avons choisie pour le volume on a  log vol(B 2 (µ, h)) = − det hsi , sj iL2 (µ,hk ) . k

Considérons maintenant le fibré en droites (Lk )Nk sur X N , dont les sections locales sont de la forme s1 (x1 ) · · · sNk (xNk ), où les si sont des sections locales de Lk . Il est muni d’une métrique induite par h que nous noterons simplement |·|h , et dont le poids dans les coordonnées précédentes est de la forme e−(φ(x1 )+···+φ(xNk )) . La base de sections (si ) induit une section de (Lk )Nk qui est définie en coordonnées locales par det(si (xj ))16i,j6Nk . Lemme 5.3. — Avec les notations précédentes on a la formule Z  2 |det(si (xj ))|h dµ(x1 ) · · · dµ(xNk ). det hsi , sj iL2 (µ,hk ) = Nk ! XNk

La concavité de Lk par rapport à h s’en déduit immédiatement : en effet faisons varier la métrique en remplaçant h par he−v . On a alors 1 −v Lk (µ, he ) = log vol(B 2 (µ, hk e−kv )) 2kNk Z 1 2 log |det(si (xj ))|h e−2kNk v dµ(x1 ) · · · dµ(xNk ) =− k 2kNk N X et cette dernière intégrale est une fonction concave de v : c’est en effet une conséquence directe de l’inégalité de Hölder. Démonstration du lemme 5.3. — Pour éviter des complications un peu artificielles d’algèbre linéaire, plaçons-nous dans le cas d’un compact de Cn muni du poids Q = 0. On se donne une base (s1 , . . . , sN ) de l’espace des polynômes d’un degré donné et µ une mesure sur K, et on doit démontrer la formule Z 2 (18) |det(si (xj ))| dµ(x1 ) · · · dµ(xN ) = N ! det(hsi , sj iL2 (µ) )i,j=1,...,N KN

qui est en fait connue des spécialistes de matrices aléatoires (voir [25, §5.4]). Soit σi une base orthonormale de l’espace des polynômes pour la structure induite par L2 (µ) P et A = (ai,j ) la matrice telle que si = j ai,j σj . Alors on vérifie simplement que 2

2

det(hsi , sj iL2 (µ) ) = |det(A)| det(hσi , σj iL2 (µ) ) = |det(A)| ,

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

94

R. DUJARDIN

et donc il suffit de montrer que dans le cas d’une base orthonormale, le membre de gauche de (18) vaut N !. Pour cela développons 2

|det(si (xj ))| = det(si (xj ))det(si (xj )) ! X

=



(τ )s1 xτ (1) · · · sN xτ (N )



τ ∈SN

! ×

X

(τ 0 )s1



xτ 0 (1) · · · sN xτ 0 (N )



τ 0 ∈SN

=

X

    (τ )(τ 0 )s1 xτ (1) · · · sN xτ (N ) s1 xτ 0 (1) · · · sN xτ 0 (N ) .

(τ,τ 0 )∈(SN )2

Si l’on intègre cette dernière expression par rapport à dµ(x1 ) · · · dµ(xN ), comme Z si (x)sj (x)dµ(x) = δj,k les seules contributions non nulles sont pour τ = τ 0 et chacune de ces contributions vaut 1, d’où le résultat. 5.3. Points de Fekete. — Considérons comme dans la preuve du théorème 5.2 une base (ordonnée) S de sections de H 0 (X, Lk ), S = (s1 , . . . , sNk ), et la section associée det(S) de H 0 (X Nk , (Lk )Nk ). Rappelons que h induit une métrique sur LNk . Si comme précédemment (K, h) est un compact pondéré et µ une mesure de Bernstein-Markov sur (K, h), on peut alors considérer les quantités kdet(S)kL∞ (K Nk ,h) et kdet(S)kL2 (µNk ,h) respectivement norme uniforme de |det(S)|h sur K Nk et norme L2 de |det(S)|h relativement à µNk . Comme précédemment, grâce à la condition de Bernstein Markov, ces deux quantités sont comparables : (19)

kdet(S)kL2 (µNk ,h) 6 kdet(S)kL∞ (K Nk ,h) 6 Mk kdet(S)kL2 (µNk ,h) , 1/kN

k avec lim Mk = 1. Ceci s’obtient simplement par intégration coordonnée par coordonnée et applications successives de (15).

Rappelons que nous avons fixé des données de référence (K0 , h0 , µ0 ) et normalisé l’énergie par Eeq (K0 , h0 ) = 0. Généralisant le §2.3 on définit ainsi le k-diamètre logarithmique de (K, h) (relativement aux données de référence) par dk (K, h) =

1 log kdet(S)kL∞ (K Nk ,h) , kNk

où S est une base orthonormale de H 0 (X, Lk ) relativement à (µ0 , hk0 ). Si µ0 est la mesure de Haar sur le tore unité de Cn , les monômes forment une base de polynômes n orthogonaux et on retrouve la définition du §2.3 (à une constante multiplicative n+1

ASTÉRISQUE 422

(1152)

THÉORIE GLOBALE DU PLURIPOTENTIEL

95

n log δk ). Une configuration de Fekete associée à (K, hk ) est un point près : dk = n+1 de K Nk où la norme kdet(S)kL∞ (K Nk ,h) (i. e. le k-diamètre) est réalisé(e).

Théorème 5.4. — Soit L un fibré en droites gros sur X, et (K, h) un compact pondéré non pluripolaire. Alors avec les normalisations précédentes, la suite des k-diamètres logarithmiques dk (K, h) converge vers −Eeq (K, h) quand k → ∞. Nous démontrerons ce théorème sous l’hypothèse qu’il existe une mesure µ sur (K, h) satisfaisant la propriété de Bernstein-Markov (voir [10, Cor. A] pour le cas général). Par ailleurs tout compact non pluripolaire de Cn porte une mesure de Bernstein Markov pour tout poids continu (voir [16, Cor. 3.8]). On obtient ainsi une nouvelle preuve de l’existence du diamètre transfini dans Cn (théorème 2.7) ainsi que son interprétation comme une énergie de Monge-Ampère. Démonstration. — D’après l’estimée de distortion L2 -L∞ (19), il suffit de démontrer 1 la convergence des « k-diamètres L2 » kN log kdet(S)kL2 (µNk ,h) . Or il se trouve que k 2

le lemme 5.3 exprime kdet(S)kL2 (µNk ,h) comme un déterminant de Gram : (20)

 1 1 1 log kdet(S)kL2 (µNk ,h) = log det hsi , sj iL2 (µ,hk ) − log(Nk !) kNk 2kNk 2kNk 1 log vol(B 2 (µ0 , hk0 )) 1 = + O (Nk log Nk ) . 2 k 2kNk log vol(B (µ, h )) 2kNk

D’où le résultat, en utilisant le théorème 4.6 et l’estimée Nk = O(k n ). On peut finalement démontrer l’équidistribution des points de Fekete : Théorème 5.5. — Soit L un fibré en droites gros sur X et (K, h) un compact non pluripolaire muni d’une métrique continue sur L| . Soit, pour tout k, Fk une K configuration de Fekete associée à (K, hk ). Alors la suite des mesures équidistribuées 1 Nk [Fk ] converge vers µeq (K, h). Démonstration. — Posons µk = N1k [Fk ]. Nous allons considérer la suite de fonctionnelles Fk (h) = Lk (µk , h) et vérifier les trois points du critère général. Nous avons démontré au cours de la preuve du théorème 5.2 que h 7→ Lk (µ, h) est concave pour toute mesure µ donc Fk est concave. Sa différentielle se calcule exactement comme au lemme 4.9 et vaut β(µk , h). Mais comme la mesure µk est atomique, si (sj ) est une base orthonormale de sections de H 0 (X, Lk ) pour la norme L2 (µk , hk ) on a pour tout j, Z 1 X 2 2 |sj (x)|hk = 1, |sj |hk dµk = Nk x∈Fk

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

96

R. DUJARDIN

d’où 1 β(µk , h) = Nk

Ñ Nk X

é 2

|sj |hk

µk = µk

j=1

et le point (i) est établi. Pour le point (ii) on remarque que pour toute mesure µ sur K 1 log vol(B ∞ (K, hk ) : en effet comme la norme L2 est dominée on a Lk (µ, h) > 2kN k ∞ par la norme L on a B ∞ (K, hk ) ⊂ B 2 (µ, hk ), d’où l’inégalité correspondante entre les volumes. On obtient bien que lim inf k Lk (µk , h) > Eeq (K, h) pour tout h. Reste à vérifier le point (iii) : nous allons pour cela montrer que Lk (µk , h) = −dk (K, h) + o(1) quand k tend vers l’infini. Pour cela nous utilisons à nouveau l’expression du volume comme déterminant de Gram et le lemme 5.3 :  vol B 2 (µk , hk )−1 = det hsi , sj iL2 (µk ,hk ) Z 1 2 = |det(si (xj ))|h dµk (x1 ) · · · dµk (xNk ) Nk ! X N k X 1 1 2 = Nk |det(si (xj ))|h = Nk kdet(S)kL∞ (K Nk ,h) , Nk Nk ! N Nk k (x1 ,...,xNk )∈Fk

où la dernière égalité vient de ce qu’un terme de la dernière somme est non nul quand les x1 , . . . , xNk sont distincts et vaut alors kdet(S)kL∞ (K Nk ,h) puisque Fk est une configuration de Fekete. En prenant le log et en utilisant le fait que Nk log Nk = o(kNk ) on obtient l’estimée annoncée, et on conclut par le théorème 5.4. Remarque 5.6. — Le résultat vaut avec la même démonstration si la suite de configurations Fk n’est qu’asymptotiquement de Fekete, c’est-à-dire, avec des notations évidentes, que (kNk )−1 log |det(S(Fk ))| − dk (K, h) = o(1). 5.4. Équidistribution arithmétique. — (Voir [23] pour plus d’informations sur les notions de ce paragraphe.) Soient X une variété projective lisse définie sur un corps de nombres K et L un fibré en droites gros sur X défini sur K. Pour simplifier on supposera K = Q. On peut alors définir une notion de métrique adélique sur L : il s’agit d’une collection h de métriques hv sur Lv , où v varie sur l’ensemble des places P ∪ {∞} (P l’ensemble des nombres premiers) qui vérifient certaines conditions de cohérence et de continuité aux places non archimédiennes (nous n’entrerons pas dans les détails), et telle que h∞ est continue sur X(C). Une telle métrique adélique sera dorénavant fixée aux places p-adiques et nous ne ferons varier la métrique qu’à la place complexe. Une section adélique de L est alors une collection de sections de Lv telles que kskv 6 1 (norme uniforme à la place v) hors d’un ensemble fini de places. On note H 0 (L)A l’espace des sections adéliques, dont la boule unité est Q BA (L, h) = H 0 (L)A ∩ v∈P ∪{∞} Bv∞ (Xv , hv ). Le groupe H 0 (L)A possède une mesure de Haar que l’on peut normaliser de la manière suivante : H 0 (L)Q se plonge comme

ASTÉRISQUE 422

(1152)

THÉORIE GLOBALE DU PLURIPOTENTIEL

97

un réseau dans H 0 (L)A et on normalise la mesure de Haar de sorte que son covolume soit 1. On fait de même pour toutes les puissances de L et on peut ainsi considérer l’énergie adélique à l’équilibre : EA,eq (L, h)

= lim sup k→∞

1 log vol BA (Lk , hk ). kNk

On montre facilement à partir des théorèmes 4.5 et 4.6 que ceci définit une fonction différentiable au sens de Gâteaux sur l’ensemble des métriques continues (rappelons que seule la métrique archimédienne varie). Une version du théorème de Minkowski assure l’existence d’une section s de Lk sur Q dont la norme à la place archimédienne est contrôlée par C vol B ∞ (Lk , hk )1/kNk et vérifiant kskv 6 1 aux places non archimédiennes. Associée à ces données on a aussi une notion de hauteur, définie pour x ∈ X(Q) par ! X X 1 hA,L,h (x) = − log |s(y)|h + log |s(y)|hp deg(x) p y∈G·x

où G · x est l’orbite de x sous le groupe de Galois et s est une section quelconque de H 0 (L)Q n’admettant ni zéro ni pôle en x. On voit également que hA,Lk ,hk (x) = khA,L,h (x). En utilisant une section s de Lk fournie par le théorème de Minkowski, on voit que si x n’appartient pas au lieu des zéros ou des pôles de s, on a Å ã 1 1 hA,L,h (x) > . log vol BA (Lk , hk ) + O kNk k Finalement si (xj ) est une suite de points de X qui est générique, au sens où elle quitte asymptotiquement toute sous-variété stricte, on obtient lim inf j→∞ hA,L,h (x) > EA,eq (L, h). On dit en général que (xj ) est une suite de points de petite hauteur si lim hA,L,h (xj ) = EA,eq (L, h).

j→∞

Le théorème suivant est une généralisation d’un théorème de Yuan [51] qui traitait du cas ample (mais donne l’équidistribution à toutes les places) et qui lui même était une généralisation du théorème de Szpiro, Ullmo et Zhang [46]. Théorème 5.7. — Soient X une variété projective lisse définie sur Q et L un fibré en droites gros sur X défini sur Q, muni d’une métrique adélique hA comme cidessus. Si (xj ) est une suite générique de points de petite hauteur sur X alors on a équidistribution des orbites de Galois vers la mesure d’équilibre : 1 [G · xj ] * µeq (X, h). j→∞ |G · xj |

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

98

R. DUJARDIN

Démonstration. — On applique le schéma général à la suite de fonctionnelles Fj (h) = hA,L,h (xj ). La discussion précédente et l’hypothèse de petite hauteur montrent que les conditions (ii) et (iii) sont satisfaites. Pour la condition (i) on remarque que la hauteur satisfait la relation 1 h[G · x], vi . hA,L,he−v (x) = hA,L,h (x) + |G · x| Le résultat suit. 5.5. Autres résultats et compléments. — Berman, Boucksom et Witt Nyström donnent dans [12] plusieurs autres résultats d’équidistribution dans le même esprit, concernant par exemple les points optimaux pour l’interpolation. Plusieurs travaux récents (Ortega-Cerda et Lev [36], Dinh, Ma et Nguyen [29]) se sont attachés à donner des estimations sur la vitesse de convergence des points de Fekete. L’approche de [29] suit plus ou moins pas à pas celle exposée ici, en tâchant de rendre explicites les vitesses de convergence à chaque étape. Par exemple dans le lemme 5.1, on peut rendre la convergence quantitative si on demande que g soit de classe C 1 avec une borne sur le module de continuité de g 0 . Ceci mène naturellement à estimer la dépendance de la mesure d’équilibre µeq(K,h) en fonction de h, ainsi que la régularité des enveloppes PK,ω Q. Les auteurs utilisent des espaces de fonctions hölderiennes et définissent le concept suivant : un compact pondéré est (C α , C β ) régulier s’il est régulier et si la projection PK,ω définit un opérateur borné de C α dans C β . Ils montrent ainsi que si L est ample, h est hölderienne et (K, h) est (C α , C β ) (pour des exposants appropriés), alors on peut estimer la vitesse de convergence des configurations de Fekete vers la mesure d’équilibre pour la distance de Wasserstein.

6. GRANDES DÉVIATIONS ET MESURES CANONIQUES Dans cette section finale nous passons en revue certains résultats plus récents dus à Berman [7, 8, 9] qui culminent avec la construction d’une mesure canonique pour toute variété projective de dimension de Kodaira strictement positive, par des méthodes probabilistes. 6.1. Processus ponctuels et formalisme des grandes déviations. — Un processus ponctuel à N points sur un espace X est une application mesurable ξ d’un espace probabilisé (Ω, A, P) vers l’ensemble des sous-ensembles de N points de X (i. e. X N /SN ). Sa loi est donc une mesure de probabilité sur X N symétrique par permutation des facteurs. La mesure empirique d’un processus ponctuel à N points est la mesure aléatoire δξ définie par δξ (ω) = N1 [ξ(ω)]. La loi de cette mesure empirique est donc une mesure de probabilité sur M (X) qui sera notée Γξ . En

ASTÉRISQUE 422

(1152)

THÉORIE GLOBALE DU PLURIPOTENTIEL

99

pratique, nous supposerons toujours que X est un espace métrique compact de sorte que M (X) est compact et métrisable. Si (ξN ) est une suite de processus ponctuels à N points dont les mesures empiriques convergent en loi vers une mesure µ, on utilise classiquement le formalisme des grandes déviations pour quantifier cette convergence. Intuitivement, il s’agit d’estimer la probabilité qu’une réalisation de la mesure δξN soit éloignée de la mesure limite µ, au sens de la topologie faible sur M (X). Formellement, soient aN une suite de réels positifs et tendant vers +∞ et I une fonction sci sur M (X). On dit qu’une suite (ΓN ) de mesures de probabilité sur M (X) satisfait un principe de grandes déviations avec vitesse (aN ) et fonction de taux I, si pour tout borélien B de M (X) on a (21)

− inf I(ν) 6 lim inf ˚ ν∈B

N →∞

1 1 log ΓN (B) 6 lim sup log ΓN (B) 6 − inf I(ν). aN ν∈B N →∞ aN

Typiquement, I admet un unique minimum égal à 0 en la mesure limite µ, et si V est un voisinage de µ, on a inf V c I > 0 et modulo effets de bord, on aura   P (δξN ∈ / V ) ≈ exp −aN infc I . V

Il existe de nombreuses techniques pour établir la propriété de grandes déviations, y compris quand on ne connaît pas a priori la limite µ. L’une d’entre elles est la proposition suivante (cf. [28, Prop. 4.1.1]). Proposition 6.1. — Soit X un compact et fixons une base d’ouverts U pour la topologie faible sur M (X). Soient (ΓN ) une suite de mesures de probabilité sur M (X) et (aN ) une suite de réels positifs tendant vers l’infini. Pour ν ∈ M (X) posons Å ã 1 I(ν) = − inf lim inf log ΓN (U ) . N →∞ aN U ∈U ,U 3ν Alors si on a également Å ã 1 log ΓN (U ) , I(ν) = − inf lim sup U ∈U ,U 3ν N →∞ aN la suite ΓN satisfait un principe de grandes déviations avec vitesse (aN ) et fonction de taux I. En particulier si I admet un unique minimiseur µ, alors (ΓN ) converge faiblement vers µ. Une autre méthode est fournie par le théorème de Gärtner-Ellis (voir [28, Cor. 4.6.14]), qui se spécialise à notre situation de la manière suivante :

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

100

R. DUJARDIN

Théorème 6.2. — Soient X un compact et (ΓN ) une suite de mesures de probabilité sur M (X). Supposons qu’il existe une suite de réels positifs (aN ) tendant vers l’infini telle que la suite (ΛN ) de fonctionnelles sur C(X) définies par Z 1 ΛN : u 7−→ log eaN hu,νi dΓN (ν) aN M (K) converge vers une fonctionnelle Λ sur C(X) différentiable au sens de Gâteaux. Alors la suite (ΓN ) satisfait un principe de grandes déviations de vitesse (aN ) et dont la fonction de taux est la transformée de Legendre Λ∗ de Λ : Λ∗ (ν) =

sup (Λ(u) − hu, νi) . u∈C(K)

6.2. Points de Fekete et grandes déviations 6.2.1. Un processus déterminantal. — Plaçons-nous maintenant dans le cadre des §§ 4 et § 5 : on se donne L un fibré en droites ample (ou gros) sur une variété complexe X, un compact non pluripolaire K pondéré par une métrique h sur L| , et une mesure ν K sur K ayant la propriété de Bernstein-Markov relativement à (K, h). Rappelons que h induit une métrique sur le fibré en droites LN sur K N ⊂ X N . Une base de sections 2 S de L induit une section det(S) de LN et donc une mesure positive |det(S)|h ν N sur K N . Un changement de base multiplie cette mesure par une constante positive, R 2 ainsi si l’on pose Z = |det(S)|h ν N , la mesure sur K N définie par Z 1 2 |det(S)|h ν N ξ : A 7−→ ξ(A) = Z A est une mesure de probabilité sur K N ne dépendant que de (h, ν), et symétrique par permutation des facteurs. En d’autres termes, c’est un processus ponctuel à N points, qui entre dans la catégorie des processus déterminantaux. Si maintenant pour k > 1 on remplace L par Lk , fibré que l’on munit de la métrique hk induite par h, on définit une suite de processus ponctuels sur K à Nk points (Nk = dim H 0 (Lk )), associée à la donnée (h, ν). Pour mémoire, dans le cas classique d’un compact de Cn muni du 2 poids Q = 0, |det(S)|h (x1 , . . . , xNk ) n’est autre que le déterminant de Vandermonde 2 |det (ei (xj ))| , où (ei ) est une base de Pk (Cn ). Si comme au §5.3 on se fixe une donnée de référence (K0 , h0 , µ0 ) et on choisit les bases Sk orthonormales relativement à L2 (µ0 , hk0 ), le théorème 5.4 et l’inégalité 1/2kNk converge vers le diamètre de Bernstein-Markov (19) montrent que la suite Zk transfini de (K, h), égal à −Eeq (K, h). Une application directe de l’inégalité de Markov montre que ä Ä 1 2kNk (dk (K,h)−ε) 1/kN P |det(S(ξk ))|h k < edk (K,h)−ε 6 e Zk

ASTÉRISQUE 422

(1152)

THÉORIE GLOBALE DU PLURIPOTENTIEL

101

converge exponentiellement vers 0 quand k tend vers l’infini. Ainsi par le lemme de Borel-Cantelli une suite indépendante (ξk (ω)) de réalisations de notre processus ponctuel est presque sûrement asymptotiquement de Fekete, et donc δξk (ω) * µeq (K, h). On a dans ce contexte un principe de grandes déviations dû à Berman [7] (voir aussi Bloom-Levenberg [16]). Théorème 6.3. — Sous les hypothèses précédentes, la suite des lois des mesures empiriques des processus déterminantaux ξk vérifie un principe de grandes déviations de vitesse 2kNk , associé à une fonction de taux H admettant un unique minimum en µeq(K,h) . Pour démontrer ce théorème, on peut appliquer l’une ou l’autre des méthodes présentées au §6.1 (les deux approches sont développées dans chacun des articles [7] et [16]). Une base d’ouverts U de M (K) étant fixée on peut ainsi poser Å ã 1 H(ν) = − inf lim inf log Γk (U ) k→∞ 2kNk U ∈U ,U 3ν et Å ã 1 H(ν) = − inf lim sup log Γk (U ) U ∈U ,U 3ν k→∞ 2kNk où Γk est la loi de δξk , et il s’agit de montrer que H = H, ce qui se fait par la théorie du pluripotentiel. L’autre méthode basée sur le théorème 6.2 repose (on s’en doute) sur le théorème 4.5. En effet en développant les définitions et en appliquant le lemme 5.3 et le calcul (20) on lie directement les fonctionnelles ΛN du théorème 6.2 et les volumes des boules dans H 0 (X, Lk ). Bloom et Levenberg [16] introduisent également des fonctionnelles plus directement liées à la définition des points de Fekete : Å ã W (ν) = inf lim sup Wk (U ) , U ∈U ,U 3ν



k→∞

¶ © 1/kN Wk (U ) = sup |det(S(ξ))|h k , |ξ| = Nk , δξ ∈ U

et de même W (ν) où la limsup est remplacée par une liminf (il faut ici normaliser comme précédemment et prendre des bases S orthonormales). On voit que W (ν) est 1/kN essentiellement la limite supérieure des |det(S(ξk ))|h k , où (ξk ) est une suite de configurations de Nk points telle que δξk * ν. Par conséquent l’équidistribution des configurations asymptotiquement de Fekete montre que W admet un unique maximum en µeq (K, h). Bloom et Levenberg montrent que dans le cas d’un compact pondéré de Cn on a W (ν) = W (ν) =: W (ν) et H(ν) = log W (µeq (K, h) − log W (ν)

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

102

R. DUJARDIN

(leur argument doit passer sans difficulté au cas ample général). 6.2.2. Retour sur l’électrostatique. — La fonction de taux H est une fonctionnelle sur l’espace des mesures sur K, qui est minimale précisément pour la mesure d’équilibre. Ces propriétés rappellent celles de l’énergie électrostatique du §1.1. Berman, Boucksom, Guedj et Zeriahi définissent justement dans [20] l’énergie pluricomplexe d’une mesure µ comme une transformée de Legendre de E de la manière suivante. Supposons pour simplifier que h s’étende à une métrique lisse sur L et soit ω sa forme de courbure. Si µ est une mesure de probabilité sur K on pose Eω (µ) =

sup

(Eω (ϕ) − hϕ, µi) .

ϕ∈PSH(X,ω)

Le théorème de Gartner-Ellis 6.2 montre que la fonction de taux dans le théorème 6.3 est alors égale à H(K,h) (µ) = Eω (µ) − C(K, h) où C(K, h) =

inf µ∈M (K)

Eω (µ).

n

La constante e− n+1 C(K,h) est appelée capacité électrostatique pluricomplexe dans [20], et elle généralise la capacité électrostatique du §1.1. Cette énergie apparaît a posteriori comme la version macroscopique de l’énergie d’interaction déterminantale évoquée à la remarque 2.8. On peut en fait relire tout ce qui précède à l’aune de la mécanique statistique et des grandes déviations (voir [19] pour une présentation dans cet esprit). 6.3. Un processus ponctuel canonique. — Toutes les constructions que nous avons faites jusqu’ici reposent sur la donnée d’un fibré en droites muni d’une métrique. Une variété complexe X de dimension n admet un fibré en droites canonique KX qui est le fibré des (n, 0)-formes holomorphes sur X. Supposons X projective. La k ) est par définition le k e plurigenre de X. Si la suite dimension Nk = dim H 0 (X, KX Nk tend vers l’infini, on montre qu’elle croît à vitesse polynomiale, et le nombre κ = lim

k→∞

1 k log dim H 0 (KX ) log k

s’appelle la dimension de Kodaira de X. C’est un entier compris entre 1 et n = dim(X). Si κ = n (i. e. KX est gros) on dit que X est de type général. Si en outre KX est ample, il admet une métrique canonique dont la forme de courbure ωKE vérifie l’équation de Kähler-Einstein Ric(ωKE ) = −ωKE , et qui a été construite par Aubin et Yau. L’extension au cas de fibrés gros a récemment donné lieu à une abondante littérature. Pour tout cela on consultera le livre de Guedj et Zeriahi [32] Berman fait dans [8, 9] la très jolie observation suivante : si Nk > 0 alors X admet un processus ponctuel canonique ξk à Nk points, que nous appellerons processus pluricanonique de degré k. Il faut pour justifier ceci construire une mesure de k , elle s’écrit dans probabilité symétrique sur X Nk . En effet si s est une section de KX

ASTÉRISQUE 422

(1152)

THÉORIE GLOBALE DU PLURIPOTENTIEL

103

des coordonnées locales z = (z1 , . . . , zn ) sous la forme s(z)(dz1 ∧ · · · ∧ dzn )⊗k et les règles de changement de coordonnées des formes pluricanoniques (dz1 ∧ · · · ∧ dzn )⊗k font que la densité (i. e. la mesure positive) s’exprimant dans ces coordonnées locales par 2/k |s(z)| idz1 ∧ dz 1 ∧ · · · ∧ idzn ∧ dz n k est globalement bien définie. Si maintenant (s1 , . . . , sNk ) est une base de H 0 (X, KX ), k Nk Nk on définit comme au §5.3 la section det(S) de (KX ) sur X . Si on fixe des (j) (j) coordonnées locales z (j) = (z1 , . . . , zn ), j = 1, . . . , Nk sur les facteurs et on pose (j) (j) ω (j) = dz1 ∧ · · · ∧ dzn , l’expression de det(S) est de la forme  ⊗k ⊗k det(S) z (1) , . . . , z (Nk ) ω (1) ⊗ · · · ⊗ ω (Nk )

et comme det(S) dépend linéairement de chaque sj , l’expression  2/k 2 in Nk det(S) z (1) , . . . , z (Nk ) ω (1) ∧ ω (1) ∧ · · · ∧ ω (Nk ) ∧ ω (Nk ) définit une mesure positive sur X Nk , invariante par permutation des facteurs. Finalement det(S) ne dépend du choix de S qu’à une constante multiplicative près, donc si on normalise par la masse totale on obtient bien une mesure de probabilité µ(Nk ) sur X Nk ne dépendant d’aucun choix. Théorème 6.4 ([8, 9]). — Soit X une variété projective de dimension de Kodaira strictement positive. La suite des mesures empiriques des processus pluricanoniques converge en loi vers une mesure de probabilité µX . Si KX est ample, µX est la forme volume de la métrique de Kähler-Einstein. La mesure canonique µX avait précédemment été construite par d’autres méthodes par Song et Tian [45] et Tsuji [48]. Dans le cas où X est ample on obtient également par une méthode similaire la forme de courbure ωKE elle-même (voir [9, Cor 1.3]. Pour démontrer le théorème on traite d’abord le cas où KX est gros, puis on en déduit le cas général par un argument de « dévissage » : en effet à une transformation birationnelle près, une variété de dimension de Kodaira strictement positive fibre sur son « modèle canonique » qui est de type général (c’est la fibration d’Iitaka, voir [35]). La démonstration dans le cas gros repose sur un nouveau principe de grandes déviations dans l’esprit du théorème 6.2, faisant intervenir des idées de mécanique statistique et de géométrie riemannienne en grande dimension. Remarque 6.5. — Dans le cas où la dimension de Kodaira de X est −∞, on −1 peut appliquer une analyse similaire aux puissances du fibré anticanonique KX . L’existence de métriques de Kähler-Einstein est alors beaucoup plus délicate et sujette à certaines obstructions (voir par exemple l’exposé de P. Eyssidieux dans ce séminaire [30]). Berman propose une interprétation probabiliste de ces obstructions

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

104

R. DUJARDIN

dans [8] et conjecture la convergence des mesures empiriques des processus ponctuels anti-pluricanoniques vers la forme volume de Kähler-Einstein dans les cas favorables.

RÉFÉRENCES [1] A. Alexandrov – On the theory of mixed volumes of convex bodies III : Extension of two theorems of Minkowski on convex polyhedra to arbitrary convex bodies., Mat. Sb. 3 (1) (1938), p. 27–44, [Traduction anglaise disponible dans Selected works Part I : Selected scientific papers. Gordon and Breach, 1996.]. [2] N. Anantharaman – Topologie des hypersurfaces nodales de fonctions aléatoires gaussiennes [d’après Nazarov et Sodin, Gayet et Welschinger], Séminaire Bourbaki, vol. 2015/2016, exposé no 1116, Astérisque 390 (2017), p. 369–408. [3] E. Bedford & B. A. Taylor – The Dirichlet problem for a complex MongeAmpère equation, Invent. math. 37 (1976), no 1, p. 1–44. [4]

, A new capacity for plurisubharmonic functions, Acta Math. 149 (1982), nos 1-2, p. 1–40.

[5]

, Plurisubharmonic functions with logarithmic singularities, Ann. Inst. Fourier 38 (1988), no 4, p. 133–171.

[6] R. Berman – Bergman kernels and equilibrium measures for line bundles over projective manifolds, Amer. J. Math. 131 (2009), no 5, p. 1485–1524. [7]

, Determinantal point processes and fermions on complex manifolds : large deviations and bosonization, Comm. Math. Phys. 327 (2014), no 1, p. 1–47.

[8]

, Kähler-Einstein metrics, canonical random point processes and birational geometry, in Algebraic Geometry, Salt Lake City, Proceedings of Symposia in Pure Mathematics, vol. 97, Amer. Math. Soc., 2015, p. 29–74.

[9]

, Large deviations for Gibbs measures with singular Hamiltonians and emergence of Kähler-Einstein metrics, Comm. Math. Phys. 354 (2017), no 3, p. 1133–1172.

[10] R. Berman & S. Boucksom – Growth of balls of holomorphic sections and energy at equilibrium, Invent. math. 181 (2010), no 2, p. 337–394. [11] R. Berman, S. Boucksom, V. Guedj & A. Zeriahi – A variational approach to complex Monge-Ampère equations, Publ. Math. Inst. Hautes Études Sci. 117 (2013), p. 179–245. [12] R. Berman, S. Boucksom & D. Witt Nyström – Fekete points and convergence towards equilibrium measures on complex manifolds, Acta Math. 207 (2011), no 1, p. 1–27.

ASTÉRISQUE 422

(1152)

THÉORIE GLOBALE DU PLURIPOTENTIEL

105

[13] T. Bloom – Orthogonal polynomials in Cn , Indiana Univ. Math. J. 46 (1997), no 2, p. 427–452. [14] T. Bloom, L. Bos, N. Levenberg & S. Waldron – On the convergence of optimal measures, Constr. Approx. 32 (2010), no 1, p. 159–179. [15] T. Bloom & N. Levenberg – Transfinite diameter notions in CN and integrals of Vandermonde determinants, Ark. Mat. 48 (2010), no 1, p. 17–40. , Pluripotential energy and large deviation, Indiana Univ. Math. J. 62 [16] (2013), no 2, p. 523–550. [17] T. Bloom, N. Levenberg, F. Piazzon & F. Wielonsky – BernsteinMarkov : a survey, Dolomites Research Notes on Approximation 8 (2015), p. 75– 91. [18] T. Bloom & B. Shiffman – Zeros of random polynomials on Cm , Math. Res. Lett. 14 (2007), no 3, p. 469–479. [19] S. Boucksom – Limite thermodynamique et théorie du potentiel, Gaz. Math. (2015), no 146, p. 16–26. [20] S. Boucksom, P. Eyssidieux, V. Guedj & A. Zeriahi – Monge-Ampère equations in big cohomology classes, Acta Math. 205 (2010), no 2, p. 199–262. [21] H. J. Bremermann – On a generalized Dirichlet problem for plurisubharmonic functions and pseudo-convex domains. Characterization of Šilov boundaries, Trans. Amer. Math. Soc. 91 (1959), p. 246–276. [22] A. Brudnyi – On local behavior of holomorphic functions along complex submanifolds of CN , Invent. math. 173 (2008), no 2, p. 315–363. [23] A. Chambert-Loir – Arakelov geometry, heights, equidistribution, and the bogomolov conjecture, in Notes de l’école d’été « Géométrie d’Arakelov et applications diophantiennes », à paraître. [24] D. Coman & E. A. Poletsky – Transcendence measures and algebraic growth of entire functions, Invent. math. 170 (2007), no 1, p. 103–145. [25] P. A. Deift – Orthogonal polynomials and random matrices : a Riemann-Hilbert approach, Courant Lecture Notes in Math., vol. 3, New York University, Courant Institute of Mathematical Sciences ; Amer. Math. Soc., 1999. [26] J.-P. Demailly – Variational approach for complex Monge-Ampère equations and geometric applications, Séminaire Bourbaki, vol. 2015/2016, exposé no 1112, Astérisque (2017), no 390, p. 245–275. , Complex analytic and differential geometry., disponible à l’adresse [27] https://www-fourier.ujf-grenoble.fr/~demailly/manuscripts/agbook. pdf. [28] A. Dembo & O. Zeitouni – Large deviations techniques and applications, seconde éd., Applications of Mathematics (New York), vol. 38, Springer, 1998.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

106

R. DUJARDIN

[29] T.-C. Dinh, X. Ma & V.-A. Nguyên – Equidistribution speed for Fekete points associated with an ample line bundle, Ann. Sci. Éc. Norm. Supér. 50 (2017), no 3, p. 545–578. [30] P. Eyssidieux – Métriques de Kähler-Einstein sur les variétés de Fano [d’après Chen-Donaldson-Sun et Tian], Astérisque, Séminaire Bourbaki, vol. 2014/2015, exp. no 1095, 380 (2016), p. 207–229. [31] M. Fekete – Über die Verteilung der Wurzeln bei gewissen algebraischen Gleichungen mit ganzzahligen Koeffizienten, Mathematische Zeitschrift 17 (1923), no 1, p. 228–249. [32] V. Guedj & A. Zeriahi – Degenerate complex Monge-Ampère equations, EMS Tracts in Mathematics, vol. 26, European Mathematical Society (EMS), 2017. [33] M. Klimek – Pluripotential theory, London Mathematical Society Monographs. New Series, vol. 6, The Clarendon Press Univ. Press, 1991, Oxford Science Publications. [34] S. Kołodziej – The logarithmic capacity in Cn , Ann. Polon. Math. 48 (1988), no 3, p. 253–267. [35] R. Lazarsfeld – Positivity in algebraic geometry. I, Ergeb. Math. Grenz. 3. Folge. A Series of Modern Surveys in Mathematics, vol. 48, Springer, 2004, Classical setting : line bundles and linear series. [36] N. Lev & J. Ortega-Cerdà – Equidistribution estimates for Fekete points on complex manifolds, J. Eur. Math. Soc. (JEMS) 18 (2016), no 2, p. 425–464. [37] N. Levenberg – Weighted pluripotential theory results of Berman-Boucksom, arXiv:1010.4035, 2010. [38] C. Lu & V. D. Nguyen – Degenerate complex Hessian equations on compact Kähler manifolds., Indiana Univ. Math. J. 64 (2015), no 6, p. 1721–1745. [39] R. Rumely – On Bilu’s equidistribution theorem, in Spectral problems in geometry and arithmetic (Iowa City, IA, 1997), Contemp. Math., vol. 237, Amer. Math. Soc., 1999, p. 159–166. [40] E. B. Saff & V. Totik – Logarithmic potentials with external fields, Grund. Math. Wiss., vol. 316, Springer, 1997, Appendix B by Thomas Bloom. [41] J-P. Serre – Distribution asymptotique des valeurs propres des endomorphismes de Frobenius [d’après Abel, Chebyshev, Robinson...], 2018. [42] B. Shiffman – Convergence of random zeros on complex manifolds, Sci. China Ser. A 51 (2008), no 4, p. 707–720. [43] J. Siciak – Extremal plurisubharmonic functions in Cn , Ann. Polon. Math. 39 (1981), p. 175–211. [44] J. Siciak – Families of polynomials and determining measures, Ann. Fac. Sci. Toulouse Math. 9 (1988), no 2, p. 193–211.

ASTÉRISQUE 422

(1152)

THÉORIE GLOBALE DU PLURIPOTENTIEL

107

[45] J. Song & G. Tian – Canonical measures and Kähler-Ricci flow, J. Amer. Math. Soc. 25 (2012), no 2, p. 303–353. [46] L. Szpiro, E. Ullmo & S.-W. Zhang – Équirépartition des petits points, Invent. math. 127 (1997), no 2, p. 337–347. [47] G. Tian – On a set of polarized Kähler metrics on algebraic manifolds, J. Differential Geom. 32 (1990), no 1, p. 99–130. [48] H. Tsuji – Canonical measures and the dynamical systems of Bergman kernels, arXiv:0805.1829, 2008. [49] M. Tsuji – Potential theory in modern function theory, Chelsea Publishing Co., 1975, Reprinting of the 1959 original. [50] J. L. Ullman – On the regular behaviour of orthogonal polynomials, Proc. London Math. Soc. 24 (1972), p. 119–148. [51] X. Yuan – Big line bundles over arithmetic varieties, Invent. math. 173 (2008), no 3, p. 603–649. [52] V. Zaharjuta – Transfinite diameter, Chebychev constants and capacity for a compactum in Cn , Mat. Sb. (N.S.) 96 (138) (1975), p. 374–389, 503. [53]

, Extremal plurisubharmonic functions, orthogonal polynomials, and the Bernstein-Walsh theorem for functions of several complex variables, Ann. Polon. Math. 33 (1976/77), nos 1-2, p. 137–148.

Romain DUJARDIN Sorbonne Université CNRS Laboratoire de Probabilités Statistiques et Modélisations (LPSM) F-75005 Paris France E-mail : [email protected]

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

Séminaire BOURBAKI 71e année, 2018–2019, no 1153, p. 109 à 147 doi:10.24033/ast.1132

Octobre 2018

NORMALITÉ ASYMPTOTIQUE DES VECTEURS PROPRES D’UN GRAPHE RÉGULIER ALÉATOIRE [d’après Ágnes Backhausz et Balázs Szegedy] par Charles BORDENAVE

INTRODUCTION Nous présentons ici le résultat principal de Backhausz et Szegedy [5] et nous introduisons les définitions les plus importantes. Graphe. — Un graphe G = (V, E) est la paire formée par un ensemble dénombrable V et un ensemble E formé de parties à deux éléments de V . Les éléments de V et E sont appelés respectivement les sommets et les arêtes du graphe. Cette définition de graphe correspond aux graphes simples (ni boucles ni arêtes multiples). Le degré du sommet x ∈ V est le nombre d’arêtes e ∈ E telles que x ∈ e. Pour d entier, un graphe est dit d-régulier si tous ses sommets ont degré d. Soient d, n des entiers positifs. Nous noterons G(n, d), l’ensemble des graphes G = (V, E) d-réguliers tels que V = {1, . . . , n}. Si dn est pair et 2 ≤ d ≤ n − 1 alors G(n, d) n’est pas vide. Si dn est impair ou d ≥ n, G(n, d) est vide. Soit G = (V, E) un graphe. Pour k entier, x, y ∈ V , un chemin de longueur k de x à y est une suite (x0 , . . . , xk ) telle que x0 = x, xk = y et pour tout t = 1, . . . , k, {xt−1 , xt } ∈ E. Le graphe G est connexe si pour tous x, y ∈ V il existe un chemin de x à y. La distance entre x et y est la longueur du plus court chemin qui les relie. Un cycle est un chemin (x0 , . . . , xk ) tel que x0 = xk et les sommets (x1 , . . . , xk ) sont tous distincts. Enfin, un arbre est un graphe connexe et sans cycle. Spectre. — On peut associer plusieurs opérateurs à un graphe G = (V, E). Le plus simple est l’opérateur d’adjacence, défini dans `2 (V ) par, pour tous f ∈ `2 (V ) et x ∈ V , X Af (x) = f (y), y:{x,y}∈E

© Astérisque 422, SMF 2020

110

C. BORDENAVE

où la somme porte sur les sommets y qui partagent une arête avec x. Si le degré des sommets est uniformément borné, l’opérateur A est un opérateur borné et autoadjoint. Si le graphe G est d-régulier, l’opérateur d−1 A est le noyau de transition de la marche au hasard sur G. Si G est un graphe d-régulier et V est fini alors le vecteur constant 1 ∈ `2 (V ) défini pour tout x ∈ V par 1(x) = 1 est un vecteur propre de A associé à la valeur propre d. Il existe de nombreuses relations entre la géométrie du graphe et les propriétés spectrales de son opérateur d’adjacence. Ces dernières années un effort de recherche tout particulier vise à décrire le spectre lorsque le graphe sous-jacent est aléatoire ou quasi-aléatoire. Pour ne citer que quelques références récentes relatives aux graphes réguliers, des outils de combinatoire [19, 12], de la théorie des matrices aléatoires [17, 16, 7, 6, 22], de l’analyse semi-classique [14, 3, 2] ont été utilisés dans ce contexte. Nous allons présenter ici une méthode très originale d’analyse du spectre développée dans [5]. Elle repose sur des liens fructueux entre la théorie de l’information et la convergence locale des graphes (sur les liens entre convergence locale des graphes et spectre, voir [11]). Le résultat principal de Backhausz et Szegedy portera sur les vecteurs propres de A orthogonaux à 1 lorsque G est distribué suivant la mesure uniforme sur G(n, d). Dans la suite de cette introduction, nous allons d’abord énoncer ce résultat sous sa forme la plus simple pour ensuite donner l’énoncé général qui exige une certaine préparation. Soit A ∈ Mn (R) une matrice symétrique de taille n. Pour tous δ ∈ [0, 1[ et λ ∈ R, un quasi-vecteur propre de déviation δ et de valeur propre λ est un vecteur non nul f ∈ Rn tel que kAf −λf k2 ≤ δkf k2 où k·k2 est la norme euclidienne. Un quasi-vecteur propre de déviation δ est un quasi-vecteur propre de déviation δ et de valeur propre λ pour un certain λ ∈ R. Évidemment, un vecteur propre est un quasi-vecteur propre de déviation nulle. Distribution d’un vecteur. — À tout vecteur f ∈ Rn , la mesure empirique de ses entrées est la mesure de probabilité distr(f ) sur R : n

distr(f ) =

1X δf (x) , n x=1

où δ est la distribution de Dirac. En termes probabilistes, distr(f ) est la loi de f (o) où o est uniformément distribué sur {1, . . . , n}. La loi distr(f ) est donc la loi d’une entrée typique. Le second moment de distr(f ) est égal à kf k22 /n de telle sorte que √ si f est non nul, distr( nf /kf k2 ) a un second moment égal à 1. Gaussianité d’un vecteur. — Pour tout σ ∈ R+ , on note traditionnellement N (0, σ 2 ) la mesure de probabilité gaussienne sur R centrée et de variance σ 2 . Pour σ = 0, on

ASTÉRISQUE 422

(1153)

NORMALITÉ ASYMPTOTIQUE DES VECTEURS PROPRES...

111

pose N (0, 0) = δ0 . La proximité d’un vecteur f ∈ Rn non nul à un vecteur gaussien centré est définie comme  √ D(f ) = inf dL distr( nf /kf k2 ), N (0, σ 2 ) , σ∈[0,1]

où dL est la distance de Lévy-Prohorov (toute autre distance qui définit la topologie faible conviendrait également). Rappelons que si µ et ν sont deux mesures de probabilités sur un espace métrique (M, d) alors, en notant B(M ) sa tribu borélienne, on a dL (µ, ν) = inf {ε > 0 : ∀A ∈ B(M ), µ(A) ≤ ν(Aε ) + ε and ν(A) ≤ µ(Aε ) + ε}, où pour tous A ∈ B(M ) et ε > 0, on note Aε l’ensemble des éléments de M à distance au plus ε de A. Considérons deux cas extrêmes de vecteurs f ∈ Rn « proches » d’un vecteur gaussien au sens que D(f ) est petit. Si f est un vecteur de la base canonique √ alors distr( nf ) = 1/n · δ√n + (1 − 1/n) · δ0 . Il est donc immédiat que lorsque √ n tend vers l’infini, distr( nf ) converge faiblement vers δ0 = N (0, 0). Si f est un vecteur aléatoire gaussien standard dans Rn (les coordonnées de f dans une base orthogonale sont des variables gaussiennes N (0, 1) indépendantes) alors la loi faible des grands nombres implique que lorsque n tend vers l’infini, la variable aléatoire √ dL (distr(f ), N (0, 1)) converge en probabilité vers 0 et kf k2 / n vers 1. Dans ces deux cas, D(f ) tend vers 0 mais pour des raisons différentes. Dans le premier cas, la norme `2 du vecteur f est localisée sur o(n) coordonnées (ici une seule). Cela √ se traduit par une perte de masse `2 dans le sens que distr( nf /kf k2 ), dont le second moment est égal à 1, converge faiblement vers δ0 , dont le second moment est nul. Dans le second cas, en probabilité, il n’y a pas de perte de masse et la mesure √ empirique distr( nf /kf k2 ) converge vers la loi d’une coordonnée de f . Plus généralement, le lemme élémentaire suivant décrit la proximité à un vecteur gaussien en terme d’une partie localisée et d’une partie proprement asymptotiquement gaussienne. Lemme 0.1. — Soit ε > 0. Il existe δ > 0 tel que pour tout entier n ≥ 1 si f ∈ Rn √ vérifie kf k2 = n et dL (distr(f ), N (0, σ 2 )) ≤ δ pour un certain σ ∈ [0, 1] alors il existe τ ∈ [0, 1], a, b ∈ Rn tels que f se décompose de la façon suivante p f = τ a + 1 − τ 2 b, avec ha, bi = 0, kak2 = kbk2 = dL (distr(b), δ0 ) ≤ ε.



n, |σ − τ | ≤ ε, dL (distr(a), N (0, 1)) ≤ ε et

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

112

C. BORDENAVE

Théorème principal, forme simplifiée. — La forme simplifiée du théorème principal de [5] est la suivante. Théorème 0.2. — Soient un entier d ≥ 3 et ε > 0. Il existe m et δ strictement positifs tels que, pour tout entier n ≥ m avec nd pair, si G est un graphe distribué uniformément sur G(n, d) et A est sa matrice d’adjacence, alors l’événement suivant a une probabilité au moins 1 − ε : tout quasi-vecteur propre f de déviation δ et orthogonal à 1 vérifie D(f ) ≤ ε. En regard du lemme 0.1, le théorème 0.2 affirme donc que si f est un vecteur propre de norme 1 de la matrice d’adjacence d’un graphe d-régulier uniforme avec n sommets alors, lorsque n tend l’infini, f se décompose en une partie de masse `2 concentrée sur o(n) entrées et le reste est asymptotiquement gaussien. Il est conjecturé que la partie localisée de cette décomposition est triviale : Conjecture 0.3. — Soient un entier d ≥ 3 et ε > 0. Il existe m positif tel que, pour tout entier n ≥ m avec nd pair, si G est un graphe distribué uniformément sur G(n, d) et A est sa matrice d’adjacence alors l’événement suivant a une probabilité au moins 1 − ε : tout vecteur propre f orthogonal à 1 vérifie √ dL (distr( nf /kf k2 ), N (0, 1)) ≤ ε. Il est important de remarquer que dans la conjecture ci-dessus, on se restreint aux vecteurs propres. Nous verrons en effet que pour tout σ ∈ [0, 1], il existe une suite de quasi-vecteurs propres fn de déviation δn avec δn → 0 telle que, en probabilité, √ dL (distr( nfn /kfn k2 ), N (0, σ 2 )) → 0. Voir remarque 2.2. Nous allons maintenant énoncer le résultat principal de [5]. L’objectif est de mesurer la distance d’un vecteur propre f de la matrice d’adjacence de G uniforme sur G(n, d) à un processus gaussien qui satisfait, avec probabilité 1, l’équation de vecteur propre sur le revêtement universel de G. Nous allons d’abord expliquer tous ces termes. Arbre régulier infini. — Pour d ≥ 2 entier, nous noterons Td = (Vd , Ed ) l’arbre d-régulier infini. Plus précisément, il sera commode d’utiliser la notation généalogique suivante. L’ensemble des sommets de Td est le sous-ensemble suivant des suites finies d’entiers, ∅ représentant la suite vide, Vd = {∅} ∪ {1, . . . , d} ∪

∞ [

{1, . . . , d} × {1, . . . , d − 1}k .

k=1

On définit le parent de x ∈ {1, . . . , d} comme ∅. Pour k ≥ 1 entier, le parent de x = (x1 , . . . , xk+1 ) ∈ Nk+1 ∩ Vd est (x1 , . . . , xk ) ∈ Nk ∩ Vd . Enfin ∅ n’a pas de parent. L’ensemble des arêtes de Td est Ed = {{x, y} : x est parent de y}.

ASTÉRISQUE 422

(1153)

NORMALITÉ ASYMPTOTIQUE DES VECTEURS PROPRES...

113

Nous dirons que y est un enfant de x si x est le parent de y. Nous dirons que y est un descendant de x si il existe une suite (x0 , . . . , xk ) avec x0 = x, xk = y et xt−1 est le parent de xt pour tout entier 1 ≤ t ≤ k (en d’autres termes, x est un suffixe de y). Pour d pair, l’arbre Td est isomorphe au graphe de Cayley du groupe libre engendré par d/2 générateurs libres et leurs inverses. Pour tout d entier, Td est aussi le graphe de Cayley du groupe librement engendré par d copies de Z/2Z et ses générateurs libres. Revêtement aléatoire. — Soit G = (V, E) un graphe d-régulier. Nous dirons qu’une application π : Vd → V est un revêtement de G si π est un homéomorphisme local au sens où pour tout x ∈ Vd , l’image par π des d voisins de x dans Td sont les d voisins de π(x) dans G. Remarquons que π(Vd ) est alors une composante connexe de G. Tout graphe d-régulier admet un revêtement. Si V est fini, alors il existe une mesure de probabilité naturelle sur l’ensemble de revêtements de G. Si G est connexe, ce revêtement aléatoire π est caractérisé par la propriété que pour tout automorphisme φ de Td , π ◦ φ et π ont même loi. Si G n’est pas connexe, pour caractériser de façon unique cette mesure, nous supposons également que π(∅) est uniformément distribuée sur V . Ce revêtement aléatoire peut être construit explicitement de la façon suivante. Soit (σx )x∈Vd une famille de permutations aléatoires indépendantes, σ∅ permutation uniformément distribuée dans Sd (le groupe symétrique à d éléments) et pour tout x ∈ Vd \{∅}, σx uniforme dans Sd−1 . Le revêtement aléatoire est défini itérativement de la façon suivante. Tout d’abord, π(∅) est distribué uniformément sur V et pour tout i ∈ {1, . . . , d}, π(i) = vσ∅ (i) où {v1 , . . . , vd } sont les voisins de π(∅) dans G. Ensuite, par récurrence sur k ≥ 1, pour tout x ∈ Nk ∩ Vd , on étend π en posant pour tout i ∈ {1, . . . , d − 1}, π((x, i)) = vσx (i) où {v1 , . . . , vd−1 } sont les d − 1 voisins de π(x) différents de π(y), y étant le parent de x. Distribution d’un vecteur sur le graphe. — La preuve du théorème 0.2 repose sur la possibilité d’associer à la paire formée par un graphe d-régulier G = (V, E) et un vecteur f ∈ RV un processus aléatoire sur Td qui est invariant par les automorphismes de l’arbre. Cette idée à la fois simple et profonde remonte au moins à Benjamini et Schramm [9]. Plus précisément, soit G = (V, E) ∈ G(n, d) un graphe d-régulier avec sommets V = {1, . . . , n}. On peut définir la loi d’un vecteur vue d’un sommet typique du graphe de la façon suivante. Soient M un espace métrique et f ∈ M V . On munit M Vd d’une distance qui induit la topologie produit. On définit distrG (f ) comme la mesure de probabilité sur M Vd distrG (f ) = loi de f ◦ π, où π : Vd → V est le revêtement aléatoire de G défini ci-dessus.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

114

C. BORDENAVE

Pour f ∈ RV , remarquons que distrG (f ) contient plus d’information que distr(f ). En effet distr(f ) est la loi image de distrG (f ) par l’application de RVd dans R : g 7→ g(∅). Notons aussi que distrG (f ) hérite des propriétés de symétrie du revêtement aléatoire π : distrG (f ) est invariant par les automorphismes de Td . Onde aléatoire et onde gaussienne. — Si M est un espace métrique, une variable aléatoire Y = (Yx )x∈Vd dans M Vd est dite invariante si sa loi est invariante par les automorphismes de l’arbre Td : pour tout automorphisme φ de Td , Y ◦ φ et Y ont même loi. Si M = R, la variable aléatoire Y est dite standard si EYx = 0 et EYx2 = 1 pour tout x ∈ Vd . La variable Y est gaussienne si toute distribution jointe d’un nombre fini de ses marginales est gaussienne. La variable Y est une onde aléatoire de valeur propre λ si elle satisfait avec probabilité 1 l’équation de vecteur propre : pour tout x ∈ Vd , X (1) Yy = λYx , y:{x,y}∈Ed

(c’est-à-dire avec probabilité 1, Y est un vecteur propre généralisé de l’opérateur A). √ √ Il est démontré dans [18, 20] que pour tout λ ∈ [−2 d − 1, 2 d − 1], il existe une unique onde aléatoire gaussienne standard invariante de valeur propre λ. Nous appellerons cette variable aléatoire simplement l’onde gaussienne de valeur propre λ et nous la noterons Yλ . Nous construirons cette onde gaussienne dans la section 2. Pour σ ∈ R, notons Gaussλ,σ la loi de σYλ . Nous pouvons mesurer la distance d’un vecteur non nul f ∈ Rn construit sur le graphe G ∈ G(n, d) à une onde gaussienne comme √ dL (distrG ( nf /kf k2 ), Gaussλ,σ ), DG (f ) = inf √ |λ|≤2 d−1 σ∈[0,1]

où dL est la distance de Lévy-Prohorov pour les mesures de probabilités sur RVd (ou toute autre distance qui définit la convergence faible). À nouveau, la présence de σ < 1 dans la définition de DG (f ) autorise une concentration de la norme `2 de f sur o(n) entrées. Théorème principal. — On peut maintenant énoncer le résultat principal de [5]. Théorème 0.4. — Soient un entier d ≥ 3 et ε > 0. Il existe m et δ positifs tels que, pour tout entier n ≥ m avec nd pair, si G est un graphe distribué uniformément sur G(n, d) et A est sa matrice d’adjacence alors l’événement suivant a une probabilité au moins 1 − ε : tout quasi-vecteur propre f de déviation δ et orthogonal à 1 vérifie DG (f ) ≤ ε.

ASTÉRISQUE 422

(1153)

NORMALITÉ ASYMPTOTIQUE DES VECTEURS PROPRES...

115

Organisation. — La suite de ce texte est organisée de la façon suivante. Dans la section 1, nous allons réduire l’énoncé du théorème principal à un énoncé sur une famille d’ondes invariantes standard. La section 2 présente la théorie spectrale des ondes invariantes. Nous allons notamment y montrer l’existence de l’onde gaussienne. La stratégie de la démonstration du résultat principal qui repose sur des inégalités entropiques est présentée dans la section 3. Dans la section 4 nous établirons une première inégalité entropique importante qui sera utilisée dans la section 5. Dans les sections 5 et 6, nous terminerons la démonstration en montrant respectivement que l’onde gaussienne minimise une entropie dans une certaine famille d’ondes invariantes standard et qu’elle maximise cette même entropie parmi les ondes invariantes standard. Notations. — Dans toute la suite de ce texte, nous fixons un entier d ≥ 3. Pour M espace métrique et V dénombrable, un élément f ∈ M V sera noté indifféremment comme un vecteur (fx )x∈V ou une fonction de V dans M , x 7→ f (x). L’espérance des variables aléatoires est notée E(·) et la mesure de probabilité correspondante est P(·). Enfin, les termes variables aléatoires et processus sont synonymes.

1. PROCESSUS TYPIQUE Processus typique. — La notion de processus typique fut introduite dans [4]. Nous allons donner une nouvelle version du théorème principal de [5] qui repose sur cette définition. Soient M un espace métrique, µ une mesure de probabilité sur M Vd et Y une variable aléatoire de loi µ. Soit G ∈ G(n, d) un graphe d-régulier sur l’ensemble de sommets V = {1, . . . , n}. Une mesure de la proximité de µ à l’ensemble des vecteurs construits sur G est ∆(µ, G) = inf{dL (distrG (f ), µ) : f ∈ M n }. Définition 1.1. — Un processus Y sur Td ou sa loi µ est typique si la propriété d’approximation suivante a lieu. Pour tous ε > 0 et m > 0, il existe un entier n ≥ m, tel que si G est un graphe aléatoire uniformément distribué sur G(n, d) alors P(∆(µ, G) ≤ ε) ≥ 1 − ε. Avec des mots : un processus typique est un processus sur Td qui peut être approché avec grande probabilité sur une suite de graphes aléatoires finis. Notons qu’un processus typique est nécessairement invariant. Pour illustrer la définition des processus typiques, nous allons en donner une première application.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

116

C. BORDENAVE

Théorème de Friedman. — Le spectre de l’opérateur d’adjacence sur Td est √ √ σ(Td ) = [−2 d − 1, 2 d − 1]. Le théorème de Friedman [19] affirme que toutes les valeurs propres non triviales d’un graphe aléatoire distribué uniformément sur G(n, d) sont avec grande probabilité dans un ε-voisinage de σ(Td ) si n est suffisamment grand. Plus précisément, Théorème 1.2. — Soit ε > 0. Il existe m positif tel que, pour tout entier n ≥ m avec nd pair, si G est un graphe distribué uniformément sur G(n, d) et A est sa matrice d’adjacence, alors l’événement suivant a une probabilité au moins 1 − ε : pour tout δ > 0, tout quasi-vecteur propre de déviation δ et orthogonal à 1 a une valeur √ propre associée λ qui satisfait |λ| ≤ 2 d − 1 + ε + δ. Le théorème de Friedman correspond au cas δ = 0 (les valeurs propres), pour une preuve simplifiée et quantitative voir [12]. Le cas général se déduit facilement du cas δ = 0 en remarquant que 1⊥ , l’hyperplan de Rn orthogonal à 1, est invariant par la matrice d’adjacence A. La matrice A étant symétrique, la norme d’opérateur de A restreint à 1⊥ est égale à la valeur absolue de la plus grande valeur propre γ associée à un vecteur propre dans 1⊥ (c’est la seconde plus grande valeur propre de A en valeur absolue). Donc, pour tout f ∈ 1⊥ , kAf k2 ≤ |γ|kf k2 . Si, de plus, on a kAf − λf k2 ≤ δkf k2 pour un certain réel λ et δ > 0, alors l’inégalité triangulaire implique |λ| ≤ |γ| + δ. Nous en déduisons bien le théorème 1.2. En terme de processus typique, nous obtenons le corollaire suivant. Corollaire 1.3. — Si Y est une onde typique standard de valeur propre λ alors λ ∈ σ(Td ). Démonstration. — Le processus Y étant typique, pour tous m et ε > 0, il existe un entier n ≥ m tel que si G est uniforme sur G(n, d), avec probabilité au moins 1/2, il existe un vecteur f ∈ Rn telle que dL (distrG (f ), µ) ≤ ε où µ est la loi de Y . Fixons maintenant un graphe G ∈ G(n, d). Nous allons construire à la main un quasi-vecteur propre de A, la matrice d’adjacence de G. Pour x réel et t > 0, on pose (x)t = x1|x|≤t . Étant donné que EY∅ = 0 et EY∅2 = 1, pour tout δ > 0, il existe t > 0   tel que |E[(Y∅ )t ]| ≤ δ et E (Y∅ )2t − 1 ≤ δ 2 . On peut aussi supposer que t est un point de continuité de la loi de Y∅ . Donc pour tout δ > 0, il existe t, ε > 0 tels que   si f ∈ Rn vérifie dL (distrG (f ), µ) ≤ ε alors |E[(f (o))t ]| ≤ δ, E (f (o))2t − 1 ≤ δ 2 et P(|(Af )(o) − λf (o)| ≥ δ) ≤ δ/t2 , où o est uniformément distribué sur {1, . . . , n}. Si 0 < δ ≤ 1/2, on considère le vecteur centré normalisé g ∈ Rn : g(x) =

ASTÉRISQUE 422

(f (x))t − E[(f (o))t ] , σt

(1153)

NORMALITÉ ASYMPTOTIQUE DES VECTEURS PROPRES...

117

  2 où σt2 est la variance de (f (o))t . On a |σt2 − 1| ≤ E (f (o))2t − 1 + (E[(f (o))t ]) ≤ √ 2δ 2 ≤ 1/2. En outre, par construction, kgk∞ ≤ (t + δ)/ 1 − 2δ 2 ≤ 2t si t ≥ 2. Nous avons aussi Eg(o) = 0, ceci est équivalent à g orthogonal à 1. Enfin Eg(o)2 = 1, √ autrement dit kgk2 = n. Ainsi, pour tout δ > 0, il existe t, ε > 0 tels que si f ∈ Rn vérifie dL (distrG (f ), µ) ≤ ε alors il existe un vecteur g orthogonal à 1 et de norme √ kgk2 = n tel que kgk∞ ≤ t et {x : |(Ag)(x) − λg(x)| ≥ δ} a au plus δn/t2 éléments. On en déduit que kAg − λgk22 ≤ nδ 2 + (δn/t2 )(d + |λ|)2 t2 ≤ kgk22 (δ 2 + (d + |λ|)2 δ). En conclusion, si Y est une onde typique de valeur propre λ alors, pour tous m et δ > 0, il existe n ≥ m tel que, si G est un uniforme sur G(n, d), avec probabilité au moins 1/2, la matrice d’adjacence de G a un quasi-vecteur propre de valeur propre λ, de déviation δ et orthogonal à 1. Il reste à appliquer le théorème 1.2. Théorème principal, version onde typique. — Nous allons maintenant donner un énoncé qui implique le théorème principal 0.4. Dans cet énoncé, il n’y a plus de quantificateur, il s’agit seulement d’une propriété des ondes typiques. Nous démarrons avec un théorème de Harangi et Virág [20] sur l’approximation de l’onde gaussienne. Théorème 1.4. — Soit λ ∈ σ(Td ). L’onde gaussienne de valeur propre λ est typique. Nous démontrerons ce résultat en même temps que nous construirons l’onde gaussienne dans la section 2. Dans [5], Backhausz et Szegedy ont démontré la réciproque du théorème 1.4 : Théorème 1.5. — Soit λ ∈ σ(Td ). Si Y est une onde typique standard de valeur propre λ alors Y est l’onde gaussienne de valeur propre λ. Dans le reste de cette section, nous allons démontrer que l’énoncé du théorème 1.5 implique le théorème 0.4. L’argument repose sur des considérations topologiques générales et sur une propriété de concentration de la mesure uniforme sur G(n, d). La démonstration de ce lemme est indépendante du reste de la preuve (elle peut être sautée sans nuire à la compréhension du reste du texte). Concentration de la mesure. — Soit M l’ensemble des mesures de probabilité µ sur RVd qui sont invariantes par les automorphismes de Td et telle que EY (∅)2 ≤ 1 où Y a loi µ. Muni de la distance de Lévy-Prohorov dL , M est un espace compact. Soit G ∈ G(n, d), on définit l’ensemble des processus typiques bornés construit sur G comme √ T (G) = {distrG (f ) : f ∈ Rn , kf k2 ≤ n}. Soit F l’ensemble des parties fermées de M . Pour tout G ∈ G(n, d), on a T (G) ∈ F . Nous notons dH la distance de Hausdorff sur F . L’ensemble T (G) est

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

118

C. BORDENAVE

concentré sous la mesure uniforme sur G(n, d). Plus précisément, nous allons vérifier le résultat suivant. Lemme 1.6. — Pour tout ε > 0, il existe m tel que pour tout entier n ≥ m avec nd pair on a, pour un certain F = F (n, d) ∈ F , P(dH (T (G), F ) ≥ ε) ≤ ε, où G est un graphe aléatoire uniforme sur G(n, d). Le théorème suivant est un résultat classique de concentration de la mesure sur G(n, d). Nous dirons que deux graphes G, G0 ∈ G(n, d) sont voisins si la différence symétrique de leurs ensembles d’arêtes est 4 (c’est-à-dire si G et G0 coïncident à la modification près de deux arêtes). Théorème 1.7. — Soient n ≥ d + 1 un entier avec nd pair, δ > 0 et h : G(n, d) → R une fonction telle que |h(G) − h(G0 )| ≤ δ pour tous graphes voisins G, G0 ∈ G(n, d). Alors, si G est uniformément distribué sur G(n, d), pour tout t ≥ 0, Å ã t2 P(|h(G) − Eh(G)| ≥ t) ≤ c exp − 2 , 2δ dn pour une certaine constante c = c(d). Voir [24, théorème 2.19 – lemme 2.1] pour une preuve. En admettant le théorème 1.7, nous pouvons démontrer le lemme 1.6. Démonstration du lemme 1.6. — Soit ε > 0. L’espace métrique (F , dH ) étant compact, il existe une partie finie R qui est ε-dense, c’est-à-dire telle que R ε = F . Notons r le cardinal de R . Le principe des tiroirs implique qu’il existe F ∈ R tel que, si G est uniformément distribué sur G(n, d), P(dH (T (G), F ) < ε) ≥ 1/r. Pour démontrer le lemme, il suffit donc de prouver que pour tout ε > 0 il existe m tel que pour tout entier n ≥ m et tout S ∈ F on a P(|dH (T (G), S) − EdH (T (G), S)| ≥ ε) ≤ ε.

(2)

En effet, on choisit ε0 < min(ε, 1/r) dans l’équation (2), pour en déduire que EdH (T (G), F ) < 2ε. On obtient donc l’inclusion d’événements {dH (T (G), F ) ≥ 3ε} ⊂ {|dH (T (G), F ) − EdH (T (G), F )| ≥ ε}. Il reste à appliquer une nouvelle fois (2) et à ajuster la valeur de ε pour obtenir le lemme 1.6. Nous passons à la preuve de (2). Soit Bk l’ensemble des sommets de Vd à distance au plus k de ∅. Si µ ∈ M , désignons par µBk la marginale de µ sur Bk . De même,

ASTÉRISQUE 422

(1153)

NORMALITÉ ASYMPTOTIQUE DES VECTEURS PROPRES...

119

si S ∈ F , SBk est l’ensemble formé par les marginales des mesures dans S. La topologie produit sur RVd étant engendrée par les cylindres, pour montrer (2), il suffit de vérifier que pour tous ε > 0 et k ∈ N, il existe m tel que pour tout entier n ≥ m et S ∈ F on a (3)

P(|dH (T (G)Bk , SBk ) − EdH (T (G)Bk , SBk )| ≥ ε) ≤ ε.

Pour tous f ∈ Rn et x ∈ {1, . . . , n}, soit distr(G,x) (f ) la loi de distrG (f ) conditionnée à ce que le revêtement aléatoire π vérifie π(∅) = x. Nous avons n

distrG (f ) =

1X distr(G,x) (f ). n x=1

En outre, distr(G,x) (f )Bk = distr(G0 ,x) (f )Bk si les sous-graphes de G et G0 engendrés par les sommets qui sont à distance au plus k de x sont égaux. Si G et G0 sont voisins, ces sous-graphes sont égaux pour tout x qui n’est pas à distance au plus k d’une arête qui est dans la différence symétrique de G et G0 . On obtient que si G et G0 sont voisins alors dL (distrG (f )Bk , distrG0 (f )Bk ) ≤ 4d(d − 1)k−1 /n = δ.

En particulier par l’inégalité triangulaire, |dH (T (G)Bk , SBk ) − dH (T (G0 )Bk , SBk )| ≤ δ si G et G0 sont voisins. Enfin, on applique le théorème 1.7 pour h(G) = dH (T (G)Bk , SBk ) et on en déduit (3). Tous les ingrédients sont réunis pour démontrer que le théorème 1.5 implique le théorème 0.4. Démonstration du théorème 0.4 (comme conséquence du théorème 1.5) Si µ ∈ M et S ∈ F , on pose dL (µ, S) = inf{dL (µ, ν) : ν ∈ S}. Soit S ∈ F l’ensemble des ondes gaussiennes de Td . Raisonnons par contradiction. Si la conclusion du théorème 0.4 est fausse, il existe ε0 ∈ (0, 1], une suite strictement croissante d’entiers (nk )k et une suite (δk )k tendant vers 0 tels que l’événement suivant a une probabilité au moins ε0 sous la loi uniforme sur G(nk , d) : il existe un quasi-vecteur propre fk = fk (G) de déviation δk de norme √ kfk k2 = n et orthogonal à 1 tel que dL (distrG (fk ), S) > ε0 . Pour tout entier n, soit Fn = F (n, d) où F (n, d) est défini dans le lemme 1.6. D’après le lemme 1.6, quitte à modifier la suite (δk ) et ε0 , on peut également supposer sans perte de généralité que l’événement Ek (G) suivant a une probabilité au moins ε0 sous la loi uniforme sur G(nk , d) : dH (T (G), Fnk ) ≤ δk et il existe un quasi-vecteur √ propre fk = fk (G) de déviation δk de norme kfk k2 = n et orthogonal à 1 tel que dH (distrG (fk ), S) > ε0 . Soient (Gk )k une suite de graphes telle que Ek (Gk ) ait lieu pour tout k et fk le quasi-vecteur propre associé. Étant donné que distrGk (fk ) ∈ M et (M , dL ) est

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

120

C. BORDENAVE

compact, quitte à prendre une sous-suite convergente, on peut supposer que distrGk (fk ) converge faiblement vers µ ∈ M . Soit Y de loi µ. Par construction, Y est une onde invariante qui vérifie dH (µ, S) ≥ ε0 et EY∅ = 0 (car Efk (o) = 0 et Efk2 (o) = 1 avec o uniforme sur {1, . . . , n}). En particulier, étant donné que S contient la loi δ0⊗Vd , on a σ 2 = EY∅2 > 0. Ainsi Z = σ −1 Y est une onde invariante standard. Le lemme 1.6 implique qu’une loi ν sur RVd est typique si, pour un certain s > 0, pour tous ε > 0 et m > 0, il existe un entier n ≥ m tel que dL (s · ν, Fn ) ≤ ε où s · ν est la mesure image de ν par l’application RVd → RVd : f 7→ sf . Étant donné que dH (T (Gk ), Fnk ) et dL (distrGk (fk ), µ) tendent vers 0, l’inégalité triangulaire implique donc que Z est une onde typique standard. Le théorème 1.5 et le corollaire 1.3 affirment que Z et Y = σZ sont des ondes gaussiennes. Cela contredit dH (µ, S) ≥ ε0 .

2. THÉORIE SPECTRALE DES ONDES INVARIANTES Nous étudions ici la théorie spectrale d’une onde invariante standard. Nous construisons aussi l’onde gaussienne et prouvons le théorème 1.4. Pour un opérateur B défini dans `2 (Vd ), on utilisera la notation matricielle : pour tous x, y ∈ Vd , on pose Bxy = hex , Bey i où ex est le vecteur de la base canonique supporté sur x. 2.1. Résolvante et onde gaussienne Cette partie s’inspire de [18, 20]. Résolvante. — Soit A l’opérateur d’adjacence sur Td . Son spectre est σ(Td ) = √ √ [−2 d − 1, 2 d − 1]. La résolvante de A est définie pour tout z ∈ C\σ(Td ) par R(z) = (A − z)−1 . On fixe λ ∈ R. Pour t > 0, avec z = λ + it, on a =R(z) = t((A − λ)2 + t2 )−1 . Il s’agit d’un opérateur positif de norme au plus 1/t. En outre, tout comme (Axy )xy∈Vd , le tableau de nombres (R(z)xy )x,y∈Vd est invariant par les automorphismes de Td . Ainsi, pour tout x ∈ Vd , R(z)xx = R(z)∅∅ et R(z)∅x = R(z)x∅ . En utilisant la positivité de =R(z), on en déduit que |=R(z)∅x | ≤ =R(z)∅∅ . En particulier, avec z = λ + it, (4)

ASTÉRISQUE 422

Σ(t)xy =

=R(z)xy =R(z)∅∅

(1153)

NORMALITÉ ASYMPTOTIQUE DES VECTEURS PROPRES...

121

est de module au plus 1. Pour tout réel λ, par extraction diagonale, il existe donc une suite (tk )k tendant vers 0 telle que pour tous x, y ∈ Vd , Σ(tk )xy converge. On pose alors Σxy = lim Σ(tk )xy . k→∞

Notons que le tableau de nombres (Σxy )x,y∈Vd est invariant par les automorphismes de Td . On peut classiquement caractériser le spectre de Td avec la résolvante appliquée à e∅ : λ ∈ σ(Td ) est équivalent à l’une des conditions suivantes, (5)

lim k=R(λ + it)e∅ k2 = ∞ t↓0

ou

lim inf =R(λ + it)∅∅ > 0. t↓0

En effet, vérifions la première condition par exemple. Si k=R(λ + it)e∅ k2 est uniformément borné pour t > 0 alors, par transitivité, k=R(λ + it)ex k2 est uniformément borné en t > 0 et x ∈ Vd . La positivité de =R(λ + it) implique donc que la norme d’opérateur de =R(λ + it) est uniformément bornée en t > 0. Cela implique λ ∈ / σ(Td ). Construction de l’onde gaussienne. — Par construction, pour tout S ⊂ Vd , la matrice ΣS = (Σxy )x,y∈S est une matrice positive. Par le théorème d’extension de Kolmogorov, il existe un processus gaussien (Yx )x∈Vd tel que pour tous x, y ∈ Vd , EYx = 0 et EYx Yy = Σ. Le processus Y est invariant et standard. Nous vérifions maintenant que si λ ∈ σ(Td ) alors Y est une onde de valeur propre λ. Pour t > 0, soit Y (t) le processus gaussien centré de covariance Σ(t) : Y (t) converge faiblement vers Y lorsque t → 0. Aussi, avec z = λ + it, on trouve (=R(z))2∅∅ E((A − λ)Y (t))2∅ = ((A − λ)2 t((A − λ)2 + t2 )−1 )∅∅ = t − t3 ((A − λ)2 + t2 )−1 )∅∅ ≤ t. Maintenant si λ ∈ σ(Td ) alors d’après (5), on a lim inf t↓0 (=R(z))∅∅ > 0. On en déduit que Y est bien une onde. Lemme 2.1. — Pour tout λ ∈ σ(Td ), il existe une onde gaussienne de valeur propre λ. Approximation de l’onde gaussienne. — Nous pouvons maintenant démontrer le théorème 1.4. Démonstration du théorème 1.4. — Soit A l’opérateur d’adjacence de Td . Pour t > 0, soit Y (t) la variable gaussienne sur Td centrée et de covariance Σ(t) donnée par (4). Par construction, l’onde gaussienne est une limite faible Y (tk ) pour une suite tk → 0. Il suffit donc de montrer que pour tout t > 0, le processus Y (t) est typique. D’un autre

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

122

C. BORDENAVE

côté, pour tout ε > 0, le théorème de Weierstrass implique qu’il existe un polynôme Q tel que pour x ∈ σ(Td ), |Q(x)2 − t/((x − λ)2 + t2 )| ≤ ε. On pose pour tout ε suffisamment petit Σ0xy = Q(A)2xy /Q(A)2∅∅ (l’inégalité Q(A)2∅∅ > 0 découle de t/((x − λ)2 + t2 > 0 pour tout x ∈ σ(Td )). Par construction Σ0 est positif et la norme d’opérateur de Σ0 − Σ(t) est au plus ε. En conclusion, il suffit donc de montrer l’énoncé suivant : tout processus µ gaussien centré invariant de covariance Q(A)2 avec Q polynôme est typique. Un tel processus µ peut se réaliser comme la loi de Q(A)Z où Z = (Zx )x∈Vd avec (Zx ) des variables gaussiennes standard indépendantes. Soit G ∈ G(n, d) un graphe d-régulier sur V = {1, . . . , n} de matrice d’adjacence A0 et Z 0 = (Zx0 )x∈V des variables gaussiennes standard indépendantes. On considère la variable gaussienne Y 0 = Q(A0 )Z 0 . Pour tous x ∈ V et k ≥ 0, soit (G, x)k le sous-graphe de G engendré par les sommets à distance au plus k de x dans G. On note Ek (x) la propriété que (G, x)k est un arbre. Soit S ⊂ Vd inclus dans Bk (∅). Par construction, si Ek (x) est vraie et π : Vd → V est un revêtement de G tel que π(∅) = x alors la variable 0 (Zπ(y) )y∈S a même loi que (Zy )y∈S . Soit ν la loi de Z. Par la loi faible des grands nombres, il est alors facile de vérifier que pour tout δ > 0, il existe ε > 0 tel que l’événement (sous la loi de Z 0 ) dL (distrG (Z 0 ), ν) ≤ δ a probabilité au moins 1−δ dès que |{x ∈ V : E1/ε (x) est fausse}| ≤ εn. L’application RVd → RVd , f 7→ Q(A)f étant continue, on en déduit que pour tout δ 0 > 0, il existe δ, ε > 0 tels que dL (distrG (Y 0 ), µ) ≤ δ 0 dès que dL (distrG (Z 0 ), ν) ≤ δ et |{x ∈ V : E1/ε (x) est fausse}| ≤ εn. Enfin, pour conclure la preuve que µ est typique, il reste à énoncer cette propriété classique : pour tout ε > 0, pour tout n suffisamment grand, avec probabilité au moins 1 − ε, si G est uniformément distribué sur G(n, d), |{x ∈ V : E1/ε (x) est fausse}| ≤ εn (avec des mots : un graphe d-régulier aléatoire est localement presque comme un arbre). Cette dernière propriété découle par exemple du fait que le nombre de moyen de cycles de taille k dans un graphe d-régulier uniforme est uniformément borné en n (à k et d fixés), voir [24, théorème 2.5]. Remarque 2.2 (Construction de quasi-vecteurs propres). — On peut se servir de la résolvante pour construire des quasi-vecteurs propres pour tout λ ∈ σ(Td ). Pour t > 0,

ASTÉRISQUE 422

(1153)

NORMALITÉ ASYMPTOTIQUE DES VECTEURS PROPRES...

123

on pose ψt = =R(λ + it)e∅ . D’après (5), lorsque t → 0, kψt k2 → ∞. En outre (A − λ)ψt = =(A − λ)(A − λ − it)−1 e∅ = =(e∅ + it(A − λ − it)−1 e∅ ) = t2 ((A − λ)2 + t2 )−1 e∅ . On en déduit que k(A − λ)ψt k2 ≤ 1 pour tout t > 0. En conclusion, le vecteur ψt est un quasi-vecteur propre de déviation δt = 1/kψt k2 → 0. En tronquant ψt , quitte à modifier δt , on en déduit qu’il existe un quasi-vecteur propre ϕt de déviation δt et de support inclus dans B1/δt (∅) (la boule de rayon 1/δt ). Maintenant soit G ∈ G(n, d) un graphe d-régulier sur V = {1, . . . , n}. Si x ∈ V est tel que la propriété E1/δt (x) définie dans le théorème 1.4 est vraie alors d’après ce qui précède il existe un quasi-vecteur propre ϕ0t de déviation δt et de support inclus dans la boule de centre x et de rayon 1/δt dans G. En particulier, puisque ϕ0t a un support de taille indépendante de la taille du graphe, la distance √ dL (distrG ( nϕ0t /kϕ0t k2 ), δ0⊗Vd ) est arbitrairement proche de 0 lorsque n tend vers l’infini. Or, comme expliqué dans le théorème 1.4, pour tout δ > 0, avec probabilité vers 1 lorsque n tend vers l’infini, si G est uniformément distribué sur G(n, d), la propriété E1/δ (1) est vraie. Ainsi, avec grande probabilité, il existe des quasi-vecteurs propres localisés de petite déviation. D’un autre côté, pour tout λ ∈ σ(Td ), d’après le théorème 1.4 et l’argument dans la démonstration du corollaire 1.3, on peut aussi construire des quasivecteurs propres proches de l’onde gaussienne de valeur propre λ sur un graphe aléatoire uniforme. En conclusion, dans le contexte du théorème 0.4, en utilisant ces deux exemples opposés, on peut montrer que pour tous ε, δ > 0, σ ∈ [0, 1] et λ ∈ σ(Td ), pour tout n suffisamment grand, avec probabilité au moins 1 − ε, la matrice d’adjacence d’un graphe uniformément distribué sur G(n, d) admet un quasi-vecteur propre f de déviation δ de valeur propre λ orthogonal à 1 tel √ que dL (distrG ( nf /kf k2 ), Gaussλ,σ ) ≤ ε.

2.2. Polynômes sans épines Pour mener des calculs plus fins sur la covariance des ondes invariantes, il est très utile d’introduire une famille de polynômes orthogonaux. Définition. — Pour n ≥ 0 entier, le polynôme de Tchebychev de seconde espèce de degré n est défini par l’identité Un (cos θ) =

sin(n + 1)θ . sin θ

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

124

C. BORDENAVE

On pose U−1 = 0, U0 = 1. On définit alors la famille de polynômes (pn ) avec n ≥ 1 entier, … ã Å ã Å 1 λ d−1 λ pn (λ) = −p Un−2 √ , Un √ d 2 d−1 2 d−1 d(d − 1) et ses polynômes renormalisés pn (λ) qn (λ) = p d(d − 1)n−1

et

Qn (λ) =

» d(d − 1)n−1 pn (λ).

Enfin, on pose p0 = q0 = Q0 = 1. En utilisant U1 (λ) = 2λ, U2 (λ) = 4λ2 − 1, on trouve q1 (λ) = λ/d et q2 (λ) = (λ2 − d)/(d(d − 1)). La relation de récurrence satisfaite par les polynômes de Tchebychev, Un+1 (λ) = 2λUn (λ) − Un−1 (λ) pour tout n ≥ 0, implique que pour tout n ≥ 1, (6) (d − 1)qn+1 (λ) = λqn (λ) − qn−1 (λ)

et

Qn+1 (λ) = λQn (λ) − (d − 1)Qn−1 (λ).

Les polynômes Qn sont souvent appelés les polynôme sans épines, voir par exemple [21, 23, 1]. En effet, si A est l’opérateur d’adjacence d’un graphe d-régulier G = (V, E), alors pour tous x, y ∈ V , et n ≥ 1 entier, Qn (A)xy est égal au nombre de chemins sans épines de x à y de longueur n (chemins (x0 , . . . , xn ) tels que xt+1 6= xt−1 pour tout t = 1, . . . , n − 1). En utilisant (6), cela se vérifie immédiatement par récurrence sur n ≥ 1. Orthogonalité. — La mesure de probabilité de Kesten-McKay µTd est la mesure de √ √ support σ(Td ) = [−2 d − 1, 2 d − 1] et densité par rapport à la mesure de Lebesgue donnée par p d 4(d − 1) − λ2 . 2π(d2 − λ2 ) Cette mesure est la mesure spectrale de l’opérateur d’adjacence A sur Td définie par la propriété : pour tout entier n ≥ 0 Z λn dµTd (λ) = (An )∅∅ . Notons aussi que les termes diagonaux de la résolvante R(z) = (A − z)−1 sont la transformation de Cauchy-Stieltjes de µTd , pour tout z ∈ C\σ(Td ) Z dµTd (λ) R(z)∅∅ = . λ−z En particulier, pour λ ∈ σ(Td ), (7)

ASTÉRISQUE 422

lim =R(λ + it)∅∅ t↓0

p d 4(d − 1) − λ2 1 dµTd (λ) = = . π dλ 2(d2 − λ2 )

(1153)

NORMALITÉ ASYMPTOTIQUE DES VECTEURS PROPRES...

125

Dans Td il n’existe qu’un seul chemin sans épines entre deux sommets. On en déduit que pour tous n, m ≥ 1 entiers Z Qn Qm dµTd = he∅ , Qn (A)Qm (A)e∅ i = hQn (A)e∅ , Qm (A)e∅ i = d(d − 1)n−1 1n=m . En particulier la suite (pn )n≥0 est une famille orthonormale pour la mesure µTd . Cela permet de donner une définition plus analytique des polynômes sans épines à partir de la résolvante R(z) = (A − z)−1 . On développe en série entière λ 7→ 1/(λ − z) dans la famille orthonormale (pn ). Ce développement est convergent pour |z| suffisamment grand pour tout λ ∈ σ(Td ). On trouve donc, pour z dans un voisinage de l’infini, Z ∞ X pn (λ) R(z) = pn (A) dµTd (λ). λ−z n=0 En passant par les chemins sans épines, on obtient, si |x| est la distance de x 6= ∅ à ∅, Z Z p|x| (λ) q|x| (λ) 1 dµTd (λ) = dµTd (λ). R(z)∅x = p λ−z λ−z d(d − 1)|x|−1 Cette formule est également vraie pour x = ∅. Par analyticité, l’identité s’étend à tout z ∈ / σ(Td ). On prend la partie imaginaire et on fait tendre z vers λ ∈ R. √ D’après (7), on en déduit la formule pour tous |λ| < 2 d − 1 et x ∈ Vd , q|x| (λ) =

limt↓0 =R(λ + it)∅x . limt↓0 =R(λ + it)∅∅

Ainsi, Σ∅x = q|x| (λ), où Σ est la covariance de l’onde gaussienne de valeur propre λ. Par continuité, cette dernière identité s’étend pour tout λ ∈ σ(Td ). Calcul de la covariance. — On déduit de (6) que, pour tout λ ∈ R, le vecteur ϕ ∈ RVd défini par ϕ(x) = q|x| (λ), où |x| est la distance de x à ∅, satisfait l’équation de vecteur propre (1). En outre, si X est une onde invariante sur Td alors EXx Xy ne dépend que de la distance entre x et y. Il est immédiat de vérifier que le vecteur EXX | ex satisfait l’équation de vecteur propre de (1) : si g = EXX | f pour f ∈ `2 (V ) alors (λI −A)g = E(λI −A)XX | f = 0. Par récurrence, on obtient que ϕ = EXX | e∅ . Le lemme suivant en découle. Lemme 2.3. — Soit X une onde invariante standard de valeur propre λ. Pour tous x, y ∈ Vd , on a EXx Xy = q|x−y| (λ) où |x − y| est la distance de x, y dans Td . En combinant avec le lemme 2.1, nous avons démontré le résultat suivant. Corollaire 2.4. — Pour tout λ ∈ σ(Td ), il existe une unique onde gaussienne de valeur propre λ.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

126

C. BORDENAVE

2.3. Rang de la matrice de covariance Soit S ⊂ Vd un sous-ensemble fini connexe de sommets de l’arbre Td . Pour tout entier k, nous noterons Bk (S) le voisinage de S dans Td de rayon k. On définit l’intérieur de S comme int(S) = {x ∈ S : B1 (x) ⊂ S} et son bord comme ∂S = S\int(S). Pour λ ∈ R, on note Wλ (S) le sous-espace vectoriel de RS des vecteurs Y ∈ RS qui vérifient l’équation de vecteur propre (1) pour tout x ∈ int(S). Nous allons commencer par un résultat classique sur la dimension de Wλ (S). Lemme 2.5. — Soit λ ∈ R. Pour tout S ⊂ Vd fini, on a dim(Wλ (S)) = |∂S|. Démonstration. — La fonction S 7→ dim(Wλ (S)) étant invariante par automorphisme, on peut supposer que ∅ ∈ S. On peut aussi supposer S connexe. En effet, Wλ (S ∪ S 0 ) est la somme directe de Wλ (S) et Wλ (S 0 ) si aucun sommet de S ne partage d’arête avec un sommet de S 0 . Pour démontrer le lemme, nous raisonnons par récurrence sur la taille de S. Si S = {∅}, ∂S = S et l’énoncé est vrai. Pour n ≥ 2 entier, nous supposons l’énoncé vrai pour tous les ensembles connexes de taille n − 1. Soit S tel que |S| = n. Il existe U connexe de taille n − 1 tel que S = U ∪ {x} avec ∅ ∈ U et y ∈ U , y parent de x. En particulier, y ∈ ∂U , dim(Wλ (U )) = |∂U | et, Td étant un arbre, aucun enfant de x n’est dans U . Si tous les enfants de y ne sont pas dans S alors ∂S = ∂U ∪ {x} et dim(Wλ (S)) = dim(Wλ (U )) + 1 (Wλ (S) est l’espace vectoriel engendré par Wλ (U ) et ex ). Dans l’autre cas possible, U contient les d − 1 autres voisins de y (parent et enfants). On trouve alors ∂S = (∂U ∪ {x})\{y} et dim(Wλ (S)) = dim(Wλ (U )) (l’équation de vecteur propre (1) devant être satisfaite au sommet y, tout vecteur f ∈ Wλ (U ) s’étend de façon unique en x). Donc, dans les deux cas, on a bien dim(Wλ (S)) = |∂S|. Nous allons maintenant étudier le rang de la matrice de covariance d’une marginale d’une onde invariante. Nous démarrons avec la remarque suivante. Lemme 2.6. — Soit X une onde invariante. Pour tous x 6= ∅ ∈ Vd , i ∈ {2, . . . , d − 1}, on a EX∅ (X(x,i) − X(x,1) ) = 0. De même pour tout i ∈ {2, . . . , d}, on a EX∅ (Xi − X1 ) = 0. Démonstration. — Il suffit d’observer qu’il existe un automorphisme de Td qui laisse ∅ invariant mais qui permute (x, i) et (x, 1). Notre objectif est maintenant de démontrer le résultat suivant.

ASTÉRISQUE 422

(1153)

NORMALITÉ ASYMPTOTIQUE DES VECTEURS PROPRES...

127

S Lemme 2.7. — Soient λ ∈ σ(Td ) et S ⊂ Vd fini tel que S = x∈int(S) B1 (x) ou |S| ≤ 2. Soit X une onde invariante standard de valeur propre λ et ΣS = (E[Xx Xy ])x,y∈S la matrice de covariance de X restreinte à S. L’image de ΣS est Wλ (S). Démonstration. — Soit X une onde standard de loi µ. Rappelons que l’image de ΣS est contenue dans Wλ (S) : si g = EXX | f alors (λI − A)g = E(λI − A)XX | f = 0. Il suffit donc de montrer que le rang ΣS est (au moins) égal à dim(Wλ (S)) = |∂S|. Pour ce faire, si m = |∂S|, nous allons trouver une transformation linéaire T : RS → Rm telle que la matrice de covariance de T ((Xx )x∈S ) est diagonale par blocs avec des blocs inversibles. On considère les variables aléatoires suivantes pour x 6= ∅, (8)

X∅ ,

A∅ = (Xi − X1 )i=2,...,d

et Ax = (X(x,i) − X(x,1) )i=2,...,d−1 .

Le lemme 2.6 implique que toutes ces variables sont décorrélées : pour tous x 6= y, i, j E(Ax )i (Ay )j = 0. On vérifie maintenant que le rang de la matrice de covariance EAx A|x est maximal. Soit x 6= ∅. Le lemme 2.6 implique que pour tous i 6= j ∈ {2, . . . , d − 1}, EX(x,i) (X(x,j) − X(x,1) ) = 0. Par linéarité, on trouve E(Ax )i (Ax )j = a et E((Ax )i )2 = 2a avec a = 1 − EX1 X2 . Cela implique que pour tout x 6= ∅, EAx A|x = a(I + J) où I est la matrice identité et J = 11⊥ (matrices de dimension (d − 1) × (d − 1)). De même, pour x = ∅, le lemme 2.6 implique que EA∅ A|∅ = a(I + J) (de dimension d × d). Nous déterminons maintenant la valeur de a. L’équation de vecteur propre (1) en ∅ implique que 2 λ2 EX∅ = λ2 = E

d X

!2 Xi

= d + d(d − 1)EX1 X2 .

i=1

On en déduit que EX1 X2 = (λ2 − d)/(d(d − 1)). On trouve a = (d2 − λ2 )/(d(d − 1)) > 0 si et seulement si |λ| < d. On a donc vérifié que pour tout x ∈ Vd , la matrice EAx A|x est définie positive. On peut maintenant compléter la preuve. Si |S| ∈ {1, 2} l’énoncé est trivial. Sinon, on peut supposer que ∅ ∈ S. L’ensemble de variables (X∅ , (Ax )x∈int(S) ) ∈ Rm a une matrice de covariance de rang plein et est une combinaison linéaire de (Xx )x∈S . En comptant (par exemple comme dans le lemme 2.5), on trouve m = |∂S|. Remarque 2.8. — Avec plus de soin, on peut enlever la restriction S = dans l’énoncé du lemme 2.7.

S

x∈int(S)

B1 (x)

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

128

C. BORDENAVE

3. UNE STRATÉGIE ENTROPIQUE Dans cette section, nous présentons les grandes lignes de la démonstration du théorème 1.5. Théorème principal, version onde typique lisse. — Avant de nous lancer dans le cœur de la preuve du théorème principal, nous procédons à une ultime réduction. Nous dirons qu’une loi µ sur RVd est lisse si pour tout ensemble fini S tel que S S = x∈int(S) B1 (x) ou |S| ≤ 2, la loi marginale de µ sur S admet une densité C ∞ et strictement positive sur le sous-espace vectoriel de RS engendré par son support (muni de la mesure de Lebesgue). La restriction sur les ensembles S est purement technique et provient de l’énoncé du lemme 2.7. √ √ Théorème 3.1. — Soit λ ∈ σ(Td ) = [−2 d − 1, 2 d − 1]. Si Y est une onde typique standard lisse de valeur propre λ alors Y est l’onde gaussienne de valeur propre λ. Par un argument de convolution, il est facile de vérifier que le théorème 3.1 implique le théorème 1.5. En effet, soit Y une onde typique standard et Z une onde gaussienne indépendante de même valeur propre λ ∈ σ(Td ). Soit S ⊂ Vd S fini tel que S = x∈int(S) B1 (x). D’après le lemme 2.7, les supports des lois de Z et de Y restreintes à S engendrent le même espace vectoriel, Wλ (S). Ainsi, pour √ tout σ ∈ (0, 1], Y (σ) = σZ + 1 − σ 2 Y est une onde standard dont µσ,S , la loi restreinte à Wλ (S), est la convolution d’une loi gaussienne de covariance définie positive et d’une autre loi. En particulier, µσ,S est lisse. D’un autre côté, pour tout σ ∈ [0, 1], en répétant la preuve du théorème 1.4, Y (σ) est une onde typique. Maintenant, étant donné que toute limite faible d’une loi gaussienne dans Rn est gaussienne, il est clair en considérant la limite σ → 0 que le théorème 3.1 implique le théorème 1.5. Entropie. — Soit µ une mesure de probabilité sur un espace mesuré (E, λ). Si µ est absolument continue par rapport à λ et de densité f , l’entropie différentielle de µ est (si l’intégrale est bien définie) Z HE (µ) = − f (x) log f (x) dλ(x). E

Si Y a loi µ, on notera cette quantité indifféremment HE (µ) ou HE (Y ). On omettra souvent l’indice E dans la notation HE (·). Si E est un espace dénombrable muni de la mesure de comptage alors H(µ) coïncide avec l’entropie de Shannon X HE (µ) = − µ(x) log µ(x). x∈E

ASTÉRISQUE 422

(1153)

NORMALITÉ ASYMPTOTIQUE DES VECTEURS PROPRES...

129

Soient µ une mesure de probabilité dans Rn et E l’espace vectoriel engendré par le support de µ. Si µ est absolument continue par rapport à la mesure de Lebesgue sur E, on pose Hsupp (µ) = HE (µ). Il est facile de vérifier que si la densité de µ sur E est uniformément bornée et EkXk22 < ∞ avec X de loi µ alors Hsupp (µ) est bien défini. Stratégie de la démonstration. — On considère les ensembles de Vd , S ? = B1 (∅)

et

S − = {∅, 1}.

La preuve se base sur l’étude pour une onde invariante lisse X de son entropie invariante définie comme : (9)

D(X) = Hsupp (XS ? ) − (d/2)Hsupp (XS − ),

avec XS = (Xx )x∈S pour tout S ⊂ Vd . Dans [5], les auteurs démontrent la propriété suivante de maximalité de l’entropie d’une gaussienne. Théorème 3.2. — Soit λ ∈ σ(Td ). Si X est une onde invariante standard lisse et Y l’onde gaussienne de même valeur propre λ. Alors D(X) ≤ D(Y ), avec égalité si et seulement si XS ? a même loi que YS ? . D’un autre côté, Backhausz et Szegedy ont établi le résultat suivant. Nous dirons qu’un processus X sur RVd est 2-markovien si pour toute arête e = {a, b} de Td , les variables (Xx )x∈Va et (Xx )x∈Vb sont indépendantes conditionnellement à (Xa , Xb ) avec Va ∪ Vb la partition de Vd en les deux composantes connexes du sous-graphe de Td où seule l’arête e est retirée. Cette propriété s’interprète comme une propriété de Markov spatiale. En utilisant le lemme 2.6, il ne sera pas difficile de vérifier que l’onde gaussienne est 2-markovienne. Théorème 3.3. — Soit λ ∈ σ(Td ). Si X est une onde typique standard lisse et Y l’onde gaussienne de même valeur propre λ alors D(X) ≥ D(Y ), avec égalité si et seulement X est 2-markovien.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

130

C. BORDENAVE

Les théorèmes 3.2 et 3.3 impliquent le théorème 3.1. Il suffit en effet d’observer qu’une onde invariante 2-markovienne X est caractérisée par la loi de XS ? . Dans la section 5, nous démontrerons le théorème 3.3 grâce à des inégalités entropiques générales satisfaites par les processus typiques que nous présentons dans la section 4. La démonstration du théorème 3.2 dans la section 6 se basera sur l’étude de l’évolution de l’entropie invariante le long du flot de la chaleur.

4. INÉGALITÉ ENTROPIQUE POUR LES ONDES TYPIQUES Si f ∈ F Vd et S ⊂ Vd alors nous noterons fS = (fx )x∈S . Nous noterons pour tout entier k ≥ 0, Sk? = Bk (S ∗ )

et

Sk− = Bk (S − ).

4.1. Inégalité entropique étoile-arête discrète La preuve du théorème 3.3 repose sur l’inégalité entropique suivante. Théorème 4.1. — Soit F un ensemble fini. Si Y est un processus typique sur F Vd alors pour tout k ≥ 0, on a H(YSk? ) − (d/2)H(YS − ) ≥ 0. k

La démonstration de ce théorème repose sur des idées présentes dans [13, 4]. Appariement et coloriage. — Soit V un ensemble fini avec |V | pair, un appariement est une involution sur V sans point fixes. Un appariement peut s’identifier à un graphe (V, Eσ ) sur V formé de |V |/2 arêtes disjointes. Le nombre d’appariements d’un ensemble à n éléments est (avec n pair) n!! = (n − 1)(n − 3) · · · 1 =

n! 2n/2 (n/2)!

(ce nombre est aussi égal au moment d’ordre n d’une loi gaussienne standard sur R). Soit F un ensemble fini dont les éléments de F seront appelés des couleurs. Un P vecteur f ∈ F V est un coloriage de V . On rappelle que distr(f ) = (1/n) x∈V δf (x) est la loi d’une entrée typique de f . Pour toute mesure µ sur F on notera H(µ, n) = |{f ∈ F n : distr(f ) = µ}|. On notera de même la mesure de probabilité sur F 2 , 1 X (10) distrσ (f ) = δ(f (x),f (σ(x))) . n x∈V

ASTÉRISQUE 422

(1153)

NORMALITÉ ASYMPTOTIQUE DES VECTEURS PROPRES...

131

Notons que cette mesure est symétrique au sens où elle est invariante par l’application (a, b) 7→ (b, a). Aussi, les deux marginales de distrσ (f ) sont égales à distr(f ). Le résultat suivant est extrait de [4, lemme 4.1]. Lemme 4.2. — Soient V, F des ensembles finis avec |V | = n pair et f ∈ F V . Soit µ une mesure de probabilité sur F 2 symétrique de loi marginale µ1 = distr(f ). Alors le nombre d’appariements de V tels que distrσ (f ) = µ est égal à n!!H(µ, n/2)/H(µ1 , n). Démonstration. — Soient Af l’ensemble des appariements σ de V tels que distrσ (f ) = µ et M l’ensemble des vecteurs h ∈ (F 2 )n tels que h(x) = (g(x), g(σ(x)) pour g ∈ F n et σ appariement avec distrσ (g) = µ. On calcule |M | de deux façons. Tout d’abord, on remarque que distr(f ) = distr(g) implique que f = g ◦θ pour une certaine permutation θ sur V . En particulier |Af | = |Ag | et on trouve M = H(µ1 , n)|Af |. D’un autre côté, un élément de M peut aussi se construire en choisissant d’abord un appariement σ et ensuite en positionnant les paires de couleurs sur les arêtes. On obtient M = n!!H(µ, n/2). Nous aurons aussi besoin d’un théorème standard de Shannon, voir [15, théorème 3.1.2]. Lemme 4.3. — Soient F un ensemble fini et µ une mesure de probabilité sur F . Pour ε > 0, on pose Hε (µ, n) = |{f ∈ F n : dL (distr(f ), µ) ≤ ε}|. On a H(µ) = lim lim inf ε↓0 n→∞

1 1 log Hε (µ, n) = lim lim sup log Hε (µ, n). ε↓0 n→∞ n n

Inégalité entropique étoile-arête. — Nous allons maintenant démontrer le théorème 4.1 Nous démarrons par le cas k = 0. Théorème 4.4. — Soit F un ensemble fini. Si Y est un processus typique sur F Vd alors H(YS ? ) − (d/2)H(YS − ) ≥ 0. Démonstration. — Un graphe coloré sur F est une paire (G, f ) avec G = (V, E) ∈ ~ = {(u, v) : {u, v} ∈ E}, G(n, d) et f ∈ F V . L’ensemble des arêtes orientées de G est E ~ il est muni de l’appariement σG (u, v) = (v, u). On étend f à F E en posant f~(u, v) = ~ La loi d’une couleur typique est distr(f ) = distr(f~), la loi f (u) pour tout (u, v) ∈ E. d’une arête orientée typique est définie comme distrσG (f~). Nous allons encoder la boule de rayon 1 autour d’un sommet par un nouveau graphe coloré. On définit le graphe coloré (G, f ? ) sur l’ensemble de couleurs (F ? )V en posant F ? = F d+1 et pour tout x ∈ V , f ? (x) = (f (x), f (xi )i=1,...,d ) où les (xi ) sont

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

132

C. BORDENAVE

les couleurs des voisins de x classés par ordre lexicographique. On note f ? (x) = (f ? (x)0 , f ? (x)1 , . . . , f ? (x)d ). De même, on définit Y ? comme le processus sur (F ? )Vd défini par Yx? = (Yx , (Yy )y:{x,y}∈E ) où E est l’ensemble des arêtes de Td . Enfin, on note µ? la loi de Y∅? et µ− la loi de (Y∅ , Y1 ). On a H(µ? ) = H(µS ? ) et H(µ− ) = H(µS − ). Pour tout ε > 0, soit C(n, ε) l’ensemble des graphes colorés (G, f ) avec G ∈ G(n, d) et f ∈ F V tels que dL (distrσG (f~), µ− ) ≤ ε et dL (distr(f ? ), µ? ) ≤ ε. La définition d’un processus typique implique (11)

lim inf lim sup ε→0

n

|C(n, ε)| ≥ 1. |G(n, d)|

Un résultat classique de Bender et Canfield [8] affirme que pour tout entier d ≥ 2, si nd est pair et dans la limite n → ∞, (12)

|G(n, d)| ∼

(nd)!! 1−d2 e 4 . (d!)n

En utilisant une idée déjà présente dans Bender et Canfield, nous allons maintenant estimer |C(n, ε)|. Nous noterons o(1) une fonction de (n, ε) qui tend vers 0 lorsque n tend vers l’infini puis ε vers 0. Soit f ? ∈ (F ? )n tel que dL (distr(f ? ), µ? ) ≤ ε. D’après le lemme 4.3, il y a exp(n(1 + o(1))H(µ? )) possibilités pour f ? . Le modèle de configuration introduit dans [8, 10] est une représentation d’un graphe à une numérotation des arêtes près par un appariement. On définit l’ensemble ~ = V × {1, . . . , d}, pour x ∈ V , on pose E(x) ~ E = {(x, i) : i = 1, . . . , d}. On conçoit ~ un élément de (x, i) ∈ E(x) comme une demi-arête orientée dont le sommet de départ ~ on peut associer un graphe G(σ) = (V, Eσ ) avec Eσ est x. À tout appariement σ sur E, ~ ~ l’ensemble des {x, y} tels que x 6= y et E(x) ∩ E(y) non vide. On aura G(σ) ∈ G(n, d) ~ ~ ~ ~ si et seulement si pour tout x 6= y, E(x) ∩ E(x) = ∅ et |E(x) ∩ E(y)| ∈ {0, 1}. De plus, en comptant les possibilités de numérotations des demi-arêtes, on a pour tout G ∈ G(n, d), (13)

|{σ : G(σ) = G}| = (d!)n .

~ → F 2 par f − (x, i) = Pour f ? ∈ (F ? )n fixé, on définit la fonction f − : E (f ? (x)0 , f ? (x)i ). On obtient ainsi une couleur sur les demi-arêtes. On cherche à apparier une demi-arête de couleur (a, b) avec une demi-arête de couleur (b, a). D’après le lemme 4.2, le nombre d’appariements possibles est (nd)!!

ASTÉRISQUE 422

H(distr(f − )2 , (nd)/2) , H(distr(f − ), nd)

(1153)

NORMALITÉ ASYMPTOTIQUE DES VECTEURS PROPRES...

133

où pour une mesure ν sur F 2 on a posé ν 2 ((a, b), (c, d)) = ν(a, b)1(c,d)=(b,a) . On note que H(ν 2 ) = H(ν). Par une nouvelle application du lemme 4.3 et (13), on en déduit Å Å ãã d (nd)!! exp n(1 + o(1)) H(µ ) − |C(n, ε)| ≤ H(µ ) . ? − (d!)n 2

Il reste à combiner cette dernière inégalité à (11)-(12) pour conclure la démonstration.

Le théorème 4.1 découle du cas k = 0. Démonstration du théorème 4.1. — Soit f ∈ F Vd un coloriage de Td . Nous encodons ~ la boule de rayon k + 1 autour d’un sommet par une nouvelle coloration. Soit E l’ensemble des arêtes orientées de Td . Nous allons d’abord définir la couleur d’une ~ arête orientée. Dans le langage de la combinatoire, on définit la couleur de (x, y) ∈ E comme la paire d’arbres enracinés non étiquetés de profondeur k associée aux sous~ on fixe un arbres issus de (x, y) et (y, x). Plus précisément, pour tout e = (x, y) ∈ E, isomorphisme de Td tel que ϕe (∅) = x et ϕe (1) = y. On définit T (e) comme la fonction f ◦ ϕe restreinte à Bk0 (1) les sommets descendants de 1 et qui sont à distance au plus k +1 de ∅ (c’est le sous-arbre issu de 1 de profondeur k). Les automorphismes ϕ de Td tels que ϕ(∅) = ∅ et ϕ(1) = 1 définissent un sous-groupe et une relation d’équivalence 0 sur F Bk (1) . L’ensemble des classes d’équivalence est un ensemble fini que l’on note F∼ . ~ on définit t(e) comme la classe d’équivalence de T (e). Enfin, on pose Pour tout e ∈ E, d Vd gf ∈ (F∼ ) avec gf (x) = (t(x, xi ))i=1,...,d où les xi sont les voisins de x classés par ordre lexicographique. Soient Y un processus typique et Z = gY ∈ (F∼d )Vd le processus de coloriage ci-dessus associé à Y . Par construction, Z est typique et d’après le théorème 4.1, H(ZS ? ) − (d/2)H(ZS − ) ≥ 0. On remarque que pour tout f ∈ F Vd , (gf (x))x∈S ? contient toutes les couleurs dans Sk? = Bk (S ? ) et (gf (x))x∈S − toutes les couleurs dans Bk (e). Cependant à cause de la relation d’équivalence, l’indice des sommets dans ces boules est inconnu. En utilisant l’invariance de Y par les automorphismes de Td , nous avons H(YSk? ) = H(ZS ? ) + d log m et H(YS − ) = H(Z− ) + 2 log m où m est le nombre k d’automorphismes de l’arbre (d − 1)-aire de profondeur k (l’arbre de profondeur k issu de 1 dans Td ). En effet, on peut construire YSk? en échantillonnant les classes d’équivalence des sous-arbres suivant la loi de ZS ? et ensuite en choisissant un étiquetage pour les sommets issus de i = 1, . . . , d grâce à d automorphismes indépendants uniformes. De même pour YS − . Ainsi H(ZS ? ) − (d/2)H(ZS − ) = k H(YSk? ) − (d/2)H(YS − ). Cela conclut la preuve. k

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

134

C. BORDENAVE

Nous aurons en fait besoin d’un raffinement du théorème 4.4 pour un processus qui est obtenu à partir de tirages indépendants sur un processus typique. Corollaire 4.5. — Soient E un espace métrique complet séparable, F un ensemble fini, P (F ) l’ensemble des mesures de probabilité sur F et w : E → P (F ) une application continue. Soit (X, Y ) un processus sur (E × F )Vd tel que pour tout x ∈ Vd la variable Yx sachant (X, (Yy )y6=x ) a distribution w(Xx ). Si X est typique alors Y est typique et pour tout k entier, H(YSk? ) − (d/2)H(YS − ) ≥ E[H(Y∅ |X∅ )], k

où H(Y∅ |X∅ ) est l’entropie de la loi conditionnelle de Y∅ sachant X∅ . Démonstration. — Nous esquissons la démonstration pour le cas E fini, le cas général se déduit du même argument en utilisant l’uniforme continuité de w sur les compacts et la séparabilité de E. Soit µ la loi de Y . Les démonstrations des théorèmes 4.4 et 4.1 et (11) montrent en fait que 1 |Ck (n, ε)| d H(YSk? ) − H(YS − ) ≥ lim lim sup log , k ε→0 n→∞ n 2 |G(n, d)| où pour tout ε > 0, Ck (n, ε) est l’ensemble des graphes colorés (G, f ) avec G ∈ G(n, d) et f ∈ F n tels que dL (distrG (f )Sk? , µSk? ) < ε où, pour ν loi d’un processus sur Vd , νSk? est sa loi marginale sur Sk? . Soit ν la loi de X. En utilisant le lemme 4.3, pour tout ε > 0, pour tout entier ` suffisamment grand et pour tout a ∈ E, le nombre de vecteurs f ∈ F ` tels que dL (distr(f ), w(a)) < ε est au moins exp(`(1 − ε)H(w(a))). Il n’est pas difficile d’en déduire que pour tout ε > 0, il existe ε0 > 0 et m tel que si n ≥ m, G ∈ G(n, d) et g ∈ Rn sont tels que dL (distrG (g)Sk? , νSk? ) < ε0 alors il existe au moins exp(n(1 − ε)E[H(Y∅ |X∅ )]) vecteurs f ∈ F n tels que dL (distrG (f )Sk? , µSk? ) < ε (on applique la propriété précédente pour chaque k-voisinage possible d’un graphe d-régulier coloré par E, avec ` le nombre de x ∈ {1, . . . , n} tels que g restreint à la boule de centre x et de rayon k dans G soit égal à ce k-voisinage). Enfin, le processus X étant typique, pour tout ε0 > 0, le nombre de graphes G ∈ G(n, d) tels qu’il existe g ∈ Rn avec dL (distrG (g)Sk? , νSk? ) ≤ ε0 est au moins |G(n, d)|/2 pour une suite infinie d’entiers n. On en déduit lim sup n→∞

|Ck (n, ε)| 1 log ≥ (1 − ε)E[H(Y∅ |X∅ )]. n |G(n, d)|

Il reste à faire tendre ε vers 0.

ASTÉRISQUE 422

(1153)

NORMALITÉ ASYMPTOTIQUE DES VECTEURS PROPRES...

135

4.2. Inégalité entropique étoile-arête pour les ondes Soit Y un processus standard invariant et lisse. Pour tout entier k ≥ 0, nous généralisons l’entropie invariante (9) de la façon suivante Dk (Y ) = Hsupp (YSk? ) − (d/2)Hsupp (YS − ).

(14)

k

Théorème 4.6. — Soit k ≥ 0 entier. Si est Y une onde standard typique lisse de valeur propre λ ∈ σ(Td ) alors Dk (Y ) ≥ 0. Nous expliquons comment déduire le théorème 4.6 du théorème 4.1 par un argument de discrétisation. Soit δ > 0 avec 2/δ 2 entier, on partitionne [−1/δ, 1/δ] en intervalles de longueurs égales à δ. Pour x ∈ [−1/δ, 1/δ], on peut ainsi définir xδ comme le centre de l’intervalle auquel il appartient. Pour x ∈ R\[−1/δ, 1/δ] on pose xδ = 0δ . Pour tout entier n ≥ 2 et x ∈ Rn , on peut également définir xδ en appliquant la partition en intervalles à chacune des coordonnées. Notons que xδ appartient à Rδn une partie finie de Rn (de cardinal (2/δ 2 )n ). Si X est une variable sur Rn avec une densité, on peut classiquement relier l’entropie de Shannon de Xδ à l’entropie de X, voir [15, théorème 8.3.1] et [5, lemme 8.1] : Lemme 4.7. — Soit X une variable aléatoire dans Rn de densité C 1 telle que EkXk22 < ∞. Alors  lim HRδn (Xδ ) + n log δ = HRn (X). δ→0

On en déduit également l’énoncé suivant. Corollaire 4.8. — Soient X une variable aléatoire dans R avec E|X|2 < ∞ et Y une variable gaussienne N (0, σ 2 ) indépendante avec σ > 0. Alors, lim (E{HRδ ((X + Y )δ |X)} + log δ) = HR (N (0, σ 2 )),

δ→0

où H(Z|X) est l’entropie de la loi conditionnelle de Z sachant X. Démonstration. — Si X est presque sûrement égal à 0 alors l’énoncé est une conséquence du lemme 4.7. Sinon on écrit EHRδ ((X + Y )δ |X) = E1|X| 0 et σ > 0. Soit Z un processus gaussien sur RVd avec (Zx )x∈Vd variables gaussiennes N (0, σ 2 ) indépendantes. On applique le corollaire 4.5 à (Y + Z)δ , on trouve      H ((Y + Z)δ )Sk? − (d/2)H ((Y + Z)δ )S − ≥ E H (Y∅ + Z∅ )δ |Y∅ ) . k

On note que pour tout entier k ≥ 0, on a |Sk? | − (d/2)|Sk− | = 1. On applique le lemme 4.7 (avec n = |Sk? | et n = |Sk− |) et le corollaire 4.8. Dans la limite δ tend vers 0, les termes en log δ s’annulent et on trouve   (15) H (Y + Z)Sk? − (d/2)H (Y + Z)S − ≥ H(N (0, σ 2 )). k

La loi du processus Z est invariante par transformation orthogonale. Ainsi, si S ⊂ Vd est fini et ES est l’espace vectoriel engendré par le support de YS , la variable ZS se décompose comme la somme indépendante d’une variable gaussienne dans ES de loi N (0, σ 2 IES ) et d’une variable gaussienne dans (ES )⊥ de loi N (0, σ 2 IES⊥ ) (où pour Σ matrice définie positive de taille n, N (0, Σ) est la loi gaussienne centrée dans Rn de covariance Σ). On a donc   H (Y + Z)S = H (Y + Z)| + dim(ES⊥ )H(N (0, σ 2 )). ES

Le processus Y étant lisse, grâce au théorème de convergence dominée, on trouve pour S ∈ {Sk? , Sk− },   lim H (Y + Z)| = Hsupp YS . ES

σ→0

En outre, pour tout k ≥ 0, d’après le lemme 2.7, dim(ES⊥k? ) − (d/2) dim(ES⊥− ) − 1 = |∂Sk? | − (d/2)|∂Sk− | = 0, k

|Sk? | − (d/2)|Sk− |

où on a utilisé que la limite σ → 0 dans (15).

ASTÉRISQUE 422

= 1 et |∂Sk? | = (d/2)|∂Sk− |. Il reste donc à prendre

(1153)

NORMALITÉ ASYMPTOTIQUE DES VECTEURS PROPRES...

137

5. MINIMUM DE L’ENTROPIE INVARIANTE Dans cette section nous démontrons le théorème 3.3. Ce résultat est une conséquence de l’inégalité entropique de la section précédente, de considérations générales sur l’entropie et du calcul explicite de Dk (Y ) = Hsupp (YSk? )−(d/2)Hsupp (YS − ) k pour Y l’onde gaussienne. Nous commençons par ce dernier point. 5.1. Entropie de l’onde gaussienne Backhausz et Szegedy ont démontré l’énoncé suivant. Théorème 5.1. — Soient λ ∈ σ(Td ) et Y l’onde gaussienne de valeur propre λ. On a lim Dk (Y ) = 0.

k→∞

Une interprétation erronée mais éclairante de ce théorème est la suivante. L’arbre Td restreint à Sk? peut se décomposer comme ∅ et l’union de d arbres isomorphes par un automorphisme de Td , chacun correspondant à l’arbre de profondeur k engendré par les sommets de Sk? qui sont les descendants du sommet i = 1, . . . , d. On peut également écrire Td restreint à Sk− comme l’union de 2 tels arbres de profondeur k. Si l’onde gaussienne restreinte à ces arbres était indépendante alors on aurait Hsupp (YSk? ) égal à (d/2)Hsupp (YS − ). La réalité est plus subtile mais la k démonstration du théorème 5.1 cache un phénomène similaire sur des sous-espaces − ? vectoriels de grandes dimensions de RSk et RSk . Nous allons seulement esquisser la démonstration du théorème 5.1. On démarre avec la formule : pour X ∈ Rn une variable gaussienne dont la matrice de covariance Σ est de rang m, 1 Hsupp (X) = log((2πe)m det0 (Σ)), 2 où det0 (Σ) est le produit des m valeurs propres non nulles de Σ. On observe que pour tout k ≥ 1, |∂Sk? | = (d/2)|∂Sk− |. Ainsi, grâce au lemme 2.7, on obtient pour k ≥ 1, 2Dk (Y ) = log(det0 (Σ?k )) − (d/2) log(det0 (Σ− k )), ? où Σ?k , Σ− k sont les covariances respectives de YSk et YS − . Il faut donc démontrer k

que log(det0 (Σ?k )) − (d/2) log(det0 (Σ− k )) tend vers 0 avec k tendant vers l’infini. Dans le lemme 2.3, nous avons donné une formule pour les entrées de Σ?k et Σ− k . En utilisant que ces matrices sont invariantes par les automorphismes de Td et que leurs images sont Wλ (Sk? ) et Wλ (Sk− ), il est en fait possible de diagonaliser explicitement ces matrices.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

138

C. BORDENAVE

Nous expliquons maintenant comment réaliser cette diagonalisation pour Σ?k . Le cas de Σ− k est similaire. On définit ¶ © ? F = f ∈ RSk : f (x) = f (y) si |y| = |x| , où |x| est la distance à ∅. Pour tout x ∈ int(Sk? ), on introduit également le sous-espace ? vectoriel Ex de RSk composé des vecteurs f qui vérifient les propriétés suivantes : (i) f (y) = 0 si y n’est pas un descendant de x ; (ii) pour tout i ∈ {1, . . . , d − 1}, y, y 0 ∈ Σ?k , f (y) = f (y 0 ) si y et y 0 sont des descendants de (x, i) ; (iii) f ∈ F ⊥ . Lemme 5.2. — Nous avons les propriétés suivantes : ?

1. L’espace vectoriel RSk admet la décomposition en somme directe M ? RSk = F ⊕ Ex . x∈int(Sk? )

2. Les espaces vectoriels F et (Ex ), x ∈ int(Σ?k ), sont invariants par Σ?k . Démonstration. — L’orthogonalité de F et Ex est la propriété (iii) de Ex . Soient x 6= x0 . Si ni x ni x0 ne sont ancêtres l’un de l’autre alors l’orthogonalité de Ex et Ex0 vient de la propriété (i) (les vecteurs de Ex et Ex0 ont supports disjoints). Si x est l’ancêtre de x0 alors la propriété (ii) implique que les vecteurs de Ex sont constants sur le support des vecteurs de Ex0 . Enfin, la propriété (iii) de Ex0 implique l’orthogonalité aux vecteurs constants sur le support des vecteurs de Ex0 . Un calcul immédiat de dimension implique la première assertion du lemme. Rappelons que les entrées de la matrice Σ?k ne dépendent que de la distance entre les sommets (voir lemme 2.3). L’invariance est une conséquence de cette seule propriété de Σ?k . Tout d’abord, l’assertion Σ?k F = F est facile à vérifier : si deux sommets x, y sont à la même distance, disons i, de ∅ alors pour tout entier j ≥ i, x et y ont le même nombre de descendants à distance j de ∅. Nous pouvons aussi vérifier l’invariance de Ex . Tout d’abord (ii) est à nouveau vérifiée car les entrées de Σ?k ne dépendent que de la distance entre les sommets. Pour (iii), F étant invariant et Σ?k symétrique, F ⊥ est également invariant. Il reste à vérifier (i) : tout sommet qui n’est pas un descendant x est à distance égale de tous les descendants de x à une distance donnée de ∅. Ainsi, la propriété (iii) de Ex implique que les vecteurs dans Σ?k Ex vérifient (i). La diagonalisation de Σ?k est maintenant à notre portée. Expliquons par exemple commet calculer les valeurs propres de Σ?k restreinte à F . D’après le lemme 2.7, l’image de Σ?k est Wλ (Sk? ). En particulier, la dimension de F ∩ Wλ (Sk? ) étant 1, les valeurs

ASTÉRISQUE 422

(1153)

NORMALITÉ ASYMPTOTIQUE DES VECTEURS PROPRES...

139

propres de Σ?k restreinte à F sont égales à 0 avec multiplicité k et λF avec multiplicité 1 pour un certain λF ≥ 0. On en déduit que λF = tr((Σ?k )| ). F

Pour calculer cette trace, on choisit la base orthogonale naturelle de F , fi = (d(d − 1)i−1 )−1/2 1i où pour i ∈ {0, . . . , k}, 1i est le vecteur égal à 1 sur tous les sommets à distance i de ∅. En utilisant la notation du lemme 2.3, on obtient k k X k X X ∗ λF = hfi , Σk fi i = N (i, 2j)q2j (λ), i=0

i=0 j=0

où N (i, 2j) est le nombre de sommets à distance i de ∅ et à distance 2j d’un sommet fixé à distance i de ∅. Une fois ces calculs explicites sur les valeurs propres menés, pour terminer la preuve du théorème 5.1, il reste à utiliser les propriétés des polynômes de Tchebychev pour estimer l’asymptotique en j tendant vers l’infini de q2j (λ) avec λ ∈ σ(Td ) fixé. Voir [5, Section 9] pour l’argument complet. 5.2. Fin de la démonstration du théorème 3.3 Soit Y une onde invariante standard lisse. On pose pour tout S ⊂ Vd tel que ∅ ∈ S S et S = x∈int(S) B1 (x), e supp (YS ) = H(Y∅ , (Ax )x∈int(S) ), H où les variables aléatoires (Ax )x∈Vd sont définies par (8). On pose également ‹k (Y ) = H e supp (YS ? ) − (d/2)H e supp (Y − ). D S k k

‹k (Y ) sert à l’analyse de Dk (Y ). Rappelons en effet Comme sa notation l’indique D que si X est une variable dans Rn et si T une application linéaire inversible de Rn , on a (16)

H(T X) = H(X) + log | det(T )|.

Ainsi, si X, Y sont des ondes invariantes standard lisses, d’après le lemme 2.7, on trouve e supp (YS ) − H e supp (XS ) = Hsupp (YS ) − Hsupp (XS ). H En particulier, (17)

‹k (Y ) − D ‹k (X) = Dk (Y ) − Dk (X). D

Le lemme suivant repose sur des inégalités basiques en théorie de l’information.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

140

C. BORDENAVE

Lemme 5.3. — Soit Y une onde invariante standard lisse sur Td . Pour tout entier k ≥ 1, on a ‹k (Y ) ≤ D ‹k−1 (Y ). D ‹k (Y ) = D ‹k−1 (Y ) alors l’onde Y est 2-markovienne. En outre si pour tout k ≥ 1, D Enfin, l’onde gaussienne est 2-markovienne. Démonstration. — On pose Bx = Ax si x 6= ∅, B∅ = (Y∅ , A∅ ) et pour S ⊂ Vd , BS = e supp (YS ) = H(BS ) pour S ∈ {S ? , S − }. (Bx )x∈int(S) . De telle sorte que nous trouvons H k k Pour k ≥ 1 et i ∈ {1, . . . , d}, on considère l’ensemble Ski formé des éléments ? de Sk? \Sk−1 qui sont des descendants de i. En particulier, nous avons les unions ? ? disjointes suivantes : Sk− = Sk−1 ∪ Sk1 et Sk? = Sk−1 ∪ Sk1 ∪ · · · ∪ Skd . On rappelle que pour tout triplet de variables aléatoires (T, U, V ), on a H(T, U, V ) ≤ H(T, U ) + H(T, V ) − H(T ) (voir [15, Problem 2.29]). On obtient ? H(BSk? ) = H(BSk−1 , BSk1 , . . . , BSkd ) ? ? ? ≤ H(BSk−1 , BSk1 , . . . , BS d−1 ) + H(BSk−1 , BSkd ) − H(BSk−1 ) k

= H(B

? Sk−1

e supp (Y − ) − H e supp (YS ? ), , B , . . . , BS d−1 ) + H S k−1 Sk1

k

k

? où à la dernière ligne on a utilisé l’invariance de Y : H(BSk−1 , BSkd ) = H(BS − ). En k répétant cette inégalité (d − 1) fois, on arrive à l’inégalité

e supp (YS ? ) ≤ dH e supp (Y − ) − (d − 1)H e supp (YS ? ). H S k−1 k

(18)

k

De même, avec Tk =

− ? \Sk−1 , Sk−1

− on a l’union disjointe Sk− = Sk−1 ∪ Tk ∪ Sk1 et

e supp (Y − ) = H(B − , BT , BS 1 ) H k S S k k

k−1

≤ H(BS − , BTk−1 ) + H(BS − , BSk1 ) − H(BS − ) k−1

k−1

= 2Hsupp (X

? Sk−1

− Sk−1

k−1

e supp (Y − ), )−H S k−1

− ? où on a utilisé l’invariance de Y et = Bk (1) est isomorphe à Sk−1 = Sk−1 ∪ Tk . Ainsi, si on additionne (d/2) fois cette dernière inégalité à (18), on arrive précisément ‹k (Y ) ≤ D ‹k−1 (Y ) comme annoncé. àD Pour le cas d’égalité, on rappelle que si H(T, U, V ) = H(T, U ) + H(T, V ) − H(T ) alors U et V sont indépendants conditionnellement à T (c’est une conséquence de [15, théorème 2.6.5]). En utilisant l’invariance de Y , il n’est alors pas difficile de vérifier la propriété 2-markovienne à l’intérieur de Sk? par récurrence sur k ≥ 0. Enfin, il ‹k (Y ) = est immédiat de vérifier que pour l’onde gaussienne, nous avons l’égalité D ‹k−1 (Y ). En effet, d’après le lemme 2.6, les variables (Bx ) sont décorrélées et donc D indépendantes dans le cas gaussien.

∪ Sk1

On peut maintenant terminer la démonstration du théorème 3.3.

ASTÉRISQUE 422

(1153)

NORMALITÉ ASYMPTOTIQUE DES VECTEURS PROPRES...

141

Démonstration du théorème 3.3. — Soient X une onde invariante lisse standard et Y ‹k (Y ) = D ‹0 (Y ) pour tout l’onde gaussienne correspondante. D’après le lemme 5.3, D entier k ≥ 1. D’après (17) et le lemme 5.3 appliqué à X, on trouve ‹0 (X) − D ‹0 (Y ) ≥ D ‹1 (X) − D ‹1 (Y ) D(X) − D(Y ) = D ‹k (X) − D ‹k (Y ) = Dk (X) − Dk (Y ). ≥ ··· ≥ D Si X est typique, d’après le théorème 4.6, on en déduit que D(X) − D(Y ) ≥ −Dk (Y ). On fait tendre k vers l’infini. En conjonction avec le théorème 5.1, on obtient D(X) − D(Y ) ≥ 0. C’est la première assertion du théorème 3.3. En cas d’égalité alors toutes les inégalités ci-dessus sont des égalités. On en déduit d’après le lemme 5.3 que l’onde X est 2-markovienne.

6. MAXIMUM DE L’ENTROPIE INVARIANTE Dans cette section, nous présentons la démonstration du théorème 3.2. Nous avons le résultat suivant sur la croissance de l’entropie invariante le long de l’équation de la chaleur. Théorème 6.1. — Soient λ ∈ σ(Td ), X une onde invariante lisse de valeur propre λ et Y une onde gaussienne indépendante de même valeur propre λ. Pour tout t ≥ 0, √ on pose X(t) = X + 2tY et on considère la fonction t 7→ D(X(t)). Alors pour tout t ≥ 0, on a D(X(t))0 ≥ 0. En outre, si D(X(0))0 = 0 alors XS ? et YS ? ont même loi. Le théorème 3.2 est une conséquence facile du théorème 6.1. Démonstration du théorème 3.2. — On remarque que l’entropie invariante est invariante par changement d’échelle : pour tout s 6= 0 et tout processus X invariant non nul, D(sX) = D(X). En effet, pour tout S ⊂ Vd fini, d’après (16), on a Hsupp (sXS ) = Hsupp (XS ) + mS log s, où mS est la dimension de l’espace vectoriel engendré par le support de XS . On rappelle d’après le lemme 2.7 que mS ? = d et mS − = 2. On en déduit bien que D(sX) = D(X). Ainsi, avec les notations du théorème 6.1, si X est une onde invariante lisse √ ¯ standard, alors X(t) = X(t)/ 1 + 2t est une onde invariante standard lisse ¯ et D(X(t)) ≥ D(X). En faisant tendre t vers l’infini, on obtient bien D(Y ) ≥ D(X).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

142

C. BORDENAVE

C’est le premier énoncé du théorème 3.2. En cas d’égalité, d’après le théorème 6.1, nous en déduisons que XS ? et YS ? ont nécessairement la même loi. Décroissance de l’entropie invariante. — Pour démontrer le théorème 6.1, nous allons commencer par exprimer la densité de XS ? dans une base de Wλ (S ? ) qui exploite au mieux les symétries des variables. Soit Σ0 la matrice de covariance commune de (X∅ (t), X1 (t), . . . , Xd−1 (t)) pour tout t ≥ 0 donnée par le lemme 2.3. Cette matrice est inversible et on pose −1/2 Z(t) = Σ0 (X∅ (t), X1 (t), . . . , Xd−1 (t)). Par construction, EZi (t)Zj (t) = 1i=j pour 1/2 tous i, j ∈ {1, . . . , d}. On note (v∅ , v1 , . . . , vd−1 ) les vecteurs colonnes de Σ0 et on pose vd = λv∅ − v1 − · · · − vd−1 , de telle sorte que Xx (t) = hvx , Z(t)i et EXx (t)Xy (t) = hvx , vy i pour tous x, y ∈ S ? . D’après le lemme 2.3, pour tous i 6= j ∈ {1, . . . , d}, kv∅ k2 = kvi k2 = 1 ,

hvi , vj i =

λ2 − d d(d − 1)

et

hv∅ , vi i =

λ . d

Pour |λ| ≤ d, il existe (α, β) ∈ R2 tels que pour tout i ∈ {1, . . . , d}, ai = αv∅ + βvi et bi = βv∅ + αvi vérifient kai k2 = kbi k2 = 1 et hai , bi i = 0 (la paire (α, β) est unique à un signe près et (α, β) vérifie les égalités (α2 + β 2 )λ/d + 2αβ = 0 et α2 + β 2 + 2αβλ/d = 1). Pour λ ∈ σ(Td ) nous avons la propriété d’orthogonalité suivante. Lemme 6.2. — Soit λ ∈ σ(Td ). Il existe une paire (p, q) ∈ [0, 1]2 telle que p + q = 1 et pour tout f ∈ Rd , d X  kf k22 = phf, ai i2 + qhf, bi i2 . i=1

√ De plus, p et q sont strictement positifs si |λ| < 2 d − 1. Démonstration. — On pose c = α + λ/d. Nous avons |c| < 1 et, pour tout i, P hai , v∅ i = c, i ai = cdv∅ et, par symétrie, pour tous i 6= j, hai , aj i = (dc2 − 1)/(d − 1) = c0 . En particulier, il existe un réel γ tel que hai − γv∅ , aj − γv∅ i = 0 pour tous i 6= j : en effet, l’équation γ 2 − 2γc + c0 = 0 a deux solutions réelles. Ainsi, la famille de vecteurs ((ai − γv∅ )/kai − γv∅ k2 )i=1,...,d forme une base orthonormée de Rd . Aussi, la norme kai − γv∅ k2 ne dépend pas de i. En particulier, d’après le théorème de Pythagore, pour tous j ∈ {1, . . . , d} et f ∈ Rd , d d d d X X X X hf, ai i2 = hf, ai − γv∅ i2 + 2γhf, ai − γv∅ ihf, v∅ i + γ 2 hf, v∅ i2 i=1

i=1

= kaj −

ASTÉRISQUE 422

γv∅ k22 kf k22

i=1 0

i=1 2

+ dc hf, v∅ i ,

(1153)

NORMALITÉ ASYMPTOTIQUE DES VECTEURS PROPRES...

143

P où on a utilisé que i ai = cdv∅ et γ 2 − 2γc + c0 = 0. L’identité ci-dessus appliquée à f = v∅ implique que kaj − γv∅ k22 = d(1 − c2 )/(d − 1). En remplaçant c et c0 par leurs valeurs, on trouve que, pour tous j ∈ {1, . . . , d} et f ∈ Rd , d X hf, ai i2 = i=1

 d (1 − haj , v∅ i2 )kf k22 + (dhaj , v∅ i2 − 1)hf, v∅ i2 . d−1

Le même argument avec (b1 , . . . bd ) donne pour tous j ∈ {1, . . . , d} et f ∈ Rd , d X i=1

hf, bi i2 =

 d (1 − hbj , v∅ i2 )kf k22 + (dhbj , v∅ i2 − 1)hf, v∅ i2 . d−1

Ainsi si p + q = 1, pour tous j ∈ {1, . . . , d} et f ∈ Rd , d X

  (dhf, v∅ i2 − kf k22 ) phf, ai i2 + qhf, bi i2 = kf k22 + dphaj , v∅ i2 + dqhbj , v∅ i2 − 1 . d−1 i=1 √ Un calcul immédiat donne dhaj , v∅ i2 et dhbj , v∅ i2 égaux à (d± d2 − λ2 )/2. On en déduit que pour tout λ ∈ σ(Td ), il existe une paire (p, q) ∈ [0, 1]2 telle que p + q = 1 √ et dphaj , v∅ i2 + dqhbj , v∅ i2 = d/2 + (2p − 1)( d2 − λ2 )/2 = 1 (pour λ = 0, on √ a p = 1/d, pour |λ| = 2 d − 1, on a p = 0). Pour ce choix de (p, q) on obtient immédiatement l’énoncé du lemme. Démonstration du théorème 6.1. — Nous démontrons d’abord que D(X(t))0 ≥ 0 pour tout t ≥ 0. L’onde X(t) étant invariante pour tout t ≥ 0, il suffit de vérifier −1/2 que D(X(0))0 ≥ 0. On rappelle que Z(t) = Σ0 (X∅ (t), X1 (t), . . . , Xd−1 (t)) est un vecteur aléatoire de Rd centré et de matrice de covariance identité. D’après (16), pour tout t > 0, D(X(t)) = c + H(Z(t)) − (d/2)H(ha1 , Z(t)i, hb1 , Z(t)i), où c est une constante indépendante de t. On pose Z = Z(0). Par construction √ Z(t) = Z + 2tN avec N vecteur gaussien standard dans Rd . Ainsi, si f est la densité de Z et f1 la densité (ha1 , Zi, hb1 , Zi), la formule classique de Bruijn (voir [15, théorème 17.7.2]) affirme que Z Z D(X(0))0 = k∇f k22 /f − (d/2) k∇f1 k22 /f1 . Rd

R2

On a k∇f1 k22 = (∂a1 f1 )2 + (∂b1 f1 )2 , et d’après le lemme 6.2, k∇f k22 =

d X

p(∂ai f )2 + q(∂bi f )2 .

i=1

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

144

C. BORDENAVE

L’onde X étant invariante, les lois de (X∅ , Xi ) et donc de (hai , Zi, hbi , Zi) ne dépendent pas de i. On en déduit que Z Z (19) D(X(0))0 = d (p(∂a1 f )2 + q(∂b1 f )2 )/f − (d/2) ((∂a1 f1 )2 + (∂b1 f1 )2 )/f1 . Rd

R2

Soient g, h des fonctions dans L1 (Rn ). L’inégalité de Cauchy-Schwarz implique que si h est presque partout strictement positive sur le support de g, ÅZ ã2 ÅZ ãÅZ ã (20) g ≤ g 2 /h h . On fixe une base orthonormale de Rd de la forme (a1 , b1 , e3 , . . . , ed ). Avec un abus de notation, on écrit la fonction f dans cette base orthonormale. Pour tout y ∈ R2 , on applique l’inégalité (20) avec n = d − 2 et, pour z ∈ Rd−2 , h(z) = f (y, z), g(z) = ∂u f (y, z), u ∈ {a1 , b1 }. On trouve Z Z Z Z 2 2 2 (∂a1 f ) /f ≥ (∂a1 f1 ) /f1 et (∂b1 f ) /f ≥ (∂b1 f1 )2 /f1 . Rd

R2

Rd

R2

On déduit donc de (19) que Z

0

D(X(0)) ≥ (dp − d/2)

Z

2

(∂a1 f1 ) /f1 + (dq − d/2) R2

(∂b1 f1 )2 /f1 .

R2

Enfin l’onde X étant invariante, les lois de (X∅ , X1 ) et (X1 , X∅ ) sont égales. Ainsi, f1 (y1 , y2 ) = f1 (y2 , y1 ) et, en particulier, Z Z (∂a1 f1 )2 /f1 = (∂b1 f1 )2 /f1 . R2

R2

0

On obtient D(X(0)) ≥ 0. C’est le premier énoncé du théorème. Pour le second énoncé, il faut considérer le cas d’égalité dans l’inégalité de Cauchy-Schwarz (20) : nous avons égalité si et seulement si g/h est presque partout √ constant. On suppose sans perte de généralité que |λ| < 2 d − 1. Dans ce cas p, q sont strictement positifs. Soit g = − log f . En utilisant la continuité de f et de ses dérivées, on obtient D(X(0))0 = 0 si et seulement si pour tous y ∈ R2 et z ∈ Rd−2 , ∂a1 g(y, z) = ∂a1 g(y, 0) et ∂b1 g(y, z) = ∂b1 g(y, 0). On en déduit que g(y, z) = g(y, 0) + k(z) pour une certaine fonction k dans C ∞ (Rd−2 ). En d’autres termes, la variable (ha1 , Zi, hb1 , Zi) est indépendante de (he3 , Zi, . . . , hed , Zi). En utilisant les symétries de la densité f , on peut alors montrer que Z est nécessairement une loi gaussienne standard dans Rd . ⊥ En effet, soit ui la projection orthogonale de vi sur v∅ . On peut vérifier que pour tous i, j, hui , uj i est non nul. Par hypothèse, pour tout x ∈ Rd , ∂ui g(x) = h(hx, ui i, hx, v∅ i) pour une certaine fonction h dans C ∞ (R2 ). Donc ∂uj ∂ui g(x) = huj , ui i∂1 h(hx, ui i, hx, v∅ i) = ∂ui ∂uj g(x) = huj , ui i∂1 h(hx, uj i, hx, v∅ i).

ASTÉRISQUE 422

(1153)

NORMALITÉ ASYMPTOTIQUE DES VECTEURS PROPRES...

145

Pour i 6= j, l’espace vectoriel engendré par (ui , uj , v∅ ) est de dimension 3. On en déduit que ∂1 h est nul et donc pour certaines fonctions h0 , h1 dans C ∞ (R), ∂ui g(x) = hx, ui ih0 (hx, v∅ i) + h1 (hx, v∅ i). P P En outre, i vi = λv∅ . Donc i ui = 0 et i ∂ui g(x) = 0. Cela implique que h1 est ⊥ nulle. L’espace vectoriel engendré par (u1 , . . . , ud ) est v∅ . Il s’en suit que pour une ∞ certaine fonction h2 dans C (R), P

g(x) = kx − hx, v∅ iv∅ k22 h0 (hx, v∅ i)/2 + h2 (hx, v∅ i). On rappelle qu’en écrivant la fonction g dans la base (a1 , b1 , e3 , . . . , ed ), g(y, z) = g(y, 0) + k(z) pour tous y ∈ R2 et z ∈ Rd−2 . Le vecteur v∅ étant dans l’espace vectoriel engendré par (a1 , b1 ), on obtient que la fonction h0 est constante (car, avec x = (y, z), z 7→ kx − hx, v∅ iv∅ k22 n’est pas une fonction constante). Donc, g(x) = kx − hx, v∅ iv∅ k22 h0 (0)/2 + h2 (hx, v∅ i) = kxk22 h2 (0)/2 + h3 (hx, v∅ i). Il reste à se souvenir que hv∅ , Zi et hv1 , Zi ont même loi. Cela implique que la fonction h3 est constante. Enfin, les relations EZi Zj = 1i=j et E1 = 1 déterminent les valeurs de h2 (0) = 1 et h3 (0) = (n/2) log(2π). Remerciements. — Je remercie beaucoup Olivier Guichard et Emmanuel Kowalski pour leurs relectures attentives. Ce texte n’aurait pu aboutir sans la disponibilité et la patience d’Ágnes Backhausz et de Balász Szegedy pour m’expliquer certains points de leur travail remarquable. Je les en remercie très chaleureusement, nagyon köszönöm !

RÉFÉRENCES [1] N. Alon, I. Benjamini, E. Lubetzky & S. Sodin – Non-backtracking random walks mix faster, Commun. Contemp. Math. 9 (2007), no 4, p. 585–603. [2] N. Anantharaman – Quantum ergodicity on regular graphs, Comm. Math. Phys. 353 (2017), no 2, p. 633–690. [3] N. Anantharaman & E. Le Masson – Quantum ergodicity on large regular graphs, Duke Math. J. 164 (2015), no 4, p. 723–765. [4] A. Backhausz & B. Szegedy – On large girth regular graphs and random processes on trees, Random Structures Algorithms (2018), à paraître. [5]

, On the almost eigenvectors of random regular graphs, prépublication arXiv:1607.04785.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

146

C. BORDENAVE

[6] R. Bauerschmidt, J. Huang, A. Knowles & H.-T. Yau – Bulk eigenvalue statistics for random regular graphs, Ann. Probab. 45 (2017), no 6A, p. 3626–3663. [7] R. Bauerschmidt, A. Knowles & H.-T. Yau – Local semicircle law for random regular graphs, Comm. Pure Appl. Math. 70 (2017), no 10, p. 1898–1960. [8] E. A. Bender & E. Canfield – The asymptotic number of labeled graphs with given degree sequences, Journal of Combinatorial Theory, Series A 24 (1978), no 3, p. 296–307. [9] I. Benjamini & O. Schramm – Recurrence of distributional limits of finite planar graphs, Electron. J. Probab. 6 (2001), no. 23, 13. [10] B. Bollobás – A probabilistic proof of an asymptotic formula for the number of labelled regular graphs, European J. Combin. 1 (1980), no 4, p. 311–316. [11] C. Bordenave – Spectrum of random graphs, in Advanced topics in random matrices, Panor. Synthèses, vol. 53, Soc. Math. France, 2017, p. 91–150. [12]

, A new proof of Friedman’s second eigenvalue theorem and its extension to random lifts, prépublication arXiv:1502.04482.

[13] L. Bowen – The ergodic theory of free group actions : entropy and the f -invariant, Groups Geom. Dyn. 4 (2010), no 3, p. 419–432. [14] S. Brooks & E. Lindenstrauss – Non-localization of eigenfunctions on large regular graphs, Israel J. Math. 193 (2013), no 1, p. 1–14. [15] T. M. Cover & J. A. Thomas – Elements of information theory, second éd., Wiley-Interscience, Hoboken, NJ, 2006. [16] I. Dumitriu, T. Johnson, S. Pal & E. Paquette – Functional limit theorems for random regular graphs, Probab. Theory Related Fields 156 (2013), nos 3-4, p. 921–975. [17] I. Dumitriu & S. Pal – Sparse regular random graphs : spectral density and eigenvectors, Ann. Probab. 40 (2012), no 5, p. 2197–2235. [18] Y. Elon – Gaussian waves on the regular tree, prépublication arXiv:0907.5065. [19] J. Friedman – A proof of Alon’s second eigenvalue conjecture and related problems, Mem. Amer. Math. Soc. 195 (2008), no 910, p. 100. [20] V. Harangi & B. Virág – Independence ratio and random eigenvectors in transitive graphs, Ann. Probab. 43 (2015), no 5, p. 2810–2840. [21] W.-C. W. Li & P. Solé – Spectra of regular graphs and hypergraphs and orthogonal polynomials, European J. Combin. 17 (1996), no 5, p. 461–477. [22] R. Roland Bauerschmidt, J. Huang & H.-T. Yau – Local Kesten-McKay law for random regular graphs, prépublication arXiv:1609.09052. [23] S. Sodin – Random matrices, nonbacktracking walks, and orthogonal polynomials, J. Math. Phys. 48 (2007), no 12, 123503, 21.

ASTÉRISQUE 422

(1153)

NORMALITÉ ASYMPTOTIQUE DES VECTEURS PROPRES...

147

[24] N. C. Wormald – Models of random regular graphs, in Surveys in combinatorics, 1999 (Canterbury), London Math. Soc. Lecture Note Ser., vol. 267, Cambridge Univ. Press, 1999, p. 239–298.

Charles BORDENAVE Institut de Mathématiques de Marseille 163 avenue de Luminy – Case 907 13288 Marseille Cedex 9 - France E-mail : [email protected]

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

Séminaire BOURBAKI 71e année, 2018–2019, no 1154, p. 149 à 172 doi:10.24033/ast.1133

Octobre 2018

ESPACES ET GROUPES NON EXACTS ADMETTANT UN PLONGEMENT GROSSIER DANS UN ESPACE DE HILBERT [d’après Arzhantseva, Guentner, Osajda, Špakula] by Ana KHUKHRO

1. INTRODUCTION The landscape of modern group theory has been shaped by the use of geometry as a tool for studying groups in various ways. The concept of group actions has always been at the heart of the theory, and the idea that one can link the geometry of the space on which the group acts to properties of the group, or that one can view groups as geometric objects themselves, has opened up many possibilities of interaction between algebra and geometry. Given a finitely generated discrete group and a finite generating set of this group, one can construct an associated graph called a Cayley graph. This graph has the set of elements of the group as its vertex set, and two vertices are connected by an edge if one can obtain one from the other by multiplying on the right by an element of the generating set. This gives us a graph on which the group acts by isometries, viewing the graph as a metric space with the shortest path metric. While a different choice of generating set will result in a non-isomorphic graph, the two Cayley graphs will be the same up to quasi-isometry, a coarse notion of equivalence for metric spaces. The study of groups from a geometric viewpoint, geometric group theory, often makes use of large-scale geometric information. This means that the properties of interest in this theory are often stable under small perturbations of the metric space, and it is these coarse properties that have important implications for various deep conjectures in topology and analysis. An example of this phenomenon is the celebrated work of Yu [34] showing that the existence of a coarse embedding (a notion of inclusion that preserves only the large-scale structure) of the Cayley graph of a finitely generated group into a Hilbert space has consequences for the coarse Baum-Connes

© Astérisque 422, SMF 2020

150

A. KHUKHRO

conjecture and the strong Novikov conjecture. One way to create groups with interesting coarse geometric properties is to ensure that certain subgraphs can be found in their Cayley graphs. This can be achieved using small cancellation theory. Small cancellation theory has its origins in the early twentieth century, when Dehn’s work on the word problem for surface groups made small cancellation methods an important tool in algorithmic group theory. Since, small cancellation has led to the discovery of many “monster” groups, i.e., groups with pathological properties, such as the Tarski monsters of Ol’shanskii, [23]. Tarski monsters are infinite groups with every proper subgroup cyclic of order p for a fixed prime p. They have served as counterexamples to both the Burnside and the von Neumann-Day problems. More recently, Gromov in [13] (see also [3]) made use of graphical small cancellation methods to show that there exist groups, now known as Gromov monsters, that are counterexamples to the Baum-Connes conjecture with coefficients [14]. These groups are built by encoding a sequence of finite graphs with special connectivity properties into the relations between generating elements in the group via graphical presentations—group presentations where the relators are the words that can be read along cycles in given labeled graphs. Small cancellation conditions on the labeling then ensure that the graphs are embedded in the Cayley graph of the group. Such an increasing sequence of highly-connected graphs, called an expander, used in Gromov’s construction satisfies the somewhat contradictory properties of consisting of graphs of uniformly bounded degree and Cheeger constant bounded uniformly from below. These properties make expanders sought-after objects for applications such as cryptography or network design. Due to the presence of a weakly embedded expander in Gromov’s monsters, they do not admit coarse embeddings into Hilbert spaces. Indeed, these groups were the first examples of finitely generated groups with this property. Gromov’s construction is an important example of the utility of sequences of finite graphs with exotic properties that can be used in conjunction with small cancellation machinery. The main source of such examples lies again in group theory, thanks to a way of producing graphs with desired properties as Cayley graphs of quotients of a given group. Given a residually finite group G with a fixed generating set S, we can consider a sequence of normal subgroups (Ni ) of finite index with trivial intersection and study the Cayley graphs of the quotients G/Ni with respect to the generating sets induced by the images of S under the quotient maps. These graphs approximate the Cayley graph of G in a certain sense, and their coarse geometric properties can be linked to algebraic or analytic properties of the group. This allows us to use grouptheoretic information to control the geometry of the resulting sequence of graphs. An example of this is the first explicit construction of expander graphs by Margulis [19] using Kazhdan’s property (T). Property (T) is a rigidity property of actions on Hilbert spaces—a countable group has property (T) if any affine isometric action on

ASTÉRISQUE 422

(1154)

ESPACES ET GROUPES NON EXACTS...

151

a Hilbert space has a fixed point. Margulis proved that a sequence of finite quotients of a group with property (T) forms an expander. Since, many such connections have been explored: G is amenable

⇐⇒

(G/Ni )i have property A [25];

G is a-(T)-menable

⇐=

(G/Ni )i coarsely embed into a Hilbert space [25];

G has property (T)

=⇒

(G/Ni )i form an expander [19];

G has property (T) ⇐⇒ G has (τ ) w.r.t. {Ni }

⇐⇒

(G/Ni )i have geometric property (T) [31]; (G/Ni )i form an expander [17].

Here, when we speak of a sequence (G/Ni )i having a certain property, we mean that the Cayley graphs of the G/Ni with respect to the images of some fixed generating set of G have this property uniformly. Thus, sequences of finite quotients are a rich source of examples of graphs with a variety of coarse geometric properties. Property A, which appears above, is a non-equivariant version of amenability. For countable discrete groups, it is equivalent to exactness of the reduced C*-algebra. Such groups are referred to as exact. Large classes of groups, such as hyperbolic and amenable groups, have Cayley graphs that enjoy this property. Property A was first introduced by Yu in [34] as a way to prove coarse embeddability into a Hilbert space, in view of his above-mentioned result on the coarse Baum-Connes conjecture. Initially, it was not known whether the two properties were actually equivalent. This was first answered in the negative by Nowak [22], via an example that does not have bounded geometry (a metric space is said to have bounded geometry if for any radius, there is a uniform bound on cardinalities of balls of that radius). Nowak’s example takes the form of a sequence of Cayley graphs of increasing sums of Z2 , giving a sequence of hypercubes of increasing dimension considered with the Hamming metric. After remaining open for some time, the question of whether there exists a bounded geometry metric space without property A that is coarsely embeddable into a Hilbert space was solved by Arzhantseva, Guentner and Špakula in [4], via an example of a space that distinguishes the two properties. Their construction uses finite quotients of non-amenable groups as a source of examples of spaces without property A, as described above. Arzhantseva, Guentner and Špakula’s example is a carefully-chosen sequence of Cayley graphs of finite quotients of the free group on two generators F2 . The key idea in [4] is to use a particular sequence of nested normal subgroups which produces quotients which can be viewed as successive covering spaces with specially chosen covering groups. The covering space structure then allows them to induce walls on each of the quotients. The wall space structure gives rise to a metric which is coarsely equivalent to the Cayley graph metric on the quotients, and which provides a natural way to coarsely embed the graphs into a Hilbert space.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

152

A. KHUKHRO

Just as amenability is an equivariant version of property A, the Haagerup property is the group-theoretic counterpart to coarse embeddability into a Hilbert space. A countable group is said to have the Haagerup property if it admits an affine isometric action on a Hilbert space that is metrically proper. This property is clearly incompatible with the aforementioned property (T) and is implied by amenability, and for this reason is also referred to as a-(T)-menability, a pun coined by Gromov. We have the following diagram of implications between these properties, for groups. amenability ⇓ Haagerup property

=⇒

property A ⇓

=⇒ coarse embeddability into a Hilbert space

There exist examples showing that the horizontal implications are not reversible: the group Z2 o SL2 (Z) is non-amenable, and even has relative property (T) with respect to the subgroup Z2 , but also has property A. A group G has relative property (T) with respect to a subgroup H if every affine isometric action of G on a Hilbert space has an H-fixed point. This property therefore precludes the Haagerup property if H is infinite. The implication “amenability ⇒ Haagerup” is not reversible, since the free group Fn for n ≥ 2 is not amenable but does admit an affine isometric action on `2 . Thus, the following questions about the only remaining implications are natural: does the Haagerup property or coarse embeddability into a Hilbert space imply property A for groups? Note that the irreversibility of “property A ⇒ coarse embeddability into a Hilbert space” for metric spaces is the main result of [4]. As we mentioned, many classes of groups are known to have property A, and so searching for a negative answer to the above question means the rather difficult task of constructing groups without property A. For some time, the only known example had been Gromov’s monster, which does not have the Haagerup property. An important step towards answering this question was taken in [6] by Arzhantseva and Osajda, who showed that graphical small cancellation groups on graphs with a certain walling condition have the Haagerup property. The Haagerup property had been shown for classical small cancellation groups by Wise [32] in the finitely presented case and by Arzhantseva and Osajda [5] in the infinitely presented case. Such a general result is of course not possible for graphical small cancellation groups, given that Gromov’s group is in this class. The difficulty was then to find a sequence of graphs without property A, but with an appropriate walling condition to use in the graphical presentation, while at the same time also establishing machinery that allows one to show that a small cancellation labeling exists on these graphs, in order for them to appear in the Cayley graph of the group. This was achieved in [24] by Osajda, using covering space methods of

ASTÉRISQUE 422

(1154)

ESPACES ET GROUPES NON EXACTS...

153

[33] and [4] to give the required walling condition, a result of Willett [30] on graphs of girth (i.e., the length of the shortest cycle) tending to infinity to show that the sequence does not have property A, and the Lovász Local Lemma to prove that a small cancellation labeling exists. Overview In this paper, we focus on the following two results: — There exists a bounded geometry metric space that does not have property A, but admits a coarse embedding into a Hilbert space [4]. — There exists a finitely generated group that does not have property A, but admits a proper action on a CAT(0) cube complex (and has the Haagerup property) [24]. In Section 2, we introduce the necessary background, including the basic ideas of geometric group theory, coarse geometry, and small cancellation theory, the relevant coarse and analytic properties, and connections of interest between group theory and geometry. In Section 3, we give a summary of relevant results about wall spaces, embeddings, and coverings, and give a brief outline of the main result of [4]. In Section 4, we summarize the construction of Osajda in [24], which relies in part on previous results of Arzhantseva and Osajda [6]. We particularly focus on the application of the Lovász Local Lemma to create a suitable small cancellation labeling on a sequence of graphs, and methods reminiscent of those in [4] to induce a proper action on a CAT(0) cube complex.

2. BASIC NOTIONS Here, we recall some basic definitions and theory necessary for the exposition of the main results. Metric spaces from groups The main objects of study will be finitely generated groups and their Cayley graphs. Recall that given such a group G with generating set S, the vertex set of the Cayley graph Cay(G, S) is the set G and the edge set is given by the pairs {(g, gs) : g ∈ G, s ∈ S}. We will refer to this Cayley graph simply as G where this does not cause confusion. The Cayley graph is a metric space with the shortest path metric, and G acts on its Cayley graph by isometries via left-multiplication.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

154

A. KHUKHRO

Recall that two metric spaces (X, dX ) and (Y, dY ) are quasi-isometric if there exists a map f : X → Y and a constant C > 0 such that 1 dX (x, x0 ) − C ≤ dY (f (x), f (x0 )) ≤ CdX (x, x0 ) + C C for all x, x0 ∈ X and such that for all y ∈ Y , there exists x ∈ X with dY (y, f (x)) ≤ C. Given a finitely generated group G and two different choices of finite generating set, S and S 0 , the Cayley graphs Cay(G, S) and Cay(G, S 0 ) are quasi-isometric. We will mainly be interested in properties of groups that are invariant under quasi-isometries, and so we can forget the choice of generating set and simply study the quasi-isometry class of the Cayley graph. We will also often make use of Cayley graphs of quotients of a given group, as follows. Given a residually finite group (i.e., one in which the intersection of all finite index subgroups is trivial), we will call a nested sequence (Ni ) of finite inT dex normal subgroups of G with trivial intersection i Ni = {e} a filtration of G. Given a fixed generating set S of G, we can consider the sequence of Cayley graphs (Cay(G/Ni , πi (S))), where πi is the surjection πi : G → G/Ni . We are often interested in the properties that these graphs have uniformly, and this is sometimes formalized using the notion of a box space. The box space (Ni ) G of G with respect to the filtraF tion (Ni ) and a fixed generating set S of G is the metrized disjoint union i G/Ni , where each quotient G/Ni is endowed with the induced Cayley graph metric, and the distance between distinct quotients is chosen to be greater than the maximum of their diameters. This metric space thus encodes the geometry of the finite quotients G/Ni . Sometimes it will be convenient to metrize disjoint unions of other families of finite F graphs i Θi in a similar way, i.e., by considering the graph metrics on each of the Θi and by setting the distance between distinct graphs to be greater than the maximum of their diameters. We call this metrized disjoint union a coarse disjoint union of the Θi . Box spaces approximate Cayley graphs in the following way: for any given radius r, one can find an index j such that for all i ≥ j, the balls of radius r in G/Nj are isometric to balls of radius r in G. This is because these are quotients with respect to a sequence of subgroups with trivial intersection. In this way, the quotients can be thought of as tending towards the Cayley graph of G. Box spaces thus have the potential to capture more than the geometric information of Cayley graphs. For box spaces, a weaker equivalence than quasi-isometry is more appropriate. A map f : X → Y is a coarse embedding if there exist non-decreasing functions ρ± : [0, ∞) → [0, ∞) such that limt→∞ ρ± (t) = ∞ and ρ− (dX (x, x0 )) ≤ dY (f (x), f (x0 )) ≤ ρ+ (dX (x, x0 ))

ASTÉRISQUE 422

(1154)

ESPACES ET GROUPES NON EXACTS...

155

for all x, x0 ∈ X. If, in addition, there exists a constant C > 0 such that for all y ∈ Y , there exists x ∈ X with dY (y, f (x)) ≤ C, then the map f is said to be a coarse equivalence. The coarse equivalence class of a box space is stable under change of generating set for the parent group, as well as the choice of distances between different quotients, as long as the condition that the distance between two quotients greater than the maximum of their diameters is satisfied. The choice of filtration, however, can lead to box spaces with wildly different coarse geometric properties, as we shall see. The Haagerup property, and related analytic properties of groups Recall that a group is amenable if it admits an invariant mean, that is, a positive, linear functional ϕ : `∞ (G) → R of norm 1 such that ϕ(g · f ) = ϕ(f ) for all g ∈ G, f ∈ `∞ , where g · f (h) = f (g −1 h). For finitely generated groups, this property can also be phrased in the language of Cayley graphs. Given a graph Θ, the Cheeger constant h(Θ) is defined by |∂A| , A⊂Θ min{|A|, |Θ\A|}

h(Θ) := inf

where the infimum is taken over proper, finite, non-empty vertex subsets A of Θ, and ∂A denotes the boundary of A (i.e., the edges with exactly one end-vertex in A). A finitely generated group is amenable if and only if h(G) = 0. A sequence of subsets of G which realizes the infimum in the definition of the Cheeger constant is known as a Følner sequence. Examples of amenable groups include finite and abelian groups, and more generally, all groups of subexponential growth, where growth refers to the dependence of the number of elements in balls in the Cayley graph on the radius. Note that this number does not depend on the chosen center of the ball, as translations by group elements are isometries of the Cayley graph. If the cardinalities of balls are bounded above by a (uniform) polynomial function of the radius, then the group is said to have polynomial growth, and if they can be bounded below by an exponential function of the radius, then the group is said to have exponential growth. Growth is an important invariant when considering groups geometrically, and it was this invariant that led to one of the most celebrated results in geometric group theory, namely, Gromov’s polynomial growth theorem [12]. Gromov proved that the purely geometric property of having polynomial growth was actually equivalent to being virtually nilpotent (recall that a group virtually has a property if there is some finite index subgroup with this property). This result showed the power of the geometric approach to groups and opened the door to many more such connections being discovered. We will explore some links between group-theoretic and coarse properties in the following subsections.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

156

A. KHUKHRO

Non-amenable groups include free groups on two or more generators. Indeed, the subject of the von Neumann conjecture was whether the presence of a free subgroup was the only obstruction to amenability. It was disproved by Ol’shanskii [23] using small cancellation theory to construct counterexamples known as Tarski monsters. We will see later how small cancellation methods can also be used to construct groups with surprising coarse properties. A class of groups that contains the class of amenable groups is that of groups with the Haagerup property (also known as a-(T)-menability). A finitely generated group G is said to have the Haagerup property if it admits an affine isometric action on a Hilbert space that is metrically proper, i.e., for any bounded subset B of the Hilbert space, the set {g ∈ G : g(B) ∩ B 6= ∅} is finite. Free groups do enjoy this property. The alternative name, a-(T)-menability, recalls that this property is incompatible with Kazhdan’s property (T)—a finitely generated group has property (T) if every affine isometric action on a Hilbert space has a fixed point. Thus, only finite groups can have both property (T) and the Haagerup property. Property A and related coarse geometric properties We will be interested in geometric properties that are preserved by coarse equivalence. Among these is property A, first defined by Yu in [34]. Definition. — A discrete metric space (X, d) is said to have property A if for all R, ε > 0 there exists a family of non-empty subsets {Ax }x∈X of X × N such that — for all x, y in X with d(x, y) < R we have

|Ax ∆Ay | |Ax ∩Ay |

< ε,

— there exists S such that for all x in X and (y, n) in Ax we have d(x, y) ≤ S. The above definition is recognizable as an asymptotic version of the Følner set characterization of amenability. Indeed, all amenable groups have property A. However, the class of groups with property A is much larger, containing in particular all hyperbolic groups. In fact, it is particularly difficult to find examples of groups without property A. For metric spaces without property A, one can exploit the group-theoretic constructions of metric spaces mentioned above, as we will see in the next subsection. For countable discrete groups, property A is equivalent to exactness of the reduced C∗ -algebra of the group, and for this reason, groups with property A are also referred to as exact. This equivalence is a combination of results of Guentner and Kaminker, and Ozawa, see [29] for a proof of this fact, as well as a survey of many applications and equivalent definitions of property A. While the above was Yu’s original definition, the following equivalent characterization by Tu [28] makes explicit the connection with coarse embeddings into Hilbert spaces.

ASTÉRISQUE 422

(1154)

157

ESPACES ET GROUPES NON EXACTS...

Theorem ([28]). — A discrete metric space (X, d) with bounded geometry has property A if and only if for every R, ε > 0, there exists S > 0 and a function f : X → `2 (X) such that kf (x)k2 = 1 for all x ∈ X, and — kf (x) − f (x0 )k2 ≤ ε whenever d(x, x0 ) ≤ R, — the support of f (x) lies in the ball of radius S around x in X. Theorem ([34]). — A discrete metric space with property A admits a coarse embedding into a Hilbert space. Theorem ([34]). — A discrete metric space admitting a coarse embedding into a Hilbert space satisfies the coarse Baum-Connes conjecture. This is of particular interest when the metric space in question is the Cayley graph of a group, as under the additional assumption of having a finite CW-complex as its classifying space, the group will satisfy the Novikov conjecture. Until recently, the only known metric spaces with bounded geometry not admitting a coarse embedding into a Hilbert space were metric spaces containing expanders. Recall that a sequence of finite graphs (Θi ) is an expander if the following three conditions are satisfied: — limi→∞ |Θi | = ∞; — there exists a uniform upper bound on the degree of all vertices in

F

i

Θi ;

— there exists ε > 0 such that h(Θi ) ≥ ε for all i. Indeed, a very weak notion of containment of expanders is sufficient to prevent a coarse embedding into a Hilbert space. An expander (Θi ) is said to weakly embed in a bounded geometry metric space Y if there exists a sequence of maps fi : Θi → Y such that the condition |f −1 (fi (x))| lim sup i =0 i→∞ x∈Θi |Θi | is satisfied. A space containing a weakly embedded expander cannot coarsely embed into a Hilbert space, and this was conjectured to be the only possible obstruction. This was disproved by Arzhantseva and Tessera in [7], via examples that use relative expansion, a particular instance of generalized expansion, which was introduced by Tessera in [27] as a characterization of not admitting a coarse embedding into a Hilbert space. The constructions in [7] were the first explicit examples of spaces that do not weakly contain expanders, but are generalized expanders. Arzhantseva and Tessera have since constructed examples of groups that do not coarsely embed into Hilbert spaces but do not weakly contain expanders [8].

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

158

A. KHUKHRO

Box spaces as exotic examples Given a finitely generated, residually finite group G and a filtration (Ni ), we know that we can see (an isometric copy of) any finite piece of the Cayley graph of G in a big enough quotient G/Ni in the box space. It is therefore unsurprising that as well as the many connections between geometric properties of the Cayley graph and the algebraic properties of the group (such as Gromov’s polynomial growth theorem, mentioned above), there is also a plethora of such connections for box spaces. Of the summary given in the introduction, it is the following implications that will be of interest to us here. G is amenable

⇐⇒

⇓ G has Haagerup property

(Ni ) G has property A ⇓

⇐=

(Ni ) G coarsely embeds into a Hilbert space

Thus, box spaces of non-amenable groups are a rich source of metric spaces without property A. A generalization of the fact that box spaces of the free group do not have property A is the result of Willett [30], showing that sequences of graphs with girth tending to infinity do not have property A. For groups, however, one must work much harder to create non-exact examples, the only known method being to encode known examples of metric spaces without property A in the group structure, as we shall see. The above diagram of implications is complete, in that no more of the implications are reversible: the free group has the Haagerup property but is not amenable; we will examine in detail an example of a box space of the free group constructed in [4] with the property that it coarsely embeds into a Hilbert space, but does not have property A; there exist box spaces of the free group that do not coarsely embed into a Hilbert space. Indeed, we now know that box spaces of the free group can exhibit very different coarse-geometric behavior, depending on which filtration is chosen: there exist box spaces of the free group that are expanders, box spaces that do not weakly contain expanders but do not coarsely embed into a Hilbert space [11], and box spaces that coarsely embed into a Hilbert space [4], [15]. Small cancellation Given a presentation of a group, does there exist an algorithm that upon input of a word in the generators of the group will tell us whether the word is trivial? This question, known as the word problem, was posed by Dehn in the early twentieth century. Dehn solved this problem for fundamental groups of closed orientable twodimensional manifolds, which admit presentations with just one relator. An important idea in Dehn’s argument was that when one considers a product of the relator and one of its conjugates, there is very little cancellation.

ASTÉRISQUE 422

(1154)

ESPACES ET GROUPES NON EXACTS...

159

It was Tartakovskii in [26] who formulated a more general small cancellation condition that was necessary to generalize Dehn’s arguments in the context of algorithmic group theory. Generally speaking, small cancellation theory allows us to better understand properties of a group from its presentation, given that relators satisfy a small cancellation condition (for example, that the length of a common subword between any two relators must be relatively small). This is useful when trying to construct groups with certain exotic properties via a suitable presentation—variants of small cancellation theory have led to many first examples and counterexamples in group theory. Infinite Burnside groups [21], Tarski monsters [23], and Gromov monsters [13] (see also [3]) can be produced as limits of infinite chains of small cancellation quotients. The small cancellation ideas that we will deal with here are graphical. In what follows, we will write (Θ, l) for a graph Θ together with a labeling l, where we shall think of the labeling as a map l : Θ → W , with W being a bouquet of finitely many loops in correspondence with a set of labels S (where the loops are considered with an orientation, and the formal inverse of a label in S is assigned to a loop traversed in the opposite sense). We will consider sequences of finite graphs (Θn , ln ) labeled in a certain way by generators S = {a1 , a2 , . . . , ak } of a free group Fk and will look at graphical presentations of the form ha1 , a2 , . . . , ak | words read along cycles in the graphs (Θn )i . We will write ha1 , a2 , . . . , ak | (Θn , ln )i to denote such a presentation. Under certain conditions on the labeling, it is possible to produce in this way a group with the graphs (Θn ) embedded in its Cayley graph. We will explore this source of groups with interesting coarse properties in the last section.

3. COVERS AND WALLS In this section, we discuss the construction by Arzhantseva, Guentner and Špakula [4] of a metric space which does not have property A but admits a coarse embedding into a Hilbert space. Walls and embeddings We begin by noting that the existence of a coarse embedding into `1 is equivalent to the existence of a coarse embedding into `2 . It will sometimes be more natural or convenient to embed into `1 .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

160

A. KHUKHRO

When property A was first defined in [34], it was unclear to what extent it captured the notion of being coarsely embeddable into a Hilbert space. The first example that showed that property A is in fact a stronger property was given by Nowak in [22]. Given a finite group F with a fixed generating set S, consider the coarse disjoint F Ln Ln union n∈N F , where F is the direct sum of n copies of F , and the metric on Ln each F is taken to be the standard direct sum metric induced by S, namely the metric with respect to the generating set S × {1} × · · · × {1} ∪ {1} × S × · · · × {1} ∪ · · · ∪ {1} × · · · × S. Theorem ([22]). — Given any finite group F , the (locally finite) metric space F Ln F , which admits a bi-Lipschitz embedding into `1 , does not have propn∈N erty A. We refer the reader to [22] for the proof. We give the details of the existence of the bi-Lipschitz embedding, as this observation will be useful for our purposes. We need only show that each of the spaces in the coarse disjoint union can be bi-Lipschitzly embedded into `1 with uniform bi-Lipschitz constants. Since F is finite, there is a bilipschitz map φ : F → `1 (N) such that forall g, h ∈ F 1 dF (g, h) ≤ kφ(g) − φ(h)k1 ≤ CdF (g, h), C for some C > 0, where dF denotes the Cayley graph metric on F with respect to the Ln Ln generating set S. Now for any n, taking the map φn = φ×· · ·×φ : F → ( i=1 `1 ), Ln where ( i=1 `1 ) is the `1 -sum, we still have 1 L d n F (g, h) ≤ kφ(g) − φ(h)k1 ≤ CdLn F (g, h) C Ln Ln for every g, h ∈ F . Since ( i=1 `1 ) is isometrically isomorphic to `1 (N), we are done. When the finite group F is taken to be Z2 , there is another way to construct an F Ln embedding into `1 . The space n∈N Z2 is now a coarse disjoint union of n-dimensional cubes, whose special structure allows us to easily construct an embedding. First, we need some definitions. Definition. — Given a connected graph Θ, a wall (sometimes also called a cut) in Θ is a subset of the edges of Θ whose removal yields exactly two remaining connected components. A wall structure W on Θ is a set of walls in Θ such that each edge in Θ is contained in exactly one wall in W . We call the pair (Θ, W ) a space with walls. We will write W (x|y) for the set of walls in W that, when removed, separate x and y, i.e., x and y end up in different connected components. If W (x|y) is always a

ASTÉRISQUE 422

(1154)

ESPACES ET GROUPES NON EXACTS...

161

finite set, the wall structure gives rise to a wall pseudometric dW on the graph, defined by dW (x, y) := |W (x|y)|. Given a graph Θ equipped with a wall structure W , let us suppose that the wall pseudometric is really a metric. One can easily embed the metric space (Θ, dW ) into `1 (W ), via φ : (Θ, dW ) → `1 (W ), φ(x) = 1W(x|x0 ) , for some fixed basepoint x0 . Moreover, this embedding is easily seen to be isometric. If the wall metric can be compared to the original graph metric via a coarse equivalence, this gives a method for coarsely embedding the graph into `1 . For example, given a tree, the wall structure that has a wall for each edge of the tree gives rise to the same metric as the original graph metric. Ln In the case of Z , consider the wall structure W with a wall for each of the Ln 2 n generators of Z2 consisting of the edges labeled by that generator (i.e., the “parallel” edges in a hypercube). This is clearly a wall structure and, in addition, the Ln associated wall metric is precisely the Cayley graph metric on Z2 with respect to the given generating set. Thus, taking the isometric embedding into `1 induced by F Ln the wall structure on each component of n∈N Z2 , we get the desired embedding of the whole space. While the above examples of spaces which are coarsely embeddable into a Hilbert space but do not have property A are uniformly discrete and locally finite, they do not have bounded geometry—recall that a metric space has bounded geometry if for each R > 0 there is an M such that the cardinality of each ball of radius R is bounded above by M . Finitely generated groups and their box spaces are archetypal spaces of bounded geometry. The question of whether property A and coarse embeddability into a Hilbert space are equivalent for bounded geometry metric spaces was answered in [4], where the above example of a space without bounded geometry was encoded in the structure of a box space of the free group Fn (n ≥ 2). This space automatically doesn’t have property A, since Fn is non-amenable. We will now look at the main ideas of this construction. Covers Let us first describe the general construction of the cover “ Θ of a finite graph Θ corresponding to a finite quotient K of π1 (Θ). Throughout, we will assume that Θ is 2-connected, i.e., removing any edge leaves Θ connected. Let ρ be the surjective homomorphism ρ : π1 (Θ)  K. Denote the vertex set of Θ by V (Θ) and the edge set by E(Θ). Choose a maximal tree T ⊂ Θ. The set of edges {e1 , e2 , . . . , er } which are not in the maximal tree T correspond to free generators of π1 (Θ), and so we can consider their image under the

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

162

A. KHUKHRO

quotient map ρ. The cover of Θ corresponding to ρ is the finite graph “ Θ with vertex set given by V (“ Θ) = V (Θ) × K and edge set given by E(“ Θ) = E(Θ) × K. “ We now just need to specify the vertices which are connected by each edge in E(Θ). “ Given an edge (e, k) ∈ E(Θ) (where e ∈ E(Θ) and k ∈ K), let v and w be the vertices of Θ connected by e. There are two cases: e ∈ T and e ∈ / T . If e ∈ T , let (e, k) connect the vertices (v, k) and (w, k). If e ∈ / T , let (e, k) connect (v, k) and (w, ρ(e)k). The graph “ Θ defined in this way is the cover of Θ corresponding to ρ : π1 (Θ)  K. Note that the cover we obtain does not depend on the choice of spanning tree or on the chosen orientation of edges, i.e., it is unique up to graph isomorphism commuting with the covering projections. The covering map π : “ Θ → Θ is given by (e, k) 7→ e and (v, k) 7→ v. We can consider the subgraphs V (Θ) × k as k ranges over the elements of K. Following [4], we will call these subgraphs clouds. Note that collapsing the clouds to points yields the Cayley graph of the group K with respect to the generating set consisting of the images of the free generating set of π1 (Θ). Z2 -homology covers We will concentrate on the case where the cover “ Θ corresponds to the quotient π1 (Θ) −→ π1 (Θ)/π1 (Θ)2 ∼ =

r M

Z2 ,

where the notation G2 denotes the group generated by all squares of elements in G (note that this normal subgroup contains the commutator [G, G]). We will call this the Z2 -homology cover of Θ. Lr Note that the Cayley graph of Z2 (where r is the free rank of π1 (Θ)) with respect to the image of the free generating set of π1 (Θ) is the same as taking the Lr natural generating set for Z2 , namely, one generator for each copy of Z2 . Here, the corresponding word metric coincides with the Hamming metric. We will refer to this metric as dT . Since collapsing the clouds of “ Θ to points gives us the space Lr Lr Z2 , dT ), the clouds are in one-to-one correspondence with elements of Z2 , ( Lr and we can refer to clouds and points in Z2 interchangeably. We can now define a wall structure on “ Θ as follows. For each edge e of Θ, consider the set of edges we of “ Θ given by we := π −1 (e) (recalling that π : “ Θ → Θ is the covering map). Defining W := {we : e ∈ E(Θ)}, it is not difficult to see that this is a wall structure. In fact, following on from the above discussion, given an edge e of Θ, we can consider a maximal spanning tree T of Θ which does not contain e (this exists since

ASTÉRISQUE 422

(1154)

ESPACES ET GROUPES NON EXACTS...

163

“ as the cover corresponding to this Θ is assumed to be 2-connected). Considering Θ choice of maximal spanning tree, we can view it as clouds (corresponding to elements Lr of Z2 ) which are connected to each other via edges exactly as the elements in the Lr Cayley graph of Z2 are connected, with respect to the standard generating set. We now see that the edges of “ Θ in we corresponds exactly to edges between these Lr clouds labeled by a particular generator of Z2 (namely, the generator ρ(e)). Thus, removing these edges yields exactly two connected components, just as the removal of Lr edges labeled by a particular generator in the r-dimensional cube Z2 would leave two connected components. It is clear that each edge of “ Θ lies in precisely one wall of W , and so W is a wall structure. The corresponding wall metric dW satisfies dW (x, y) ≤ d(x, y) for all x, y ∈ “ Θ, where d is the natural graph metric on “ Θ. This is easy to see, since the walls are disjoint and given a d-geodesic from x to y (i.e., a path in “ Θ which realizes the distance d(x, y)), such a geodesic must traverse all the walls separating x and y at least once. Recall that the girth of a graph is defined as the length of a shortest cycle in the graph. In [4], Arzhantseva, Guentner and Špakula go on to show that for every x, y ∈ “ Θ, dW (x, y) < girth(Θ) ⇐⇒ d(x, y) < girth(Θ) and if the above inequalities hold, then dW (x, y) = d(x, y). It is this comparison between the metrics that eventually allows one to conclude that a particular box space of the free group coarsely embeds into `1 , and thus into `2 . The “⇐” implication of the above statement is trivial by the observation that dW (x, y) ≤ d(x, y). The “⇒” implication can be proved by considering projections of geodesic paths of length < girth(Θ) in the cover “ Θ to Θ: such a projection cannot traverse any edge more than once (if it did, this path would contain a cycle in Θ, which is not possible since its length is strictly smaller than the girth of Θ), and so each such edge traversed by the projection contributes exactly 1 to the wall metric dW , whence the two metrics coincide on the scale of the girth of Θ. For a sequence of graphs with girth tending to infinity, the above implies that the wall metric and the graph metric in the sequence of Z2 -homology covers will be coarsely equivalent. Thus, via the discussion on embeddings using wall metrics, we can obtain the following result. “n } be Theorem. — Let {Xn } be a sequence of 2-connected finite graphs and let {X the sequence of Z2 -homology covers of the Xn . If girth(Xn ) → ∞ as n → ∞, then the F “ coarse disjoint union n X n coarsely embeds into a Hilbert space.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

164

A. KHUKHRO

We can obtain a corollary for box spaces in this way. Given m ∈ N and a group G, the derived m-series of G is a sequence of subgroups defined inductively by G1 = G, m Gi+1 = [Gi , Gi ]Gm i , where Gi is the subgroup of G generated by mth powers of T elements of Gi . When G is free, the intersection Gi of all the Gi is trivial by a theorem of Levi (see Proposition 3.3 in Chapter 1 of [18]), since each Gi is a proper characteristic subgroup of the previous Gi−1 . For free groups it thus makes sense to talk about the box space corresponding to the derived m-series, for m ≥ 2. Theorem ([4]). — Given a finitely generated free group, the box space corresponding to the derived 2-series coarsely embeds into a Hilbert space. This relies on an innovative construction, in which Arzhantseva, Guentner and Špakula exploit the fact that for a derived 2-series, each subsequent quotient in the box space with respect to this sequence of subgroups can be viewed as a Z2 -homology cover of the previous quotient. Since we are working with a filtration of the free group, the girths of the quotients tend to infinity, and so the result above applies. Note that the construction of [4] can be generalized for m-derived series, m > 2 [15]. For m > 2, the wall space structure is not available, and so one needs to employ different methods, that make use of Nowak’s aforementioned result [22].

4. A NON-EXACT GROUP WITH THE HAAGERUP PROPERTY In this section, we give an overview of the construction by Osajda [24] of a nonexact group with the Haagerup property. In fact, Osajda’s result is stronger, giving a non-exact group which acts properly on a CAT(0) cube complex. The set-up and some results that are used in [24] are those of Section 2 of [6]. Consider a bouquet of k loops Y (1) corresponding to the labels {a1 , a2 , . . . , ak }, and take a sequence of labeled simple graphs (Θn , ln ) also labeled by the ai . The labels of cycles in these graphs will define the relators in the group presentation that we will construct, and so by slight abuse of terminology we will also refer to the graphs Θn as relators. For each of the Θi , define the cone over Θi by cone Θi := Θi × [0, 1]/{(x, 1) ∼ (y, 1)}. Let Y = Y (Θn , ln ) be the space defined by [[ Y := Y (1) cone Θi , (ψi ) i (1)

where the ψi : Θi × {0} → Y are natural gluing maps of the cone Θi to Y (1) , induced by the labelings li . The object we will work with is the space X(Θn , ln ) which is defined as the universal cover of the space Y . The space X(Θn , ln ) has the

ASTÉRISQUE 422

(1154)

ESPACES ET GROUPES NON EXACTS...

165

structure of a CW-complex, and we will consider it together with the path metric defined on its 0-skeleton X(Θn , ln )(0) by the shortest paths in X(Θn , ln )(1) . Let ϕi denote the maps of the Θi into X(Θn , ln ) induced by the ψi . Note that these maps will be local isometries. To define the small cancellation condition that we will use, we need the notion of a piece. A piece is a (labeled) subgraph p of X(Θn , ln )(1) that appears in two essentially distinct ways in the relators, i.e., the inclusion of p in X(Θn , ln ) factors ϕj ϕi as p ,→ Θi −→ X(Θn , ln ) and as p ,→ Θj −→ X(Θn , ln ) for i 6= j such that there is no isomorphism Θi → Θj that makes the diagram p

/ Θj >

 Θi o

 X

commute. X(Θn , ln ) is then said to satisfy the small cancellation condition C 0 (λ) if ϕi every piece p coming from an embedding of Θi −→ X(Θn , ln ) satisfies diam(p) ≤ λ · girth(Θi ), i.e., pieces must be short with respect to the length of the shortest loop in the relator that they come from. The following lemma of Arzhantseva and Osajda in [6] is the crucial consequence of this small cancellation condition that will allow us to geometrically encode the relators in a group. Lemma 1 ([6]). — If X(Θn , ln ) (as above) satisfies the C 0 (1/24) small cancellation condition, then the maps ϕi : Θi → X(Θn , ln ) are isometric embeddings. This lemma is proved using results of Wise [33]. The set-up and structure of Osajda’s proof are as follows. Let λ be a small cancellation constant, λ ∈ (0, 1/24]. We start with an infinite sequence of finite, connected graphs (Θn ) satifying the following conditions: — there exists D > 0 such that all vertices in Θn are of degree at most D, for all n; — limn→∞ girth(Θn ) = ∞, and the girth of the sequence is strictly increasing; — there exists A > 0 such that for all n, diam(Θn ) ≤ A girth(Θn ); — for all n, λ girth(Θn ) > 1. Note that given a sequence with girth tending to infinity, we can always arrange for the last condition to hold and for the girths to be strictly increasing by passing to a subsequence—something we can allow ourselves to do with our applications in mind, as this will not affect the coarse geometric properties that interest us here.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

166

A. KHUKHRO

Such graph sequences do exist, one can take for example the Ramanujan expander graphs constructed in [16]. We will need a suitable small cancellation labeling in order to apply Lemma 1. Step 1: Small cancellation between different graphs Θn The main tool introduced in [24] for proving the existence of a desired labeling is the following result from probability theory (see, for example, [2]). Lemma 2 (Lovász Local Lemma). — Let A be a finite set of events, and let A = A1 ∪ A2 ∪ · · · ∪ Ar be a partition of A , with Prob(A) = pi for every event A ∈ Ai , i = 1, 2, . . . , r. Suppose that there are real numbers 0 ≤ a1 , a2 , . . . , ar < 1 and ∆ij ≥ 0, i, j = 1, 2, . . . , r such that: — for any A ∈ Ai there is a set DA ⊂ A with |DA ∩ Aj | ≤ ∆ij for all j = 1, 2, . . . , r and such that A is independent of A \(DA ∪ {A}); Qr — pi ≤ ai j=1 (1 − aj )∆ij for all i = 1, 2, . . . , r. ÄT ä Then Prob A∈A ¬A > 0. Osajda’s application of this result, following similar ideas in [1], ensures that there exist labelings (Θn , ln ), where the ln are all labelings by the same finite set of labels, satisfying the C 0 (λ) small cancellation condition between graphs Θn , Θm , n 6= m. In other words, this first step is only concerned with making sure that labeled paths appearing in both (Θn , ln ) and (Θm , lm ) for n 6= m are bounded above in length by λ min{girth(Θn ), girth(Θm )}. Let ri := bλ girth(Θi )c, noting that we thus have girth(Θi ) 2 < . ri λ The labeling is performed inductively. One begins by randomly labeling the £ † +1 4 2A λ is a function of λ graph Θ1 by L labels to get (Θ1 , l1 ), where L := 2Dγ D and the degree D of the graphs (here, γ denotes Euler’s constant). Note that the number of edges |E(Θn )| in Θn is bounded above by Ddiam(Θn ) , and so, by the properties of the graphs Θn , we have |E(Θn )| ≤ DA girth(Θn ) . Given that we have defined the labelings (Θ1 , l1 ), (Θ2 , l2 ), . . . , (Θn−1 , ln−1 ), we can now apply the Lovász Local Lemma as follows to ensure the existence of a good labeling for Θn . Note that the number of labelings of paths of length ri in (Θi , li ) is bounded above by |E(Θi )|Dri and the number of labelings of any path of length ri by L labels is exactly Lri .

ASTÉRISQUE 422

(1154)

ESPACES ET GROUPES NON EXACTS...

167

Take a random labeling ln of Θn by L labels. Given a path p in Θn of length ri with i < n, A(p) will denote the event that the ln -labeling of p in Θn coincides with the li -labeling of a path of length ri in Θi . Now let Ai denote the set of events Ai

= {A(p) : p is a path of length ri in Θn }.

Now, using the above inequalities, we have Ñ A girth(Θ ) éri Ç å ri i +1 2a ri DA girth(Θi )+ri D D λ +1 |E(Θi )|Dri ≤ = . < pi ≤ Lri Lri L L In the notation of the Lovász Local Lemma, for an event A(p) ∈ Ai , let us set DA(p) ⊂ A to be the set of events {A(q) : q is a path that shares an edge with p}. Now a path of length ri can share an edge with at most ri rj Drj paths of length rj , so let us set ∆ij := ri rj Drj . We thus have that |DA(p) ∩ Aj | ≤ ∆ij and that the event A(p) is independent of A \(DA(p) ∪ A(p)), because A(p) is only dependent on events A(q) such that q shares an edge with p. Setting ai := (2D)−ri , and combining the inequality obtained above with the definitions of ∆ij and ai , and the properties of γ, one can compute that Å X ã ∞ ri j pi < ≤2 D γ = ai exp −2 L 2j j=1 ã ã Å X Å X ∞ ∞ ri rj rj −rj ≤ ai exp −2 = ai exp −2 ri rj D (2D) 2rj j=1 j=1 Å X ã Y Y = ai exp −2 ∆ij aj = ai γ −2aj ∆ij ≤ ai (1 − ai )∆ij , Å

D

2a λ +1

ãri

−ri

j

−ri −4ri

j

j

whence the hypotheses of the Lovász Local Lemma are satisfied. Thus there exists a labeling ln of Θn by L labels such that pieces in Θn must be of length smaller than ri = λ girth(Θi ), for any i < n. We have thus inductively proved the existence of labelings (Θn , ln ) by L labels such that labeled paths appearing in both (Θn , ln ) and (Θm , lm ) for n 6= m are bounded above in length by λ min{girth(Θn ), girth(Θm )}. The use of the Lovász Local Lemma in the context of small cancellation theory is an innovation in the subject of geometric group theory.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

168

A. KHUKHRO

Step 2: Small cancellation in each graph Θn ¯ One must now prove that there exist labelings (Θn , ¯ln ) by a finite number of labels L such that different paths occurring with the same labeling in any given Θn must be relatively short. Here, Osajda proves that if two long paths with identical labelings occur in a given graph Θn , then a path with a specific labeling occurs. He then uses the Lovász Local Lemma to prove that a labeling avoiding this specifically-labeled path exists. Step 3: Combined small cancellation labeling To prove that there exist labelings (Θn , mn ) such that X(Θn , mn ) is a C 0 (λ) small cancellation complex, we simply combine the labelings obtained in Step 1 and Step 2, by assigning to each edge e in Θn the ordered pair of labels (ln (e), ¯ln (e)) to give ¯ labels. the required labeling mn on L × L Step 4: Covers “ Θn with “good” walls “n , m We now need to take a sequence of covers (Θ “ n ) of the labeled sequence (Θn , mn ), so that the covering space structure induces walls. We will need the walls of (“ Θn ) to satisfy certain properties that ensure the group given by the graphical presentation over the graphs (“ Θn , m “ n ) acts properly on a space with walls, whence we can conclude by [20] and [9] that G acts properly on a CAT(0) cube complex (and has the Haagerup property, by a result of Haglund, Paulin and Valette, see Corollary 7.4.2 in [10]). One of the stronger properties that the walls in our graphs must satisfy is as follows. Definition ([24], Definition 4.1). — For β ∈ (0, 1/2] and a homeomorphism Φ : [0, ∞) → [0, ∞), a graph Θ with walls is said to satisfy the (β, Φ)-separation property if the following conditions hold. β-condition: for all pairs of edges e, e0 in Θ belonging to the same wall, d(e, e0 ) + 1 ≥ β girth(Θ). Φ-condition: for any geodesic γ in Θ, the number of edges in γ belonging to walls that separate the endpoints of γ is at least Φ(|γ|). The complex X(Θn , ln ) is said to satisfy the (β, Φ)-separation property if each relator Θn does. The β-condition above implies that the complex has the structure of a space with walls. Indeed, given a sequence of graphs (Θn , ln ) with walls, let us define walls in X(Θn , ln )(1) in the following way: let two edges belong to the same wall if they are in the same wall for some relator Θi , and extend this relation transitively.

ASTÉRISQUE 422

(1154)

ESPACES ET GROUPES NON EXACTS...

169

Proposition 3 ([6], Proposition 3.4). — For every β ∈ (0, 1/2], there exists λ ≤ 1/24 such that for a C 0 (λ) complex X(Θn , ln ) satisfying the β-condition above, the walls as defined above induce the structure of a space with walls (X(Θn , ln )(0) , W ) on the vertices of X(Θn , ln ). This is proved using results of Wise from [33], Section 5. We will also need the wall pseudometric on the complex to be proper, in order to get a proper action of the group we will construct. To this end, the following conditions are needed. P (Θ) here will denote the maximal number of edges in a piece in Θ. Definition ([24], Definition 5.1). — Let X(Θn , ln ) be a complex as above, let D > 1 be a natural number, and let β ∈ (0, 1/2]. Let 0 < λ < β/2 be the number provided for β by Proposition 3, so that (X(Θn , ln )(0) , W ) is a space with walls. Let Φ, Ω, ∆ : [0, ∞) → [0, ∞) be homeomorphisms. X(Θn , ln ) satisfies the proper lacunary walling condition if the following hold: (i) X(Θn , ln )(1) has degree bounded above by D; (ii) X(Θn , ln ) satisfies the C 0 (λ)-condition; (iii) X(Θn , ln ) satisfies the (β, Φ)-separation property; (iv) Φ((β − λ) girth(Θn )) − 6P (Θn ) ≥ Ω(girth(Θn )) for each relator Θn ; (v) girth(Θn ) ≥ ∆(diam(Θn )) for each relator Θn . Given that this condition holds, one can deduce properness of the wall pseudometric. Theorem 4 ([24], Theorem 5.6). — Let X(Θn , ln ) be a complex satisfying a proper lacunary walling condition as above. Then there exists a homeomorphism Ψ : [0, ∞) → [0, ∞) such that the wall pseudometric dW induced by the wall structure W on X(Θn , ln )(1) satisfies d(x, y) ≥ dW (x, y) ≥ Ψ(d(x, y)), for all x, y ∈ X(Θn , ln )(0) , where d denotes the usual graph metric in X(Θn , ln )(1) . In particular, dW is a metric. The covers are taken in two stages: firstly, one takes a sequence of covers (‹ Θn ) with the labelings m ‹ n induced by the lifts of the labelings mn , so that the girth is sufficiently large compared to the length of pieces, i.e., so that (1/2−1/24) girth(‹ Θn )−P (‹ Θn ) > 0, which will be useful in view of condition (iv). Note that, when we take covers of our graphs, we do not increase the length of pieces, since labeled paths that now occur more than once in the covers will differ by a covering automorphism and thus do not satisfy the definition of a piece (such occurrences will not be essentially distinct from each other, according to our definition above).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

170

A. KHUKHRO

“n ) of the (‹ We then take Z2 -homology covers (Θ Θn ), with labelings m “ n induced by the lifts of the labelings m ‹ n . It is these covers that will satisfy all of the properties above. Indeed, Z2 -homology covers will satisfy the β-condition for β = 1/2 ([6], Lemma 7.1): for two edges e, e0 in the same wall in the Z2 -homology cover “ Θ of a graph Θ, the projection of a geodesic between them to Θ must contain a cycle, since e and e0 must project to the same edge in Θ. Thus, since the girth of “ Θ is precisely twice the girth of Θ, we have d(e, e0 ) + 1 ≥ girth(Θ) = 1 girth(“ Θ). 2

The Φ-condition follows from [4], Proposition 3.11 (see the discussion in the preceding section). We now see that condition (i) is satisfied since the degree does not increase when taking covers, condition (ii) is satisfied as the length of pieces is preserved when passing to a cover of the C 0 (λ)-labeled graphs (Θn , mn ), condition (iii) holds thanks to the Z2 -homology construction as above, condition (iv) holds by the choice of initial covers (‹ Θn ) with sufficiently large girth and an appropriate choice of Ω, and condition (v) follows from an appropriate choice of ∆, given that the girth of the graphs (“ Θn ) tends to infinity. Step 5: A non-exact group G as a graphical presentation over (“ Θn , m “n) Let G be the group defined by the graphical presentation over the graphs (“ Θn , m “ n ), i.e., the quotient of the free group on the finite set of labels of the m “ n by the normal subgroup generated by all words that can be read along cycles in the “ Θn . (1) “ The 1-skeleton X(Θn , m “ n ) of the associated complex is the Cayley graph of G, G “n , m being the fundamental group of Y (Θ “ n ) (see beginning of the section). The com0 “ plex X(Θn , m “ n ) satisfies the C (1/24) condition and so by Lemma 1, the graphs “ Θn admit isometric embeddings into the Cayley graph of G. By the result of Willett [30], graphs with girth tending to infinity do not have property A and thus the group G is non-exact since property A passes to subspaces. Step 6: G acts properly on a CAT(0) cube complex We show that G acts properly on a space with walls with respect to the wall metric. The group G acts properly on X(“ Θn , m “ n )(0) with respect to the Cayley graph metric, “ and since X(Θn , m “ n ) satisfies the proper lacunary walling condition by construction, we have by Theorem 4 that the wall metric is coarsely equivalent to the Cayley graph metric, whence G acts properly on the space with walls (X(“ Θn , m “ n )(0) , W ). REFERENCES [1] N. Alon, J. Grytczuk, M. Hałuszczak & O. Riordan – “Nonrepetitive colorings of graphs,” Random Structures Algorithms 21 (2002), p. 336–346.

ASTÉRISQUE 422

(1154)

ESPACES ET GROUPES NON EXACTS...

171

[2] N. Alon & J. H. Spencer – The probabilistic method, second ed., Wiley-Interscience Series in Discrete Mathematics and Optimization, WileyInterscience, 2000. [3] G. Arzhantseva & T. Delzant – “Examples of random groups,” preprint, http://www.mat.univie.ac.at/~arjantseva/Abs/random.pdf, 2008. [4] G. Arzhantseva, E. Guentner & J. Špakula – “Coarse non-amenability and coarse embeddings,” Geom. Funct. Anal. 22 (2012), no. 1, p. 22–36. [5] G. Arzhantseva & D. Osajda – “Infinitely presented small cancellation groups have the Haagerup property,” J. Topol. Anal. 7 (2015), no. 3, p. 389–406. [6]

, “Graphical small cancellation groups with the Haagerup property,” preprint, https://arxiv.org/abs/1404.6807.

[7] G. Arzhantseva & R. Tessera – “Relative expanders,” Geom. Funct. Anal. 25 (2015), no. 2, p. 317–341. [8]

, “Admitting a Coarse Embedding is Not Preserved Under Group Extensions,” Int. Math. Res. Not. 2019 (2019), no. 20, p. 6480–6498.

[9] I. Chatterji & G. Niblo – “From wall spaces to CAT(0) cube complexes,” Internat. J. Algebra Comput. 15 (2005), nos. 5-6, p. 875–885. [10] P.-A. Cherix, M. Cowling, P. Jolissaint, P. Julg & A. Valette – Groups with the Haagerup property, Progress in Math., vol. 197, Birkhäuser, 2001. [11] T. Delabie & A. Khukhro – “Box spaces of the free group that neither contain expanders nor embed into a Hilbert space,” Adv. Math. 336 (2018), p. 70–96. [12] M. Gromov – “Groups of polynomial growth and expanding maps,” Publ. Math. IHÉS (1981), no. 53, p. 53–73. [13]

, “Random walk in random groups,” Geom. Funct. Anal. 13 (2003), no. 1, p. 73–146.

[14] N. Higson, V. Lafforgue & G. Skandalis – “Counterexamples to the BaumConnes conjecture,” Geom. Funct. Anal. 12 (2002), no. 2, p. 330–354. [15] A. Khukhro – “Embeddable box spaces of free groups,” Math. Ann. 360 (2014), nos. 1-2, p. 53–66. [16] A. Lubotzky, R. Phillips & P. Sarnak – “Ramanujan graphs,” Combinatorica 8 (1988), no. 3, p. 261–277. [17] A. Lubotzky & A. Żuk – “On property (τ ),” preliminary version available online at www.ma.huji.ac.il/~alexlub/, 2003. [18] R. C. Lyndon & P. E. Schupp – Combinatorial group theory, Ergebn. Math. Grenzg., vol. 89, Springer, 1977. [19] G. A. Margulis – “Explicit constructions of expanders,” Problemy Peredači Informacii 9 (1973), no. 4, p. 71–80. [20] B. Nica – “Cubulating spaces with walls,” Algebr. Geom. Topol. 4 (2004), p. 297– 309.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

172

A. KHUKHRO

[21] P. S. Novikov & S. I. Adjan – “Infinite periodic groups. I,” Izv. Akad. Nauk SSSR Ser. Mat. 32 (1968), p. 212–244. [22] P. W. Nowak – “Coarsely embeddable metric spaces without Property A,” J. Funct. Anal. 252 (2007), no. 1, p. 126–136. [23] A. Y. Ol0 shanski˘ı – Geometry of defining relations in groups, Mathematics and its Applications (Soviet Series), vol. 70, Kluwer Academic Publishers Group, 1991. [24] D. Osajda – “Small cancellation labellings of graphs and applications,” preprint, https://arxiv.org/abs/1406.5015. [25] J. Roe – Lectures on coarse geometry, University Lecture Series, vol. 31, Amer. Math. Soc., 2003. [26] V. A. Tartakovski˘ı – “Solution of the word problem for groups with a k-reduced basis for k > 6,” Izvestiya Akad. Nauk SSSR. Ser. Mat. 13 (1949), p. 483–494. [27] R. Tessera – “Coarse embeddings into a Hilbert space, Haagerup property and Poincaré inequalities,” J. Topol. Anal. 1 (2009), no. 1, p. 87–100. [28] J.-L. Tu – “Remarks on Yu’s “property A” for discrete metric spaces and groups,” Bull. Soc. Math. France 129 (2001), no. 1, p. 115–139. [29] R. Willett – “Some notes on property A,” in Limits of graphs in group theory and computer science, EPFL Press, Lausanne, 2009, p. 191–281. [30]

, “Property A and graphs with large girth,” J. Topol. Anal. 3 (2011), no. 3, p. 377–384.

[31] R. Willett & G. Yu – “Higher index theory for certain expanders and Gromov monster groups, II,” Adv. Math. 229 (2012), no. 3, p. 1762–1803. [32] D. T. Wise – “Cubulating small cancellation groups,” Geom. Funct. Anal. 14 (2004), no. 1, p. 150–214. [33]

, “The structure of groups with quasiconvex hierarchy,” preprint, 2011.

[34] G. Yu – “The coarse Baum-Connes conjecture for spaces which admit a uniform embedding into Hilbert space,” Invent. math. 139 (2000), no. 1, p. 201–240.

Ana KHUKHRO Department of Pure Mathematics and Mathematical Statistics Centre for Mathematical Sciences University of Cambridge Wilberforce Road Cambridge, CB3 0WB Royaume-Uni E-mail : [email protected]

ASTÉRISQUE 422

Séminaire BOURBAKI 71e année, 2018–2019, no 1155, p. 173 à 223 doi:10.24033/ast.1134

Janvier 2019

LA CONJECTURE DES COMPAGNONS [d’après Deligne, Drinfeld, L. Lafforgue, T. Abe, ...] par Anna CADORET

1. INTRODUCTION Dans tout l’exposé k désignera un corps fini de caractéristique p et de cardinal q et k un clôture algébrique de k ; on notera π1 (k) := π1 (Spec(k), Spec(k)) le groupe de Galois absolu de k et ϕ ∈ π1 (k) le Frobenius géométrique i. e. l’inverse de a → aq . Une k-variété est un schéma séparé de type fini sur k et une courbe est une k-variété de dimension 1. Si X est une k-variété, on note |X| l’ensemble des points fermés de X. Pour x ∈ X (non nécessairement fermé), on note k(x) le corps résiduel et si x est un point géométrique au-dessus de x, π1 (x) := π1 (x, x) le groupe de Galois absolu de k(x) ; si x ∈ |X|, on note ϕx ∈ π1 (x) le Frobenius géométrique. La lettre ` désignera toujours un premier 6= p. Soit X une k-variété, normale, ∗ un premier et Q une extension algébrique de Q∗ . On utilisera la terminologie (empruntée à Kedlaya) Q-coefficient sur X pour désigner de façon uniforme : – Si ∗ = 6 p : un Q-faisceau de Weil lisse ; – si ∗ = p : un Q-F-isocristal surconvergent. Soit C un Q-coefficient sur X. La fibre Cx de C en un point géométrique x au-dessus de x ∈ |X| est un Q-espace vectoriel de dimension finie naturellement muni d’une action du Frobenius ϕx . On notera χx (C , T ) := d´et(1 − ϕx T |Cx ) ∈ Q[T ] le polynôme caractéristique inverse ; il ne dépend pas de x. Le corps des traces QC de C est la Q-sousextension de Q engendrée par les coefficients des χx (C , T ), x ∈ |X|. Si σ : Q∗ →Q ˜ ∗0 est un isomorphisme, un σ-compagnon de C est un Q∗0 -coefficient C 0 tel que σχx (C , T ) = χx (C 0 , T ), x ∈ |X|. On notera C ∼σ C 0 . La conjecture dite « des compagnons », sous une forme un peu simplifiée, est l’énoncé suivant.

© Astérisque 422, SMF 2020

174

A. CADORET

Conjecture 1.1 (Conjecture des compagnons ; Deligne [16, (1.2.10)]) Soit X une k-variété, normale, géométriquement connexe et C un Q∗ -coefficient sur X, irréductible et de déterminant fini. (a) [Pureté] C est pur de poids 0 : pour tout isomorphisme ι : Q∗ →C ˜ et pour tout x ∈ |X| les racines de ιχx (C , T ) sont de module 1 ; (b) [Finitude] QC est une extension finie de Q ; (c) [Compagnons] Pour tout isomorphisme σ : Q∗ →Q ˜ ∗0 , C admet un σ-compagnon. On verra que, s’il existe, le σ-compagnon est unique à isomorphisme près, irréductible et de déterminant fini. 1.1. Statut L’énoncé original de la conjecture 1.1 est un peu différent. Deligne demande notamment que les compagnons soient définis sur les complétés d’une même extension finie de QC [16, (1.2.10) (v)]. La descente du corps des coefficients est traitée au paragraphe 8.2 ; c’est en fait une conséquence « formelle » de la conjecture 1.1. L’autre différence est la partie p-adique de la conjecture. Dans [16], Deligne énonce la conjecture pour les Q` -faisceaux lisses et émet l’espoir qu’il existe « de petits camarades cristallins » [16, (1.2.10) (vi)]. C’est Crew [13, Conj. 4.13] (cf. aussi [3, Conj. (D)]) qui a identifié la catégorie des F-isocristaux surconvergents de Berthelot [7] comme candidat potentiel pour l’analogue p-adique de la catégorie des Q` -faisceaux lisses et a obtenu les premiers résultats à l’appui — notamment le théorème de monodromie globale ; un ingrédient essentiel de la théorie des poids de Deligne (cf. 2.2 ci-dessous). 1.1.1. — Supposons dans ce paragraphe que X est une k-courbe ; notons k(X) son corps des fonctions et A l’anneau des adèles de k(X). Dans ce cas, la conjecture 1.1 est une conséquence de la correspondance de Langlands pour GLr et k(X). La correspondance `-adique en rang r = 2 a été établie par Drinfeld [22] à la fin des années 70 et c’est ce résultat qui est sans doute à l’origine de la conjecture 1.1. Deligne avait noté que la preuve de Drinfeld n’établissait pas seulement une correspondance « abstraite » préservant les facteurs L locaux entre faisceaux `-adiques irréductibles de rang 2 sur les ouverts de X et représentations automorphes pour GL2 (A) mais qu’elle exhibait les faisceaux `-adiques en question comme la réalisation de certains motifs découpés dans la cohomologie des champs de Chtoucas. En développant l’approche de Drinfeld, L. Lafforgue [50] a démontré la correspondance `-adique en rang r quelconque, établissant ainsi automatiquement la conjecture des compagnons pour les courbes dans ce contexte. La preuve de la version p-adique de la correspondance ([3, Conj. (L)]) a été l’un des moteurs de la construction d’un formalisme en cohomologie rigide parallèle à celui de la cohomologie `-adique. Ces développements techniques

ASTÉRISQUE 422

(1155)

175

LA CONJECTURE DES COMPAGNONS

ont permis à T. Abe [3], [2] d’établir la version p-adique de la correspondance de Langlands et, partant, de compléter la conjecture des compagnons pour les courbes. 1.1.2. — Lorsque X est de dimension supérieure, il n’y a pas d’analogue — même conjectural — de la correspondance de Langlands mais dans le contexte de la philosophie des motifs (e. g. [28, §2]) et notamment par analogie avec une conjecture de Simpson pour les systèmes locaux rigides quasi unipotents sur une C-variété lisse ([68, Conj. 4], [52, Conj. 1.1] si X est projective — cf. 9), on s’attend à ce que les Q∗ -coefficients irréductibles de déterminant fini sur une k-variété X lisse de dimension arbitraire soient encore la réalisation de motifs découpés dans la cohomologie de certains champs sur X. Si de tels résultats semblent actuellement hors de portée, la conjecture 1.1 est maintenant en grande partie établie en toute dimension. Théorème 1.2 (Deligne, Drinfeld, L. Lafforgue, Abe, Abe-Esnault, Kedlaya) Les énoncés 1.1 (a), (b) sont établis. L’énoncé 1.1 (c) est établi si X est une courbe ou si ∗0 6= p et X est lisse. Pour établir la conjecture 1.1 en dimension supérieure, la stratégie n’est donc pas de chercher à construire une réalisation motivique des Q∗ -coefficients mais de se ramener au cas des courbes par des arguments géométriques. L’énoncé 1.1 (a) peut se tester en un seul point et est invariant par extension de corps ; il suffit donc, étant donné un Q∗ -coefficient C irréductible de déterminant fini, de savoir construire une courbe C → X (dépendant de C ) telle que C | est encore irréductible. C’est C essentiellement ainsi que procède Deligne [19, Thm. 1.6] (corrigeant un argument de L. Lafforgue) pour ∗ 6= p et Abe-Esnault [5, Thm. 2.6], Kedlaya [46, Lem. 3.1.3] pour ∗ = p. Les énoncés 1.1 (b) et 1.1 (c) sont eux de nature globale et l’existence de telles courbes n’est pas suffisant pour les démontrer. L’énoncé 1.1 (b) pour ∗ = 6 p est dû à Deligne [19, Thm. 3.1]. Le point-clef est de prouver que si X est une courbe, le corps QC est engendré par les coefficients des χx (C , T ) pour x ∈ |X| de degré résiduel borné seulement en termes de la ‘complexité’ de C (un invariant qui ne dépend que de X et de la ramification de C ) puis de montrer que sur une k-variété X de dimension arbitraire on peut faire passer en tout point x ∈ |X| une courbe C x telle que la complexité de C | x reste suffisamment petite par rapport au C degré résiduel de x. L’énoncé 1.1 (c) pour ∗0 = ` 6= p est dû à Drinfeld [24, Thm. 1.1], inspiré par des techniques de Wiesend. L’idée est de considérer l’ensemble Cu(X) des courbes tracées sur X, d’appliquer 1.1 (c) aux restrictions C | , C ∈ Cu(X) puis C

de montrer que les σ(C | ), C ∈ Cu(X) proviennent en fait d’un Q` -coefficient σ C C sur X. L’énoncé sous-jacent est donc un critère (théorème 7.1) caractérisant les familles de faisceaux `-adiques C | , C ∈ Cu(X) vérifiant la condition de compatibilité C

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

176

A. CADORET

évidente : CC | ' CC 0 | , C, C 0 ∈ Cu(X) (ce que, en suivant EsnaultC×X C 0 C×X C 0 Kerz, on appellera un squelette `-adique) qui proviennent d’un faisceau `-adique sur X en fonction de propriétés (finitude du corps des coefficients, et modération) préservées par les compagnons sur les courbes. La preuve de l’énoncé 1.1 (b) s’applique non seulement aux faisceaux `-adiques C sur X dont le corps QC est une extension algébrique de Q mais à n’importe quel squelette `-adique CC , C ∈ Cu(X) dont les corps QCC sont des extensions algébriques de Q et qui sont modérés par une même altération génériquement étale de X. Cette observation permet de montrer la finitude et l’existence de compagnons `-adiques pour les F-isocristaux surconvergents. Comme l’a noté Kedlaya, la preuve de 1.1 (b) peut aussi se transposer telle quelle au cadre p-adique. Il n’en va pas de même de la preuve de 1.1 (c), qui utilise de façon cruciale la description galoisienne (cf. 2.1.3) de la catégorie des faisceaux `-adiques. 1.2. Structure du texte Le second paragraphe rassemble un certain nombre de notations et de préliminaires utilisés dans la suite. Nous n’avons pas tenté d’expliciter la construction des catégories de Q∗ -coefficients qui interviennent dans la conjecture des compagnons ; cela nous aurait conduit au-delà des objectifs de l’exposé. Nous avons par contre essayé d’en dégager quelques propriétés essentielles, qui suffisent pour les manipuler. Le troisième paragraphe passe brièvement en revue la correspondance de Langlands pour GLr . Au quatrième paragraphe, nous introduisons les notions de squelettes et de squelettes géométriques. Le cinquième paragraphe est consacré à la preuve de l’énoncé de finitude 1.1 (b) et les sixième et septième paragraphes à celle de l’existence de compagnons 1.1 (c) pour ∗0 6= p et X lisse. Au huitième paragraphe, nous déduisons du théorème 1.2 certaines propriétés de descente du corps des coefficients et de ∗-indépendance. Enfin, au dernier paragraphe, nous donnons une application — due à Esnault-Groechenig — de la conjecture 1.1 à la conjecture de Simpson évoquée plus haut. Au-delà de sa beauté conceptuelle, la conjecture 1.1 fournit un substitut aux théorèmes de comparaison cohomologique, permettant de transférer certaines propriétés entre cohomologies `-adiques et cohomologie rigide. Ces aspects apparaissent un peu à la marge dans l’exposé (cf. notamment la fin du paragraphe 7.1 et le corollaire 8.3) ; pour limiter la longueur du texte, nous ne les avons pas traités systématiquement. Remerciements Je remercie Vincent Lafforgue, Javier Fresàn, Hélène Esnault et Marco d’Addezio pour leur relecture et corrections — notamment mathématiques. Je suis reconnaissante à Emiliano Ambrosi et Atsushi Shiho de m’avoir signalé un problème dans une première version de la preuve du corollaire 3.8. Je remercie également les participants

ASTÉRISQUE 422

(1155)

LA CONJECTURE DES COMPAGNONS

177

au groupe de travail organisé dans le cadre de l’A.N.R. ECOVA à l’I.H.P. au printemps 2017. C’est grâce à Emiliano Ambrosi, qui n’a pas hésité à s’attaquer aux isocristaux, que j’ai appris à avoir un peu moins peur des aspects p-adiques de la conjecture. La tentative de présenter uniformément les aspects `-adiques et p-adiques doit beaucoup aux textes de Kedlaya [46], [47] et d’Addezio [14].

2. PRÉLIMINAIRES Soit X une k-variété normale, géométriquement connexe (pour simplifier), de dimension d. 2.1. Q-coefficients Soit ∗ un nombre premier et Q une extension algébrique de Q∗ . Les catégories de Q-coefficients sont des catégories tannakiennes neutres sur Q i. e. des ⊗-catégories abéliennes rigides Q-linéaires C que l’on peut munir de ⊗-foncteurs « fibres » F : C → VectQ , fidèles, exacts, de cible la ⊗-catégorie VectQ des Q-espaces vectoriels de dimension finie. À tout foncteur fibre est associé le Q-schéma en groupe affine G(C, F ) := Aut⊗ (F ) des ⊗-automorphismes de F — appelé groupe de Tannaka. Le foncteur fibre F : C → VectQ induit une ⊗-équivalence de catégories entre Q-coefficients et Q-représentations de dimension finie de G(C, F ). Si C est un objet de C, on peut restreindre les foncteurs fibres à la plus petite souscatégorie tannakienne hC i⊗ de C contenant C ; le groupe de Tannaka correspondant G(C ) := G(hC i⊗ , F ) est un Q-sous-groupe fermé de GL(F (C )), quotient de G(C, F ). On renvoie par exemple à [18] pour un exposé systématique du formalisme tannakien. Les groupes de Tannaka dépendent des foncteurs fibres à forme intérieure près ; ceci n’interviendra pas dans l’exposé et on commettra un premier abus de notation en n’indiquant pas les foncteurs fibres. 2.1.1. — Rappelons que l’on a défini la catégorie des Q-coefficients sur X comme : – Si ∗ = 6 p : la catégorie des Q-faisceaux de Weil lisses sur X. – Si ∗ = p : la catégorie des Q-F-isocristaux surconvergents sur X. Après choix d’une clôture algébrique k de k, la catégorie des Q-coefficients sur Spec(k) est équivalente à la catégorie des Q-espaces vectoriels de dimension finie munis d’une action du Frobenius géométrique ϕ. Si C est un Q-coefficient sur X et x un point géométrique au-dessus de x ∈ |X| (et si ∗ = p, Q contient le corps des fractions des vecteurs de Witt de k(x)), la fibre Cx de C en x est donc un Q-espace vectoriel de dimension finie muni d’une action de ϕx . Cette action ne dépend du choix de x qu’à isomorphisme près, ce qui, là encore n’interviendra pas dans l’exposé

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

178

A. CADORET

et justifie notre deuxième abus de notation (Cx plutôt que Cx ). On commettra un troisième abus en notant encore C 7→ Cx le foncteur composé du foncteur fibre en x et du foncteur d’oubli de l’action de ϕx ; munie de C 7→ Cx , la catégorie des Q-coefficients est tannakienne neutre sur Q. 2.1.2. — On dispose d’une version géométrique des catégories de Q-coefficients sur X, à savoir : – Si ∗ = 6 p : la catégorie des Q-faisceaux lisses sur Xk . – Si ∗ = p : la catégorie des Q-isocristaux surconvergents sur X. La catégorie des Q-coefficients géométriques sur Spec(k) est équivalente à la catégorie des Q-espaces vectoriels de dimension finie. Si C est un Q-coefficient géométrique sur X et x ∈ |X| (et si ∗ = p, Q contient le corps des fractions des vecteurs de Witt de k(x)), la fibre Cx de C en x est donc un Q-espace vectoriel de dimension finie. Munie du foncteur C 7→ Cx la catégorie des Q-coefficients géométriques est tannakienne neutre sur Q. On dispose d’un ⊗-foncteur exact C 7→ C (on notera aussi parfois C | := C si ∗ 6= p) canonique de la catégorie des Q-coefficients sur X Xk

vers celle des Q-coefficients géométriques sur X. Si ∗ = 6 p, c’est le pullback par la projection canonique Xk → X. Si ∗ = p, c’est le foncteur d’oubli de la structure de Frobenius. Sa restriction hC i⊗ → hC i⊗ induit une immersion fermée G(C ) ,→ G(C ) qui fait de G(C ) un sous-groupe normal de G(C ) ; le quotient G(C )/G(C ) est commutatif (e. g. [14, Cor. 3.2.7]). 2.1.3. Le cas ∗ = `. — La catégorie des Q` -faisceaux (étales) lisses est construite par passages à la limite à partir des catégories de faisceaux localement constants constructibles à coefficients finis de caractéristique `, qui sont des catégories galoisiennes. On en déduit que pour tout point géométrique x au-dessus de x ∈ X, la fibre Cx d’un Q` -faisceau lisse C est munie d’une action continue du groupe fondamental étale π1 (X) := π1 (X, x) de X (là encore π1 (X, x) et son action sur Cx ne dépendent qu’à isomorphisme près du choix de x, justifiant un quatrième abus de notation...) et que le foncteur fibre C 7→ Cx induit une équivalence de catégories entre Q` -faisceaux lisses sur X et Q` -représentations continues de dimension finie de π1 (X). Comme π1 (X) est compact, la condition de continuité implique que l’action de π1 (X) stabilise un sous Z-réseau H ⊂ V pour Z l’anneau des entiers d’une extension finie de Q` et que l’action de π1 (X) sur H est continue pour les topologies profinies (e. g. [42, Rem. 9.0.7]). Les groupes G(C ), G(C ) ⊂ GL(Cx ) s’identifient respectivement à l’adhérence de Zariski de l’image de π1 (Xk ), π1 (X) agissant sur Cx . Les morphismes Xk¯ → X → Spec(k) induisent une suite exacte courte (on a supposé X géométriquement connexe) 1 → π1 (Xk¯ ) → π1 (X) → π1 (k) → 1.

ASTÉRISQUE 422

(1155)

LA CONJECTURE DES COMPAGNONS

179

ˆ La Par ailleurs, le Frobenius géométrique définit un morphisme Z → π1 (k) ' Z. catégorie des Q` -faisceaux de Weil lisses peut être décrite de la même façon en remplaçant le groupe fondamental étale par le groupe de Weil W (X), qui est le produit fibré W (X) := π1 (X) ×π1 (k) Z muni de la topologie induite par le produit des topologie profinie sur π1 (Xk ) et discrète sur Z. Par exemple, la donnée d’un Q` -faisceau de Weil lisse de rang 1 sur Spec(k) est équivalente à celle d’un élément × de Q` ; la sous-catégorie pleine des Q` -faisceaux lisses sur Spec(k) correspond au sous× × groupe Z` ⊂ Q` des unités `-adiques. Si C est un Q` -faisceau de Weil lisse sur X, les groupes G(C ), G(C ) ⊂ GL(Cx ) s’identifient encore respectivement à l’adhérence de Zariski de l’image de π1 (Xk ), W (X) agissant sur Cx . La catégorie des Q` -faisceaux de Weil lisses est introduite par commodité pour maintenir le caractère purement algébrique de la correspondance de Langlands et, a posteriori, le parallélisme avec la catégorie des Qp -F-isocristaux surconvergents. Nous verrons plus bas que la différence entre Q` -faisceaux lisses et Q` -faisceaux de Weil lisses n’est pas essentielle. On trouvera dans [31, §2] une introduction un peu plus détaillée aux faisceaux `-adiques et dans l’ouvrage [62] une présentation « for the working mathematician » des principaux résultats de la théorie. Pour une introduction aux F-isocristaux surconvergents, on renvoie à l’exposé de survol de Kedlaya [47]. En première approximation, on peut penser aux Q∗ -coefficients comme à des analogues pour les sites étale et cristallin des systèmes locaux de la géométrie complexe. 2.2. Cohomologie On dispose de groupes de cohomologie H i (X, −) et de groupes de cohomologie à support compact Hci (X, −), qui sont des Q-espaces vectoriels de dimension finie, nuls si i > 2d. Lorsque ∗ = `, il s’agit des groupes de cohomologie `-adiques sur Xk construits à partir des groupes de cohomologie étale à coefficients de torsion. Lorsque ∗ = p, il s’agit des groupes de cohomologie rigide construits par Berthelot ; si X est propre et lisse sur k, ils coïncident avec les groupes de cohomologie cristalline. Ces Q-espaces vectoriels sont munis d’une action naturelle du Frobenius géométrique ϕ. 2.3. Images inverses, images directes Si f : Y → X est un revêtement étale, on dispose d’un foncteur image directe par f que l’on note f∗ de la catégorie des Q-coefficients sur Y vers celle des Q-coefficients sur X. Par exemple, si ∗ = ` et Y est connexe, π1 (Y ) est un sous-groupe ouvert de π1 (X) et, en termes de représentations `-adiques, le foncteur f∗ correspond au foncteur d’induction de π1 (Y ) à π1 (X) (ou de W (Y ) à W (X)). Si f : Y → X est un morphisme de k-variétés, on dispose d’un foncteur image inverse par f que l’on note f ∗ ou −| de la catégorie des Q-coefficients (resp. des Y

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

180

A. CADORET

Q-coefficients géométriques) sur X vers celle des Q-coefficients (resp. des Q-coefficients géométriques) sur Y . Si ∗ = ` et Y est connexe, f : Y → X induit un morphisme de groupes topologiques π1 (Y ) → π1 (X) et le foncteur f ∗ correspond en termes de représentations `-adiques au foncteur de restriction de l’action de π1 (X) à π1 (Y ). Mentionnons deux cas particuliers, utiles dans les réductions. 2.3.1. Revêtement étale. — Soit C un Q-coefficient sur X. En utilisant que les revêtements étales connexes de X correspondent aux sous-groupes ouverts de π1 (X), il est immédiat que, si ∗ 6= p et X 0 → X est un revêtement étale connexe, le morphisme G(C | 0 ) → G(C ) est une immersion ouverte et qu’il existe un revêtement X étale connexe X 0 → X tel que G(C | 0 )→G( ˜ C )◦ ⊂ G(C ). Ce résultat reste vrai mais X est un peu plus délicat pour ∗ = p (e. g. [14, Prop. 3.3.3, 3.3.4]). 2.3.2. Immersion ouverte d’image dense. — Soit U ,→ X une immersion ouverte d’image dense. En utilisant que le groupe fondamental étale d’un schéma normal connexe est le groupe de Galois de l’extension maximale non ramifiée au-dessus des points de codimension 1 de son corps des fonctions, on déduit immédiatement que le morphisme de groupes profinis π1 (U ) → π1 (X) est surjectif. En particulier, pour tout Q` -faisceau lisse C sur X, le morphisme G(C | ) → G(C ) est un isomorphisme. U

Cette formulation tannakienne s’étend au Qp -F-isocristaux surconvergents sous réserve que U soit lisse sur k ; modulo un lemme tannakien, c’est un résultat de Tsuzuki [74, Cor. 1.2] — cf. [5, §4.6]. 2.4. Quelques résultats de structure Un Q∗ -coefficient C de rang 1 sur X est dit d’ordre fini s’il existe n ≥ 1 tel que C ⊗n est trivial. Notons pr : X → Spec(k) le morphisme structural et soit L un Q∗ -coefficient de × rang 1 sur Spec(k) correspondant à un élément α ∈ Q∗ . Pour tout Q∗ -coefficient C sur X le twist de C par L est le Q∗ -coefficient C (α) := C ⊗ pr∗ L . L’énoncé suivant, qui est une conséquence de la théorie du corps de classes, permet de se ramener au cas des Q∗ -coefficients de déterminant fini et de passer des Q` -faisceaux de Weil lisses aux Q` -faisceaux lisses. Théorème 2.1 ([16, Prop. 1.3.4], [3, Lem. 6.1]). — Tout Q∗ -coefficient de rang 1 sur X est le twist d’un Q∗ -coefficient fini. En particulier, tout Q∗ -coefficient sur X est le twist d’un Q∗ -coefficient de déterminant fini. Corollaire 2.2 (Monodromie globale ; Grothendieck [16, Thm. 1.3.8], [13, Thm. 4.9]) Soit C un Q∗ -coefficient sur X. Le radical de G(C )◦ est unipotent.

ASTÉRISQUE 422

(1155)

181

LA CONJECTURE DES COMPAGNONS

On en déduit notamment, – (2.4.1) Soit C un Q∗ -coefficient semisimple sur X. Les conditions suivantes sont équivalentes 1. Tous les constituants irréductibles de C sont de déterminant fini ; 2. G(C ) est d’indice fini dans G(C ) ; 3. G(C ) est semisimple. On notera que les conditions (2.4.1) 2), 3) sont invariantes par revêtement étale (cf. 2.3.1). – (2.4.2) Soit C un Q` -faisceau de Weil lisse irréductible sur X. Les conditions suivantes sont équivalentes 1. C est étale ; 2. d´et(C ) est étale ; 3. C = S (α) , où S est un Q` -faisceau lisse irréductible de déterminant fini et α est une unité `-adique. Pour n ≥ 1 notons kn l’extension de degré n de k dans k et pn : Xkn → X la projection canonique. Lemme 2.3. — ([19, 1.3, 1.4], [46, Rem. 9.13]) Soit C un Q∗ -coefficient. (a) C est irréductible si et seulement si C | est irréductible, n ≥ 1 ; Xk n

(α )

(b) Supposons C irréductible de rang r. Il existe n|r tel que C = pn∗ Cn n , où Cn est un Q∗ -coefficient de rang r/n et de déterminant fini sur Xkn tel que C n est × irréductible, αn ∈ Q∗ et l’orbite de Cn sous l’action de ϕ est de longueur n. 2.5. Fonctions L et poids Soit C un Q∗ -coefficient sur X. 2.5.1. Polynôme caractéristique et corps des traces. — Le rang r de Cx est indépendant de x et on dispose d’une application polynôme caractéristique inverse χ− (C , T ) : |X| → Pr (Q∗ ) x → χx (C , T ) := d´et(1 − ϕx T |Cx ), à valeurs dans les Q∗ -points de la Q-variété Pr := Gm × Ar−1 des polynômes de degré r et terme constant 1. On rappelle que le corps des traces de C est la Q-sousextension QC de Q engendrée par les coefficients des χx (C , T ), x ∈ |X|. On dira ˜ ∗0 est un que C est algébrique si QC est une extension algébrique de Q. Si σ : Q∗ →Q isomorphisme, on dira que C est σ-unitaire si pour tout x ∈ |X| et pour toute valeur × propre α de ϕx agissant sur Cx , σ(λ) ∈ Z∗ . Si C est σ-unitaire pour tout σ : Q∗ →Q ˜ ∗ 0 on dira que C est ∗-unitaire. Si C est σ-unitaire pour tout σ : Q∗ →Q ˜ ∗0 , ∗ 6= p on dira que C est p0 -unitaire.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

182

A. CADORET

2.5.2. Fonctions L. — Supposons de plus X lisse. Pour x ∈ |X|, on notera n(x) := [k(x) : k] le degré résiduel et Lx (C ) := χx (C , T n(x) )−1 ∈ Q∗ [[T ]] la fonction L Q locale de C en x. La fonction L globale de C est le produit L(C , T ) := x∈|X| Lx (C , T ) ∈ Q∗ [[T ]]. La formule des traces et la dualité de Poincaré la relient aux groupes de cohomologie et aux groupes de cohomologie à support compact. Théorème 2.4 ([35], [30]). — On a Y Y i+1 i+1 d´et(1 − ϕT |Hci (X, C ))(−1) . d´et(1 − q −d ϕ−1 T |H i (X, Cˇ))(−1) = L(C , T ) = i≥0

i≥0

2.5.3. Poids. — Étant donné un isomorphisme ι : Q∗ →C, ˜ les ι-poids de C en x ∈ |X| sont les 2 log|k(x)| (|ια|) pour α décrivant les racines inverses de χx (C , T ). On dit que C est ι-pur de poids w en x ∈ |X| si tous ses ι-poids en x sont égaux à w et que C est ι-pur de poids w s’il l’est en tout x ∈ |X|. On dit que C est ι-mixte s’il est extension successive de Q∗ -coefficients ι-purs. Enfin on dit que C est pur de poids w (resp. mixte) s’il est ι-pur de poids w pour tout isomorphisme ι : Q∗ →C ˜ (resp. extension successive de Q∗ -coefficients purs). L’énoncé suivant est le résultat fondamental de la théorie des poids de Frobenius. Théorème 2.5 ([16, (3.3.4), (3.3.5)], [44, 6.6.2], [4]). — Si C est ι-pur de poids w les groupes de cohomologie Hci (X, C ) sont de ι-poids ≤ w+i (resp. H i (X, C ) sont de ι-poids ≥ w + i). On en déduit notamment Corollaire 2.6 ([16, (3.4.1)], [4, §4.3], [47, §9]). — Soit C est un Q∗ -coefficient sur X. (a) Si C est ι-mixte, il admet une unique filtration — la filtration par le ι-poids — 0 = C0 ⊂ C1 ⊂ · · · ⊂ Cs = C telle que Ci /Ci−1 est ι-pur de poids wi avec w1 < · · · < ws . (b) Si C est ι-pur, C est semisimple ; en particulier, G(C ) est semisimple. 2.5.4. Conséquences pour les compagnons. — Soit C un Q∗ -coefficient semisimple, σ : Q∗ →Q ˜ ∗0 un isomorphisme et C 0 un Q∗0 -coefficient semisimple tel que C ∼σ C 0 . Par définition, σL(C , T ) = L(C 0 , T ) et C est ι-pur de poids w si et seulement si C 0 est ισ −1 -pur de poids w. Les théorèmes 2.4 et 2.5 impliquent immédiatement que si C est ι-pur, – (2.5.4.1) σd´et(1 − ϕT |H 0 (X, C )) = d´et(1 − ϕT |H 0 (X, C 0 )), σd´et(1 − ϕT |Hc2d (X, C )) = d´et(1 − ϕT |Hc2d (X, C 0 )). Et si X est une courbe, σd´et(1 − ϕT |Hc1 (X, C )) = d´et(1 − ϕT |Hc1 (X, C 0 )), σd´et(1 − ϕT |H 1 (X, C )) = d´et(1 − ϕT |H 1 (X, C 0 )).

ASTÉRISQUE 422

(1155)

LA CONJECTURE DES COMPAGNONS

183

– (2.5.4.2) Si X est propre, σd´et(1−ϕT |H i (X, C )) = d´et(1−ϕT |H i (X, C 0 )), i ≥ 0. L’intérêt du corollaire (2.5.4.1) vient de son interprétation tannakienne. En effet, le degré de d´et(1 − ϕT |H 0 (X, C )) est la dimension des G(C )-invariants de Cx et la multiplicité de 1 comme racine de d´et(1 − ϕT |H 0 (X, C )) est la dimension des G(C )-invariants de Cx . – (2.5.4.3) Si σ = Id et si I est un facteur irréductible de C , Iˇ ⊗ C , Iˇ ⊗ C 0 sont purs de poids 0 et on a encore Iˇ ⊗ C ∼Id Iˇ ⊗ C 0 , donc la multiplicité de I dans C est égale à la multiplicité de I dans C 0 . On en déduit que C ' C 0 . – (2.5.4.4) En observant que d´et(C ) ∼σ d´et(C 0 ), C est de déterminant fini si et seulement si C 0 l’est, auquel cas d´et(C ) et d´et(C 0 ) ont même ordre. En utilisant la filtration par le ι-poids, on a l’amplification suivante de (2.5.4.3). Corollaire 2.7 (Cebotarev tannakien ; Tsuzuki — e. g. [46, Thm. 3.2.4]) Pour tout Q∗ -coefficients semisimples ι-mixtes (1) C , D, χx (C , T ) = χx (D, T ), x ∈ |X| si et seulement si C ' D. En particulier, un Q∗ -coefficient admet au plus un σ-compagnon semisimple ι-mixte à isomorphisme près ; on le note σ C . Pour ∗ = p, le corollaire 2.7 sert de substitut au théorème de densité de Cebotarev classique, qui affirme que l’union des classes de conjugaison des Frobenii géométriques est dense dans π1 (X) — e. g. [66, Thm. 7]. Il découle directement de ce dernier que, pour ∗0 = ` 6= p, un Q` -coefficient admet au plus un σ-compagnon semisimple à isomorphisme près sans hypothèse de mixité (mais cf. la note 1). Supposons toujours C semisimple et ι-pur. On peut appliquer les observations cidessus non seulement à C mais aussi à tout Q∗ -coefficient de la forme T m,n (C ) = C ⊗m ⊗ Cˇ⊗n . En effet, T m,n (C ) est encore ι-pur et σT m,n (C ) = T m,n (σ C ). Autrement dit, les fonctions N2 → N, (m, n) → dim(T m,n (Cx )G(σC ) ), dim(T m,n (σ Cx )G(σC ) ) ne dépendent que de C et pas de σ. En particulier, pour (m, n) = (1, 1), on déduit du lemme de Schur – (2.5.4.5) C est irréductible (resp. C ) si et seulement si σ C (resp. σ C ) est irréductible. – (2.5.4.6) Si D est un autre Q∗ -coefficient semisimple ι-pur, C ' D si et seulement si σ C ' σ D. On déduit également de [55, Thm. 1] – (2.5.4.7) G(C ) et G(σ C ) ont même système de racines. (1)

A posteriori, l’énoncé de pureté 1.1 (a) montre que cette hypothèse est superflue.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

184

A. CADORET

Pour résumer, Corollaire 2.8. — Supposons la conjecture 1.1 vraie sur X. (a) Tout Q∗ -coefficient est ι-mixte ; (b) Soit σ : Q∗ →Q ˜ ∗0 un isomorphisme. Tout Q∗ -coefficient C sur X admet un σ-compagnon σ C semisimple sur X, unique à isomorphisme près et qui est irréductible (resp. de déterminant fini) si C l’est. De plus, (i) Si ∗0 6= p et C est σ-unitaire, σ C est un Q∗0 -faisceau lisse. (ii) Les énoncés (2.5.4.1), 2), 5), 6) s’étendent sans hypothèse de pureté. Démonstration. — Pour (a), il suffit de considérer une filtration de Jordan-Hölder (α ) 0 = C0 ⊂ C1 ⊂ · · · ⊂ Cs = C et d’écrire Ci /Ci−1 = Ii i avec Ii de déterminant fini (théorème 2.1). D’après 1.1.(a), Ci /Ci−1 est ι-pur de poids 2 log|k| (|ιαi |). Pour (b), on L L (αi ) (α−1 ) peut supposer C semisimple et écrire C = ) i avec Ci 1≤i≤r Ci = 1≤i≤r (Ci ×

(α )

irréductible, Ci i irréductible de déterminant fini et αi ∈ Q∗ . Par construction le L (αi ) (σ(αi )−1 ) Q∗0 -coefficient C 0 = ) est un σ-compagnon semisimple de C ; 1≤i≤r σ(Ci par (a) et le théorème 2.7 il est unique. (b).(i) résulte de (2.4.2) et (b).(ii) des énoncés correspondant dans le cas pur en raisonnant composante par composante. 2.6. Ramification à l’infini 2.6.1. Dimension 1. — Soit X une k-courbe lisse et x un point géométrique au-dessus h de x ∈ |X|. Notons U := X \ {x} ⊂ X, X(x) := Spec(OX,x ) le spectre de l’henselisé h OX,x de l’anneau local OX,x en x, X(x) := Spec(OX,x ), le spectre de l’hensélisé strict défini par x (l’anneau local de X en x pour la topologie étale), U(x) := U ×X X(x) , U(x) := U ×X X(x) . Notons également Ix := π1 (U(x) ) ⊂ Dx := π1 (U(x) ) les groupes de d’inertie et de décomposition de X en x. On a une suite exacte courte scindée 1 → Ix → Dx → π1 (x) → 1 et, en notant Px ⊂ Ix l’unique p-Sylow de Ix (le groupe d’inertie sauvage), Ixt := Ix /Px b p )(−1). (le groupe d’inertie modéré), un isomorphisme π1 (x)-équivariant Ixt →( ˜ Z/Z Soit C un Q∗ -coefficient sur X. À C | est attaché une représentation de Dx sur U(x)

un Q∗ -espace vectoriel Cx de dimension finie. Dans le cas ∗ = 6 p, c’est la représentation correspondant à C | , dans le cas ∗ = p cf. [47, Rem. 4.12]. Cela permet de définir le U(x)

conducteur de Swan local Swx (C ) de C en x. Le groupe Dx est muni d’une filtration (λ) décroissante Ix , λ ∈ R≥0 par des sous-groupes fermés normaux (sous-groupes de ramification en numérotation supérieure, e. g. [67, Chap. IV]) tels que T (λ) (µ) T (λ) – λ>µ Ix = Ix , λ≥0 Ix = {1} ; (0)

(0+)

– Ix := Ix ⊂ Dx est le groupe d’inertie et Px := Ix sauvage,

ASTÉRISQUE 422

(0)

⊂ IX le groupe d’inertie

(1155)

185

LA CONJECTURE DES COMPAGNONS

S (µ+) (λ) (µ) où on a posé Ix := λ 0 tel que W Ix = 0, W Ix = W . On dit que λ est (λ+) (λ) ss ss Ix ss Ix la pente de W ; Cx (λ) := (Cx ) /(Cx ) est donc la somme des sous Px -modules simples de Cxss de pente λ. Avec ces notations, on pose X Swx (C ) = λdim(Cxss (λ)). λ>0

Si Swx (C ) = 0 on dit que C est modérément ramifié en x. Dans le cas ∗ = p, la condition Swx (C ) = 0 est aussi équivalente au fait que C admet un prolongement logarithmique en x. Soit X une courbe lisse sur k, X ,→ X sa compactification lisse et C un Q∗ -coefficient sur X. Les conducteurs de Swan locaux sont liés à la caractéristique d’Euler-Poincaré P χc (C ) := i≥0 (−1)i dim Hci (X, C ) = − deg(L(C , T )) par la formule de GrothendieckOgg-Shafarevich. Théorème 2.9 ([65], [44, Thm. 4.4.1]). — On a X χc (C ) = rang(C )χc (Q∗ ) − n(x)Swx (C ). x∈X\X

Il est parfois commode de globaliser la définition du conducteur de Swan en P considérant le diviseur effectif Sw(C ) = x∈X\X Swx (C )[x]. 2.6.2. Dimension ≥ 2. — En dimension supérieure, il y a plusieurs définitions possibles de la notion de modération à l’infini ; les relations entre celles-ci ont été clarifiées dans [49]. Soit X ,→ X une compactification normale. Si ∗ = 6 p (resp. ∗ = p) on dit qu’un Q∗ -coefficient C sur X est modérément ramifié en un point x ∈ X \ X de codimension 1 si la représentation de π1 (X(x) ) correspondant à C | l’est (resp. X(x)

si C admet un prolongement logarithmique en x). On dit que C est modéré le long de X \ X s’il l’est en tout point x ∈ X \ X de codimension 1. Lorsque X est lisse les conditions suivantes – (C(courbe)-modération) Pour toute courbe C lisse sur k et tout morphisme C → X, C est modéré ; – (D(iviseur)-modération) Pour toute compactification normale X ,→ X, C est modérément ramifié le long de X \ X sont équivalentes et on dira simplement que C est modéré. Lorsque X admet une compactification lisse X ,→ X telle que X \ X est un diviseur à croisements normaux, C est modéré si et seulement si il est modéré le long de X \ X [5, §1.2], [46, §1.4]. On rappelle qu’une altération f : Y → X est un morphisme propre, surjectif et génériquement fini.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

186

A. CADORET

Théorème 2.10. — Si ∗ = 6 p (resp. ∗ = p) tout Q∗ -coefficient sur X est modéré par un revêtement étale connexe (resp. une altération génériquement étale). Démonstration. — Si ∗ = `, c’est une conséquence élémentaire de la description galoisienne. En effet, on peut supposer C semisimple et le décomposer sous la forme L × (αi ) C = avec les Ii irréductible de déterminant fini et les αi ∈ Q` . Quitte i∈I Ii L à remplacer C par i∈I Ii , ce qui n’affecte pas la ramification, on peut supposer que C est un Q` -faisceau lisse donc provient par extension des scalaires d’un Z-faisceau lisse H , où Z est l’anneau des entiers d’une extension finie Q de Q` dans Q` . En notant λ l’uniformisante de Z on peut prendre le revêtement étale trivialisant H /λ. Dans le cas ∗ = p c’est un théorème difficile de Kedlaya [45, Thm. 2.4.4]. L’existence de compagnons `-adiques montre a posteriori que tout Qp -F-isocristal surconvergent est aussi modéré par un revêtement étale connexe (cf. 7.1). 2.7. Notations On notera CQ,r (X) l’ensemble des classes d’isomorphismes de Q-coefficients semisimples de rang r et IQ,r (X) ⊂ CQ,r (X) le sous-ensemble de celles correspondant à des Q-coefficients irréductibles de déterminant fini. Si ∗ = 6 p, on notera aussi e CQ,r (X) ⊂ CQ,r (X) le sous-ensemble de celles correspondant à des Q-faisceaux lisses. Tout morphisme de k-variétés f : Y → X induit par pull-back et semisimplification des applications CQ,r (X) → CQ,r (Y ) et, si ∗ = 6 p, e CQ,r (X) → e CQ,r (Y ) que l’on notera ∗ ss ss f (−) ou −|Y . On dira que C , D ∈ CQ∗ ,r (X) sont équivalents modulo twists et on notera C ≈ D ×

s’il existe I1 , . . . , Ir ∈ IQ∗ ,r (X), α1 , . . . , αr , β1 , . . . , βr ∈ Q∗ tels que M (α ) M (β ) i i C = Ii , D= Ii . 1≤i≤r

1≤i≤r

La relation ≈ définit une relation d’équivalence sur CQ∗ ,r (X).

3. DIMENSION 1 Fixons un isomorphisme Q∗ →C. ˜ Soit X une courbe propre, lisse, géométriquement connexe de genre g sur k. Notons η son point générique et K = k(η) son corps de fonctions. Pour x ∈ |X|, notons b OX,x le complété de l’anneau local de X en x, Kx son corps des fractions et tx ∈ Kx une Q uniformisante. Soit A l’anneau des adèles de K et O := x∈|X| b OX,x ⊂ A. La théorie locale du corps de classes assure pour chaque x ∈ |X| l’existence d’un morphisme

ASTÉRISQUE 422

(1155)

187

LA CONJECTURE DES COMPAGNONS

continu injectif d’image dense — l’application de réciprocité locale — recx : Kx× ,→ π1 (Kx )ab qui s’insère dans le diagramme commutatif exact 1

/ O× X,x '

1



/ Ix

/ Kx× _ recx

 / π1 (Kx )ab

/Z _

/0

 / π1 (b OX,x ) ' π1 (x)

/ 1,

vx

où vx : Kx× → Z est la valuation attachée à x. Les applications de réciprocité locale se globalisent en un morphisme continu injectif d’image dense — l’application de réciprocité globale d’Artin — rec : K × \ A× ,→ π1 (K)ab qui induit un isomorphisme Ÿ× \ A× →π en passant à la complétion profinie K ˜ 1 (K)ab et est compatible aux applications de réciprocité locale au sens que l’on imagine. La correspondance de Langlands pour les corps de fonctions [54], [53] est une généralisation non-abélienne et en rang supérieur de la théorie globale du corps de classes. 3.1. Représentations automorphes cuspidales 3.1.1. Définition. — Fixons un caractère fini π1 (K)ab → C× et soit δ : K × \ A× → C× sa composée avec l’application de réciprocité globale. Pour un entier r ≥ 1, GLr (A) agit par translation à droite sur le C-espace vectoriel des applications localement constantes GLr (K) \ GLr (A) → C. Cette action stabilise le sous-C-espace vectoriel Cuspr,δ (A) des formes automorphes cuspidales de caractère central δ i. e. des applications localement constantes f : GLr (K) \ GLr (A) → C vérifiant les conditions suivantes. – GLr (O )-finitude : la GLr (O )-orbite de f engendre un C-espace vectoriel de dimension finie ; – caractère central : Pour tout z ∈ Z(GLr (A)) = A× , f · z = δ(z)f ; – cuspidalité : Pour toute partition r = r1 + · · · + rs en entiers ri > 0 induisant un sous-groupe parabolique standard Pr ⊂ GLr de radical unipotent Ur , Z f (ug)du = 0, g ∈ GLr (A). Ur (K)\Ur (A)

Comme représentation de GLr (A), Cuspr,δ (A) se décompose en somme directe de représentations irréductibles, chacune apparaissant avec multiplicité 1, appelées représentations automorphes cuspidales. Les représentations automorphes cuspidales sont celles qui ne proviennent pas (par induction parabolique) de groupes linéaires de rangs inférieurs.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

188

A. CADORET

3.1.2. Invariants locaux. — Fixons un caractère additif non trivial Ψ : k → C× et une forme différentielle 0 6= ω ∈ Ω1K|k ou, de façon équivalente (2) un caractère additif non-trivial ψ : K \ A → C× . À toute représentation automorphe cuspidale π ⊂ Cuspr,δ (A) sont attachés un ouvert dense Uπ ⊂ X et, pour chaque x ∈ |X|, une représentation irréductible πx de GLr (Kx ), tels que – La représentation πx est non ramifiée (i. e. le sous-C-espace vectoriel des vecteurs GLr (b OX,x )-invariants est de dimension 1) si et seulement si x ∈ |Uπ |. N – π est engendrée par les vecteurs de la forme x∈|X| fx , où en dehors d’un b nombre fini de x ∈ |Uπ |, fx est un vecteur GLr (OX,x )-invariant de πx . N0 On note π = x∈|X| πx . Cette décomposition permet de définir pour chaque x ∈ |X| une fonction L locale L(πx , T ) ∈ C((T )), qui ne dépend que de πx et vérifie une équation fonctionnelle [32, (3.3)], où interviennent : – un conducteur local a(πx , ψx ) = a(πx ) + rc(ψx ), où a(πx ) ∈ N et où c(ψx ) est le conducteur de ψx i. e. le plus grand entier c tel que ψx (t−c x ) = 1; × – une constante locale (πx , ψx ) ∈ C . 3.1.2.1. — Pour r = 1, πx coïncide avec son caractère central δx et on sait calculer explicitement L(πx , T ), a(πx , ψx ), (πx , ψx ) [72], [58, (3.1.3.2)]. 3.1.2.2. — Chaque r-uplet λ = (λ1 , . . . , λr ) ∈ C× définit un caractère χλ : Br (Kx ) → C× du Borel des matrices triangulaires supérieure de GLr (Kx ) v (b ) v (b ) par χλ (b) = λ1x 1,1 · · · λrx r,r , b = (bi,j ) ∈ Br (Kx ). La représentation induite à GLr (Kx ) possède une unique sous-représentation irréductible non ramifiée πx (λ) et πx (λ) ' πx (µ) si et seulement si λ et µ sont dans la même orbite sous le groupe symétrique Sr . Pour x ∈ |Uπ |, la représentation πx est isomorphe à une représentation de la forme πx (λx (π)) et on dit que le multiensemble {λ1,x (π), . . . , λr,x (π)} est l’ensemble des valeurs propres de Hecke en x. Dans ce cas, on a L(πx , T ) =

Y 1≤i≤r

1 1 − λi,x (π)T

, a(πx , ψx ) = 0, (πx , ψx ) =

Y

(|k(x)|λi,x (π))c(ψx ) .

1≤i≤r

Le théorème de multiplicité 1 fort de Piatetski-Shapiro [63] assure que la donnée des {λ1,x (π), . . . , λr,x (π)}, x ∈ |Uπ | détermine uniquement π.

Les caractères additifs non triviaux ψ : K \ A → C× sont paramétrés par Ω1K|k \ {0} ; le caractère P correspondant à 0 6= ω ∈ Ω1K|k est ψ(a) = x∈|X| Ψ(trk(x)|k (Resx (ax · ωx )), a ∈ A — la formule des résidus assure que K ⊂ ker(ψ) (2)

ASTÉRISQUE 422

(1155)

LA CONJECTURE DES COMPAGNONS

189

3.1.3. Fonction L globale. — La fonction L globale de π est le produit infini, convergeant dans C[[T ]], Y L(π, T ) = L(πx , T n(x) ). x∈|X|

C’est le développement d’une fraction rationnelle de C(T ) et il vérifie une équation fonctionnelle de la forme (3.1.3.1) L(π, T ) = (π)T a(π) L(ˇ π , (|k|T )−1 ) obtenue comme produit d’équations fonctionnelles locales [32, (13.8)] avec X Y (3.1.3.2) a(π) = n(x)a(πx , ψx ), (π) = |k|r(1−g) (πx , ψx ). x∈|X|

x∈|X|

Remarque 3.1. — La disparition de la dépendance en ψ dans les termes globaux provient de Riemann-Roch. Par exemple pour a(π), on a c(ψx ) = vx (ωx ) et P P x∈|X| n(x)c(ψx ) = x∈|X| n(x)vx (ωx ) = 2(1 − g). On notera que (3.1.3.2) est bien défini puisque a(πx , ψx ) = 0, x ∈ |Uπ | et c(ψx ) = vx (ωx ) = 0 en dehors d’un nombre fini de x ∈ |X|. 3.2. Enoncé de la Correspondance de Langlands pour GLr Pour tout r ≥ 1 et tout ouvert ∅ = 6 U ⊂ X, notons Ar (U ) l’ensemble des classes d’isomorphismes de représentations automorphes cuspidales de GLr (A) de caractère central fini et telles que U ⊂ Uπ . Notons Ar (η)

=

lim

−→ ∅6=U ⊂X ouvert

Ar (U ), IQ ,r (η) ∗

=

lim

−→ ∅6=U ⊂X ouvert

IQ ,r (U ). ∗

Pour C ∈ IQ∗ ,r (η), notons UC ⊂ X le plus grand ouvert sur lequel C est défini. On dit que π ∈ Ar (η) et C ∈ IQ∗ ,r (η) se correspondent au sens de Langlands, ce que l’on notera π ∼ C , si L(πx , T ) = L(Cx , T ), x ∈ Uπ ∩ UC . Si π ∼ C , le caractère central de χ correspond à d´et(C ) via l’application de réciprocité globale. Théorème 3.2 (Correspondance de Langlands — Drinfeld, L. Lafforgue, T. Abe ; [22], [23], [50], [3]) Il existe des applications inverses l’une de l’autre C∗,−

Ar (η)

o

π∗,−

/

IQ ,r (η), ∗

telles que pour tout π ∈ Ar (η), Uπ = UC∗,π et π ∼ C∗,π et pour tout C ∈ IQ∗ ,r (η) UC = Uπ∗,C et π∗,C ∼ C .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

190

A. CADORET

3.3. Résumé de la preuve 3.3.1. Unicité. — Les conditions de compatibilité pour les facteurs L locaux imposent que si les flèches existent, elles sont uniques et automatiquement inverses l’une de l’autre. Pour π∗,− : IQ∗ ,r (η) → Ar (η) c’est le théorème de multiplicité 1 fort. Pour C`,− : Ar (η) → IQ` ,r (η), c’est le théorème de densité de Cebotarev. En démontrant la correspondance de Langlands pour ∗ = `, L. Lafforgue a montré simultanément : Théorème 3.3 (Conjecture de Ramanujan-Peterson ; L. Lafforgue [50, VI.10 (i)]) Pour tout π ∈ Ar (η), les facteurs locaux πx , x ∈ |X| sont tempérés (e.g [50, p. 224]) ; en particulier, pour tout x ∈ Uπ , les valeurs propres de Hecke sont de valeur absolue 1. Donc si Cp,− : Ar (η) → IQp ,r (η) existe, le théorème 3.3 assure que Cp,π est pur de poids 0 et l’unicité résulte alors de la version tannakienne 2.7 du théorème de Cebotarev. − → 3.3.2. Rang 1. — Pour ∗ = `, l’existence de la correspondance A1 (η) − ← −− − − IQ` ,1 (η) résulte de la théorie du corps de classes. Pour ∗ = p, il suffit alors de construire − → pour tout ouvert U ⊂ X IQ` ,1 (U ) − ← −− − − IQp ,1 (U ) non vide. D’après le théorème 2.1, les éléments de IQp ,1 (η) sont finis donc p-unitaires. Le choix des isomorphismes ×

Q` →C ˜ ←Q ˜ p induit une bijection entre caractères finis de π1 (U ) à valeurs dans Q` et ×

à valeurs dans Qp . Par ailleurs, Tsuzuki [73, Thm. 4.2.6] a construit une équivalence de catégories entre F -isocristaux surconvergents p-unitaires de rang r sur U et Qp -représentations continues de rang r potentiellement non ramifiées de π1 (U ). Le − → cas r = 1 de l’équivalence de Tsuzuki donne les bijections I (U ) − (U ) ← −− − −I Q` ,1

Qp ,1

cherchées. 3.3.3. Principe de récurence et formule du produit. — La preuve se fait ensuite par récurrence sur r. Supposons d’abord ∗ = ` et avoir construit les flèches C`,−

Ar0

0 − − → ← −− − − IQ` ,r0 (η) pour tout r < r. Expliquons la construction de la flèche π`,−

π`,− : IQ` ,r (η) → Ar (η). Fixons C ∈ IQ` ,r (η) et j : UC ,→ X l’inclusion canonique. N0 On définit π = x∈|X| πx en prenant pour x ∈ |UC |, πx = πx (λx ) avec λx le r-uplet des valeurs propres de ϕx sur Cx et pour x ∈ X \ UC , πx une induite de type Whittaker avec caractère central χπx = d´et((j∗ C )x ) ◦ recx . Il faut montrer que, quitte à modifier πx aux x ∈ X \ UC , π est automorphe cuspidale. Le point de départ est le théorème réciproque de Piatetski-Shapiro [50, Thm. B.13], qui assure l’existence d’une représentation automorphe (i. e. sous-quotient de l’espace des applications

ASTÉRISQUE 422

(1155)

191

LA CONJECTURE DES COMPAGNONS

localement constantes f : GLr (K) \ GLr (A) → C) irréductible π ˜ de GLr (A) telle que π ˜x = πx , x ∈ |UC | sous la condition suivante. (3.3.3.1)

Pour tout r0 < r et π 0 ∈ Ar0 tel que Uπ ∪ Uπ0 = X, les séries formelles L(π × π 0 , T ), L(ˇ π×π ˇ 0 , T ) sont des polynômes et vérifient l’équation 0

fonctionnelle (3.1.1) i. e. L(π × π 0 , T ) = (π × π 0 )T a(π×π ) L(ˇ π × πˇ 0 , (|k|T )−1 ). Pour vérifier (3.3.3.1), il faut utiliser que si C est un Q` -faisceau lisse sur un ouvert Q dense j : U ,→ X la fonction L L(j∗ C , T ) := x∈|X| Lx (j∗ C , T ) du Q` -faisceau constructible j∗ C sur X vérifie une équation fonctionnelle faisant intervenir des invariants locaux similaires à ceux de 3.1.2. 3.3.3.1. Equation fonctionnelle. — La formule des traces, Y

L(j∗ C , T ) =

i+1

d´et(1 − ϕT |H i (X, j∗ C ))(−1)

0≤i≤2

combinée à la dualité de Poincaré donne [15, §10] une équation fonctionnelle de la forme (3.3.3.1.1) L(j∗ C , T ) = (C )T −χ(j∗ C ) L(j∗ Cˇ, (|k|T )−1 ), faisant intervenir : P – la caractéristique d’Euler-Poincaré χ(j∗ C ) = 0≤i≤2 (−1)i dimH i (X, j∗ C ) ; Q i+1 – la constante globale (j∗ C ) = 0≤i≤2 d´et(−ϕ|H i (X, j∗ C ))(−1) . 3.3.3.2. Invariants locaux. — Par ailleurs, en chaque x ∈ |X| on peut attacher à C : – un conducteur local a(j∗ C |

X(x)

a(j∗ C |

X(x)

, ψx ) = a(j∗ C |

X(x)

) + rc(ψx ), où

) = r − rang((j∗ C )x¯ ) + Swx (C ) ;

– une constante locale (j∗ C | , ψx ) ∈ C× , qui ne dépend que de j∗ C | et ψx . X(x) X(x) La définition de (j∗ C | , ψx ) est axiomatique. A tout triplet (S, F , ψ) formé X(x)

d’un trait hensélien S de point générique η, d’un Q` -faisceau constructible F sur S et d’un caractère additif non trivial ψ : π1 (η) → C× on peut associer de façon unique une constante (S, F , ψ) ∈ C× qui vérifie certains axiomes (multiplicativité en F etc. — cf. [15, Thm. 4.1], [58, Thm. (3.1.5.4)]) et qui, × si F est de rang 1 i. e. correspond à un caractère χ : π1 (η) → Q` , est définie par 3.1.2.1.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

192

A. CADORET

3.3.3.3. — (On suppose toujours fixé un caractère additif non trivial Ψ : k → C× .) Contrairement à l’équation fonctionnelle (3.1.3.1), qui est obtenue par produit d’équations fonctionnelles locales, (3.3.3.1.1) est obtenue par voie globale et il n’est pas évident a priori que les analogues des relations (3.1.3.2) soient vérifiés par les invariants attachés à j∗ C . La relation χ(j∗ C ) =

X

n(x)a(C |

X(x)

, ψx )

x∈|X|

est la formule de Grothendieck-Ogg-Shafarevich. La relation (j∗ C ) = |k|r(1−g)

Y

(j∗ C |

X(x)

, ψx )

x∈|X|

appelée « formule du produit » et conjecturée par Deligne [17], a été démontrée par Laumon [58, Thm. (3.2.1.1)] comme conséquence du « principe de la phase stationnaire » pour la transformée de Fourier `-adique sur la droite affine. Nous renvoyons à l’exposé Bourbaki de Katz [39] pour une introduction à la démonstration de Laumon. 3.3.3.4. — Revenons à (3.3.3.1). Par hypothèse de récurrence, il existe C 0 ∈ IQ` ,r0 (η) tel que π 0 ∼ C 0 . Des calculs locaux [20] montrent que quitte à tordre π par un caractère ξ : K × \ A× → C× suffisamment ramifié aux places x ∈ |X \ UC |, les facteurs L locaux et les constantes locales de ξπ×π 0 et ξj∗ C ⊗j∗ C 0 d’une part et ξ −1 π ˇ ×ˇ π 0 et ξ −1 j∗ Cˇ ⊗j∗ Cˇ0 d’autre part coïncident pour tout x ∈ |X|. Donc L(ξπ × π 0 , T ) = L(ξj∗ C ⊗ j∗ C 0 , T ), L(ξ −1 π ˇ×π ˇ 0 , T ) = L(ξ −1 j∗ Cˇ ⊗ j∗ Cˇ0 , T ) sont des polynômes et vérifient (3.3.3.1.1) qui, d’après la formule du produit 3.3.3.3, coïncide avec (3.3.3.1). Cela montre donc que ξπ donc π est automorphe irréductible. Il reste à vérifier qu’elle est cuspidale. Sinon, il existerait une partition r = r1 +· · ·+rs de r et des représentations πi ∈ Ari non ramifiées sur UC , i = 1, . . . , s telles que Lx (C , T ) = Lx (

M

Cπi , T ),

x ∈ |UC |

1≤i≤s

donc, par Cebotarev C '

L

1≤i≤s Cπi ,

ce qui contredit l’irréductibilité de C .

Remarque 3.4. — L. Lafforgue montre en fait plus, à savoir que si on suppose en outre que les C`,π sont purs de poids 0 alors la conjecture de Ramanujan-Peterson est vraie et pour tout couple π ∈ Ar (η), π 0 ∈ Ar0 (η) correspondant au sens de Langlands

ASTÉRISQUE 422

(1155)

LA CONJECTURE DES COMPAGNONS

193

à C ∈ IQ` ,r (η), C 0 ∈ IQ` ,r0 (η), on a L(πx × πx0 , T ) = Lx (j∗ F ⊗ j∗ F 0 , T ), a(πx × πx0 , ψx ) = a(j∗ F ⊗ j∗ F 0 |

, ψx ),

(πx × πx0 , ψx ) = (j∗ F ⊗ j∗ F 0 |

, ψx ), x ∈ |X|.

X(x)

X(x)

3.3.3.5. Champs de Chtoucas. — Pour conclure, il reste à construire la flèche F`,− : Ar (η) −→ IQ ,r (η) de sorte que les F`,π soient purs de poids 0. Cette ` construction est due à Drinfeld pour r = 2 [22, 23] et à L. Lafforgue pour r arbitraire [50]. Leur stratégie consiste à faire apparaitre C`,π  Cˇ`,π (1 − r) dans la cohomologie essentielle de certains champs algébriques Chtr → X × X classifiant les Chtoucas de Drinfeld en rang r. Les calculs cohomologiques se font par comptage des points rationnels et utilisent la formule des traces d’Arthur-Selberg. Plus récemment V. Lafforgue a donné une autre démonstration, dans l’esprit de la correspondance de Langlands géométrique, et qui s’étend à tout groupe algébrique réductif [51]. V. Lafforgue ne calcule pas explicitement la cohomologie des champs de Chtoucas mais montre qu’il existe une décomposition canonique indexée par les paramètres de Langlands (i. e. IQ` ,r (η) pour GLr ) de l’espace des formes automorphes cuspidales. Cette décomposition est obtenue comme décomposition spectrale d’une sous-algèbre commutative — l’algèbre des opérateurs d’excursion — de l’algèbre des endomorphismes de l’espace des formes automorphes cuspidales. Les ingrédients principaux de la preuve de V. Lafforgue sont la généralisation des champs de Chtoucas de Drinfeld à tout groupe réductif et à un nombre arbitraires de pattes et l’équivalence de Satake géométrique ; elle n’utilise pas la formule des traces d’Arthur-Selberg. Nous renvoyons aux exposés Bourbaki de Laumon [59] et Stroh [70] pour une introduction aux démonstrations de L. Lafforgue et V. Lafforgue respectivement. 3.3.3.6. Le cas ∗ = p. — La preuve de la correspondance de Langlands pour les Qp -F-isocristaux surconvergents suit de près la stratégie esquissée ci-dessus. Il s’agit essentiellement de montrer que le formalisme de la cohomologie `-adique se transpose au cadre de la cohomologie rigide. Cette prouesse technique est l’aboutissement de travaux de Marmora [61] (définition des facteurs  locaux), Abe-Marmora [6] (formule du produit), Abe [3] (principe de réccurence), [2] (construction de la flèche Cp,− : Ar (η) → IQp ,r (η), formalisme des 6 opérations pour les D-modules arithmétiques sur les champs), lesquels reposent sur les contributions de nombreux auteurs, notamment Berthelot, Caro, Crew, Kedlaya etc. Nous renvoyons aux introductions de [6] et [2] pour une synthèse des développements de la théorie des F-isocristaux surconvergents et des D-modules arithmétiques.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

194

A. CADORET

3.4. Premières conséquences Soit encore X une courbe propre, lisse, géométriquement connexe sur k et j : U ,→ X un ouvert dense. 3.4.1. Finitude. — Les relations de la remarque 3.4 impliquent en particulier que si π ∼ C , X X Sw(C ) = (r−rang(Cx¯ ))[x]+Ar(π) = (r−deg(L(πx , T )−1 )[x]+Ar(π) ≥ Ar(π), x∈|X|

x∈|X|

P

où l’on a noté Ar(π) := x∈|X| a(πx , ψx )[x] le conducteur d’Artin de π. Pour tout diviseur effectif D ⊂ X à support dans X \ U , notons IQ∗ ,r (U, ≤ D) ⊂ IQ∗ ,r (U ) le sous-ensemble des Q∗ -coefficients C tels que Sw(C ) ≤ D. Corollaire 3.5. — L’ensemble IQ∗ ,r (U, ≤ D)/ ≈ est fini. Démonstration. — Notons π ∈ Ar (U ) la représentation correspondant à C . Puisque Ar(π) ≤ Sw(C ) ≤ D, Ar(π) ne peut prendre qu’un nombre fini de valeurs. Par ailleurs, il n’y a qu’un nombre fini de représentations automorphes cuspidales irréductibles de caractère central et de conducteur d’Artin fixés. Plus précisément, à π est attachée une droite — la droite « essentielle » — lπ ⊂ π, caractérisée par le fait que son fixateur sous GLr (A) est un sous-groupe compact ouvert Kπ ⊂ GLr (A) [37]. Le sous-groupe Kπ ne dépend en fait de π que via Ar(π). Or d’après Harder, Gelfand, Piatetski-Shapiro [58, Thm. 9.2.4], pour tout sous-groupe compact ouvert K ⊂ GLr (A), il n’y a qu’un nombre fini de représentations automorphes cuspidales irréductibles de caractère central fixé possédant un vecteur K-invariant. 3.4.2. Conjecture des compagnons en dimension 1. — On déduit de la correspondance de Langlands 3.2 et de la conjecture de Ramanujan-Peterson 3.3 la conjecture des compagnons 1.1 lorsque X est une courbe. Dans 1.1 (b), on peut prendre pour QC le compositum de Q(|k|1/2 ) et du corps de rationalité de πC (qui est un corps de nombres). Corollaire 3.6 ([50, Thm. VII.7], [2, Thm. 4.4.1]). — Si X est une courbe, la conjecture 1.1 (donc le corollaire 2.8) est vraie. De plus, pour tout x ∈ |X|, Lx (j∗ σ C ) = σLx (j∗ C ), a(j∗ σ C | , ψx ) = a(j∗ C | , ψx ), (j∗ σ C | , ψx ) = X(x)

(j∗ C |

X(x)

X(x)

X(x)

, ψx ) (donc Swx (σ C ) = Swx (C )).

3.4.3. Tests ponctuels. — Soit P l’une des propriétés suivantes : algébrique, pur de poids 0, p0 -unitaire. Corollaire 3.7 ([19, Prop. 1.9]). — Soit X une k-variété connexe. Un Q∗ -coefficient C sur X possède la propriété P si et seulement si il existe x ∈ |X| tel que C possède la propriété P en x.

ASTÉRISQUE 422

(1155)

LA CONJECTURE DES COMPAGNONS

195

Démonstration. — Supposons d’abord que X est une k-courbe lisse connexe. Quitte à traiter séparément chaque constituant irréductible du semisimplifié C ss de C sur X, on peut supposer que C est irréductible. On peut écrire (théorème 2.1) −1 C = (C (α) )(α ) avec C (α) ∈ IQ ,r (X). D’après le corollaire 3.6, C (α) vérifie P. En ∗ testant en x, on voit que α vérifie aussi P et on a gagné. Dans le cas général, pour vérifier P en x0 ∈ |X|, on peut remplacer (X, C ) par (Y, C |ss Y ) où Y → X est un 0 morphisme quelconque de k-variétés contenant x dans son image. Il suffit donc d’observer que pour tout x, x0 ∈ |X|, on peut construire une suite de morphismes de k-variétés fi : Ci → X, i = 0, . . . , n telle que Ci soit une courbe lisse connexe, fi (Ci ) ∩ fi+1 (Ci+1 ) 6= ∅, x ∈ f0 (C0 ), x0 ∈ fn (Cn ) (e. g. [48, Prop. 2.3]). Cette observation permet d’établir l’énoncé de pureté 1.1 (a) et la p0 -unitarité en dimension supérieure. L’argument suivant est essentiellement dû à Kedlaya [46, §3.1] ; il s’applique uniformément aux cas ∗ = 6 p, ∗ = p. Dans le cas ∗ = `, on pourrait invoquer directement la variante quasi-modéré du théorème de Bertini 6.1 que l’on verra un peu plus loin. Corollaire 3.8. — Soit X une k-variété normale. Tout C ∈ IQ∗ ,r (X) est pur de poids 0 (donc algébrique) et p0 -unitaire. Démonstration. — D’après le corollaire 3.7 on peut remplacer X par un ouvert non vide donc d’après 2.3.2 appliqué à l’ouvert de lissité de X (il est non vide puisque k est parfait), on peut supposer que X est lisse. On peut également remplacer X par un revêtement étale donc, d’après (2.4.1), le lemme 2.3. (b) et le théorème 2.10 se ramener au cas où C est irréductible et modérément ramifié. Toujours d’après le corollaire 3.7, il suffit de montrer que, quitte à remplacer k par une extension finie, on sait construire une k-courbe lisse C et un morphisme C → X tels que C | est encore irréductible. C

On va en fait montrer qu’on peut assurer que l’immersion fermée G(C | ) ,→ G(C ) est C un isomorphisme. L’idée est d’appliquer le lemme 3.9 ci-dessous. Là encore, quitte à remplacer X par un ouvert, on peut supposer que X admet un morphisme étale fini g : X → Ank . Fixons x ∈ |X|. Soit e : Y → Ank l’éclatement de Ank en g(x) et h : Y → Pn−1 la projection de centre g(x). Le morphisme f : X ×Ank Y → Pn−1 k k vérifie alors les hypothèses du lemme 3.9. Lemme 3.9. — Soit X une k-variété lisse, C ∈ CQ∗ (X) et f : X → S un morphisme lisse, de dimension relative 1, admettant une section g : S → X telle que C | soit S trivial. Il existe alors un ouvert dense U ⊂ S (dépendant de C ) tel que pour tout s ∈ S, le morphisme induit H 0 (X, C ) → H 0 (Xs , C ) est un isomorphisme. Si de plus C est modérément ramifié sur X, il existe un ouvert dense U ⊂ S (indépendant de C ) tel que pour tout s ∈ S, l’immersion fermée G(C | ) ,→ G(C ) est un isomorphisme. Xs

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

196

A. CADORET

Démonstration. — On peut supposer C irréductible non constant donc, en particulier, H 0 (X, C ) = 0 (H 0 (X, C ) définit toujours un sous-objet constant de C ) et il faut montrer que H 0 (Xs , C ) = 0. Quitte à remplacer S par un ouvert dense et un revêtement purement inséparable, on peut supposer (cf. 2.3.2) qu’on a une factorisation f : X ,→ X → S avec X → S propre et lisse et X \ X ⊂ X un diviseur, fini, étale sur S. On peut de plus assurer que le conducteur de Swan des C | , s ∈ S est constant Xs

[57, 2.1.1 (i)], [60, 9.2. (1)] donc que f∗ C existe dans la catégorie des Q∗ -coefficients sur S et commute à tout changement de base [57, 2.1.2], [60, 9.3 (2), 9.3 (2)]. Par adjonction, le morphisme f ∗ f∗ C ,→ C est injectif. Si c’était un isomorphisme, en appliquant g ∗ , on aurait f∗ C ' g ∗ C donc 0 = H 0 (X, C ) = H 0 (S, g ∗ C ) 6= 0 : contradiction. Si on suppose déjà que C est modérément ramifié sur X, le conducteur de Swan des C | , s ∈ S est trivial et cela reste vrai pour les T m,n (C )| , s ∈ S. Xs

Xs

Autrement dit, pour tout s ∈ S le sous-groupe G(C |

Xs

) ,→ G(C ) a les mêmes

invariants tensoriels que G(C ). Puisque G(C ) est semisimple et que le groupe des caractères de G(C | ) est fini (théorème 2.2), la conclusion résulte de [21, 3.1.(c)]. Xs

4. SQUELETTES Soit Q une extension algébrique de Q∗ . Soit X une k-variété normale. On peut formaliser l’idée consistant à associer à un Q-coefficient la famille de ses restrictions aux courbes sur X en introduisant la notion de Q-squelette. Cette notion est utilisée par Drinfeld [24] et en filigrane dans [19] mais la terminologie est introduite dans [29] et attribuée à Kindler. 4.1. Squelettes Notons Cu(X) l’ensemble des couples (C, φ), où C est une courbe lisse sur k et φ : C → X un k-morphisme. On appelle Q-squelette de rang r tout élément de l’égaliseur SQ,r (X) défini par le diagramme ci-dessous, où les flèches sont les flèches évidentes — composées des flèches de restriction et semisimplification. Y Y // 0 / SQ,r (X) CQ,r (C) CQ,r ((C ×X C )red ) / f C∈Cu(X)

O

C,C 0 ∈Cu(X)

Sq

CQ,r (X, Q).

‹Q,r (X) ⊂ SQ,r (X) le sous-ensemble des Q-squelettes lisses, Si ∗ 6= p, on note S construits à partir des Q-coefficients lisses.

ASTÉRISQUE 422

(1155)

LA CONJECTURE DES COMPAGNONS

197

On prendra garde que si X est de dimension ≥ 2 il n’est pas du tout clair qu’un Q∗ -squelette provienne par extension des scalaires d’un Q-squelette pour Q une extension finie de Q∗ dans Q∗ . 4.1.1. — Pour tout x ∈ |X|, l’application χx (−, T ) : CQ,r (X) → Pr (Q) de 2.5.1 s’étend à SQ,r (X) de la façon suivante. Pour chaque x ∈ |X| on se fixe une courbe C x ∈ Cu(X) telle que x se relève en un point k(x)-rationnel sur C x (cf. théorème 6.1) ; l’application χx (−, T ) : SQ,r (X) → Pr (Q) qui à C = (CC )C∈Cu(X) ∈ SQ,r (X) associe χx (C , T ) := χx (CC x , T ) est alors bien définie, injective et vérifie χx (−, T ) ◦ Sq = χx (−, T ). En particulier, d’après la version tannakienne 2.7 du théorème de Cebotarev, l’application Sq : CQ,r (X) → SQ,r (X) est injective. 4.1.2. — On définit encore le corps des traces QC d’un Q-squelette C comme la sous-Q-extension de Q engendrée par les coefficients des χx (C , T ), x ∈ |X| (de façon équivalente, par les QCC , C ∈ Cu(X)). On dira qu’un Q-squelette C est ι-pur de poids w, (resp. pur de poids w, resp. algébrique, resp. σ-unitaire, etc.) si les CC , C ∈ Cu(X) le sont. On étend également de façon évidente aux Q∗ -squelettes la notion de σ-compagnons. On définit enfin, toujours de façon évidente, la somme directe de deux squelettes et on dit qu’un squelette est irréductible s’il ne peut s’écrire comme somme directe de deux squelettes non nuls. 4.1.3. — On dira qu’un Q-squelette C est modéré si les CC , C ∈ Cu(X) le sont. On définit l’image inverse f ∗ C (ou C | ) d’un Q-squelette C par un k-morphisme f : Y → X Y par (f ∗ C )(C,φ) = C(C,f ◦φ) , (C, φ) ∈ Cu(Y ) et on dira que f : Y → X modère C si f ∗ C est modéré.

4.2. Squelettes géométriques 4.2.1. — Par définition, tout Q-coefficient provient par extension des scalaires d’une extension finie de Q∗ dans Q. Dans le cas ∗ = `, cette propriété est automatiquement vérifiée par les Q-squelettes dont le corps des traces est une extension finie de Q` . C’est un cas particulier du lemme galoisien suivant, pas tout à fait formel puisqu’il utilise la structure du groupe de Brauer d’un corps `-adique. lemme ([24, Lem. 2.7]). — Soit K un corps complet pour une valuation discrète de corps résiduel quasi-fini et K 0 une sous-K-extension finie d’une clôture algébrique K de K. Soit Γ un groupe opérant de façon semisimple sur un K-espace vectoriel V de dimension r et dont les traces sont contenues dans K. Si r!|[K 0 : K] la Γ-représentation V est définie sur K 0 .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

198

A. CADORET

4.2.2. — On rappelle (théorème 2.10) que si ∗ 6= p (resp. ∗ = p) tout Q∗ -coefficient sur X est modéré par un revêtement étale connexe (resp. une altération génériquement étale). Dans le cas ∗ = `, la description galoisienne nous dit même que si Q est une extension finie de Q` et λ une uniformisante de Q, pour tout Q-coefficient étale C sur X il existe une famille de revêtements galoisiens Xn → X, n ≥ 1 (les revêtements étale trivialisant H /λn pour H comme dans la preuve du théorème 2.10) tels que (4.2.2.1)

Pour tout x ∈ |Xn |, χx (C , T ) ≡ (1 − T )r [λn ], n ≥ 1 ;

(4.2.2.2) π1 (X)/Π est un groupe virtuellement pro-`, topologiquement de type T fini, où Π := n≥1 π1 (Xn ). 4.2.3. — On dira qu’un Q-squelette C est quasi-modéré si (3) il existe une altération qmod génériquement étale X 0 → X qui modère C et on notera SQ,r (X) ⊂ SQ,r (X) le sous-ensemble correspondant. L’application de restriction canonique Sq : CQ,r (X) → qmod SQ,r (X) se factorise via Sq : CQ,r (X) → SQ,r (X). Si ∗ = ` on dira qu’un Q-squelette lisse est géométrique s’il vérifie (4.2.2.1), (4.2.2.2) ‹g´eom (X) ⊂ S qmod (X) le pour une extension finie Qλ de Q` dans Q et on notera S Q,r Q,r sous-ensemble correspondant. L’application de restriction canonique Sq : e CQ,r (X) → g´ eom ‹ e ‹ SQ,r (X) se factorise via Sq : CQ,r (X) → S (X). Q,r

L’invariance du conducteur de Swan par passage au compagnon dans le corollaire 3.6 montre que le σ-compagnon d’un Q∗ -squelette quasi-modéré est encore quasi-modéré.

5. FINITUDE DU CORPS DES TRACES Soit X une k-variété normale. Théorème 5.1 (Deligne ; [19, Thm. 3.1]). — Soit C un Q` -squelette quasi-modéré de rang r sur X. Si C est algébrique, QC est une extension finie de Q. Puisque tout C ∈ IQ∗ ,r (X) est automatiquement algébrique et p0 -unitaire (corollaire 3.8) (donc, si ∗ = p, admet des compagnons squelettiques `-adiques quasi-modérés), ceci établit l’énoncé de finitude 1.1 (b). (3)

On notera que si l’image inverse d’un revêtement étale par une immersion fermée est encore un revêtement étale, ce n’est pas vraie pour une altŕation génériquement étale. Il serait donc plus naturel de demander que pour tout sous-schéma Y ⊂ X il existe une altération génériquement étale Y 0 → Y qui modère C | ; cependant la définition plus faible de Q-squelette quasi-modéré utilisée ici est Y suffisante pour montrer l’existence de compagnons `-adiques laquelle, comme on l’a déjà mentionné, implique a posteriori que tout Qp -F-isocristal surconvergent est modéré par un revêtement étale.

ASTÉRISQUE 422

(1155)

LA CONJECTURE DES COMPAGNONS

199

Pour N ≥ 1, notons Q≤N ⊂ QC la sous-Q-extension engendrée par les trx (C ) := C tr(ϕx |Cx ), x ∈ X(kn ), n ≤ N . 5.1. Complexité Si X est une k-courbe lisse, on note b(X) := dimHc1 (X, Q` ) (la formule des traces assure que b(X) ne dépend pas de `(6= p)). Soit C ∈ CQ` ,r (X). D’après le théorème 4.2.2, il existe un revêtement étale connexe X 0 → X qui modère C . Notons b(C ) := min{b(X 0 ) | X 0 → X revêtement étale modérant C }, auquel on pensera comme à une mesure de la ‘complexité’ de C . 5.2. Version effective de l’énoncé de finitude 1.1 (b) On suppose ici que X est une k-courbe affine, lisse, géométriquement connexe. La première partie de la preuve consiste à rendre effectif 1.1 (b) pour X. ≤N (C )

Théorème 5.2. — Pour tout C ∈ CQ` ,r (X) algébrique QC

= QC avec

N (C ) = O log+ |k| (b(C )), où log+ |k| est la fonction sup{0, log|k| } et les constantes dans O ne dépendent que de r. 5.2.1. — Soit C ∈ CQ` ,r (X) et f : X 0 → X un revêtement étale qui modère C . f∗

trf

La composée Hc1 (X, C ) → Hc1 (X 0 , C ) → Hc1 (X, C ) est la multiplication par le degré de f : X 0 → X donc f ∗ : Hc1 (X, C ) → Hc1 (X 0 , C ) est injective et d’après le théorème 2.9 dimHc1 (X, C ) ≤ rb(X 0 ). D’où dimHc1 (X, C ) ≤ rb(C ). 5.2.2. — Soit F , G ∈ CQ` ,r (X). Notons 2 N0 := N0 (F , G ) := 2 log+ |k| (r b(F ⊕ G )), N := N (F , G ) := bN0 c + 2r,

où b−c est la fonction partie entière. Proposition 5.3. — Si tr(ϕx , Fx ) = tr(ϕx , Gx ), x ∈ X(kn ), n ≤ N alors F ' G . Démonstration. — On rappelle que pour n ≥ 1 on a noté pn : Xkn → X la projection canonique. Notons également prn : Xkn → Spec(kn ) le morphisme structural. D’après le lemme 2.3 on a M M F = pn(a)∗ (Sa ⊗ pr∗n(a) La ), G = pn(a)∗ (Sa ⊗ pr∗n(a) La0 ), a∈A

a∈A

où, pour tout a ∈ A, – Sa est un Q` -faisceau lisse, de rang ra , irréductible et de déterminant fini sur Xkn(a) ;

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

200

A. CADORET

– si on note Sai le translaté de Sa par ϕi , les Sai | , i = 1, . . . , n(a) sont des X k

Q` -faisceaux lisses irréductibles sur Xk deux à deux non isomorphes ; – La , La0 sont des Q` -faisceaux de Weil lisses irréductibles sur Spec(kn(a) ) et l’un au moins est non nul. Il suffit donc de montrer que La = La0 , a ∈ A. Puisque Sai | est un facteur direct de F | ou de G | Xk

Xk

Xk

, on a b(Sai ⊕ Saj ) ≤ b(F ⊕ G ).

On note A(n) l’ensemble des a ∈ A tels que n(a)|n. Lemme 5.4. — Si n > N0 , les fonctions t(a,i) : X(kn ) → Q` i x → tr(ϕx , Sa,x ) =: trx (Sai ),

i = 1, . . . , n(a), a ∈ A(n), sont linéairement indépendantes sur Q` . Démonstration. — D’après le corollaire 3.6, les fonctions t(a,i) sont à valeurs dans ˜ et montrons un corps de nombres Q ⊂ Q` . Fixons un isomorphisme ι : Q` →C que les t(a,i) := ιt(a,i) , i = 1, . . . , n(a), a ∈ A(n) sont « presque orthogonales » dans L2 (X(kn ), C). Toujours d’après le corollaire 3.6, Sai est ι-pure de poids 0 donc la conjuguée complexe de t(a,i) est la fonction associée au faisceau dual de Sai et X X ht(a,i) , t(b,j) i = trx (Hom(Sbj , Sai )) = (−1)u tr(ϕn |Hcu (X, Hom(Sbj , Sai )), u≥0

x∈X(kn )

où la seconde égalité est la formule des traces. On a – Hc0 (X, Hom(Sbj , Sai )) = 0 puisque X est affine ; n – les valeurs propres de ϕn sur Hc1 (X, Hom(Sbj , Sai )) sont de module ≤ |k| 2 puisque Hom(Sbj , Sai ) est ι-pur de poids 0 [16, Thm. (3.2.1)] ; – par dualité de Poincaré, Hc2 (X, Hom(Sbj , Sai )) ' Hom(Sai | , Sbj | )∨ (−1). Xk

n

D’où : ht(a,i) , t(b,j) i = δ(a,i),(b,j) |k| + C(a,i),(b,j) |k| |C(a,i),(b,j) | ≤

n 2

Xk

avec, en utilisant 5.2.1,

dimHc1 (X, Hom(Sbj , Sai ))

≤ ra rb b(Sai ⊕ Sbj ).

Supposons maintenant qu’il existe une relation de dépendance linéaire P (b,j) λ(b,j) t(b,j) = 0 et soit a, i tels que |λ(a,i) | est maximal parmi les |λ(b,j) |. Quitte à diviser par λ(a,i) , on peut supposer que λ(a,i) = 1 et |λ(b,j) | ≤ 1. On a alors X 0= λ(b,j) ht(a,i) , t(b,j) i = |k|n + R (b,j)

avec n

|R| ≤ |k| 2

P

(b,j)

|λ(b,j) ||C(a,i),(b,j) |

n

≤ |k| 2 ( n 2

P

(b,j)

|λ(b,j) |ra rb b(Sai ⊕ Sbj ))

≤ |k| r2 b(F ⊕ G ).

ASTÉRISQUE 422

(1155)

LA CONJECTURE DES COMPAGNONS

201

En particulier, |R| < |k|n dès que n > N0 . Donc, si pour n > N0 X X tr(ϕn |La )t(a,i) (x) = trx (F ) = trx (G ) = tr(ϕn |La0 )t(a,i) (x), x ∈ X(kn ), (a,i)

(a,i) n

n

|La0 ),

on a nécessairement tr(ϕ |La ) = tr(ϕ a ∈ A(n). Fixons a ∈ A. Il y a au moins b2r/n(a)c entiers n tels que bN0 c + 1 ≤ n ≤ N = bN0 c + 2r et n(a)|n i. e. a ∈ A(n). Notons Λa l’ensemble des valeurs propres de ϕn(a) agissant sur La ⊕ La0 et, pour λ ∈ Λa , notons mλ , m0λ sa multiplicité dans La , La0 . On a donc, en posant P M := bN0 /n(a)c + 1, λ∈Λa (mλ − m0λ )λn = 0, n = M, . . . , M + b2r/n(a)c alors r c. Donc, par Vandermonde, que |Λa | ≤ b2r/n(a)c puisque La , La0 sont de rang ≤ b n(a) 0 mλ = mλ , λ ∈ Λa . 5.2.3. Fin de la démonstration. — Soit E une extension galoisienne de Q contenant QC . Pour σ ∈ Gal(E/Q≤N ), notons encore σ ∈ Gal(Q` /Q≤N ) un prolongement de σ. C C 1 D’après le corollaire 2.8.(b).(ii), d´et(1 − ϕT |Hc (X, C )) = d´et(1 − ϕT |Hc1 (X, σ C )). Donc N0 := N0 (C ) := N0 (C , σ C ), N := N (C ) := N (C , σ C ) ne dépendent que de C et pas de σ. Par définition, σtrx (C ) = trx (σ C ), x ∈ |X| donc en particulier, trx (C ) = σtrx (C ) = trx (σ C ), x ∈ X(kn ), n ≤ N . D’après la proposition 5.2.2 on en déduit C ' σ C donc σtrx (C ) = trx (σ C ) = trx (C ), x ∈ |X|. 5.3. Preuve du théorème 5.1 En raisonnant par induction sur la dimension de X, on se ramène à prouver le théorème 5.1 pour un ouvert non vide U ⊂ X. On peut donc supposer que X est une k-variété irréductible, affine, lisse munie d’un morphisme étale p : X → Adk génériquement de degré δ, et qu’il existe un revêtement étale connexe f : X 0 → X qui modère C ; en particulier, avec les notations de 5.2.2, b(CC 0 ) ≤ rb(C 0 ), C 0 ∈ Cu(X 0 ). L’objectif est de montrer qu’il existe un entier N ≥ 1 ne dépendant que de r, p et f tel que pour tout n > N et x ∈ X(kn ), trx (C ) ∈ Q≤n−1 . À cette fin, C Deligne attache à chaque x ∈ X(kn ) une courbe C x → X ∈ Cu(X) et un point c ∈ C x (kn ) au dessus de x tels que b(CC x ) = O(nD ), où les constantes dans O et l’entier D ne dépendent que de p et f . Il existe donc un N explicite ne dépendant que de r, p et f tel que n > N (CC x ) si n ≥ N , et ceci pour tout x ∈ X(kn ). ≤N (C x ) D’après le théorème 5.2, trx (C ) := tr(ϕx , Cx ) est donc dans QC ⊂ QC≤n−1 et une |C x récurrence immédiate donne Q = Q≤N . Pour construire les courbes C x en controlant C la complexité des CC x , Deligne utilise un cas particulier d’un théorème de BombieriKatz qui donne une majoration effective de b(C) lorsque C est une courbe affine, lisse (mais non nécessairement connexe) sur k en fonction du degré et du nombre

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

202

A. CADORET

d’équations définissant un plongement affine C ,→ AkN . Le théorème de BombieriKatz repose entre autres sur des arguments p-adiques de Dwork (et [16]). Fixons x ∈ X(kn ). 5.3.1. Construction Lemme 5.5. — Il existe un k-morphisme ψ : A1k → Adk défini par des polynômes ψ1 , . . . , ψd de degré ≤ n − 1 et un point y ∈ A1k (kn ) tels que ψ(y) = p(x). Démonstration. — Fixons un générateur de l’extension kn /k, que l’on voit comme un kn -point y de A1k . Notons p(x)1 , . . . , p(x)d les coordonnées de p(x). On peut prendre X Y (T − τ (y)) ψi := σ(p(x)i ) , i = 1, . . . , d. (σ(y) − τ (y)) τ 6=σ

σ∈Gal(kn /k)

Notons C0x la composante connexe de X ×Adk A1k contenant (x, y) et kdx son corps des constantes. Comme C0x possède un kn -point et que C0x → A1k est étale génériquement de degré ≤ δ, dx est ≤ d et divise n. Notons C x (resp. X x ) la composante connexe de C0x ×k kdx (resp. X ×k kdx ) contenant (x, y) (resp. contenant x). La courbe C x ainsi construite est lisse, géométriquement irréductible sur kdx . Notons enfin C x0 une composante connexe de Ckx ×X x Xk0 . On va pouvoir appliquer les résultats de 5.2.2 k à CC x en utilisant le revêtement ψ : C x0 → Ckx qui modère CC x . 5.3.2. Estimation de b(C x0 ) Théorème 5.6 (Bombieri, Katz [8], [41, Cor. of Thm. 1]). — Soit K un corps algébriquement clos et V ,→ AtK un sous-schéma fermé défini par A équations polynomiales F1 , . . . , FA de degré ≤ D. On a X σc (V ) := dimHcu (V, Q` ) = O(2A (AD)t+1 ). u≥0

Esquisse de démonstration. — Bombieri, en utilisant des méthodes p-adiques de Dwork [25] et la théorie des poids de Deligne via [16, (3.3.4)] montre que |χc (V )| = O((4D)t+A ). Katz en déduit par dévissage l’estimation de l’énoncé. P Notons σ(V ) := u≥0 dimH u (V, Q` ). En utilisant la suite exacte d’excision pour la t cohomologie à support compact et σc (AN K ) = 1, on obtient σc (V ) ≤ σc (AK \ V ) = t σ(AK \ V ), où l’égalité de droite résulte de la dualité de Poincaré puisque AtK \ V est lisse. Par la suite spectrale de Mayer-Vietoris pour le recouvrement de AtK \ V par les ouverts Ui := AtK [Fi−1 ], i = 1, . . . , A, X X σ(AtK \ V ) ≤ σ(Ui1 ∩ · · · ∩ Uij ) 1≤j≤A 1≤i1 0 and every finite subset F ⊂ G there are vectors η1 , . . . , ηn ∈ Hρ such that ∀g ∈ F :

n X hπ(g)ξ, ξi − hρ(g)ηi , ηi i < ε. i=1

— We say that π and ρ are weakly equivalent and write π ∼ ρ, if π ≺ ρ and ρ ≺ π. — We say that π is weakly regular if π ≺ λ. Theorem 28 ([16, Theorem 1.2]). — A group G is C∗ -simple if and only if every weakly regular unitary representation of G is weakly equivalent to its regular representation. The main link between dynamics and representation theory is made by the Koopman representation. We will not need any theory about Koopman representations, but want to point out for the expert that since we study boundary actions in the sense of Definition 20, we typically consider non-singular actions which are not preserving any probability measure. Recall that an action on a non-trivial σ-finite measure space G y (X, ν) is called non-singular if ν is quasi-invariant, that is gν ∼ ν for all g ∈ G. Definition 29. — Let (X, ν) be a non-singular G-space. Then the associated Koopman representation κ of G is the unique unitary representation on L2 (X, ν), which satisfies the following formula for all f ∈ C(X), x ∈ X and g ∈ G and for chosen representatives of the Radon-Nikodym derivatives.  dgµ 1/2 κ(g)f (x) = f (g −1 x) (x). dµ

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

238

S. RAUM

The crucial ingredient for the approach presented here is the following property of G-boundaries singled out by Breuillard-Kalantar-Kennedy-Ozawa. Lemma 30 ([6, Lemma 3.7]). — Let G be a non-trivial group and X a G-boundary. Then for every non-empty open subset U ⊂ X and ε > 0, there is a finite subset F ⊂ G\{e} such that for every probability measure µ on ∂F G, there is t ∈ F satisfying µ(tU ) > 1 − ε. Recall that a compact G-space X is topological free, if the fixed points in X of every non-trivial group element in G are nowhere dense. Equivalently, for every finite subset F ⊂ G and every non-empty open subset U ⊂ X there is a non-empty open subset V ⊂ U such that the sets gV for g ∈ F are pairwise disjoint. The next theorem clarifies how topological freeness translates to a property of the Koopman representation of a boundary. Its proof essentially follows the same lines as [6, Proposition 3.5], although its statement looks different. Theorem 31. — Let X be a G-boundary and κ the Koopman representation associated to some quasi-invariant measure on X. Then the following statements are equivalent. 1. X is topologically free. 2. For any unitary representation of G satisfying π ≺ κ, we have λ ≺ π. 3. λ ≺ κ. Proof. — It is clear that 2. implies 3.. Let us first assume 1. and show 2.. Let π be a unitary representation of G satisfying π ≺ κ. We have to show that λ ≺ π. Let F ⊂ G be a finite subset and ε > 0. It suffices to find a vector ξ ∈ Hπ such that ∀g ∈ F :

|δe,g − hπ(g)ξ, ξii| < 3ε,

where δe,g denotes Kronecker’s delta. Let U ⊂ X be an open subset such that gU ∩ U = ∅ for all g ∈ F \ {e}. Let E ⊂ G be a finite subset such that for every probability measure µ on X there is some t ∈ E such that µ(tU ) > 1 − ε2 (cf. Lemma 30). Let ξ0 ∈ Hπ be a unit vector. Denote by ν the quasi-invariant measure with respect to which κ is constructed. Since π ≺ κ, there are η1 , . . . , ηn ∈ L2 (X, ν) such that ∀g ∈

[

tF t−1 :

n X hπ(g)ξ0 , ξ0 i − hκ(g)ηi , ηi i < ε. i=1

t∈E

Pn

Pn Without loss of generality, we may assume that i=1 kηi k22 = 1. Then dµ = i=1 |ηi |2 dν defines a probability measure on X and there is t ∈ E such that µ(tU ) > 1 − ε2 . For all g ∈ F \ {e} the fact that gU ∩ U = ∅ implies hκ(t)κ(g)κ(t)∗ 1tU ηi , 1tU ηi i = hκ(g)1U κ(t)∗ ηi , 1U κ(t)∗ ηi i = 0.

ASTÉRISQUE 422

(1156)

C∗ -SIMPLICITY

239

Further for g ∈ F \ {e}, the Cauchy-Schwarz inequality shows that ! n n X X 2 hκ(t)κ(g)κ(t)∗ ηi , 1tU c ηi i ≤ kηi k22 µ(tU c ) < ε2 , i=1

i=1

and similarly n n X X hκ(t)κ(g)κ(t)∗ 1tU c ηi , 1tU ηi i 2 ≤ µ(tU c ) k1tU ηi k22 i=1

! < ε2 .

i=1 ∗

We put ξ = π(t) ξ0 and obtain for g ∈ F \ {e} n n X X |hπ(g)ξ, ξi| ≤ hπ(tgt−1 )ξ0 , ξ0 i − hκ(tgt−1 )ηi , ηi i + hκ(tgt−1 )ηi , ηi i < 3ε, i=1

i=1

while |hπ(e)ξ, ξi| = kξk2 = 1 holds. This shows λ ≺ π and thus proves 2.. Let us now assume 3. and prove 1.. In other words, assuming λ ≺ κ, we will show that G y X is topologically free. Take g ∈ G that admits a non-trivial open subset U ⊂ FixX (g). We have to show that g is trivial. To this end let, t1 , . . . , tk ∈ G be elements such that for every probability measure µ ∈ P (X) there −1 is some t ∈ {t1 , . . . , tk } satisfying µ(tU ) > 8/9. Put F = {t1 gt−1 1 , . . . , tk gtk } ∪ {e} and let ξ1 , . . . , ξn ∈ L2 (X) be such that n X 1 ∀f ∈ F : hδe,f − hκ(f )ξi , ξi i < . 3 i=1

Pn 2 Without loss of generality we may assume that i=1 kξi k2 = 1. Then dµ = Pn 2 i=1 |ξi | dν defines a probability measure µ ∈ P (X), where ν denotes the quasiinvariant measure from which κ is constructed. Let t ∈ {t1 , . . . , tk } be such that µ(tU ) > 8/9. Then the fact that U ⊂ FixX (g) implies n n X X hκ(t)κ(g)κ(t)∗ ξi , ξi i = hκ(t)κ(g)κ(t)∗ (1tU + 1tU c )ξi , ξi i i=1

i=1

n X = µ(tU ) + hκ(t)κ(g)κ(t)∗ 1tU c ξi , ξi i i=1



8 − 9

n X

kκ(g)κ(t)∗ 1tU c ξi k22

i=1

n 1/2 X

kκ(t)∗ ξi k22

1/2

i=1

8 1 ≥ − . 9 3 Since t−1 gt ∈ F , this implies t−1 gt = e and hence g = e.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

240

S. RAUM

We can now provide a purely dynamical proof of [37, Theorem 1.5] and [6, Theorem 3.1], respectively. The formulation we adopt for the following theorem appeared already as [6, Proposition 7.6]. It is interesting that at no point in the proof do we have to refer to operator algebraic notions, and instead work directly with the characterisation of C∗ -simplicity provided by Theorem 28. An easy but slightly technical variation of Theorem 31 allows for a proof of the following result for arbitrary discrete groups. Theorem 32. — Let G be a group and X a G-boundary with some amenable point stabilizer. Then G is C∗ -simple if and only if X is topologically free. Proof for countable groups. — Assume that X is topologically free and denote by κ the Koopman representation of X with respect to some quasi-invariant measure, which exists by countability of G. Then λ ≺ κ by Theorem 31 so that π ≺ λ implies π ≺ κ. Another application of Theorem 31 shows that λ ≺ π. This proves C∗ -simplicity of G. Assume now that G is C∗ -simple and take x ∈ X with amenable stabilizer. Since Gx is amenable, it follows that λG/Gx ≺ λ (see e.g., Theorem G.3.2., Theorem F.3.5 and Example E.1.8 (ii) in [5]). So C∗ -simplicity implies λ ∼ λG/Gx . Further λG/Gx ≺ κ by approximation of matrix coefficients. This implies topological freeness of X by Theorem 31. Pointing out the limits of the operator algebra free approach presented in this section, we are not aware of a proof for the following statement that does not use operator algebraic techniques. Theorem 33 ([6, Proposition 7.8]). — Assume that G is a discrete group with a G-boundary X such that there is x ∈ X with Gx being C∗ -simple. Then G is C∗ -simple.

3. THE UNIQUE TRACE PROPERTY Recall that a group G has the unique trace property, if C∗red (G) has a unique tracial state. Note that the formula τ (ug ) = δg,e defines at least one such tracial state. In this section we provide a proof that G has the unique trace property if and only if its amenable radical R(G) is trivial, following the presentation of [6]. Drawing the analogy with Section 2, we also point out a representation theoretic characterisation of the unique trace property and ask for a proof relating this to triviality of the amenable radical without passing through operator algebras. Theorem 34 ([6, Theorem 4.1]). — Every tracial state on C∗red (G) factors through the natural conditional expectation E : C∗red (G) → C∗red (R(G)), which satisfies

ASTÉRISQUE 422

(1156)

C∗ -SIMPLICITY

241

E(ug ) = 1R(G) (g)ug for all g ∈ G. In particular, the following statements are equivalent for a group G. — G has the unique trace property. — The amenable radical of G is trivial. Proof. — Let ϕ be some tracial state, which we can consider as a unital completely positive G-map ϕ : C∗red (G) → C(∂F G). Denote by ϕ˜ : C(∂F G) ored G → C(∂F G) some G-unital completely positive extension, which exists by G-injectivity of C(∂F G) as verified in Proposition 26. Restricting ϕ˜ to C(∂F G) we obtain a unital completely positive G-equivariant endomorphism which must equal the identity map by rigidity of C(∂F G) shown in Corollary 22. The theory of multiplicative domains [7, Proposition 1.5.7] then shows that ϕ˜ is C(∂F G)-bimodular. So we obtain for arbitrary f ∈ C(∂F G) and g ∈ G that ϕ(ug )f = ϕ(u ˜ g )f = ϕ(u ˜ g f ) = ϕ(f ˜ (g −1 ·)ug ) = ϕ(ug )f (g −1 ·). We can now invoke Furman’s Proposition 18 saying that the kernel of the action G y ∂F G is the amenable radical of G. So for g ∈ G\R(G) there is some x ∈ ∂F G satisfying gx 6= x. Taking f ∈ C(∂F G) some function such that f (x) = 1 and f (g −1 x) = 0, then ϕ(ug ) = ϕ(ug )f (x) = ϕ(ug )f (g −1 x) = 0 follows. This shows that ϕ = ϕ ◦ E. In particular, if the amenable radical of G is trivial, it has the unique trace property. Assume now that G has the unique trace property. Denote by R the amenable radical of G. Since R is amenable we obtain a well-defined ∗-homomorphism  : C∗red (R) → C satisfying (ug ) = 1 for all g ∈ R. Note that  is a trace on C∗red (R). Since R is normal, the composition  ◦ E with the natural conditional expectation remains tracial. By the unique trace property we find τ = ◦E and hence R = {e}. The following folklore representation theoretic characterisation of the unique trace property provides an analogue of Fell’s Theorem 28. It would be interesting to find a proof of Theorem 34 that directly relates this characterisation to triviality of the amenable radical. Recall that two unitary representations π1 , π2 of a group G are quasi-equivalent if there is a cardinal κ such that π1⊕κ ∼ = π2⊕κ . Further, we call a representation finite if it is generated by tracial vectors, that is vectors ξ whose matrix coefficient h·ξ, ξi defines a conjugation invariant function on G. Note that every finite dimensional representation is finite, but that the latter class is larger, containing the left-regular representation in particular. In the proof of the next proposition we are going to employ the GNS-representation associated with a state on a C∗ -algebra, which is explained in [45, Sections 3.4 and 5.1]. It is noteworthy that the GNS-representation of the natural trace on C∗red (G) is unitary equivalent with the left-regular representation of a discrete group G.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

242

S. RAUM

Proposition 35. — The following statements are equivalent for a group G. 1. G has the unique trace property. 2. Every finite, weakly regular unitary representation is quasi-equivalent to λ. Proof. — Assume that C∗red (G) has a unique trace. Let π ≺ λ be a finite unitary representation. We may assume without loss of generality that π is cyclic with tracial cyclic unit vector ξ. By linearity and continuity, the state a 7→ haξ, ξi on C∗π (G) is tracial. Since π ≺ λ, there is a ∗-homomorphism C∗red (G) → C∗π (G) and we thus obtain a tracial state ϕξ on C∗red (G). Then ϕξ = τ by the unique trace property. Applying the GNS-theorem, we find that π ∼ = πϕξ = πτ ∼ = λ. Now assume the every finite weakly regular unitary representation is quasiequivalent to λ. We first observe that the group von Neumann algebra of G is a factor and hence has a unique trace. Let ϕ be any tracial state on C∗red (G). Denote by π its GNS-representation, which is quasi-equivalent to λ by our assumption, so that π(C∗red (G))00 ∼ = LG preserving the inclusion of C∗red (G). Since ϕ extends to a trace on the former von Neumann algebra, while the latter has a unique trace, it follows that ϕ = τ .

4. EXTENSIONS AND EXAMPLES OF C∗ -SIMPLE GROUPS An important contribution of [6] was the systematic solution of virtually all open problems on C∗ -simplicity of discrete groups. We do not have anything to add to the elegant proofs presented in [6], which naturally make use of the dynamical characterisation of C∗ -simplicity provided by Theorem 32. The first result to mention solved the longstanding open problem whether the extension of C∗ -simple groups remains C∗ -simple. The answer interestingly is yes. While the proof of [6, Theorem 1.4] constructs a topological free boundary action from the assumptions, we point out that stability of C∗ -simplicity under extensions is a corollary of Theorem 33. Theorem 36 ([6, Theorem 1.4]). — Let G be a group and N E G a normal subgroup. Then G is C∗ -simple if and only if N and ZG (N ) are C∗ -simple. In particular, C∗ -simplicity is closed under extensions. Proof that C∗ -simplicity is closed under extensions. — Let G be a group with C∗ -simple normal subgroup N E G and C∗ -simple quotient Q = G/N . Consider the Furstenberg boundary ∂F Q as a G-space. Since Q is C∗ -simple, its action on ∂F Q is

ASTÉRISQUE 422

(1156)

C∗ -SIMPLICITY

243

free by Theorem 32 and the fact that ∂F Q is extremally disconnected (cf. [6, Proposition 2.4]). So G y ∂F Q is a G-boundary whose point stabilizers are equal to N and hence C∗ -simple. An application of Theorem 33 finishes the proof. In another direction, [6] gave a series of criteria for groups to be C∗ -simple, recovering basically all previously known classes of examples. In view of Problem 1 about the relation between C∗ -simplicity and triviality of the amenable radical, we choose the following form to summarize these results and refer to [6] for more details. Theorem 37 ([6, Theorems 1.5, 1.6 and 1.7]). — A group G with trivial amenable radical is C∗ -simple if one of the following conditions holds. — G is linear. — Bounded cohomology of G does not vanish. — There is at least one non-trivial `2 -Betti number of G. — G has at most countably many amenable subgroups.

5. RECONNECTING TO ORIGINAL IDEAS. WORK OF HAAGERUP AND KENNEDY 5.1. The Dixmier property and Powers averaging A unital C∗ -algebra A is said to have the Dixmier property if for any a ∈ A the convex norm closure of {uau∗ | u ∈ A unitary} intersects the center of A non-trivially. This property was introduced in [12] in the context of von Neumann algebras and it is not difficult to show that a tracial, unital C∗ -algebra with trivial center and the Dixmier property must be simple and has exactly one trace. Vice versa it was shown in [25, Corollaire] (see also [1] for a more recent generalization) that a simple, unital C∗ -algebra with at most one trace has the Dixmier property. For unital C∗ -algebras with trace the only scalar in conv{uau∗ | u ∈ A unitary} can be the value of the trace on a. This allows us to rewrite the Dixmier property as follows: a unital C∗ -algebra A with trace τ and trivial center has the Dixmier property if and only if for every a ∈ A there is a sequence of unitaries (ui )i∈N in U (A) such that n

1 X

ui au∗i − τ (a)1 → 0.

n i=1 With this reformulation in mind, we say that a group G satisfies the Powers averaging property [39, Definition 1.3] if for every element a ∈ C∗red (G) there is a sequence of

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

244

S. RAUM

group elements (gi )i∈N in G such that n

1 X

ugi au∗gi − τ (a)1 → 0.

n i=1 Using the original formulation of the Dixmier property, the last statement is equivalent to the convex norm closure of {ug au∗g | g ∈ G} intersecting the scalars of C∗red (G) non-trivially. Using this terminology, Powers’ achievement was to single out a combinatorial way to ensure the Powers averaging property. After the results of [6], it appears natural to reconnect C∗ -simplicity to this original idea. Both Kennedy and Haagerup approached this problem independently, obtaining essentially equivalent but differently presented results. Note the resemblance with the proof of Theorem 34. Theorem 38 ([39, Theorem 1.4] and [23, Theorem 5.3]). — The following ments are equivalent for a group G with natural trace τ on C∗red (G).

state-

1. G is C∗ -simple. 2. The unique unital completely positive G-map C∗red (G) → C(∂F G) is a 7→ τ (a)1. ∗

3. For every state ϕ ∈ C∗red (G)∗ we have τ ∈ convw {g · ϕ | g ∈ G}. 4. G has Powers averaging property. Proof. — Assume that G is C∗ -simple and let Φ : C∗red (G) → C(∂F G) be any unital completely positive G-map. Since C(∂F G) is G-injective by Proposition 26, it extends to a unital completely positive G-map Ψ : C(∂F G) or G → C(∂F G). Restricting Ψ to C(∂F G) and applying rigidity from Corollary 22, we find that Ψ| = idC(∂F G) . So the theory of multiplicative domains [7, Proposition 1.5.7] C(∂F G)

shows that Ψ is C(∂F G)-bimodular. As in the proof of Theorem 34, we conclude that Φ(ug )f = Φ(ug )f (g −1 ·) for any f ∈ C(∂F G). For every x ∈ ∂F G \ Fix∂F G (g), there is some function f ∈ C(∂F G) such that f (x) = 1 and f (g −1 x) = 0. Hence Φ(ug )(x) = Φ(ug )(x)f (x) = Φ(ug )(x)f (g −1 x) = 0. Since G is C∗ -simple, Theorem 32 says that G y ∂F G is topologically free, meaning that ∂F G \ Fix∂F G (g) is dense in ∂F G. So Φ(ug ) = 0 = τ (ug ). This proves 2.. ∗ Assume 2. and let ϕ ∈ S (C∗red (G)) be a state. Then C = convw {g · ϕ | g ∈ G} is a compact convex G-space, so that it contains a G-boundary B ⊂ C by Proposition 25. Universality of the Furstenberg boundary provides us with a G-equivariant map ∂F G → B, which then translates by Proposition 7 to a unital completely positive G-map Φ : C∗red (G) → C(∂F G). By 2. we have Φ(a) = τ (a)1 for all a ∈ C∗red (G), which translates to B = {τ }, proving 3.. The implication 3. =⇒ 4. is an easy application of the Hahn-Banach separation theorem, while the implication 4. =⇒ 1. follows from the discussion about the Dixmier property.

ASTÉRISQUE 422

(1156)

C∗ -SIMPLICITY

245

Note that the last result can be interpreted as saying that any non-trivial boundary action in the state space of the reduced group C∗ -algebra already witnesses failure of C∗ -simplicity. Let us mention the following characterisation of triviality of the amenable radical, highlighting the subtle difference to C∗ -simplicity. Theorem 39 ([23, Theorem 5.2 (iv)]). — A discrete group G has trivial amenable radical if and only if for every h ∈ G we have that conv{ug uh u∗g | g ∈ G} intersects the scalars. 5.2. The amenable radical While [6] showed that a group with trivial amenable radical has the unique trace property, Le Boudec showed in [42] that C∗ -simplicity cannot be concluded in general, as there are examples of groups with trivial amenable radical that are not C∗ -simple. It thus became natural to investigate to which extent the long hoped for equivalence between C∗ -simplicity and the triviality of the amenable radical could be saved. This was achieved by Kennedy in [39] replacing normal subgroups by the appropriate dynamical notion, so called uniformly recurrent subgroups introduced by GlasnerWeiss in [21]. Definition 40 ([21, Defintion 0.1]). — Let G be a group. — The Chabauty space S (G) is the compact G-space obtained from the set of all subgroups of G equipped with the topology inherited from the power set 2G and the action of G by conjugation. — A minimal G-invariant closed subset of S (G) is called a uniformly recurrent subgroup of G. — A uniformly recurrent subgroup of G is amenable if all its elements are amenable. The topology of the Chabauty space S (G) can be characterized by convergence of nets: a net of subgroups (Hi )i∈I converges to H, if for every g ∈ G we have g ∈ Hi ultimately if and only if g ∈ H. Let us state an observation, providing a dynamical replacement of the amenable radical. Lemma 41 (Cf. [39, Proposition 3.2 and Theorem 4.1]). — For any discrete group G, the G-set {Gx | x ∈ ∂F G} ⊂ S (G) is an amenable uniformly recurrent subgroup of G.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

246

S. RAUM

Proof. — Consider the map ∂F G → S (G) : x 7→ Gx . It is G-equivariant and continuous since for every g ∈ G the set FixX (g) is clopen, thanks to the fact that ∂F G is extremally disconnected. The image of a minimal compact G-space under a continuous map has the same properties, so it follows that {Gx | x ∈ ∂F G} is a uniformly recurrent subgroup. The uniformly recurrent subgroup defined in the previous statement is called the Furstenberg URS of G. It is the dynamical analogue of the amenable radical. Theorem 42 ([39, Theorem 1.2]). — For a group G the following statements are equivalent. — G is C∗ -simple. — G has no non-trivial amenable uniform recurrent subgroups. — The Furstenberg URS of G is trivial. If the amenable radical is the maximal amenable normal subgroup, one might wonder how the Furstenberg uniformly recurrent subgroup can be characterized in an algebraic way. In this direction, the proof of Theorem 6.2 in [6] and work of Kennedy [39, Section 5] can be interesting starting points.

6. DEVELOPMENTS FOLLOWING BREUILLARD-KALANTAR-KENNEDY-OZAWA The presented work on C∗ -simplicity gave rise to a wave of results on simplicity or more generally the ideal structure of C∗ -algebras associated with groups. In this section we intend to give a concise overview of these developments pointing out current and future directions of research. Above all, it should be noted that the methods developed in [37] and [6] are of equal importance as the results. C∗ -simplicity of non-discrete groups Already in [29, page 232, Conjecture] speculations about the existence of nondiscrete C∗ -simple groups were raised and the problem to find one was expressed in [30, Question 5]. This question was made more precise in [8, Problem 8.1], asking to characterize C∗ -simple groups “in terms of [their] Furstenberg boundary”. While candidates for non-discrete C∗ -simple groups considered in [29, Conjecture, page 232] are not C∗ -simple due to the fact that every C∗ -simple group must be totally disconnected [51, Theorem A], Suzuki provided in [55] some examples of non-discrete C∗ -simple groups, whose construction is based on elementary considerations only using Powers’ original work [49]. It is to be noted that it is currently unclear whether or

ASTÉRISQUE 422

(1156)

C∗ -SIMPLICITY

247

not the examples of non-discrete C∗ -simple groups provided in [51, Theorem B] are actually valid in full generality, owing to a gap in Lemma 5.1 pointed out by Suzuki. The natural generalization of the unique trace property for non-discrete groups asks whether the reduced group C∗ -algebra of a unimodular locally compact group admits the Plancherel trace as its unique (unbounded) trace up to scaling. Suzuki’s examples do have this property. In another direction, [17] investigated which reduced group C∗ -algebras admit bounded traces, and [40] solved this problem completely stating that C∗red (G) admits a tracial state if and only if the amenable radical of G is open. Ideal structure of crossed products In [32], de la Harpe and Skandalis showed that if G is a Powers group, and A is a G-C∗ -algebra that does not admit any non-trivial G-invariant ideals, then the crossed product C∗ -algebra Aored G is simple. Clearly the condition on A (called G-simplicity) is necessary. The condition on G can be weakend to C∗ -simplicity as [6, Theorem 7.1] shows. Methods developed in the setting of C∗ -simplicity, notably from [39], do not stop to apply here, and results on the ideal structure of crossed products by notnecessarily C∗ -simple groups are obtained in [38, 41]. See also [15, Section 6.3]. Characterisations of C∗ -simplicity through stationary traces In Section 5.2 it was shown that the gap between uniqueness of a trace and C∗ -simplicity can be overcome by a uniqueness result for unital completely positive G-maps into the Furstenberg boundary. In another direcrtion [33] investigated the possibility to relax the traciality condition and studied more generally stationary states on group C∗ -algebras to obtain another characterisation of C∗ -simplicity. Twisted group C∗ -algebras Twisted group C∗ -algebras and twisted crossed products play an important role in the understanding of unitary representation theory, being linked through the notion of projective representation [3]. Although they appear in different disguise, the study of their simplicity even predates Powers’ article [53]. Continuing work that had been done in between and possibly inspired by the recent success of C∗ -simplicity, [4] investigates simplicity and the unique trace property for twisted group C∗ -algebras. However, methods and ideas from [37, 6] could not yet be applied, leaving the possibility for further development. Thompson’s groups The question whether Thompson’s group F is amenable or not, is very well-known in the group theory community. Surprisingly, it is possible to exhibit a sharp dichotomy between amenability and C∗ -simplicity in this context: after [24, Theorem 5.5] showed that C∗ -simplicity of Thompson’s group T implies non-amenability of

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

248

S. RAUM

Thompson’s group F, methods from [6] and [39] were applied to groups of homeomorphisms obtaining not only the converse to Haagerup-Olesen, but even the dichotomy that F is either amenable or C∗ -simple [43, Theorem 1.7]. Strong amenability The notion of strong amenability was introduced by Glasner in [20, Section II.3]. Being formulated in terms of proximal actions, it dynamically bears similarity to amenability characterized by triviality of the Furstenberg boundary. Seemingly independent from the developments on C∗ -simplicity, [36] characterized strongly amenable groups as FC-hypercentral groups (those groups that do not have any non-trivial quotient with infinite non-trivial conjugacy classes) and [35] went on to solve the longstanding open problem to characterize finitely generated Choquet-Deny groups, which are by definition those finitely generated groups all of whose Poisson boundaries vanish. The power of dynamical methods and closeness to the operator algebraic setting are stunning similarities to the developments in C∗ -simplicity.

REFERENCES [1] R. Archbold, L. Robert & A. Tikuisis – “The Dixmier property and tracial states for C*-algebras,” J. Funct. Anal. 273 (2017), no. 8, p. 2655–2718. [2] W. B. Arveson – “Subalgebras of C∗ -algebras,” Acta Math. 123 (1969), p. 141– 224. [3] L. Auslander & C. C. Moore – “Unitary representations of solvable Lie groups,” Mem. Am. Math. Soc. 62 (1966), p. 199 pages. [4] E. Bédos & T. Omland – “On reduced twisted group C∗ -algebras that are simple and/or have a unique trace,” J. Noncomm. Geom. 12 (2018), no. 3, p. 947– 996. [5] B. Bekka, P. de la Harpe & A. Valette – Kazhdan’s property (T), New Mathematical Monographs, vol. 11, Cambridge: Univ. Press, 2008. [6] E. Breuillard, M. Kalantar, M. Kennedy & N. Ozawa – “C∗ -simplicity and the unique trace property for discrete groups,” Publ. Math. Inst. Hautes Étud. Sci. 126 (2017), no. 1, p. 35–71.

ASTÉRISQUE 422

(1156)

C∗ -SIMPLICITY

249

[7] N. P. Brown & N. Ozawa – C*-algebras and finite-dimensional approximations, Graduate Studies in Math., vol. 88, Providence, RI: Amer. Math. Soc., 2008. [8] P.-E. Caprace & N. Monod – New directions in locally compact groups, Lond. Math. Soc. Lecture Note Series, vol. 447, Cambridge: Univ. Press, 2018. [9] M. D. Choi & E. G. Effros – “Injectivity and operator spaces,” J. Funct. Anal. 24 (1977), no. 2, p. 156–209. [10] D. Creutz & J. Peterson – “Character rigidity for lattices and commensurators,” preprint arXiv:1311.4513. [11] F. Dahmani, V. Guirardel & D. Osin – Hyperbolically embedded subgroups and rotating families in groups acting on hyperbolic spaces, Mem. Am. Math. Soc., vol. 245, 2017. [12] J. Dixmier – “Les anneaux d’opérateurs de classe finie,” Ann. Sci. Éc. Norm. Supér. 66 (1949), p. 209–261. [13]

, C∗ -algebras, Amsterdam: North-Holland Publishing Company, 1977.

[14] B. Eckmann & A. H. Schopf – “Über injektive Moduln,” Arch. Math. 4 (1953), p. 75–78. [15] G. Elek – “Uniformly recurrent subgroups and simple C∗ -algebras,” J. Funct. Anal. 274 (2018), no. 6, p. 1657–1689. [16] J. M. Fell – “The dual spaces of C∗ -algebras,” Trans. Am. Math. Soc. 94 (1960), no. 3, p. 365–403. [17] B. E. Forrest, N. Spronk & M. Wiersma – “Existence of tracial states on reduced group C∗ -algebras,” preprint arXiv:1706.05354. [18] A. Furman – “On minimal strongly proximal actions of locally compact groups,” Isr. J. of Math. 136 (2003), p. 173–187. [19] H. Furstenberg – “Boundary theory and stochastic processes on homogeneous spaces. Harmonic analysis on homogeneous spaces,” in Proc. Sympos. Pure Math., Vol. XXVI, Williams Coll., Williamstown, Mass., 1972, Providence, RI: Amer. Math. Soc., 1973, p. 193–229. [20] S. Glasner – Proximal flows, Lecture notes in Mathematics, vol. 517, Berlin: Springer, 1976. [21] S. Glasner & B. Weiss – “Uniformly recurrent subgroups,” Contemp. Math. 631 (2015), p. 63–75. [22] A. M. Gleason – “Projective topological spaces,” Ill. J. Math. 2 (1958), p. 482– 489.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

250

S. RAUM

[23] U. Haagerup – “A new look at C∗ -simplicity and the unique trace property of a group,” in Operator Algebras and Applications (T. M. Carlsen, N. S. Larsen, S. Neshveyev & C. Skau, eds.), Abel Symposia, vol. 12, Cham: Springer, 2016, p. 167–176. [24] U. Haagerup & K. K. Olesen – “Non-inner amenability of the Thompson groups T and V,” J. Funct. Anal. 272 (2017), no. 11, p. 4838–4852. [25] U. Haagerup & L. Zsido – “Sur la propriété de Dixmier pour les C*-algèbres,” C. R. Acad. Sci. Paris 298 (1984), no. 8, p. 173–176. [26] M. Hamana – “Injective envelopes of Banach modules,” Tohoku Math. J. 30 (1978), no. 3, p. 439–453. [27]

, “Injective envelopes of C∗ -algebras,” J. Math. Soc. Japan 31 (1979), no. 1, p. 181–197.

[28]

, “Injective envelopes of operator systems,” Publ. Res. Inst. Math. Sci. 15 (1979), no. 3, p. 773–785.

[29] P. de la Harpe – “Reduced C∗ -algebras of discrete groups which are simple with a unique trace,” in Operator algebras and their connections with topology and ergodic theory (Bus,teni, 1983), Lecture Notes in Math., vol. 1132, BerlinHeidelberg-New York: Springer, 1985, p. 230–253. [30]

, “On simplicity of reduced C∗ -algebras of groups,” Bull. Lond. Math. Soc. 39 (2007), p. 1–26.

[31] P. de la Harpe & J.-P. Préaux – “C∗ -simple groups: amalgamated free products, HNN extensions, and fundamental groups of 3-manifolds,” J. Topol. Anal. 3 (2011), no. 4, p. 451–489. [32] P. de la Harpe & G. Skandalis – “Powers’ property and simple C∗ -algebras,” Math. Ann. 273 (1986), no. 2, p. 241–250. [33] Y. Hartman & M. Kalantar – “Stationary C*-dynamical systems,” preprint arXiv:1712.10133. [34] N. A. Ivanov – “On the structure of some reduced amalgamated free product C∗ -algebras,” Internat. J. Math. 22 (2011), no. 2, p. 281–306. [35] F. Joshua, Y. Hartman, O. Tamuz & P. V. Ferdowsi – “Choquet-Deny groups and the infinite conjugacy class property,” Ann. Math. 190 (2019), no. 1, p. 307–320. [36] F. Joshua, O. Tamuz & P. V. Ferdowsi – “Strong amenability and the infinite conjugacy class property,” Invent. math. 218 (2019), no. 3, p. 833–851. [37] M. Kalantar & M. Kennedy – “Boundaries of reduced C∗ -algebras of discrete groups,” J. reine angew. Math. 727 (2017), p. 247–267.

ASTÉRISQUE 422

(1156)

C∗ -SIMPLICITY

251

[38] T. Kawabe – “Uniformly recurrent subgroups and the ideal structure of reduced crossed products,” preprint arXiv:1701.03413. [39] M. Kennedy – “An intrinsic characterization of C∗ -simplicity,” preprint arXiv:1509.01870, to appear in Ann. Sci. Éc. Norm. Supér. [40] M. Kennedy & S. Raum – “Traces on reduced group C∗ -algebras,” Bull. Lond. Math. Soc. 49 (2017), no. 6, p. 988–990. [41] M. Kennedy & C. Schafhauser – “Noncommutative boundaries and the ideal structure of reduced crossed products,” Duke Math. J. 168 (2019), p. 3215–3260. [42] A. Le Boudec – “C∗ -simplicity and the amenable radical,” Invent. math. 209 (2017), p. 159–174. [43] A. Le Boudec & N. Matte Bon – “Subgroup dynamics and C∗ -simplicity of groups of homeomorphisms,” Ann. Sci. Éc. Norm. Supér. 51 (2018), no. 3, p. 557–602. [44] Y. Matsuda, S.-I. Oguni & S. Yamagata – “C∗ -simplicity for groups with non-elementary convergence group actions,” Houston J. Math. 39 (2013), no. 4, p. 1291–1299. [45] G. J. Murphy – C∗ -algebras and operator theory, Boston, MA: Academic Press, 1990. [46] A. Y. Olshanskii & D. Osin – “C∗ -simple groups without free subgroups,” Groups Geom. Dyn. 8 (2014), no. 3, p. 933–983. [47] M. S. Osborne – Locally convex spaces, Graduate Texts in Math., vol. 269, Cham-Heidelberg-New York-Dordrecht-London: Springer, 2014. [48] N. Ozawa – “Lecture on the Furstenberg boundary and C∗ -simplicity,” http: //www.kurims.kyoto-u.ac.jp/~narutaka/notes/yokou2014.pdf, 2014. [49] R. T. Powers – “Simplicity of the C∗ -algebra associated with the free group on two generators,” Duke Math. J. 42 (1975), p. 151–156. [50] T. Poznansky – “Characterization of linear groups whose reduced C∗ -algebras are simple,” preprint arXiv:0812.2486. [51] S. Raum – “C*-simplicity of locally compact Powers groups,” J. reine angew. Math. 748 (2019), p. 173–205. [52] Z. Semadeni – “Spaces of continuous functions on compact sets,” Adv. Math. 1 (1965), no. 3, p. 319–382. [53] J. Slawny – “On factor representations and the C∗ -algebra of canonical commutation relations,” Comm. Math. Phys. 24 (1972), p. 151–170. [54] W. F. Stinespring – “Positive functions on C∗ -algebras,” Proc. Am. Math. Soc. 6 (1955), no. 2, p. 211–216.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

252

S. RAUM

[55] Y. Suzuki – “Elementary constructions of non-discrete C∗ -simple groups,” Proc. Am. Math. Soc. 145 (2017), no. 3, p. 1369–1371.

Sven RAUM Stockholm University Department of Mathematics SE-109 61 Stockholm Sweden E-mail : [email protected]

ASTÉRISQUE 422

Séminaire BOURBAKI 71e année, 2018–2019, no 1157, p. 253 à 290 doi:10.24033/ast.1136

Janvier 2019

BOUNDEDNESS RESULTS FOR SINGULAR FANO VARIETIES, AND APPLICATIONS TO CREMONA GROUPS [following Birkar and Prokhorov-Shramov] by Stefan KEBEKUS

1. MAIN RESULTS Throughout this paper, we work over the field of complex numbers. 1.1. Boundedness of singular Fano varieties A normal, projective variety X is called Fano if a negative multiple of its canonical divisor class is Cartier and if the associated line bundle is ample. Fano varieties appear throughout geometry and have been studied intensely, in many contexts. For the purposes of this talk, we remark that Fanos with sufficiently mild singularities constitute one of the fundamental variety classes in birational geometry. In fact, given any projective manifold X, the Minimal Model Program (MMP) predicts the existence of a sequence of rather special birational transformations, known as “divisorial contractions” and “flips,” as follows, X = X (0)

α(1) birational

/ X (1)

α(2) birational

/ ···

α(n) birational

/ X (n) .

The resulting variety X (n) is either canonically polarized (which is to say that a suitable power of its canonical sheaf is ample), or it has the structure of a fiber space whose general fibers are either Fano or have numerically trivial canonical class. The study of (families of) Fano varieties is thus one of the most fundamental problems in birational geometry. Remark 1.1 (Singularities). — Even though the starting variety X is a manifold by assumption, it is well understood that we cannot expect the varieties X (•) to be (∗) Stefan Kebekus gratefully acknowledges support through a fellowship of the Freiburg Institute of Advanced Studies (FRIAS).

© Astérisque 422, SMF 2020

254

S. KEBEKUS

smooth. Instead, they exhibit mild singularities, known as “terminal” or “canonical”— we refer the reader to [33, Sect. 2.3] or [31, Sect. 2] for a discussion and for references. If X (n) admits the structure of a fiber space, its general fibers will also have terminal or canonical singularities. Even if one is primarily interested in the geometry of manifolds, it is therefore necessary to include families of singular Fanos in the discussion. In a series of two fundamental papers, [6, 8], Birkar confirmed a long-standing conjecture of Alexeev and Borisov-Borisov, [1, 12], asserting that for every d ∈ N, the family of d-dimensional Fano varieties with terminal singularities is bounded: there exists a proper morphism of quasi-projective schemes over the complex numbers, u : X → Y , and for every d-dimensional Fano X with terminal singularities a closed point y ∈ Y such that X is isomorphic to the fiber Xy . In fact, a much more general statement holds true. Theorem 1.2 (Boundedness of ε-lc Fanos, [8, Thm. 1.1]). — Given d ∈ N and ε ∈ R+ , let Xd,ε be the family of projective varieties X with dimension dimC X = d that admit an R-divisor B ∈ R Div(X) such that the following holds true. (1.2.1) The tuple (X, B) forms a pair. In other words: X is normal, the coefficients of B are contained in the interval [0, 1] and KX + B is R-Cartier. (1.2.2) The pair (X, B) is ε-lc. In other words, the total log discrepancy of (X, B) is greater than or equal to ε. (1.2.3) The R-Cartier divisor −(KX + B) is nef and big. Then, the family Xd,ε is bounded. Remark 1.3 (Terminal singularities). — If X has terminal singularities, then (X, 0) is 1-lc. We refer to Section 2.3, to Birkar’s original papers, or to [22, Sect. 3.1] for the relevant definitions concerning more general classes of singularities. For his proof of the boundedness of Fano varieties and for his contributions to the Minimal Model Program, Caucher Birkar was awarded with the Fields Medal at the ICM 2018 in Rio de Janeiro. 1.1.1. Where does boundedness come from?— The brief answer is: “From boundedness of volumes!” In fact, if (Xt , At )t∈T is a family of tuples where the Xt are normal, projective varieties of fixed dimension d and At ∈ Div(Xt ) are very ample, and if there exists a number v ∈ N such that  d! · h0 Xt , OXt (n · At ) vol(At ) := lim sup 0

...

Kawamata log terminal (or “klt”)

alog (X, B) ≥ ε

...

ε-log canonical (or “ε-lc”)

alog (X, B) ≥ 1

...

canonical

alog (X, B) > 1

...

terminal

The total log discrepancy measures how bad the singularities are: the smaller alog (X, B) is, the worse the singularities are. Table 1 lists the classes of singularities will be relevant in the sequel. In addition, (X, B) is called plt if alog (D, X, B) > 0 ‹ → X and every exceptional divisor D on X. ‹ The class of ε-lc for every resolution π : X singularities, which is perhaps the most relevant for our purposes, was introduced by Alexeev. 2.3.1. Places and centers. — The divisors D that appear in the definition log discrepancy deserve special attention, in particular if alog (D, X, B) ≤ 0. Definition 2.8 (Non-klt places and centers). — Let (X, B) a pair. A non-klt place of (X, B) is a prime divisor D on birational models of X such that alog (D, X, B) ≤ 0. A non-klt center is the image on X of a non-klt place. When (X, B) is lc, a non-klt center is also called an lc center. 2.3.2. Thresholds. — Suppose that (X, B) is a klt pair, and that D is an effective divisor on X. The pair (X, B + t · D) will then be log-canonical for sufficiently small numbers t, but cannot be klt when t is large. The critical value of t is called the log-canonical threshold. Definition 2.9 (LC threshold, compare [34, Sect. 9.3.B]). — Let (X, B) be a klt pair. If D ∈ R Div(X) is effective, one defines the lc threshold of D with respect to (X, B) as   lct X, B, D := sup t ∈ R (X, B + t · D) is lc . If ∆ ∈ R Div(X) is R-Cartier with non-empty R-linear system (but not necessarily effective itself ), one defines lc threshold of |∆|R with respect to (X, B) as   lct X, B, |∆|R := inf lct(X, B, D) D ∈ |∆|R . Remark 2.10. — In the setting of Definition 2.9, it is a standard fact that   lct X, B, |∆|R = sup t ∈ R (X, B + t · D) is lc for every D ∈ |∆|R .

ASTÉRISQUE 422

(1157)

BOUNDEDNESS RESULTS FOR SINGULAR FANO VARIETIES

261

In particular, if (X, B) is klt, then (X, B + t0 · D) is lc for every D ∈ |∆_R and every 0 < t0 < t.  Notation 2.11. — If B = 0, we omit it from the notation and write lct X, |∆_R  and lct X, D in short. 2.4. Fano varieties and pairs Fano varieties come in many variants. For the purposes of this overview, the following classes of varieties will be the most relevant. Definition 2.12 (Fano and weak log Fano pairs, [6, Sect. 2.10]) — A projective pair (X, B) is called log Fano if (X, B) is lc and if −(KX + B) is ample. If B = 0, we just say that X is Fano. — A projective pair (X, B) is called is called weak log Fano if (X, B) is lc and −(KX + B) is nef and big. If B = 0, we just say that X is weak Fano. Remark 2.13 (Relative notions). — There exist relative versions of the notions discussed above. If (X, B) is any quasi-projective pair, if Z is normal and if X → Z is surjective, projective and with connected fibers, we say (X, B) is log Fano over Z if it is lc and if −(KX + B) is relatively ample over Z. Ditto with “weak log Fano”. 2.5. Varieties of Fano type Varieties X that admit a boundary B that makes (X, B) a Fano pair are said to be of Fano type. This notion was introduced by Prokhorov and Shokurov in [40]. We refer to that paper for basic properties of varieties of Fano type. Definition 2.14 (Varieties of Fano type, [40, Lem. and Def. 2.6]) A normal, projective variety X is said to be of Fano type if there exists an effective, Q-divisor B such that (X, B) is klt and weak log Fano pair. Equivalently: there exists a big Q-divisor B such that KX + B ∼Q 0 and such that (X, B) is a klt pair. Remark 2.15 (Varieties of Fano type are Mori dream spaces) If X is of Fano type, recall from [9, Sect. 1.3] that X is a “Mori dream space”. Given any R-Cartier divisor D ∈ R Div(X), we can then run the D-Minimal Model Program and obtain a sequence of extremal contractions and flips, X 99K Y . If the push-forward of DY of Y is nef over, we call Y a minimal model for D. Otherwise, there exists a DY -negative extremal contraction Y → T with dim Y > dim T , and we call Y a Mori fiber space for D. Remark 2.16 (Relative notions). — As before, there exists an obvious relative version of the notion “Fano type”. Remark 2.15 generalizes to this relative setting.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

262

S. KEBEKUS

Varieties of Fano type come in two flavors that often need to be treated differently. The following notion, which we recall for later use, has been introduced by Shokurov. Definition 2.17 (Exceptional and non-exceptional pairs). — Let (X, B) be a projective pair, and assume that there exists an effective P ∈ R Div(X) such that KX + B + P ∼R 0. We say (X, B) is non-exceptional if we can choose P so that (X, B + P ) is not klt. We say that (X, B) is exceptional if (X, B + P ) is klt for every choice of P .

3. B-DIVISORS AND GENERALIZED PAIRS In addition to the classical notions for singularities of pairs that we recalled in Section 2.3 above, much of Birkar’s work uses the notion of generalized polarized pairs. The additional flexibility of this notion allows for inductive proofs, but adds substantial technical difficulties. Generalized pairs were introduced by Birkar and Zhang in [10]. Disclaimer. — The notion of generalized polarized pairs features prominently in Birkar’s work, and should be presented in an adequate manner. The technical complications arising from this notion are however substantial and cannot be explained within a few pages. As a compromise, this section briefly explains what generalized pairs are, and how they come about in relevant settings. Section 4.4 pinpoints one place in Birkar’s inductive scheme of proof where generalized pairs appear naturally, and explains why most (if not all) of the material presented in this survey should in fact be formulated and proven for generalized pairs. For the purpose of exposition, we will however ignore this difficulty and discuss the classical case only. 3.1. Definition of generalized pairs To begin, we only recall a minimal subset of the relevant definitions, and refer to [6, Sect. 2] and to [10, Sect. 4] for more details. We start with the notion of b-divisors, as introduced by Shokurov in [46], in the simplest case. Definition 3.1 (b-divisor). — Let X be a variety. We consider projective, birational morphisms Y → X from normal varieties Y , and for each Y a divisor MY ∈ R Div(Y ). The collection M := (MY )Y is called b-divisor if for any morphism f : Y 0 → Y of birational models over X, we have MY = f∗ (MY 0 ). Definition 3.2 (b-R-Cartier and b-Cartier b-divisors). — Setting as in Definition 3.1. A b-divisor M is called b-R-Cartier if there exists one Y such that MY is

ASTÉRISQUE 422

(1157)

BOUNDEDNESS RESULTS FOR SINGULAR FANO VARIETIES

263

R-Cartier and such that for any morphism f : Y 0 → Y of birational models over X, we have MY 0 = f ∗ (MY ). Ditto for b-Cartier b-divisors. Definition 3.3 (Generalized polarized pair, [6, Sect. 2.13], [10, Def. 1.4]) Let Z be a variety. A generalized polarized pair over Z is a tuple consisting of the following data: (3.3.1) a normal variety X equipped with a projective morphism X → Z, (3.3.2) an effective R-divisor B ∈ R Div(X), and (3.3.3) a b-R-Cartier b-divisor over X represented as (ϕ : X 0 → X, M 0 ), where M 0 ∈ R Div(X 0 ) is nef over Z, and where KX + B + ϕ∗ M 0 is R-Cartier. Notation 3.4 (Generalized polarized pair). — In the setup of Definition 3.3, we usually write M := ϕ∗ M 0 and say that (X, B + M ) is a generalized pair with data ϕ X 0 → X → Z and M 0 . In contexts where Z is not relevant, we usually drop it from the notation: in this case one can just assume X → Z is the identity. When Z is a point we also drop it but say the pair is projective. Observation 3.5. — Following [10, p. 286] we remark that Definition 3.3 is flexible with respect to X 0 and M 0 . To be more precise, if g : X 00 → X 0 is a projective birational morphism from a normal variety, then there is no harm in replacing X 0 with X 00 and replacing M 0 with g ∗ M 0 . 3.2. Singularities of generalized pairs All notions introduced in Section 2.3 have analogues in the setting of generalized pairs. Again, we cover only the most basic definition here. Definition 3.6 (Generalized log discrepancy, singularity classes) ϕ

Consider a generalized polarized pair (X, B + M ) with data X 0 → X → Z and 0 M , where ϕ is a log resolution of (X, B). Then, there exists a uniquely determined divisor B 0 on X 0 such that KX 0 + B 0 + M 0 = ϕ∗ (KX + B + M ). If D ∈ Div(X 0 ) is any prime divisor, the generalized log discrepancy is defined to be alog (D, X, B + M ) := 1 − multD B 0 . As before, we define the generalized total log discrepancy alog (X, B + M ) by taking the infimum over all D and all resolutions. In analogy to the definitions of Table 1, we say that the generalized polarized pair is generalized lc if alog (X, B + M ) ≥ 0. Ditto for all the other definitions.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

264

S. KEBEKUS

3.3. Example: Fibrations and the canonical bundle formula We discuss a setting where generalized pairs appear naturally. Let Y be a normal pair variety, and let f : Y → X be a fibration: the space X is projective, normal and of positive dimension, the morphism f is surjective with connected fibers. Also, assume that KY is Q-linearly equivalent to zero over X, so that there exists LX ∈ Q Div(X) with KY ∼Q f ∗ LX . Ideally, one might hope that it would be possible to choose LX = KX , but this is almost always wrong—compare Kodaira’s formula for the canonical bundle of an elliptic fibration, [4, Sect. V.12]. To fix this issue, we define a first correction term B ∈ Q Div(X) as X  B := (1 − tD ) · D where tD := lct◦ Y, ∆Y , f ∗ D . D∈Div(X) prime

The symbol lct◦ denotes a variant of the lc threshold introduced in Definition 2.9,  which measures the singularities of Y, f ∗ D only over the generic point of D. Since X is smooth in codimension one, this also solves the problem of defining f ∗ D. Finally, one chooses M ∈ Q Div(X) such that KX + B + M is Q-Cartier and such that the desired Q-linear equivalence holds, KY ∼Q f ∗ (KX + B + M ). The divisor B is usually called the “discriminant part” of the correction term. It detects singularities of the fibration, such as multiple or otherwise singular fibers, over codimension one points of X. The divisor M is called the “moduli part”. It is harder to describe. While we have defined it only up to Q-linear equivalence, a more involved construction can be used to define it as an honest divisor. Commentary. — Conjecturally, the moduli part carries information on the birational variation of the fibers of f , [28]. We refer to [30] and to the introduction of the recent research paper [16] for an overview, but see also [17]. 3.3.1. Behavior under birational modifications. — We ask how the moduli part of the correction term behaves under birational modification. To this end, let ϕ : X 0 → X be a birational morphism of normal, projective varieties. Choosing a resolution Y 0 of Y ×X X 0 , we find a diagram as follows, Y0

Φ, birational

f0

 X0

ASTÉRISQUE 422

/Y f

ϕ, birational

 / X.

(1157)

BOUNDEDNESS RESULTS FOR SINGULAR FANO VARIETIES

265

Set ∆Y 0 := Φ∗ KY −KY 0 . Generalizing the definition of lct◦ a little to allow for negative coefficients in ∆Y 0 , one can then define B 0 similarly to the construction above, X  B 0 := (1 − t0D ) · D where t0D := lct◦ Y 0 , ∆Y 0 , (f 0 )∗ D . D∈Div(X 0 ) prime

Finally, one may then choose M 0 ∈ Q Div(X 0 ) such that KY 0 + ∆Y 0 ∼Q (f 0 )∗ (KX 0 + B 0 + M 0 ), KX 0 + B 0 + M 0 = ϕ∗ (KX + B + M ) and B = ϕ∗ B 0 as well as M = ϕ∗ M 0 . 3.3.2. Relation to generalized pairs. — Now assume that Y is lc. The divisor B will then be effective. However, much more is true: after passing to a certain birational model X 0 of X, the divisor MX 0 is nef and for any higher birational model X 00 → X 0 , the induced MX 00 on X 00 is the pullback of MX 00 , [28, 2, 30] and summarized in [6, Thm. 3.6]. In other words, going to a sufficiently high birational model of X 0 of X, the moduli parts M 0 define an b-R-Cartier b-divisor. Moreover, this b-divisor is b-nef. ϕ We obtain a generalized polarized pair (X, B + M ) with data X 0 → X → Spec C and M 0 . This generalized pair is generalized lc by definition. Commentary. — A famous conjecture of Prokhorov and Shokurov [40, Conj. 7.13] asserts that the moduli divisor MX 00 is semiample, on any sufficiently high birational model X 00 of X. More precisely, it is expected that a number m exists that depends only on the general fiber of f such that all divisors m · MX 00 are basepoint free. If this conjecture was solved, it is conceivable that Birkar’s work could perhaps be rewritten in a manner that avoids the notion of generalized pairs. Remark 3.7 (Outlook). — The construction outlined in this section is used in the proof of “Boundedness of complements,” as sketched in Section 4.4 below. It generalizes fairly directly to pairs (Y, ∆Y ), and even to tuples where ∆Y is not necessarily effective, [6, Sect. 3.4].

4. BOUNDEDNESS OF COMPLEMENTS 4.1. Statement of result One of the central concepts in Birkar’s papers [6, 8] is that of a complement. The notion of a “complement” is an ingenious concept of Shokurov that was introduced in his investigation of threefold flips, [45, Sect. 5]. We recall the definition in brief.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

266

S. KEBEKUS

Definition 4.1 (Complement, [6, Sect. 2.18]). — Let (X, B) be a projective pair and m ∈ N. An m-complement of KX + B is a Q-divisor B + with the following properties. (4.1.1) The tuple (X, B + ) is an lc pair. (4.1.2) The divisor m · (KX + B + ) is linearly equivalent to 0. In particular, m · B + is integral. (4.1.3) We have m · B + ≥ m · bBc + b(m + 1) · {B}c. Remark 4.2 (Complements give sections). — Setting as in Definition 4.1. If m can be chosen such that m · bBc + b(m + 1) · {B}c ≥ m · B, then Item (4.1.2) guarantees that −m · (KX + B) is linearly equivalent to the effective divisor m · (B + − B). In  particular, the sheaf OX −m · (KX + B) admits a global section. Remark 4.3. — In view of Item (4.1.2), Shokurov considers complements as divisors that make the lc pair (X, B + ) “Calabi-Yau,” hence “flat”. The following result, which asserts the existence of complements with bounded m, is one of the core results in Birkar’s paper [6]. A proof of Theorem 4.4 is sketched in Section 4.4. Theorem 4.4 (Boundedness of complements, [6, Thm. 1.7]) Given d ∈ N and a finite set R ⊂ [0, 1] ∩ Q, there exists m ∈ N with the following property. If (X, B) is any log canonical, projective pair, where (4.4.1) X is of Fano type and dim X = d, (4.4.2) the coefficients of B are of the form

l−r l ,

for r ∈ R and l ∈ N,

(4.4.3) −(KX + B) is nef, then there exists an m-complement B + of KX + B that satisfies B + ≥ B. The divisor B + is also an (m · l)-complement, for every l ∈ N. Remark 4.5 (Complements give sections). — Given a pair (X, B) as in Theorem 4.4 and a number l ∈ N such that (ml)·B is integral, then ml·bBc+b(ml+1)·{B}c ≥ ml·B,  and Remark 4.2 implies that h0 X, OX (−ml · (KX + B)) > 0. 4.2. Idea of application We aim to show Theorem 1.2: under suitable assumptions on the singularities the family of Fano varieties is bounded. The proof relies on the following boundedness criterion of Hacon and Xu that we quote without proof (but see Sections 1.1.1 and 1.1.2 for a brief discussion). Recall that a set of numbers is DCC if every strictly descending sequence of elements eventually terminates.

ASTÉRISQUE 422

(1157)

BOUNDEDNESS RESULTS FOR SINGULAR FANO VARIETIES

267

Theorem 4.6 (Boundedness criterion, [24, Thm. 1.3]). — Given d ∈ N and a DCC set I ⊂ [0, 1] ∩ Q, let Yd,I be the family of pairs (X, B) such that the following holds true. (4.6.1) The pair (X, B) is projective, klt, and of dimension dimC X = d. (4.6.2) The coefficients of B are contained in I. The divisor B is big and KX +B ∼Q 0. Then, the family Yd,I is bounded. With the boundedness criterion in place, the following observation relates “boundedness of complements” to “boundedness of Fanos” and explains what pieces are missing in order to obtain a full proof. Observation 4.7. — Given d ∈ N and ε ∈ R+ , Theorem 4.4 gives a number m ∈ N such that every ε-lc Fano variety X with −KX nef admits an effective complement B + 1 2 of KX = KX + 0, with coefficients in the set { m , m, . . . , m m }. If one could in addition + + always choose B so that (X, B ) was klt rather than merely lc, then Theorem 4.6 would immediately apply to show that the family of ε-lc Fano varieties with −KX nef is bounded. As an important step towards boundedness of ε-lc Fanos, we will see in Section 5 how the theorem on “effective birationality” together with Theorem 4.6 and Observation 4.7 can be used to find a boundedness criterion (=Proposition 5.3) that applies to a relevant class of klt, weak Fano varieties.

4.3. Variants and generalizations Theorem 4.4 is in fact part of a much larger package, including boundedness of complements in the relative setting, [6, Thm. 1.8], and boundedness of complements for generalized polarized pairs, [6, Thm. 1.10]. To keep this survey reasonably short, we do not discuss these results here, even though they are of independent interest, and play a role in the proofs of Theorems 4.4 and 1.2.

4.4. Idea of proof for Theorem 4.4 We sketch a proof of “boundedness of complements,” following [6, p. 6ff] in broad strokes, and filling in some details now and then. In essence, the proof works by induction over the dimension, so assume that d is given and that everything was already shown for varieties of lower dimension.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

268

S. KEBEKUS

Simplification. — Theorem 4.4 considers a finite set R ⊂ [0, 1]∩Q, and log canonical pairs (X, B), where the coefficients of B are contained in the set  Φ(R ) := l−r l | r ∈ R and l ∈ N . The set Φ(R ) is infinite, and has 1 ∈ Q as its only accumulation point. Birkar shows that it suffices to treat the case where the coefficient set is finite. To this end, he constructs in [6, Prop. 2.49 and Constr. 6.13] a number ε0  1 and shows that it suffices to consider pairs with coefficients in the finite set Φ(R ) ∩ [0, 1 − ε0 ] ∪ {1}. In fact, given any (X, B), he considers the divisor B 0 obtained by replacing those coefficients on B that lie in the range (1 − ε0 , 1) with 1. Next, he constructs a birational model (X,00 B 00 ) of (X, B 0 ) that satisfies all assumptions Theorem 4.4. His construction guarantees that to find an n-complement for (X, B) it is equivalent to find an n-complement for (X,00 B 00 ). Among other things, the proof involves carefully constructed runs of the Minimal Model Program, Hacon-McKernan-Xu’s local and global ACC for log canonical thresholds [22, Thms. 1.1 and 1.5], and the extension of these results to generalized pairs [10, Thm. 1.5 and 1.6]. Remark 4.8. — Recall from Remark 2.15 that Assumption (4.4.1) (“X is of Fano type”) allows us to run Minimal Model Programs on arbitrary divisors. Along similar lines, Birkar is able to modify (X,00 B 00 ) by further birational transformation, and eventually proves that it suffices to show boundedness of complements for pairs that satisfy the following additional assumptions. Assumption 4.9. — The coefficient set of (X, B) is contained in R rather than in Φ(R ), and one of the following holds true. (4.9.1) The divisor −(KX + B) is nef and big, and B has a component S with coefficient 1 that is of Fano type. (4.9.2) There exists a fibration f : X → T and KX + B ≡ 0 along that fibration. (4.9.3) The pair (X, B) is exceptional. Commentary. — The main distinction is between Case (4.9.3) and Case (4.9.1). In fact, if (X, B) is not exceptional, recall from Definition 2.17 that there exists an effective P ∈ R Div(X) such that KX + B + P ∼R 0 and such that (X, B + P ) is not klt. This allows us to find a birational model whose boundary contains a divisor with multiplicity one. Case (4.9.2) comes up if the runs of the Minimal Model Programs used in the construction of birational models terminates with a Kodaira fiber space. The three cases (4.9.1)–(4.9.3) require very different inductive treatments.

ASTÉRISQUE 422

(1157)

BOUNDEDNESS RESULTS FOR SINGULAR FANO VARIETIES

269

Case (4.9.1). — We consider only the simple case where S = bBc is a normal prime divisor, where (X, B) is plt near S and where −(KX + B) is ample. Setting BS := (KX + B)| − KS , the coefficients are contained in a finite set R 0 of rational S numbers that depends only on R and on d. In summary, the pair (S, BS ) reproduces the assumptions of Theorem 4.4, and by induction we obtain a number n ∈ N that depends only on R and d, such that (4.9.4) the divisor n · BS is integral, and (4.9.5) there exists an n-complement BS+ of KS + BS . Following [6, Prop. 6.7], we aim to extend BS+ from S to a complement B + of KX + B on X. As we saw in in Remark 4.5, Item (4.9.4) guarantees that n · (BS+ − BS ) is effective, so that the complement BS+ gives rise to a section in   H 0 S, n · (BS+ − BS ) = H 0 S, −n · (KS + BS ) . But then, looking at the cohomology of the standard ideal sheaf sequence,    H 0 X, −n · (KX + B) → H 0 S, −n · (KX + B)| → H 1 X, −n · (KX + B) − S S {z } | | {z } 6= 0 by Rem. 4.5

= 0 by Kawamata-Viehweg vanishing

we find that the section extends to X and defines an associated divisor B + ∈ |−(KX + B)|Q . Using the connectedness principle for non-klt centers (3), one argues that B + is the desired complement. Case (4.9.2). — Given a fibration f : X → T , we apply the construction of Section 3.3, in order to equip the base variety T with the structure of a generalized ϕ polarized pair (T, B + M ), with data T 0 → T → Spec C and M 0 . Adding to the results explained in Section 3.3, Birkar shows that the coefficients of B and M are not arbitrary. The coefficients of B are in Φ(S ) for some fixed finite set S of rational numbers that depends only on R and d. Along similar lines, there exists a bounded number p ∈ N such that p · M is integral. The plan is now to use induction to find a bounded complement for KT + B + M and pull it back to X. This plan works out well, but requires us to formulate and prove all results pertaining to boundedness of complements in the setting of generalized polarized pairs. All the arguments sketched here continue to work, mutatis mutandis, but the level of technical difficulty increases substantially.

(3)

For generalized pairs, this is [6, Lem. 2.14].

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

270

S. KEBEKUS

Case (4.9.3). — There is little that we can say in brief about this case. Still, assume for simplicity that B = 0 and that X is a Fano variety. If we could show that X belongs to a bounded family, then we would be done. Actually we need something weaker: effective birationality. Assume we have already proved Theorem 5.1. Then there is a bounded number m ∈ N such that | − mKX | defines a birational map. Pick 1 M ∈ | − mKX | and let B + := m · M . Since X is exceptional, (X, B + ) is automatically + klt, hence KX + B is an m-complement. Although this gives some idea of how one may get a bounded complement but in practice we cannot give a complete proof of Theorem 5.1 before proving Theorem 4.4. Contrary to the exposition of this survey paper, where “boundedness of complements” and “effective birationality” are treated as if they were separate, the proofs of the two theorems are in fact much intertwined, and this is one of the main points where they come together. Many of the results discussed in this overview (“Bound on anticanonical volumes,” “Bound on lc thresholds”) have separate proofs in the exceptional case.

5. EFFECTIVE BIRATIONALITY 5.1. Statement of result The second main ingredient in Birkar’s proof of boundedness is the following result. A proof is sketched in Section 4.4. Theorem 5.1 (Effective birationality, [6, Thm. 1.2]). — Given d ∈ N and ε ∈ R+ , there exists m ∈ N with the following property. If X is any ε-lc weak Fano variety of dimension d, then |−m · KX | defines a birational map. Remark 5.2. — The divisors m · KX in Theorem 5.1 need not be Cartier. The linear system |−m·KX | is the space of effective Weil divisors on X that are linearly equivalent to −m · KX . 5.2. Idea of application In the framework of [6], effective birationality is used to improve the boundedness criterion spelled out in Theorem 4.6 above. Proposition 5.3 (Boundedness criterion, [6, Prop. 7.13]). — Let d, v ∈ N and let (t` )`∈N be a sequence of positive real numbers. Let X be the family of projective varieties X with the following properties. (5.3.1) The variety X is a klt weak Fano variety of dimension d. (5.3.2) The volume of the canonical class is bounded, vol(−KX ) ≤ v.

ASTÉRISQUE 422

(1157)

BOUNDEDNESS RESULTS FOR SINGULAR FANO VARIETIES

271

(5.3.3) For every ` ∈ N and every L ∈ |−` · KX |, the pair (X, t` · L) is klt. Then, X is a bounded family. Remark 5.4. — The formulation of Proposition 5.3 is meant to illustrate the application of Theorem 5.1 to the boundedness problem. It is a simplified version of Birkar’s formulation and defies the logic of his work. While we present Proposition 5.3 as a corollary to Theorem 5.1, and to all the results mentioned in Section 4, Birkar uses [6, Prop. 7.13] as one step in the inductive proof of “boundedness of complements” and “effective birationality”. That requires him to explicitly list partial cases of “boundedness of complements” and “effective birationality” as assumptions to the proposition, and makes the formulation more involved. Remark 5.5. — Proposition 5.3 reduces the boundedness problem to solving the following two problems. — Boundedness of volumes, as required in (5.3.2). This is covered in the subsequent Section 6. — Existence of numbers t` , as required in (5.3.3). This amounts to bounding “lc thresholds” and is covered in Section 7. To prove Proposition 5.3, Birkar uses effective birationality in the following form, as a log birational boundedness result. Proposition 5.6 (Log birational boundedness of certain pairs, [6, Prop. 4.4]) Given d, v ∈ N and ε ∈ R+ . Then, there exists c ∈ R+ and a bounded family P of couples with the following property. If X is a normal projective variety of dimension d and if B ∈ R Div(X) and M ∈ Q Div(X) are divisors such that the following holds, (5.6.1) the divisor B is effective, with coefficients in {0} ∪ [ε, ∞), (5.6.2) the divisor M is effective, nef and |M | defines a birational map, (5.6.3) the difference M − (KX + B) is pseudo-effective, (5.6.4) the volume of M is bounded, vol(M ) < v, (5.6.5) if D is any component of M , then multD (B + M ) ≥ 1, then there exists a log smooth couple (X 0 , Σ) ∈ P , a rational map X 99K X and a ‹ → X, with the following properties. resolution of singularities r : X (5.6.6) The divisor Σ contains the birational transform on M , as well as the exceptional divisor of the birational map β. ∗ (5.6.7) The movable part AX f of r M is basepoint free.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

272

S. KEBEKUS

‹0 is any resolution of X that factors via X 0 and X, ‹ (5.6.8) If X ‹0 X

e birational β,

s, resolution

 X0

‹ /X r, resolution

β, birational

 /X

e ∗ M are at most c and βe∗ A f is then the coefficients of the Q-divisor s∗ (r ◦ β) X 0 linearly equivalent to zero relative to X . Sketch of proof for Proposition 5.6, following [6, p. 42]. — Since |M | defines a bira‹ → X such that r∗ M decomposes as the sum tional map, there exists a resolution r : X 00 of a base point free movable part AX f and fixed part RX f. The contraction X → X 00 defined by AX f is birational. Since vol(M ) is bounded, the varieties X obtained in this way are all members of one bounded family P 0 . The family P 0 is however not yet the desired family P , and the varieties in P 0 are not yet equipped with an appropriate boundary. To this end, one needs to invoke a criterion of Hacon-McKernan-Xu for “log birationally boundedness,” [21, Lem. 2.4.2(4)], and take an appropriate resolution of the elements in P 0 . Sketch of proof for Proposition 5.3, following [6, p. 80]. — Applying Theorems 4.4 (“Boundedness of complements”) and 5.1 (“Effective birationality”), we find a number m ∈ N such that every X ∈ X admits an m-complement for KX and that |−m · KX | defines a birational map. If m-complements B + of KX could always be chosen such that (X, B + ) were klt, we have seen in Observation 4.7 that X is bounded. However, Theorems 4.4 guarantees only the existence of an m-complement B + of KX where (X, B + ) is lc. Using the bounded family P obtained when applying Proposition 5.6 with M = −m · KX and B = 0, we aim to find a universal constant ` and a finite set R , and then perturb any given (X, B + ) in order to find a boundary B ++ with coefficients in R that is Q-linearly equivalent to −KX and makes (X, B ++ ) klt. Boundedness will then again follow from Theorem 4.6. To spell out a few more details of the proof use boundedness of the family P to infer the existence of a universal constant ` with the following property. If (X 0 , Σ) ∈ P and if AX 0 ∈ Div(X 0 ) is contained in Σ with coefficients bounded by c, and if |AX 0 | is basepoint free and defines a birational morphism, then there exists GX 0 ∈ |` · AX 0 | whose support contains Σ. Now assume that one X ∈ X is given. It suffices to consider the case where 1 · M , for general X is Q-factorial and admits an m-complement of the form B + = m M ∈ |−m · KX |. To make use of `, consider a diagram as discussed in Item (5.6.8) of

ASTÉRISQUE 422

(1157)

BOUNDEDNESS RESULTS FOR SINGULAR FANO VARIETIES

273

Proposition 5.6 above and decompose r∗ M = AX f into its moving and its fixed f + RX part. Write A := r∗ AX f and R := r∗ RX f. Item (5.6.6) of Proposition 5.6 implies that the divisor AX 0 := s∗ βe∗ AX is then contained in Σ, and Item (5.6.8) asserts that it is f basepoint free, defines a birational morphism. So, we find GX 0 ∈ |` · AX 0 | as above. Writing G := r∗ βe∗ s∗ GX 0 , we find that G+`·R ∈ |−m`·KX |, so that (X, tm` G) is klt by 1 1 assumption. We may assume that tm` is rational and tm` < m` . If (X, m` (G+`·R)) is 1 0 lc, then set B := m` (G + ` · R). Otherwise, one needs to use the lower-dimensional versions of the variants and generalizations of boundedness of complements that we discussed in Section 4.3 above. To be more precise, using (5.6.9) boundedness of complements for generalized polarized pairs for varieties of dimension ≤ d − 1, and (5.6.10) boundedness of complements in the relative setting for varieties of dimension d, one can always find a universal number n and B 0 ≥ tm` · (G + ` · R) where (X, B 0 ) is lc and n · (KX + B 0 ) ∼ 0. Finally, set B ++ :=

t t 1 1 · B+ + ·A− · G + · B0 2 2m 2m` 2

and then show by direct computation that all required properties hold. 5.3. Preparation for the proof of Theorem 5.1 We prepare for the proof with the following proposition. In essence, it asserts that effective divisors with “degree” bounded from above cannot have too small lc thresholds, under appropriate assumptions. Since this proposition may look plausible, we do not go into details of the proof. Further below, Proposition 7.3 gives a substantially stronger result whose proof is sketched in some detail. Proposition 5.7 (Singularities in bounded families, [6, Prop. 4.2]) Given ε0 ∈ R+ and given a bounded family P of couples, there exists a number δ ∈ R>0 such that the following holds. Given the the following data, “ B), “ (5.7.1) an ε0 -lc, projective pair (G,  “ such that G, “ supp(B “ + T ) ∈ P , and (5.7.2) a reduced divisor T ∈ Div(G) “ whose support is contained in T , and whose coefficients have (5.7.3) an R-divisor N absolute values ≤ δ, “B “ + L) b is klt, for all L b ∈ |N “|R . then (G,

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

274

S. KEBEKUS

5.4. Sketch of proof of Theorem 5.1 Assume that numbers d and ε are given. Given an ε-lc Fano variety X of dimension d, we will be interested in the following two main invariants, mX := min{ m0 ∈ N | the linear system |−m0 · KX | defines a birational map}, nX := min{ n0 ∈ N | vol(−n0 · KX ) ≥ (2d)d }. Eventually, it will turn out that both numbers are bounded from above. Our aim here is to bound the numbers mX by a constant that depends only on d and ε. Bounding the quotient Following [6], we will first find an upper bound for the quotients mX /nX by a number that depends only on d and ε. 5.4.1. Construction of non-klt centers. — In the situation at hand, a standard method (“tie breaking”) allows us to find dominating families of non-klt centers; we refer to [29, Sect. 6] for an elementary discussion, but see also [6, Sect. 2.31]. Given an ε-lc Fano variety X of dimension d, and using the assumption that vol(−nX · KX ) ≥ (2d)d , the following has been shown by Hacon, McKernan and Xu. Claim 5.8 (Dominating family of non-klt centers, [22, Lem. 7.1]) Given any ε-lc Fano variety X, there exists a dominating family GX of subvarieties in X with the following property. If (x, y) ∈ X × X is any general tuple of points, then there exists a divisor ∆ ∈ | − (nX + 1) · KX |R such that the following holds. (5.8.1) The pair (X, ∆) is not klt at y. (5.8.2) The pair (X, ∆) is lc near x with a unique non-klt place. The associated non-klt center is a subvariety of the family GX . Given X, we may assume that the members of the families GX all have the same dimension, and that this dimension is minimal among all families of subvarieties that satisfy (5.8.1) and (5.8.2). 5.4.2. The case of isolated centers. — If X is given such that the members of GX are points, then the elements are isolated non-klt centers. Given G ∈ GX , standard vanishing theorems for multiplier ideals will then show surjectivity of the restriction maps   H 0 X, OX (KX + ∆) → H 0 G, OX (KX + ∆)| . G {z } | ∼ =C

ASTÉRISQUE 422

(1157)

BOUNDEDNESS RESULTS FOR SINGULAR FANO VARIETIES

275

In particular, we find that OX (KX + ∆) ∼ = OX (−nX · KX ) has non-trivial sections. Further investigation reveals that a bounded multiple of −nX · KX will in fact give a birational map. 5.4.3. Non-isolated centers. — It remains to consider varieties X where the members of GX are positive-dimensional. Following [6, proofs of Prop. 4.6 and 4.8], we trace the arguments for that case in very rough strokes, ignoring all of the (many) subtleties along the way. The main observation to handle this case is the following volume bound. Claim 5.9 (Volume bound, [6, Step 3 on p. 48]). — There exists a number v ∈ R+ that depends only on d and ε, such that for all X and all positive-dimensional G ∈ GX , we have vol(−mX · KX | ) < v. G

Idea of proof for Claim 5.9. — Going back and looking at the construction of nonklt centers (that is, the detailed proof of Claim 5.8), one finds that the construction can be improved to provide families of lower-dimension centers if only the volumes are big enough. But this collides with our assumption that the varieties in GX were of minimal dimension. To make use of Claim 5.9, look at one X where the members of GX are positivedimensional. Choose a general divisor (4) M ∈ |−mX · KX |, and let (x, y) ∈ X × X be a general tuple of points with associated center G ∈ GX . Since G is a non-klt center that has a unique place over it, adjunction (and inversion of adjunction) works rather well. Together with the bound on volumes, this allows us to define a natural boundary “ on a suitable birational modification G “ of the normalization of G, such that the B following holds. “ B) “ is ε0 -lc, for some controllable number ε0 . (5.10.1) The pair (G, “ → G and T := (B “ + E)red , the (5.10.2) Writing E for the exceptional divisor of G  “ “ couple G, supp(B +T ) belongs to a bounded family P that in turn depends only on the numbers d and ε. “ has support in supp(B “ + T ). (5.10.3) The pull-back of M to G 5.4.4. End of proof. — The idea now is of course to apply Proposition 5.7, using the family P . Arguing by contradiction, we assume that the numbers mX /nX are unbounded. We can then find one X where nX /mX is really quite small when com“ as the pull-back pared to the number δ given by Proposition 5.7. In fact, taking N nX “ are smaller than δ. of mX · M , it is possible to guarantee that the coefficients of N (4)

The divisor M should really be taken as the movable part, but we ignore this detail.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

276

S. KEBEKUS

Intertwining this proof with the proof of “boundedness of complements,” we may use a partial result from that proof, and find L ∈ | − nX · KX |Q , whose coefficients b of L are ≥ 1. Since the points (x, y) ∈ X × X were chosen generically, the pull-back L “ to G has coefficients ≥ 1, and can therefore never appear in the boundary of a klt b ∈ |N “|R , which contradicts Proposition 5.7 and ends the proof. In pair. But then, L summary, we were able to bound the quotient mX /nX by a constant that depends only on d and ε. Bounding the numbers mX Finally, we still need to bound mX . This can be done by arguing that the volumes vol(−mX · KX ) are bounded from above, and then use the same set of ideas discussed “ of its subvariety G. Since some of the above, using X instead of a birational model G core ideas that go into boundedness of volumes are discussed in more detail in the following Section 6 below, we do not go into any details here.

6. BOUNDS FOR VOLUMES 6.1. Statement of result Once Theorem 1.2 (“Boundedness of Fanos”) is shown, the volumes of anticanonical divisors of ε-lc Fano varieties of any given dimension will clearly be bounded. Here, we discuss a weaker result, proving boundedness of volumes for Fanos of dimension d, assuming boundedness of Fanos in dimension d − 1. Theorem 6.1 (Bound on volumes, [6, Thm. 1.6]). — Given d ∈ N and ε ∈ R+ , if the ε-lc Fano varieties of dimension d − 1 form a bounded family, then there is a number v such that vol(−KX ) ≤ v, for all ε-lc weak Fano varieties X of dimension d. 6.2. Idea of application We have seen in Section 5.2 how to obtain boundedness criteria for families of varieties from boundedness of volumes. This makes Theorem 6.1 a key step in the inductive proof of Theorem 1.2. 6.3. Idea of proof for boundedness of volumes, following [6, Sect. 9] To illustrate the core idea of proof, we consider only the simplest cases and make numerous simplifying assumptions, no matter how unrealistic. The assumption that ε-lc Fano varieties of dimension d − 1 form a bounded family will be used in the following form.

ASTÉRISQUE 422

(1157)

BOUNDEDNESS RESULTS FOR SINGULAR FANO VARIETIES

277

Lemma 6.2 (Consequence of boundedness, [6, Lem. 2.22]). — There exists a finite set I ⊂ R with the following property. If X is an ε-lc Fano variety of dimension d − 1, if r ∈ R≥1 and if D is any non-zero integral divisor on X such that KX + r · D ≡ 0, then r ∈ I. We argue by contradiction and assume that there exists a sequence (Xi )i∈N of ε-lc weak Fanos of dimension d such that the sequence of volumes is strictly increasing, with lim vol(Xi ) = ∞. For simplicity of the argument, assume that all Xi are Fanos rather than weak Fanos, and that they are Q-factorial. For the general case, one needs to consider the maps defined by multiples of −KX and take small Q-factorialisations. Choose a rational ε0 in the interval (0, ε). Using explicit discrepancy computations of boundaries of the form N1 · Bi0 , for Bi0 ∈ |−N · KXi | general, [33, Cor. 2.32], we find a decreasing sequence (ai )i∈N of rationals, with lim ai = 0, and boundaries Bi ∈ Q Div(Xi ) with the following properties. (6.2.1) For each i, the divisor Bi is Q-linearly equivalent to −ai · KXi . (6.2.2) The volumes of the Bi are bounded from below, (2d)d < vol(Bi ). (6.2.3) The pair (Xi , Bi ) has total log discrepancy equal to ε0 . Passing to a subsequence, we may assume that ai < 1 for every i. Again, discrepancy computation show that this allows us to find sufficiently general, ample Hi ∈ Q Div(Xi ) that are Q-linearly equivalent to −(1 − ai ) · KXi and have the property that (X, Bi + Hi ) are still ε0 -lc. Given any index i, Item (6.2.3) implies that there exists a prime divisor Di0 on a birational model Xi0 that realizes the total log discrepancy. For simplicity, consider only the case where one can choose Xi = Xi0 for every i, and therefore find prime divisors Di on Xi that appear in Bi with multiplicity 1 − ε0 . Without that simplifying assumption one needs to invoke [9, Cor. 1.4.3], in order to replace the variety Xi by a model that “extracts” the divisor Di0 . In summary, we can write (6.2.4)

− KXi ∼Q

1 − ε0 1 · Bi = · Di + (effective). ai ai

As a next step, recall from Remark 2.15 that the Xi are Mori dream spaces. Given any i, we can therefore run the −Di -MMP, which terminates with a Mori fiber space on which the push-forward of Di is relatively ample. Again, we ignore all technical difficulties and assume that Xi itself is the Mori fiber space, and therefore admits a fibration Xi → Zi with relative Picard number ρ(Xi /Zi ) = 1 such that Di is relatively ample. Let Fi ⊆ Xi be a general fiber. Adjunction and standard inequalities for discrepancies imply that Fi is again ε-lc and Fano. The statement about the relative Picard number implies that any effective divisor on Xi is either trivial or ample on Fi . 0 In particular, Equation 6.2.4 implies that −KFi ≡ si · Di , where si ≥ 1−ε ai goes to

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

278

S. KEBEKUS

infinity. If dim Fi = d − 1, or more generally if dim Fi < d for infinitely many indices i, this contradicts Lemma 6.2 and therefore proves Theorem 6.1. It remains to consider the case where the Zi are points. Birkar’s proof in this case is similar in spirit to the argumentation above, but technically much more demanding. He creates a covering family of non-klt centers, uses adjunction on these centers and the assumption that ε-lc Fano varieties of dimension d − 1 form a bounded family to obtain a contradiction.

7. BOUNDS FOR LC THRESHOLDS The last of Birkar’s core results presented here pertains to log canonical thresholds of anti-canonical systems; this is the main result of Birkar’s second paper [8]. It gives a positive answer to a well-known conjecture of Ambro [3, p. 4419]. With the notation introduced in Section 2.3, the result is formulated as follows. Theorem 7.1 (Lower bound for lc thresholds, [8, Thm. 1.4]) Given d ∈ N and ε ∈ R+ , there exists t ∈ R+ with the following property. If (X, B) is any projective ε-lc pair of dimension d and if ∆ := −(KX + B) is nef and  big, then lct X, B, |∆|R ≥ t. Though this is not exactly obvious, Theorem 7.1 can be derived from boundedness of ε-lc Fanos, Theorem 1.2. One of the core ideas in Birkar’s paper [8] is to go the other way and prove Theorem 7.1 using boundedness, but only for toric Fano varieties, where the result has been established by Borisov-Borisov in [12]. 7.1. Idea of application As pointed out in Section 5.2, bounding lc thresholds from below immediately applies to the boundedness problem. To illustration the application, consider the following corollary, which proves Theorem 1.2 in part. Corollary 7.2 (Boundedness of ε-lc Fanos). — Given d ∈ N and ε ∈ R+ , the famFano ily Xd,ε of ε-lc Fanos of dimension d is bounded. Fano Proof. — We aim to apply Proposition 5.3 to the family Xd,ε . With Theorem 6.1 (“Bound on volumes”) in place, it remains to satisfy Condition (5.3.3) of Proposition 5.3: we need a sequence (t` )`∈N such that the following holds. Fano For every ` ∈ N, for every X ∈ Xd,ε and every L ∈ |−` · KX |, the pair (X, t` · L) is klt.

ASTÉRISQUE 422

(1157)

BOUNDEDNESS RESULTS FOR SINGULAR FANO VARIETIES

279

But this is not so hard anymore. Let t ∈ R+ be the number obtained by applying Fano Theorem 7.1. Given a number ` ∈ N, a variety X ∈ Xd,ε and a divisor L ∈ |−`·KX |, 1 t observe that ` · L ∈ | − KX |R and recall from Remark 2.10 that (X, 2` · L) is klt. We t can thus set t` := 2` . 7.2. Preparation for the proof of Theorem 7.1: R-linear systems of bounded degrees To prepare for the proof of Theorem 7.1, we begin with a seemingly weaker result that provides bounds for lc thresholds, but only for R-linear systems of bounded degrees. This result will be used in Section 7.4 to prove Theorem 7.1 in an inductive manner. Proposition 7.3 (LC thresholds for R-linear systems of bounded degrees, [8, Thm. 1.6]) Given d, r ∈ N and ε ∈ R+ , there exists t ∈ R+ with the following property. If (X, B) is any projective, ε-lc pair of dimension d, if A ∈ Div(X) is very ample with  A − B ample and [A]d ≤ r, then lct X, B, |A|R ≥ t. Remark 7.4. — The condition on the intersection number, [A]d ≤ r implies that X belongs to a bounded family of varieties. More generally, if we choose A general in its linear system, then (X, A) belongs to a bounded family of pairs. The proof of Proposition 7.3 is sketched below. It relies on two core ingredients. Because of their independent interest, we formulate them separately. Setting 7.5. — Given d, r ∈ N and ε ∈ R+ , we consider projective, ε-lc pairs (X, B) of dimension d where X is Q-factorial, equipped with the following additional data. (7.5.1) A very ample divisor A ∈ Div(X), with A − B ample and [A]d ≤ r. (7.5.2) An effective divisor L ∈ R Div(X), with A − L ample. (7.5.3) A birational morphism ν : Y → X of normal projective varieties, and a prime divisor T ∈ Div(Y ) whose image is a point x ∈ X. Lemma 7.6 (Existence of complements, [8, Prop. 5.9]). — Given d, ε ∈ R+ , assume that Proposition 7.3 holds for varieties of dimension there exist integers n, m ∈ N and a real number 0 < ε0 < ε, with property. Whenever we are in Setting 7.5, and whenever there exists a such that

r ∈ N and d − 1. Then, the following number t < r

(7.6.1) the pair (X, B + t · L) is ε0 -lc, and (7.6.2) the log discrepancy is realized by T , that is alog (T, X, B + t · L) = ε0 . Then there exists an effective divisor Λ ∈ Q Div(X) such that (7.6.3) the divisor n · Λ is integral,

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

280

S. KEBEKUS

(7.6.4) the tuple (X, Λ) is lc near x, and T is an lc place of (X, Λ), and (7.6.5) the divisor m · A − Λ is ample. Commentary. — Lemma 7.6 is another existence-and-boundedness result for complements, very much in the spirit of what we have seen in Section 4. The relation to complements is made precise in [8, Thm. 1.7], which is a core ingredient in Birkar’s proof. In fact, after some birational modification of Y , Birkar finds a divisor ΛY ∈ Div(Y ) such that (Y, ΛY ) is lc near T and such that n · (KY + ΛY ) is linearly equivalent to 0, relative to X and for some bounded number n ∈ N. As Birkar points out in [7, p. 16], one can think of KY + ΛY as a local-global type of complement. He then takes Λ to be the push-forward of ΛY and proves all required properties. Lemma 7.7 (Bound on multiplicity at an lc place, [8, Prop. 5.7]) Given d, r and n ∈ N and ε ∈ R+ , assume that Proposition 7.3 holds for varieties of dimension ≤ d − 1. Then, there exists q ∈ R+ , with the following property. Whenever we are in Setting 7.5, whenever a(T, X, B) ≤ 1, and whenever a divisor Λ ∈ Q Div(X) is given that satisfies the following conditions, (7.7.1) Λ is effective and n · Λ is integral, (7.7.2) A − Λ is ample, (7.7.3) (X, Λ) is lc near x, and T is an lc place of (X, Λ), then T appears in the divisor ν ∗ L with multiplicity multT ν ∗ L ≤ q. Commentary. — Lemma 7.7 is perhaps the core of Birkar’s paper [8]. To begin, one  needs to realize that the couples X, supp(Λ) that appear in Lemma 7.7 come from a bounded family. This allows us to consider common resolution, and eventually to assume from the outset that (X, Λ) is a log-smooth couple. In particular, (X, Λ) is toroidal, and T can be obtained by a sequence of blowing ups that are toroidal with respect to (X, Λ). Given that toroidal blow-ups are rather well understood, Birkar finds that to bound the multiplicity multT ν ∗ L, it suffices to bound the number of blowups involved. Bounding the number of blowups is hard, and the next few sentences simplify a very complicated argument to the extreme (5). Birkar establishes a Noether-normalization theorem, showing that he may replace the couple (X, Λ), which is log-smooth, by a pair of the form (Pd , union of hyperplanes), which is toric rather than toroidal. Better still, applying surgery coming from the Minimal Model Program, he is then able to replace Y by a toric, Fano, ε-lc variety. But the family of such Y is bounded by the classic result of Borisov-Borisov, [12], and a bound for the number of blowups follows. (5)

See [7, p. 16f] and [50, Sect. 10] for a more realistic account of all that is involved.

ASTÉRISQUE 422

(1157)

BOUNDEDNESS RESULTS FOR SINGULAR FANO VARIETIES

281

Sketch of proof for Proposition 7.3. — The proof of Proposition 7.3 proceeds by induction, so assume that d, r, and ε are given and that everything was already shown in lower dimensions. Now, given a d-dimensional pair (X, B) and a very ample A ∈ Div(X) as in Proposition 7.3, we aim to apply Lemma 7.6 and 7.7. This is, however, not immediately possible because X need not be Q-factorial. We know from minimal model theory that there exists a small Q-factorialisation, say X 0 → X, but then we need to compare lc thresholds of X 0 and X, and show that the difference is bounded. To this end, recall from Remark 7.4 that the family of all possible X is bounded, which allows us to construct simultaneous Q-factorialisations in stratified families, and hence gives the desired bound for the differences. Bottom line: we may assume that X is Q-factorial. Let ε0 be the number given by Lemma 7.6. Next, given any divisor L ∈ |A|R , look at s := sup{s0 ∈ R | (X, B + s0 · L) is ε0 -lc}. Following Remark 2.10, we would be done if we could bound s from below, independently of X, B, A and L. To this end, choose a resolution of singularities, ν : Y → X and a prime divisor T ∈ Div(Y ) such that alog (T, X, B + s · L) = ε0 . For simplicity, we will only consider the case where ν(T ) is a point, say x ∈ X-–if ν(T ) is not a point, Birkar cuts down with general hyperplanes from |A|, uses inversion of adjunction and invokes the induction hypothesis in order to proceed. In summary, we are now in a situation where we may apply Lemma 7.6 (“Existence of complements”) to find a divisor Λ and then Lemma 7.7 (“Bound on multiplicity at an lc place”) to bound the multiplicity multT ν ∗ L from above, independently of X, B, A and L. But then, a look at Definition 2.7 (“log discrepancy”) shows that this already gives the desired bound on s. 7.3. Preparation for the proof of Theorem 7.1: varieties of Picard-number one The second main ingredient in the proof of Theorem 7.1 is the following result, which essentially proves Theorem 7.1 in one special case. Its proof, which we do not cover in detail, combines all results discussed in the previous Sections 4–6: boundedness of complements, effective birationality and bounds for volumes. Proposition 7.8 (Theorem 7.1 in a special case, [8, Prop 3.1]) Given d ∈ N and ε ∈ R+ , assume that Proposition 7.3 (“LC thresholds for R-linear systems of bounded degrees”) holds in dimension ≤ d and that Theorem 1.2 (“Boundedness of ε-lc Fanos”) holds in dimension ≤ d − 1. Then, there exists v ∈ R+ such that the following holds. If X is any Q-factorial, ε-lc Fano variety of dimension d of Picard number one, and if L ∈ R Div(X) is effective with L ∼R −KX , then each coefficient of L is less than or equal to v.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

282

S. KEBEKUS

7.4. Sketch of proof of Theorem 7.1 Like other statements, Theorem 7.1 is shown using induction over the dimension. The following key lemma provides the induction step. Lemma 7.9 (Implication Proposition 7.3 ⇒ Theorem 7.1, [8, Lem. 3.2]) Given d ∈ N, assume that Proposition 7.3 (“LC thresholds for R-linear systems of bounded degrees”) holds in dimension ≤ d and that Theorem 1.2 (“Boundedness of ε-lc Fanos”) holds in dimension ≤ d − 1. Then, Theorem 7.1 (“Lower bound for lc thresholds”) holds in dimension d. Sketch of proof following [8, p. 13f]. — The first steps in the proof are similar to the proof of Proposition 7.3. Choose any number ε0 ∈ (0, ε). Given any projective, d-dimension, ε-lc pair (X, B) be as in Theorem 7.1 in dimension d and any divisor L ∈ |∆|R , let s be the largest number such that (X, B + s · L) is ε0 -lc. We need to show s is bounded from below away from zero. In particular, we may assume that s < 1. As in the proof of Proposition 7.3, we may also assume X is Q-factorial. There is a birational modification ϕ : Y → X and a prime divisor T ∈ Div(Y ) with log discrepancy alog (T, X, B + s · L) = ε0 .

(7.9.1)

Techniques of [9] (“extracting a divisor”) allow us to assume that ϕ is either the identity, or that the ϕ-exceptional set equals T precisely. The assumption that X is Q-factorial allows us to pull back divisors. Let BY := ϕ∗ (KX + B) − KY

and LY := ϕ∗ L.

Using the definition of log discrepancy, Definition 2.7, the assumption that (X, B) is ε-lc and Equation (7.9.1) are formulated in terms of divisor multiplicities as multT BY ≤ 1 − ε and

multT (BY + s · LY ) = 1 − ε0 ,

hence multT (s · LY ) ≥ ε − ε0 . The pair (Y, BY + s · LY ) is klt and weak log Fano, which implies that Y is Fano type. Recalling from Remark 2.15 that Y is thus a Mori dream space, we may run a (−T )-Minimal Model Program and obtain rational maps, Y

α, extr. contractions and flips

/ Y0

β, Mori fiber space

/ Z 0,

where −T is ample when restricted to general fibers of β. We write BY 0 := α∗ BY and LY 0 := α∗ LY and note that −(KY 0 + BY 0 + s · LY 0 )

ASTÉRISQUE 422

def. of L ∼R

s 0, then restricting to a general fiber of Y 0 → Z 0 and applying Proposition 7.3 (“LC thresholds for R-linear systems of bounded degrees”) in lower dimension (6) shows that the coefficients of those components of (1−s)·LY 0 that dominate Z 0 components of are bounded from above. In particular, multT 0 (1 − s) · LY 0 is bounded from above. Thus from the inequality multT 0 (1 − s) · LY 0 ≥

(1 − s) · (ε − ε0 ) , s

we deduce that s is bounded from below away from zero. If Z 0 is a point, then Y 0 is a Fano variety with Picard number one. Now −KY 0 ∼R (1 − s) · LY 0 + BY 0 + s · LY 0 ≥ (1 − s) · LY 0 , so by Proposition 7.8, multT 0 (1 − s) · LY 0 is bounded from above which again gives a lower bound for s as before.

8. APPLICATION TO THE JORDAN PROPERTY We explain in this section how the boundedness result for Fano varieties applies to the study of birational automorphism groups, and how it can be used to prove the Jordan property. Several of the core ideas presented here go back to work of Serre, who solved the two dimensional case, [43, Thm. 5.3] but see also [44, Thm. 3.1]. If one is only interested in the three-dimensional case, where birational geometry is particularly well-understood, most arguments presented here can be simplified. 8.1. Existence of subgroups with fixed points If X is any rationally connected variety, Theorem 1.4 (“Jordan property of Cremona groups”) asks for the existence of finite Abelian groups in the Cremona groups Bir(X). As we will see in the proof, this is almost equivalent to asking for finite groups of automorphisms that admit fixed points, and boundedness of Fanos is the key tool used to find such groups. The following lemma is the simplest result in this direction. Here, boundedness enters in a particularly transparent way.

(6)

Or applying Theorem 1.2 (“Boundedness of ε-lc Fanos”).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

284

S. KEBEKUS

Lemma 8.1 (Fixed points on Fano varieties, [42, Lem. 4.6]) Given d ∈ N, there exists a number jdFano ∈ N such that for any d-dimensional Fano variety X with canonical singularities and any finite subgroup G ⊆ Aut(X), there exists a subgroup F ⊆ G of index |G : F | ≤ jdFano acting on X with a fixed point. Remark 8.2. — To keep notation simple, Lemma 8.1 is formulated for Fanos with canonical singularities, which is the relevant case for our application. In fact, it suffices to consider Fanos that are ε-lc. Fano Proof of Lemma 8.1. — As before, write Xd,0 for the d-dimensional Fano variety X with canonical singularities. It follows from boundedness, Theorem 1.2 or Corollary 7.2, that there exist numbers m, v ∈ N such that the following holds for evFano ery X ∈ Xd,0 .

(8.2.1) The divisor −m · KX is Cartier and very ample. (8.2.2) The self-intersection number of −m · KX is bounded by v. More precisely, −[m · KX ]d ≤ v. Given X, observe that the associated line bundles OX (−m · KX ) are Aut(X)-linFano earised. Accordingly, there exists a number N ∈ N, such that every X ∈ Xd,0 Jordan admits an Aut(X)-equivariant embedding X ,→ PN . Let jN be the number ob+1 tained by applying the classical result of Jordan, Theorem 1.6, to GLN +1 (C), and set Jordan jdFano := jN +1 · v. Fano Now, given any X ∈ Xd,0 and any finite subgroup G ⊆ Aut(X), the G action N extends to P . The action is thus induced by a representation of a finite linear group Γ, say  / GLN +1 (C) Γ    G

 / P GLN +1 (C).

By Theorem 1.6, the classic result of Jordan, we find a finite Abelian subgroup Φ ⊆ Γ N +1 Jordan is a of index |Φ : Γ| ≤ jN +1 . Since Φ is Abelian, the Φ-representation space C direct sum of one-dimensional representations. Equivalently, we find N + 1 linearly independent, Φ-invariant, linear hyperplanes Hi ⊂ PN +1 . The intersection of suitably chosen Hi with X is then a finite, Φ-invariant subset {x1 , . . . , xr } ⊂ X, of cardinality r ≤ v. The stabilizer of x1 ∈ X is a subgroup Φx1 ⊂ Φ of index |Φ : Φx1 | ≤ v. Taking F as the image of Φx1 → G, we obtain the claim. Remark 8.3. — The proof of Lemma 8.1 shows that the groups G are close to Abelian. It also gives an estimate for jdFano in terms of the volume bound (“v”) and the classical Jordan constant jdFano .

ASTÉRISQUE 422

(1157)

BOUNDEDNESS RESULTS FOR SINGULAR FANO VARIETIES

285

As a next step, we aim to generalize the results of Lemma 8.1 to varieties that are rationally connected, but not necessarily Fano. The following result makes this possible. Lemma 8.4 (Rationally connected subvarieties on different models, [42, Lem. 3.9]) Let X be a projective variety with an action of a finite group G. Suppose that X is klt, with GQ-factorial singularities and let f : X 99K Y be a birational map obtained by running a G-Minimal Model Programs. Suppose that there exists a subgroup F ⊂ G and an F -invariant, rationally connected subvariety T ( Y . Then, there exists an F -invariant rationally connected subvariety Z ( X. Since we are mainly interested to see how boundedness applies to birational transformation groups, we will not explain the proof of Lemma 8.4 in detail. Instead, we merely list a few of the core ingredients, which all come from minimal model theory and birational geometry. — Hacon-McKernan’s solution [19] to Shokurov’s “rational connectedness conjecture,” which guarantees in essence that the fibers of all morphisms appearing in the MMP are rationally chain connected. — A fundamental result of Graber-Harris-Starr, [18], which implies that if f : X → Y is any dominant morphism of proper varieties, where both the target Y and a general fiber is rationally connected, then X is also rationally connected. — Log-canonical center techniques, in particular a relative version of Kawamata’s subadjunction formula, [42, Lem. 2.5]. These results identify general fibers of minimal log-canonical centers under contraction morphisms as rationally connected varieties of Fano type. Proposition 8.5 (Fixed points on rationally connected varieties, [42, Lem. 4.7]) Given d ∈ N, there exists a number jdrc ∈ N such that for any d-dimensional, rationally connected projective variety X and any finite subgroup G ⊆ Aut(X), there exists a subgroup F ⊆ G of index |G : F | ≤ jdrc acting on X with a fixed point. Sketch of proof. — We argue by induction on the dimension. Since the case d = 1 is rc have been found. trivial, assume that d > 1 is given, and that numbers j1rc , . . . , jd−1 Set rc jd := max{j1rc , . . . , jd−1 , jdFano } and jdrc := (jd )2 . Assume that a d-dimensional, rationally connected projective variety X and a finite subgroup G ⊆ Aut(X) are given. By induction hypothesis, it suffices to find a subgroup G0 ⊆ G of index |G : G0 | ≤ jd and a G0 -invariant, rationally connected, proper subvariety X 0 ( X.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

286

S. KEBEKUS

‹ → X is the canonical resolution of singularities, as in [5], then X ‹ is likewise If X ‹ rationally connected, G acts on X and the resolution morphism is equivariant. Since images of rationally connected, invariant subvarieties are rationally connected and invariant, we may assume from the outset that X is smooth. But then we can run a G-equivariant Minimal Model Program (7) terminating with a G-Mori fiber space, X

G-equivariant MMP

/ X0

G-Mori fiber space

/ Y.

In the situation at hand, Lemma 8.4 claims that to find proper, invariant, rationally connected varieties on X, it is equivalent to find them on X 0 . The fiber structure, however, makes that feasible. Indeed, if the base Y of the fibration happens to be a point, then X 0 is Fano with terminal singularities, and Lemma 8.1 applies. Otherwise, let GY be the image of G in Aut(Y ), let GX 0 /Y ⊆ G be the ineffectivity of the G-action on Y , and consider the exact sequence 1 → GX 0 /Y → G → GY → 1. As the image of the rationally connected variety X 0 , the base Y is itself rationally connected. By induction hypothesis, using that dim Y < dim X, there exists a subgroup FY0 ⊆ GY of index |GY : FY0 | < jd that acts on Y with a fixed point, say y ∈ Y . Let G0 ⊂ G be the preimage of G0Y . The fiber Xy is then invariant with respect to the action of G0 and rationally chain connected by [19, Cor. 1.3]. Better still, Prokhorov and Shramov show that it contains a rationally connected, G0 -invariant subvariety. The induction applies. 8.2. Proof of Theorem 1.4 (“Jordan property of Cremona groups”) Given a number d ∈ N, we claim that the number j := jdrc · jdJordan will work for us, where jdrc is the number found in Proposition 8.5, and jdJordan comes from Jordan’s Theorem 1.6. To this end, let X be any rationally connected variety of dimension d, and let G ⊆ Bir(X) be any finite group. Blowing up the indeterminacy loci of the birational transformations g ∈ G in an appropriate manner, we find a bira‹ → X where the action of G in X ‹ is regular rather tional, G-equivariant morphism X than merely birational, see [49, Thm. 3]. Combining with the canonical resolution of ‹ is smooth. Proposition 8.5 will then guarantee singularities, we may assume that X 0 ‹ with a the existence of a subgroup G ⊆ G of index |G : G0 | ≤ jdrc acting on X fixed point x e. Standard arguments (“linearisation at a fixed point”) that go back to ‹ is Minkowski show that the induced action of G0 on the Zariski tangent space Txe (X) (7)

The existence of an MMP terminating with a fiber space is [9, Cor. 1.3.3], which we have quoted before. The fact that the MMP can be chosen in an equivariant manner is not explicitly stated there, but follows without much pain.

ASTÉRISQUE 422

(1157)

BOUNDEDNESS RESULTS FOR SINGULAR FANO VARIETIES

287

faithful, so that Jordan’s Theorem 1.6 applies. In fact, assuming that there exists an element g ∈ G0 \ {e} with Dg | = IdTx‹ (X) f , choose coordinates and use a Taylor series x e expansion to write g(~x) = ~x + Ak (~x) + Ak+1 (~x) + · · · , where each Am (~x) is homogeneous of degree m, and Ak is non-zero. Given any number n, observe that g n (~x) = ~x + n · Ak (~x) + (higher order terms). Since the base field has characteristic zero, this contradicts the finite order of g.

REFERENCES [1] V. Alexeev – “Boundedness and K 2 for log surfaces,” Internat. J. Math. 5 (1994), no. 6, p. 779–810. [2] F. Ambro – “Shokurov’s boundary property,” J. Differential Geom. 67 (2004), no. 2, p. 229–255. [3]

, “Variation of log canonical thresholds in linear systems,” Int. Math. Res. Not. 2016 (2016), no. 14, p. 4418–4448.

[4] W. P. Barth, K. Hulek, C. A. M. Peters & A. Van de Ven – Compact complex surfaces, Ergebn. Math. Grenzg., vol. 4, Springer, 2004. [5] E. Bierstone & P. D. Milman – “Canonical desingularization in characteristic zero by blowing up the maximum strata of a local invariant,” Invent. math. 128 (1997), no. 2, p. 207–302. [6] C. Birkar – “Anti-pluricanonical systems on Fano varieties,” preprint arXiv:1603.05765. [7]

, “Birational geometry of algebraic varieties,” preprint arXiv:1801.00013, to appear as ICM report.

[8]

, “Singularities of linear systems and boundedness of Fano varieties,” preprint arXiv:1609.05543.

[9] C. Birkar, P. Cascini, C. D. Hacon & J. McKernan – “Existence of minimal models for varieties of log general type,” J. Amer. Math. Soc. 23 (2010), p. 405–468. [10] C. Birkar & D.-Q. Zhang – “Effectivity of Iitaka fibrations and pluricanonical systems of polarized pairs,” Publ. Math. Inst. Hautes Études Sci. 123 (2016), p. 283–331.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

288

S. KEBEKUS

[11] J. Blanc, S. Lamy & S. Zimmermann – “Quotients of higher dimensional cremona groups,” preprint arXiv:1901.04145. [12] A. A. Borisov & L. A. Borisov – “Singular toric Fano varieties,” Mat. Sb. 183 (1992), no. 2, p. 134–141. [13] S. Cantat – “The Cremona group,” in Algebraic geometry: Salt Lake City 2015, Proc. Sympos. Pure Math., vol. 97, Amer. Math. Soc., 2018, p. 101–142. [14] W. Chen – “Boundedness of varieties of fano type with alpha-invariants and volumes bounded below,” preprint arXiv:1810.04019. [15] S. R. Choi & V. V. Shokurov – “Geography of log models: theory and applications,” Cent. Eur. J. Math. 9 (2011), no. 3, p. 489–534. [16] E. Floris & V. Lazić – “On the b-semiampleness conjecture,” preprint arXiv:1808.00717. [17] O. Fujino & Y. Gongyo – “On the moduli b-divisors of lc-trivial fibrations,” Ann. Inst. Fourier 64 (2014), no. 4, p. 1721–1735. [18] T. Graber, J. Harris & J. Starr – “Families of rationally connected varieties,” J. Amer. Math. Soc. 16 (2003), no. 1, p. 57–67. [19] C. D. Hacon & J. McKernan – “On Shokurov’s rational connectedness conjecture,” Duke Math. J. 138 (2007), no. 1, p. 119–136. [20]

, “Boundedness results in birational geometry,” in Proceedings of the International Congress of Mathematicians. Volume II, Hindustan Book Agency, New Delhi, 2010, p. 427–449.

[21] C. D. Hacon, J. McKernan& C. Xu – “On the birational automorphisms of varieties of general type,” Ann. of Math. 177 (2013), no. 3, p. 1077–1111. [22]

, “ACC for log canonical thresholds,” Ann. of Math. 180 (2014), no. 2, p. 523–571.

[23]

, “Boundedness of varieties of log general type,” in Algebraic geometry: Salt Lake City 2015, Proc. Sympos. Pure Math., vol. 97, Amer. Math. Soc., 2018, p. 309–348.

[24] C. D. Hacon & C. Xu – “Boundedness of log Calabi-Yau pairs of Fano type,” Math. Res. Lett. 22 (2015), no. 6, p. 1699–1716. [25] F. Hu – “Jordan property for algebraic groups and automorphism groups of projective varieties in arbitrary characteristic,” preprint arXiv:1804.10946, to appear in Indiana Univ. Math. J. [26] C. Jiang – “Boundedness of Q-fano varieties with degrees and alpha-invariants bounded from below,” preprint arXiv:1705.02740.

ASTÉRISQUE 422

(1157)

BOUNDEDNESS RESULTS FOR SINGULAR FANO VARIETIES

289

[27] C. Jordan – “Mémoire sur les équations différentielles linéaires à intégrale algèbriques,” J. reine angew. Math. 84 (1877), p. 89–216, available at http: //resolver.sub.uni-goettingen.de/purl?PPN243919689_0084. [28] Y. Kawamata – “Subadjunction of log canonical divisors. II,” Amer. J. Math. 120 (1998), no. 5, p. 893–899. [29] J. Kollár – “Singularities of pairs,” in Algebraic geometry—Santa Cruz 1995, Proc. Sympos. Pure Math., vol. 62, Amer. Math. Soc., 1997, p. 221–287. [30]

, “Kodaira’s canonical bundle formula and adjunction,” in Flips for 3-folds and 4-folds, Oxford Lecture Ser. Math. Appl., vol. 35, Oxford Univ. Press, 2007, p. 134–162.

[31]

, Singularities of the minimal model program, Cambridge Tracts in Mathematics, vol. 200, Cambridge Univ. Press, 2013.

[32] J. Kollár, Y. Miyaoka & S. Mori – “Rational connectedness and boundedness of Fano manifolds,” J. Differential Geom. 36 (1992), no. 3, p. 765–779. [33] J. Kollár & S. Mori – Birational geometry of algebraic varieties, Cambridge Tracts in Mathematics, vol. 134, Cambridge Univ. Press, 1998. [34] R. Lazarsfeld – Positivity in algebraic geometry. II, Ergebn. Math. Grenzg., vol. 49, Springer, 2004. [35] S. Meng & D.-Q. Zhang – “Jordan property for non-linear algebraic groups and projective varieties,” Amer. J. Math. 140 (2018), no. 2, p. 403–418. [36] V. L. Popov – “Jordan groups and automorphism groups of algebraic varieties,” in Automorphisms in birational and affine geometry, Springer Proc. Math. Stat., vol. 79, Springer, 2014, p. 185–213. [37] [38]

, “The Jordan property for Lie groups and automorphism groups of complex spaces,” Math. Notes 103 (2018), nos. 5-6, p. 811–819. , “Three plots about the cremona groups,” preprint arXiv:1810.00824.

[39] Y. G. Prokhorov & V. V. Shokurov – “The first fundamental theorem on complements: from global to local,” Izv. Ross. Akad. Nauk Ser. Mat. 65 (2001), no. 6, p. 99–128. [40]

, “Towards the second main theorem on complements,” J. Algebraic Geom. 18 (2009), no. 1, p. 151–199.

[41] Y. G. Prokhorov & C. Shramov – “Jordan property for groups of birational selfmaps,” Compos. Math. 150 (2014), no. 12, p. 2054–2072. [42]

, “Jordan property for Cremona groups,” Amer. J. Math. 138 (2016), no. 2, p. 403–418.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

290

S. KEBEKUS

[43] J-P. Serre – “A Minkowski-style bound for the orders of the finite subgroups of the Cremona group of rank 2 over an arbitrary field,” Mosc. Math. J. 9 (2009), no. 1, p. 193–208. [44]

, “Le groupe de Cremona et ses sous-groupes finis,” Séminaire Bourbaki, vol. 2008/2009, exposé no 1000, Astérisque 332 (2010), p. 75–100.

[45] V. V. Shokurov – “3-fold log flips. Appendix by Yujiro Kawamata: The minimal discrepancy coefficients of terminal singularities in dimension three.,” Russ. Acad. Sci., Izv., Math. 40 (1992), no. 1, p. 95–202. [46]

, “3-fold log models,” J. Math. Sci. 81 (1996), no. 3, p. 2667–2699.

[47]

, “Complements on surfaces,” J. Math. Sci. (New York) 102 (2000), no. 2, p. 3876–3932.

[48] C. Shramov & V. Vologodsky – “Automorphisms of pointless surfaces,” preprint arXiv:1807.06477. [49] H. Sumihiro – “Equivariant completion,” J. Math. Kyoto Univ. 14 (1974), p. 1– 28. [50] Y. Xu – “Summary on Proof of BAB,” preprint arXiv:1804.07681.

Stefan KEBEKUS Mathematisches Institut Albert-Ludwigs-Universität Freiburg Ernst-Zermelo-Straße 1 79104 Freiburg im Breisgau, Germany Freiburg Institute for Advanced Studies (FRIAS) Freiburg im Breisgau, Germany E-mail : [email protected]

ASTÉRISQUE 422

Séminaire BOURBAKI 71e année, 2018–2019, no 1158, p. 291 à 326 doi:10.24033/ast.1137

Janvier 2019

RÉDUCTION STABLE EN DIMENSION SUPÉRIEURE [d’après Kollár, Hacon-Xu, ...] par Olivier BENOIST

INTRODUCTION L’espace de modules Mg des courbes lisses de genre g > 2 construit par Mumford [66] est une variété algébrique dont les points complexes sont naturellement en bijection avec les classes d’isomorphisme de courbes projectives lisses complexes de genre g (nous renvoyons à [3] et à [55] pour un aperçu de l’histoire de ce sujet). Que ce soit pour étudier les dégénérescences de familles de courbes lisses ou la géométrie de la variété Mg elle-même, il est utile de disposer d’une compactification projective de Mg qui soit modulaire, c’est-à-dire qui paramètre encore des courbes algébriques, éventuellement singulières. Une telle compactification a été construite par Deligne et Mumford [14] : c’est l’espace de modules des courbes stables M g . La recherche d’espaces de modules analogues paramétrant des variétés de dimension supérieure a suscité de nombreux travaux. Pour obtenir une théorie similaire, on se restreint aux variétés dont le fibré canonique est ample (1). Le cas des surfaces a alors été résolu par Kollár, Shepherd-Barron et Alexeev [60, 47, 5], et Viehweg [79] a traité le cas des variétés lisses en dimension arbitraire. Le cas général a fait l’objet d’avancées récentes, décrites dans ce rapport. Ces progrès sont dus au développement du programme des modèles minimaux par Birkar, Cascini, Hacon, McKernan et Xu [12, 36, 34], à de nombreux travaux de Kollár [47, 57, 53, 54], ainsi qu’à Fujino, Kovács et Patakfalvi [22, 62]. Nous expliquons tout d’abord une motivation pour ces travaux : obtenir des théorèmes de réduction stable en dimension supérieure (théorèmes 1.6 et 1.7). Nous (1)

Par le biais de leurs modèles canoniques, cela prend en compte toutes les variétés de type général. Des compactifications modulaires ont aussi été construites, par d’autres méthodes que celles expliquées ici, pour d’autres espaces de modules : variétés abéliennes [7], certaines variétés de Fano [64].

© Astérisque 422, SMF 2020

292

O. BENOIST

définissons ensuite les variétés stables qui jouent dans ce cadre le rôle des courbes stables de Deligne et Mumford, et énonçons le théorème d’existence des espaces de modules de variétés stables (théorème 2.6). Dans les troisième et quatrième sections, nous esquissons enfin la preuve du théorème de réduction stable et la construction de ces espaces de modules. Conventions. Tous les schémas sont des Q-schémas noethériens. Une variété est un schéma séparé de type fini sur un corps k de caractéristique nulle, par exemple le corps C des nombres complexes.

1. RÉDUCTION SEMI-STABLE ET RÉDUCTION STABLE Fixons dans cette section un morphisme propre et surjectif f : X → B entre variétés réduites. Supposons B intègre, et notons η le point générique de B et Xη la fibre générique de f . On voit f comme une famille de variétés algébriques paramétrée par les points de B. Cette famille peut avoir de mauvaises propriétés : les fibres de f peuvent ne pas toutes avoir la même dimension, être très singulières... On est ainsi amené à rechercher des modèles birationnels f 0 : X 0 → B 0 de f dont la géométrie et les singularités sont contrôlées. Plus précisément, on recherche un diagramme commutatif : φ

X0

/X

/ XB 0

(1) f0

!  B0

f

π

 / B,

dans lequel B 0 est une variété intègre de point générique η 0 , le morphisme π : B 0 → B est propre, génériquement fini et surjectif, le carré est cartésien, φη0 est birationnelle et f 0 est propre. Quelles propriétés peut-on alors imposer au morphisme f 0 ? 1.1. Réduction semi-stable Une première réponse est apportée par le théorème de réduction semi-stable de Kempf, Knudsen, Mumford et Saint-Donat [45, p. 53]. Théorème 1.1. — Si dim(B) = 1, on peut choisir f 0 : X 0 → B 0 comme dans (1) de sorte que B 0 et X 0 soient lisses et les fibres de f 0 soient des diviseurs réduits à croisements normaux stricts dans X 0 . L’assertion que les fibres sont réduites (c’est-à-dire sans multiplicités) est ici essentielle. Quand la base a dimension arbitraire, on dispose encore d’un théorème de

ASTÉRISQUE 422

(1158)

RÉDUCTION STABLE EN DIMENSION SUPÉRIEURE

293

réduction semi-stable, démontré dans une variante faible par Abramovich et Karu [2] et en toute généralité par Adiprasito, Liu et Temkin [4]. Théorème 1.2. — On peut choisir f 0 : X 0 → B 0 comme dans (1) de sorte que B 0 et X 0 soient lisses, et f 0 soit plat à fibres réduites. Les énoncés de [2, 4] sont plus précis : on peut garantir que f 0 soit munie d’une structure toroïdale. On en déduit par exemple que les fibres de f 0 sont Gorenstein [2, Proposition 6.5]. Les théorèmes de réduction semi-stable ci-dessus ont l’avantage de donner lieu à des familles f 0 : X 0 → B 0 dont l’espace total X 0 est lisse. Ils ont cependant plusieurs inconvénients. Ils sont fortement non uniques. Par exemple, dans le cadre du théorème 1.1, on peut sans dommage éclater un point de X 0 en lequel f 0 est lisse. De cette manière, même si le morphisme f est lisse (si Xη a bonne réduction), il se peut que f 0 ne le soit pas. Ainsi, si les singularités des fibres sont très contrôlées, leur géométrie ne l’est pas du tout. Les théorèmes de réduction stable apportent une solution à ce problème. 1.2. Réduction stable pour les familles de courbes Le premier tel énoncé, pour les familles à un paramètre de courbes, est dû à Deligne et Mumford [14] (d’autres preuves ont été données, par exemple dans [10, 77]). Définition 1.3. — Une courbe stable est une variété projective connexe C de dimension 1 dont les singularités sont au plus nodales et dont le faisceau dualisant ωC est ample. Le genre de C est l’entier g(C) = h0 (C, ωC ). Théorème 1.4. — Si dim(B) = 1 et si Xη est une courbe stable, on peut choisir f 0 : X 0 → B 0 comme dans (1) de sorte que f 0 soit plat à fibres des courbes stables, et φη0 soit un isomorphisme. De plus, si B 0 est fixée, un tel f 0 : X 0 → B 0 est unique. Le théorème 1.4 s’applique en particulier quand X η est une courbe lisse de genre > 2. À la différence du théorème 1.1, il ne restreint pas les singularités de X 0 . La géométrie des fibres de f 0 est en revanche très contrainte. Les énoncés d’unicité et d’existence dans le théorème 1.4 reflètent la séparation et la propreté de l’espace de modules des courbes stables M g (et même, plus précisément, du champ de modules M g des courbes stables). La propreté de M g implique à son tour un théorème de réduction stable sur des bases de dimension arbitraire. Théorème 1.5. — Si Xη est une courbe stable, on peut choisir f 0 : X 0 → B 0 comme dans (1) de sorte que f 0 soit plat à fibres des courbes stables, et φη0 soit un isomorphisme.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

294

O. BENOIST

Preuve. — Soit g le genre de X η . Il n’existe pas de famille universelle de courbes stables sur l’espace de modules M g . Il résulte en revanche du lemme de Chow pour les champs de Deligne-Mumford [63, Théorème 16.6], appliqué au champ de modules M g des courbes stables, qu’il existe une famille plate p : C → Z de courbes stables de genre g telle que le morphisme induit Z → M g soit fini et surjectif. Remarquons que Z est propre par propreté de M g . La courbe stable X η induit un morphisme ‹ η → M g . Notons η 0 une composante irréductible du produit fibré η ×M Z. Soient B g ‹ une modification résolvant les indéterminées la normalisation de B dans η 0 et B 0 → B ‹ de l’application rationnelle naturelle B 99K Z. Le morphisme f 0 : X 0 → B 0 construit en changeant de base p : C → Z par le morphisme B 0 → Z a les propriétés requises. Le théorème 1.5, appliqué à une famille de courbes balayant une variété arbitraire, est un outil crucial dans la preuve du théorème d’altération des singularités de de Jong [41] (voir plus précisément [41, §2.24, §5.13] ou [11, §3.2.3]). 1.3. Réduction stable en dimension supérieure Nous définirons plus loin une notion de variété stable (définition 2.2) et de famille de variétés stables ou famille stable (définition 2.4) en dimension supérieure, permettant de généraliser les théorèmes 1.4 et 1.5. Pour l’instant, disons seulement qu’une variété propre et lisse est stable si et seulement si son fibré canonique est ample. C’est une condition bien plus restrictive pour les variétés de dimension > 2 que pour les courbes. Par exemple, les théorèmes ci-dessous ne s’appliquent pas aux familles de variétés de Fano, de variétés abéliennes ou de surfaces K3. Théorème 1.6. — Si dim(B) = 1 et si Xη est une variété stable, il existe f 0 : X 0 → B 0 comme dans (1) tel que f 0 soit une famille stable, et φη0 soit un isomorphisme. De plus, si B 0 est fixée, un tel f 0 : X 0 → B 0 est unique. Ce théorème est dû à Hacon et Xu [36] quand X η est normale et à Kollár en général [53, 54] (voir §3 pour plus de détails). Comme dans le cas des courbes, une conséquence géométrique du théorème 1.6 est la propreté des espaces de modules de variétés stables (voir le théorème 2.6). Une fois de tels espaces de modules construits (ce qui est significativement plus dur que pour les espaces de modules de courbes, comme on le verra au § 4), l’argument expliqué dans la preuve du théorème 1.5 permet d’obtenir un théorème de réduction stable sur une base de dimension supérieure.

ASTÉRISQUE 422

(1158)

RÉDUCTION STABLE EN DIMENSION SUPÉRIEURE

295

Théorème 1.7. — Si Xη est une variété stable, il existe f 0 : X 0 → B 0 comme dans (1) tel que f 0 soit une famille stable, et φη0 soit un isomorphisme.

2. STABILITÉ Dans cette section, nous définissons et étudions les analogues en dimension supérieure des courbes stables de Deligne et Mumford. 2.1. Variétés stables On peut penser aux courbes lisses de genre g > 2 qui ne sont pas hyperelliptiques comme plongées, à l’aide de leur fibré canonique, dans l’espace projectif Pg−1 . Si l’on k veut aussi prendre en compte les courbes hyperelliptiques, il faut plutôt considérer leur plongement tricanonique dans P5g−6 . On voudra aussi penser aux variétés stables k de dimension supérieure comme étant pluricanoniquement plongées. Ce point de vue va imprégner toute la suite de ce texte. Il explique le rôle prépondérant que vont jouer le faisceau canonique et ses puissances dans la définition des variétés stables. 2.1.1. Singularités. — Introduisons tout d’abord la classe des singularités que ces variétés stables pourront porter. Définition 2.1. — Une variété X est dite à singularités semi-log canoniques (slc) si elle satisfait les conditions (i)–(v) suivantes. (i) (ii) (iii) (iv) (v)

X est réduite et purement de dimension d, X est à croisements normaux doubles en codimension 1, X satisfait la condition S2 de Serre, [m] il existe m > 0 tel que ωX soit inversible, les discrépances des diviseurs au-dessus de X sont > −1.

Si X est de plus normale ou de manière équivalente par le critère de Serre, si X vérifie : (ii)0 X est régulière en codimension 1, on dit que X est à singularités log canoniques (lc). Expliquons ces conditions. Que X soit à croisements normaux doubles en codimension 1 signifie qu’il existe un ouvert U ⊂ X dont le complémentaire a codimension > 2, le long duquel X est soit régulière, soit localement isomorphe (pour la topologie étale ou, si k = C, pour la topologie analytique) à la singularité {xy = 0} ⊂ Ad+1 . Qu’il soit nécessaire d’autoriser de telles singularités est déjà k apparent dans le cas des courbes stables.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

296

O. BENOIST

La condition S2 de Serre est la propriété de Hartogs : elle stipule que les fonctions régulières sur X s’étendent au travers des fermés Z ⊂ X de codimension > 2. Plus précisément, si Z est un tel fermé et si j : X \ Z ,→ X est l’inclusion, le morphisme naturel O X → j∗ O X\Z est un isomorphisme. C’est un substitut de la normalité de X. Les variétés stables doivent être pensées comme (pluri)canoniquement plongées et il est donc important de contrôler les formes différentielles de degré maximal sur X. C’est le rôle des conditions (iv) et (v). Notons j : U ,→ X le plus gros ouvert le long duquel les singularités de X sont à croisements normaux doubles. Comme les croisements normaux doubles sont des singularités localement d’intersection complète, donc Gorenstein, le faisceau dualisant ωU de U est un faisceau inversible (2). On définit le faisceau canonique (3) de X par ωX := j∗ ωU et on introduit, pour tout n ∈ Z, ses [n] ⊗n puissances réflexives ωX := j∗ (ωU ) : les faisceaux pluricanoniques de X. Qu’il existe [m] un entier m > 0 tel que ωX soit un faisceau inversible, donc associé à un fibré en droites, est bien sûr une condition nécessaire à toute tentative de voir X comme plongée à l’aide de formes pluricanoniques ! La condition (v) donne un contrôle birationnel sur les formes pluricanoniques sur X. Soit π : Y → X une modification normale (4) de X (par exemple la normalisation de X ou une résolution des singularités de X), et soient (Ei )i∈I les diviseurs exceptionnels S [m] de π. Soit m > 0 un entier tel que ωX soit inversible. Au-dessus du lieu Y \ i Ei [m] où π est un isomorphisme, on dispose d’un isomorphisme évident ρ : ωY \S Ei −∼→ i

[m]

[m]

[m]

(π ∗ ωX )| S . Comme ωY et π ∗ ωX sont inversibles au point générique de chacun Y \ i Ei des Ei , le morphisme ρ a des zéros ou des pôles d’une certaine multiplicité le long 1 de ces diviseurs, de sorte qu’il existe des aEi (X) ∈ m Z tels que ρ se prolonge en un isomorphisme ÅX ã [m] ∼ ∗ [m] m · aEi (X)Ei . (2) ρ : ωY −→ π ωX i

Les nombres rationnels aEi (X) ont été choisis pour ne pas dépendre du choix de l’entier m : ce sont les discrépances des diviseurs Ei . La condition (v) selon laquelle ces discrépances sont toujours > −1 signifie en substance que les formes canoniques sur X s’étendent en des formes à pôles au plus logarithmiques sur les modifications de X. Il suffit de la vérifier pour les (2)

Sur l’ouvert de lissité de X, il s’agit du faisceau canonique des formes différentielles de degré maximal. On peut décrire très concrètement ωU en général : une section locale est une d-forme différentielle sur la normalisation, à pôles au plus logarithmiques le long de l’image inverse du lieu double, et dont les résidus le long des deux branches du lieu double sont opposés [53, Proposition 5.8]. (3) On prendra garde que, X n’étant pas Cohen-Macaulay en général, ce faisceau peut ne pas coïncider avec le complexe dualisant de X : il n’en est qu’un des faisceaux de cohomologie. (4) Une modification est un morphisme propre birationnel. On n’a pas vraiment besoin de supposer Y normale : il suffit que Y soit S2 et régulière aux points génériques des diviseurs exceptionnels de π.

ASTÉRISQUE 422

(1158)

RÉDUCTION STABLE EN DIMENSION SUPÉRIEURE

297

diviseurs apparaissant sur une résolution arbitraire des singularités de X dont le diviseur exceptionnel est à croisements normaux stricts (combiner [53, Lemma 5.10 et Corollary 2.13]). C’est la condition la plus subtile de la définition 2.1. La preuve transparente de l’unicité dans le théorème de réduction stable au § 3.1 permet de se convaincre de sa pertinence. On définit d’autres classes de singularités en conservant les conditions (i)-(iv), mais en demandant à ce que les discrépances des diviseurs au-dessus de X soient > −1 (resp. > 0, resp. > 0) : ce sont les singularités kawamata log terminales ou klt (resp. canoniques, resp. terminales). Ces singularités sont normales. Nous nous en servirons peu. Ces définitions s’étendent sans difficultés à des schémas plus généraux que des variétés. Nous les utiliserons par exemple pour des schémas de type fini sur le spectre d’un anneau de valuation discrète au §3 et au §4.2.4. 2.1.2. Définition. — La notion de stabilité combine les propriétés locales discutées ci-dessus et une condition globale d’amplitude du faisceau canonique. Définition 2.2. — Une variété stable est une variété projective X à singularités slc dont le faisceau canonique ωX est ample. Le faisceau ωX n’est pas inversible en général. La définition 2.2 requiert seulement [m] qu’il soit ample comme Q-fibré en droites, c’est-à-dire que ωX soit ample pour un [m] m > 0 (de manière équivalente, pour tout m > 0) tel que ωX soit inversible. Les courbes stables sont traditionnellement supposées connexes, comme dans la définition 1.3. Il est plus naturel de ne pas faire cette hypothèse (voir par exemple le théorème 3.3). La définition des variétés stables dans le cas des surfaces avait été dégagée par Kollár et Shepherd-Barron [60, §5.4] et la définition en dimension arbitraire en est une extension immédiate. En revanche, l’étude de ces variétés est bien plus difficile en dimension > 3 qu’en dimension 2. 2.1.3. Cas des paires. — Nous utiliserons la variante suivante des définitions 2.1 et 2.2. Une paire (X, ∆) est constituée d’une variété X et d’un Q-diviseur de Weil P ∆ = ci ∆i , où les ∆i sont des sous-variétés intègres de codimension 1 de X non incluses dans le lieu singulier de X et où ci ∈ Q (dans la pratique, on aura même ci ∈ Q ∩[0, 1]). On étend les définitions à ce cadre en remplaçant partout ωX par le faisceau canonique ωX (∆) de la paire. Définition 2.3. — La paire (X, ∆) est à singularités slc (resp. lc) si ci ∈ Q ∩[0, 1], si X est réduite, purement de dimension d, à croisements normaux doubles (resp. [m] régulière) en codimension 1 et S2 , s’il existe un entier m > 0 tel que ωX (m∆) est inversible et si les discrépances aE (X, ∆) des diviseurs E au-dessus de X sont > −1.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

298

O. BENOIST

Elle est stable si elle est à singularités slc si X est projective et si ωX (∆) est ample. Dans cette définition, les hypothèses faites sur X assurent l’existence d’un ouvert j : U ,→ X dont le complémentaire a codimension > 2 le long duquel X est Gorenstein et les ∆i sont Cartier. Si n ∈ Z est tel que les nci sont des entiers, cela [n] ⊗n permet de définir le faisceau n-canonique ωX (n∆) := j∗ (ωU (n∆| )) de (X, ∆). U Les discrépances aE (X, ∆) sont calculées par rapport au faisceau canonique ωX (∆) de la paire. Si π : Y → X est une modification normale de X avec diviseurs exceptionnels Ei , si (π −1 )∗ ∆ est la transformée stricte de ∆ dans Y , et si m > 0 est [m] tel que ωX (m∆) est inversible, elles sont définies par l’isomorphisme naturel généralisant (2) :  X [m] [m] (3) ωY (m(π −1 )∗ ∆) −∼→ π ∗ ωX (m∆) m · aEi (X, ∆)Ei . i

Nous aurons à considérer des paires pour plusieurs raisons ; la principale est la suivante. Soit X une variété satisfaisant aux conditions (i)-(iv) de la définition 2.1. [m] ‹ → X la normalisation de X. Notons Soit m > 0 tel que ωX soit inversible et soit ν : X ‹ Γ ⊂ X le lieu exceptionnel de ν, muni de sa structure réduite. C’est un diviseur qui est l’adhérence de l’image inverse par ν du lieu où X est à croisements normaux doubles. [m] [m] On appelle Γ le conducteur de X. L’isomorphisme évident (ν ∗ ωX )| f −∼→ ω f | f X\Γ X X\Γ se prolonge en un isomorphisme [m]

[m] X

ν ∗ ωX −∼→ ω f (mΓ),

(4)

comme le montre un calcul local sur le lieu où X est à croisements normaux doubles [53, (5.7.4)]. On déduit immédiatement de l’isomorphisme (4) l’équivalence [53, Lemma 5.10] : (5)

‹ Γ) est à singularités lc. X est à singularités slc ⇐⇒ (X,

Ce procédé de normalisation permettra de ramener l’étude des variétés à singularités slc au cas normal. Comprendre dans quelle mesure on peut reconstruire X à partir ‹ Γ) est une question difficile (voir le théorème 3.3 pour un énoncé précis). de (X, 2.1.4. Exemples. — Les seules singularités slc de dimension 1 sont les nœuds. En dimension 2, les singularités slc ont été classifiées par Kawamata [43, Theorem 2] dans le cas normal et par Kollár et Shepherd-Barron [60, Theorem 4.24] en général (voir aussi [53, §3.3] ou [54]). Sans rappeler cette classification en détail, donnons quelques exemples représentatifs. Les singularités obtenues comme quotient de A2k par un sous-groupe fini de GL2 (k) sont lc. Cela inclut toutes les singularités Du Val (ou points doubles rationnels). D’autres singularités lc de surface sont les singularités elliptiques obtenues comme cônes sur une courbe elliptique.

ASTÉRISQUE 422

(1158)

RÉDUCTION STABLE EN DIMENSION SUPÉRIEURE

299

Des exemples de surfaces slc non normales sont les points à croisement normaux triples {xyz = 0} ⊂ A3k , le parapluie de Whitney ou pinch point {x2 = yz 2 } ⊂ A3k , ou un cône sur une courbe elliptique nodale {y 2 = x3 + x2 } ⊂ A3k . On ne dispose pas de classification en dimension supérieure. Les cônes M (6) C(X, L) := Spec H 0 (X, L⊗l ) l>0

où X est une variété projective munie d’un fibré ample L, fournissent une instructive source d’exemples. On calcule que C(X, L) a des singularités slc (resp. lc) si et seulement si X a des singularités slc (resp. lc) et s’il existe des entiers m < 0 et l > 0 [m] tels que ωX ' L⊗l [53, §3.1]. En particulier, le cône anticanonique sur une variété de Fano, ou un cône associé à un fibré ample arbitraire sur une variété de Calabi-Yau, ont des singularités lc. D’autres exemples élémentaires sont les singularités quotient, c’est-à-dire les quotients de variétés lisses (5) par l’action d’un groupe fini [53, 3.18]. Des exemples plus riches, à la topologie plus compliquée, ont été construits par Kollár [50]. 2.2. Familles stables 2.2.1. Définition. — Comme on le verra au §2.2.2, les familles plates à fibres slc (resp. stables) ne donnent pas lieu à une bonne notion de famille de variétés slc (resp. stables). La raison pour cela est que, si l’on souhaite penser aux variétés stables comme étant pluricanoniquement plongées, il est important que les faisceaux (pluri)canoniques des fibres varient convenablement en famille ; c’est une condition que l’on doit imposer. Définition 2.4. — Une famille localement stable est un morphisme plat à fibres [n] slc f : X → B tel que pour tout n ∈ Z, le faisceau ωX /B soit f -plat de formation commutant à tout changement de base. C’est une famille de variétés stables ou famille stable si f est de plus propre à fibres stables. [n]

Dans cette définition, les faisceaux pluricanoniques relatifs ωX /B sont construits comme dans le cas absolu. Plus précisément, on note j : U ,→ X le plus gros ouvert le long duquel les singularités des fibres géométriques de f sont à croisements normaux doubles. Le morphisme f | est plat à fibres Gorenstein, de sorte que le faisceau U dualisant relatif ωU /B est inversible [13, Theorem 3.5.1]. On pose ωX /B := j∗ ωU /B [n]

⊗n et ωX /B := j∗ (ωU /B ). (5) Il est faux en général que le quotient d’une variété lc par un groupe fini est encore lc. Soit π : S → T une surface K3 obtenue comme revêtement double de T = P1 × P1 ramifié au-dessus d’un diviseur lisse de bidegré (4, 4), et notons L := O T (1, 2). Le morphisme de cônes C(S, π ∗ L) → C(T, L) est le quotient par une action de Z /2 Z, mais C(S, π ∗ L) est lc alors que C(T, L) ne l’est pas.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

300

O. BENOIST

La définition 2.4 requiert tout d’abord que les faisceaux pluricanoniques [n] relatifs ωX /B soient plats sur B. Cette hypothèse ne suffit pas à assurer que [n]

les fibres ωX /B |

Xb

de ces faisceaux au-dessus d’un point b ∈ B coïncident avec [n]

les faisceaux pluricanoniques ωXb de la fibre. C’est le rôle de la condition de changement de base dans la définition 2.4 : elle revient à imposer que le morphisme [n] [n] naturel ωX /B | → ωXb soit un isomorphisme, pour tout b ∈ B et tout n ∈ Z. Xb

Ceci implique (6) en effet la propriété, a priori plus forte, de commutation à tout changement de base : pour tout morphisme g : B 0 → B, si l’on note gX : X 0 → X le [n] ∗ [n] changement de base, le morphisme naturel gX ωX /B → ωX 0 /B 0 est un isomorphisme. Il suit de la définition 2.4 que si f est localement stable, il existe m > 0 tel que [m] le faisceau ωX /B soit inversible (et f -ample si f est stable). En effet, par récurrence [m]

noethérienne sur la base B, on peut choisir m de sorte que ωXb soit inversible pour tout b ∈ B. Il résulte de sa platitude et de sa commutation au changement de base [m] que ωX /B est inversible (et f -ample si les fibres sont stables). Une famille stable est donc bien canoniquement polarisée, comme désiré. [n] Les conditions de platitude et de commutation au changement de base pour ωX /B sont subtiles. Elles sont automatiques pour n = 1 par [58, Theorem 7.9.3] et [53, Corollary 6.32]. Elles sont toujours vérifiées si les fibres de f sont à singularités canoniques (7) (voir [52, Aside 30]). Enfin, quand la base B est réduite, on dispose d’un critère numérique : il est équivalent de demander que le degré de la polarisation canonique des fibres soit localement constant sur la base [54]. [n] Dans la définition 2.4, la condition de commutation de tous les ωX /B aux changements de base est connue sous le nom de condition de Kollár. Une variante, [m] dite condition de Viehweg [79, Assumptions 8.30], consiste à demander que ωX /B soit inversible (et par conséquent commute aux changements de base) seulement pour un m > 0. Elle permet également de construire des espaces de modules projectifs de variétés stables ; ils diffèrent par leur structure schématique de ceux obtenus à l’aide de la condition de Kollár (voir [9]). 2.2.2. Exemples. — Illustrons, en suivant [61, 7.A] et [52, Example 26], l’importance de la condition de changement de base dans la Définition 2.4. Considérons d’une part le plongement de Veronese Σ1 = P2k ,→ P5k et d’autre part le plongement Σ2 = P1k × P1k ,→ P5k induit par O (1, 2). Ces deux surfaces projectives (6)

Pour le voir, on peut combiner [31, Théorème 5.10.5 et Proposition 6.3.1]. Justifions-le. Par classification des singularités canoniques de surfaces [59, Theorem 4.20], les fibres de f sont Gorenstein en codimension 2. Par [13, Theorem 3.5.1], il existe un ouvert j : U ,→ X tel que X \ U a codimension > 3 dans les fibres de f et tel que f | est Gorenstein, de sorte que ωU /B est U inversible. Comme les fibres de f sont de plus S3 par [19] (voir le théorème 2.8), on peut conclure à l’aide de [49, Theorem 12].

(7)

ASTÉRISQUE 422

(1158)

RÉDUCTION STABLE EN DIMENSION SUPÉRIEURE

301

ont pour sections hyperplanes lisses des courbes rationnelles normales quartiques Γ. Pour i ∈ {1, 2}, soit fi : X i → P1k un pinceau général de sections hyperplanes du cône C(Σi , O (1)) sur Σi . Toutes les fibres de fi sont isomorphes à Σi , sauf la section hyperplane passant par le sommet du cône, qui est isomorphe au cône C sur la courbe rationnelle normale quartique (8). On voit ainsi que les fibres de fi ont des singularités lc (voir § 2.1.4). On remarque cependant que les nombres d’intersection ωΣ1 ·ωΣ1 = 9 et ωΣ2 ·ωΣ2 = 8 des surfaces Σ1 et Σ2 diffèrent. Comme f1 et f2 ont une fibre spéciale isomorphe à C en commun, cette remarque n’est pas compatible avec le fait que les faisceaux dualisants relatifs de ces familles forment un Q-fibré en droites. Cela s’explique par le fait que, [2] si f1 est bien localement stable (en particulier, le faisceau ωX 1 /B est inversible (9)), la [n]

famille f2 ne l’est pas (ωX 2 /B n’est inversible pour aucun n > 0(9) ). En remplaçant les fibres des fi par des revêtements ramifiés appropriés, on obtient des exemples analogues pour lesquels f1 est stable (et pas seulement localement stable). On construit un exemple un peu différent en suivant [60, Example 5.12]. Effectuons la même construction à l’aide des deux surfaces Σ01 = P1k × P1k ,→ P8k et Σ02 = PP1k (O ⊕ O (1)) ,→ P8k , plongées par leur fibré anticanonique, dont les sections hyperplanes lisses sont des courbes elliptiques octiques. Prenant, pour i ∈ {1, 2}, un pinceau de sections hyperplanes du cône C(Σ0i , O (1)) sur Σ0i , on peut obtenir deux familles fi0 : X 0i → P1k dont les fibres générales sont toutes isomorphes à Σ0i , sauf une qui est un cône sur une courbe elliptique octique fixée. À la différence de l’exemple précédent, les deux familles sont localement stables : on vérifie même que ωX i /B est inversible(9) pour i ∈ {1, 2}. Comme ci-dessus, en remplaçant les fi par des revêtements ramifiés bien choisis, on peut obtenir deux familles stables qui ont une fibre singulière en commun et dont les fibres générales, lisses, ne peuvent être membres d’une même famille lisse de base irréductible. Il s’agit donc d’un exemple où deux composantes irréductibles distinctes de l’espace des modules des variétés stables s’intersectent. Ce phénomène n’apparaît pas en dimension 1. Signalons que Horikawa [40, Theorem 3] a construit de tels exemples pour lesquels la fibre spéciale commune aux deux familles est de plus lisse.

(8)

Cette section hyperplane pourrait a priori avoir un point immergé au sommet. On vérifie que ce n’est pas le cas en remarquant que Σi et C ont même polynôme de Hilbert. (9) Dans ces exemples, l’unique singularité de l’espace total est celle d’un cône. On vérifie alors ces assertions à l’aide du calcul du groupe des classes d’un cône [53, Proposition 3.14 (4)].

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

302

O. BENOIST

2.3. Espaces de modules de variétés stables 2.3.1. Existence. — Nous pouvons à présent donner l’énoncé précis d’existence de l’espace de modules des variétés stables. La construction de l’espace de modules des courbes stables demandait de fixer le genre de ces courbes. En dimension supérieure, on doit aussi fixer un invariant discret : la fonction de Hilbert. Définition 2.5. — La fonction de Hilbert F : Z → Z d’une variété stable X est [n]

F (n) := χ(X, ωX ). Comme ωX n’est pas inversible en général, la fonction de Hilbert de X peut ne pas être un polynôme en n (10). L’hypothèse de platitude dans la définition 2.4 montre que cet invariant est localement constant sur la base d’une famille stable. Théorème 2.6. — Soit F : Z → Z une fonction. La catégorie fibrée en groupoïdes (7)

B 7→ { familles stables f : X → B dont les fibres ont fonction de Hilbert F }

sur la catégorie des k-schémas est un champ de Deligne-Mumford M F propre sur k admettant un espace de modules grossier projectif M F . La preuve de ce théorème, due à de nombreux auteurs, sera esquissée au §4. Le lecteur qui ne serait pas familier avec les champs [63, 68] peut ne retenir que la seconde partie de son énoncé. Elle signifie qu’il existe une variété projective M F sur k, et une manière d’associer à toute famille stable f : X → B dont les fibres ont fonction de Hilbert F un morphisme ψ(f ) : B → M F , qui soit fonctorielle en B, de sorte que (M F , ψ) soit universel pour cette propriété, et induise une bijection ( ) classes d’isomorphisme de variétés −∼→ M F (K). stables sur K de fonction de Hilbert F pour toute extension algébriquement close K de k. Par exemple, le théorème 2.6 munit l’ensemble des classes d’isomorphisme de variétés stables complexes de fonction de Hilbert F d’une structure naturelle de variété projective complexe. Insistons sur l’importance de la définition des singularités slc pour la validité de cet énoncé. Admettre une classe plus large de singularités aurait nui au caractère séparé de M F ; restreindre les singularités autorisées aurait empêché sa propreté. Dans le cas des surfaces, le théorème 2.6 est connu depuis longtemps, par des travaux de Kollár, Shepherd-Barron et Alexeev [60, 47, 5], à deux subtilités près. D’une part, une structure schématique sur M F prenant en compte les fonctions nilpotentes, (10)

Soit L un fibré en droites très ample sur une surface d’Enriques S et soit Z = C(S, L) le cône sur S dans le plongement induit par L. Soit X → S un revêtement double ramifié le long d’une section lisse de L⊗4 . Nous laissons au lecteur le soin de vérifier que X est stable et que sa fonction de Hilbert n’est pas un polynôme.

ASTÉRISQUE 422

(1158)

RÉDUCTION STABLE EN DIMENSION SUPÉRIEURE

303

n’a été construite rigoureusement que plus tard (voir [39, 57, 1] et §4.2.2). D’autre part, la propreté des composantes irréductibles de M F paramétrant génériquement des variétés non normales n’a pu être établie que grâce aux techniques de recollement de Kollár (voir [53, 54] et §3.3). 2.3.2. Géométrie. — La fonction de Hilbert F (n) = (g − 1)(2n − 1) donne lieu au champ de modules M g des courbes stables de Deligne et Mumford [14] et à son espace de modules grossier M g . Le champ M g est lisse et irréductible, de sorte que M g est normal et irréductible. On a vu à la fin du §2.2.2 que ces propriétés tombaient en défaut en dimension supérieure. Vakil [78, Main Theorem M2] a même démontré que les singularités des variétés M F peuvent être arbitrairement mauvaises. La géométrie de M g est aujourd’hui bien comprise et fait l’objet d’une abondante littérature. A contrario, on dispose de très peu de descriptions concrètes d’espaces de modules non triviaux de variétés stables en dimension supérieure (à l’exception notable de l’espace de modules des produits de courbes stables [69]). On ne sait par exemple pas décrire l’adhérence de l’ouvert paramétrant des surfaces quintiques dans P3k [27, 73]. On trouvera dans [20] l’état de l’art dans le cas des surfaces de Godeaux. Comme la fonction de Hilbert d’une variété stable lisse est polynomiale, les variétés stables dont la fonction de Hilbert n’est pas polynomiale, comme dans la note de bas de page (10), donnent lieu à des composantes connexes de l’espace de modules qui ne paramètrent que des variétés singulières. Soit enfin M une composante connexe de M F . On sait que si l’une des variétés que M paramètre vérifie la condition Sk de Serre, alors toutes ont cette propriété [58, Corollary 1.3]. Par conséquent, si l’une d’entre elles est Cohen-Macaulay (par exemple : lisse), toutes sont Cohen-Macaulay. Il est malgré tout utile de considérer aussi des variétés stables qui ne sont pas Cohen-Macaulay ; on en verra une raison au §3.3.3. 2.3.3. Variantes. — De nombreuses variantes des espaces de modules de variétés stables sont utiles et ont été étudiées. Tout d’abord, il est naturel de considérer plutôt des espaces de modules de paires stables, qui généralisent en dimension supérieure les espaces de modules de courbes stables pointées. Ce sujet a été développé dans [38, 33, 8, 62, 56] et le livre [54] en fait une étude approfondie. Il est également intéressant de construire des espaces de modules de morphismes stables à valeurs dans une variété fixée. Quand la source du morphisme est une courbe, ces espaces ont été introduits par Kontsevich (voir [26]), et on pourra consulter [6, 15] en dimension supérieure. Les résultats en caractéristique positive sont limités. L’article [71] contient le meilleur énoncé connu : sur un corps de caractéristique p > 7, l’espace de modules des

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

304

O. BENOIST

surfaces stables existe comme espace algébrique séparé et ses sous-espaces propres sont projectifs.

2.4. Outils pour l’étude des singularités slc Pour obtenir des compactifications modulaires M F des espaces de modules de variétés projectives lisses canoniquement polarisées, nous avons dû autoriser des variétés à singularités slc. Que ce soit pour construire ces compactifications ou pour d’éventuelles applications de leur existence, il est important d’étudier cette classe de singularités. Il s’avère qu’elles ont des propriétés remarquables ; nous en décrivons ici quelques-unes. 2.4.1. Adjonction. — Soit (X, ∆ + B) une paire dans laquelle le diviseur de Weil B est affecté d’un coefficient 1. On suppose que X est normale, purement de [m] dimension d, et qu’il existe un entier m > 0 tel que ωX (m∆ + mB) est inversible. ‹ → B de B et soit U ⊂ X le plus gros ouvert Considérons la normalisation ν : B disjoint de ∆ le long duquel X et B sont tous deux réguliers. L’isomorphisme −∼→ ωB∩U donné par le résidu des formes différentielles induit canonique ωX (B)| B∩U un isomorphisme (8)

[m]

[m] B

ωX (m∆ + mB)| ‹ −∼→ ω ‹ (m Diff B‹ (∆)), B

‹ uniquement déterminé et indépendant où Diff B‹ (∆) est un Q-diviseur de Weil sur B ‹ (voir [53, Definition 4.2]). de m : c’est la différente de ∆ sur B Dans de nombreuses situations, par exemple dans le cadre d’une récurrence sur la ‹ Diff ‹ (∆)). Le dimension, il est utile de ramener l’étude de (X, ∆ + B) à celle de (B, B théorème 2.7, dû à Kawakita [42], et qui fait suite à des travaux de Shokurov [76] et de Kollár [48, §17], est un outil précieux pour ce type d’arguments. Théorème 2.7. — Les conditions suivantes sont équivalentes : (i) La paire (X, ∆ + B) est lc dans un voisinage de B. ‹ Diff ‹ (∆)) est lc. (ii) La paire (B, B L’implication (i) =⇒ (ii), dite adjonction, est facile. C’est l’implication réciproque (ii) =⇒ (i), dite inversion de l’adjonction, qui est délicate. Sa preuve repose de manière essentielle sur le théorème d’annulation de Kawamata-Viehweg. Par le biais de l’équivalence (5), on peut déduire du théorème 2.7 des énoncés portant sur les singularités slc (voir [70, Lemma 2.10, Corollary 2.11]).

ASTÉRISQUE 422

(1158)

RÉDUCTION STABLE EN DIMENSION SUPÉRIEURE

305

2.4.2. Propriétés cohomologiques. — La première indication que les classes de singularités que nous considérons ont de bonnes propriétés cohomologiques a été le théorème d’Elkik [19] selon lequel les singularités canoniques sont rationnelles. Ce résultat reste valide plus généralement pour les singularités klt [59, Theorem 5.22]. Théorème 2.8. — Les singularités klt sont rationnelles. On en déduit que les singularités klt sont Cohen-Macaulay [59, Theorem 5.10]. Malheureusement, les singularités lc ne sont pas toujours rationnelles, ni même Cohen-Macaulay. Par exemple, un cône sur une surface abélienne est lc mais pas S3 [53, Example 3.6]. Il est donc nécessaire de trouver un substitut à la rationalité, qui s’applique aux variétés lc (ou plus généralement slc). Kollár et Kovács ont montré que les singularités Du Bois [53, §6] remplissent ce rôle (voir [58], [53, §6.2]). Théorème 2.9. — Les singularités slc sont Du Bois. Une conséquence concrète de cet énoncé est le fait que si f : X → B est une famille stable, les fonctions b 7→ hi (X b , O X b ) sont localement constantes sur B [17, Théorème 4.6]. Nous n’utiliserons pas les singularités Du Bois dans la suite de ce texte. En revanche, nous devrons savoir contrôler précisément le défaut de la propriété S3 des singularités slc. Nous utiliserons à cet effet un résultat d’Alexeev [8, Lemma 3.2], étendu dans [53, Theorem 7.20]. On dit qu’une sous-variété intègre d’une variété X à singularités slc est un centre log canonique de X si c’est l’image d’un diviseur audessus de X dont la discrépance est égale à −1. Théorème 2.10. — Soit X une variété slc. Si x ∈ X n’est pas le point générique [n] d’un centre log canonique de X, on a prof(ωX,x ) > min(3, dim(O X,x )) pour tout n ∈ Z. Les cas n = 0 et n = 1 sont explicités dans [53, Corollaries 7.21 and 7.22], et le cas général se prouve de la même manière (11).

3. LE THÉORÈME DE RÉDUCTION STABLE Nous expliquons dans cette section la preuve du théorème 1.6. On en considère plutôt une variante locale sur un anneau de valuation discrète R de corps de fonctions K. On note T = Spec(R) son spectre, de point fermé t et de point générique η. On travaille localement au voisinage de x et on applique [53, Theorem 7.20] avec ∆ = ∆0 = 0 à [n] un diviseur de Weil D ⊂ X tel que O X (−D) ' ωX .

(11)

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

306

O. BENOIST

Théorème 3.1. — Soit X une variété stable sur K. Il existe une extension finie d’anneaux de valuations discrètes R ⊂ R0 de corps de fonctions K ⊂ K 0 et une famille stable f : X → Spec(R0 ) telle que XK 0 ' XK 0 . Si R0 est fixé, cette famille est unique. Que le théorème 3.1 implique le théorème de réduction stable sous sa forme globale énoncée au théorème 1.6 est standard. Preuve du théorème 1.6. — Soit f : X → B un morphisme propre de base une courbe intègre de corps de fonctions K. Si X η est stable, la famille f est stable au-dessus d’un ouvert dense U ⊂ B (par exemple, par les arguments des §§4.2.1–4.2.4). Pour tout b ∈ B \ U , le théorème 3.1 appliqué à l’anneau de valuation discrète Rb := O B,b fournit une extension finie Rb0 de Rb de corps de fonctions Kb0 telle que X Kb0 ait un modèle stable sur Rb0 . Soit K 0 une extension galoisienne de K dans laquelle tous les Kb0 se plongent et soit π : B 0 → B la normalisation de B dans K 0 . Par construction, la variété X K 0 possède un modèle stable au voisinage de tout point de B 0 . Ces modèles locaux se recollent par unicité. Le théorème 3.1 est dû à Hacon et Xu [36] et Kollár [53, 54]. C’est ce théorème qui nous permettra de vérifier la propreté du champ de modules des variétés stables (voir §4.3). Les résultats antérieurs de Birkar, Cascini, Hacon et McKernan [12] auraient cependant suffi à démontrer la propreté des composantes irréductibles de M F qui paramètrent génériquement des variétés lisses. La preuve du théorème 3.1 repose sur le point de vue selon lequel les variétés stables doivent être considérées comme pluricanoniquement plongées. Plus précisément, [m] si X est une variété stable et si m > 0 est tel que ωX est inversible, on peut reconstruire X à partir de son algèbre m-canonique par la formule M [lm] X ' Proj H 0 (X, ωX ). l>0

L’existence comme l’unicité des familles stables dans le théorème 3.1 seront obtenues par le biais de ces algèbres m-canoniques. 3.1. Unicité Montrons la propriété d’unicité dans le théorème 3.1. La preuve donnée dans [52, Proposition 6] quand les fi sont lisses s’étend au cas général [54]. Commençons par démontrer un lemme que nous utiliserons à plusieurs reprises. Lemme 3.2. — Soit f : X → T un morphisme propre et plat dont les fibres satisfont [m] les conditions (i)-(iv) de la définition 2.1. Soit m > 0 un entier tel que ωX /T soit inversible. Si la variété X t est à singularités slc, la paire (X , X t ) est à singularités slc.

ASTÉRISQUE 422

(1158)

307

RÉDUCTION STABLE EN DIMENSION SUPÉRIEURE

Preuve. — On considère le diagramme commutatif ›t X 

˜ ι

‹ /X

ι

ν /X,

νt

Xt

où ν et νt sont les normalisations de X et X t , et où ι et ˜ι sont les morphismes naturels. ‹ et ∆ ⊂ X ›t les conducteurs de X et X t (voir §2.1.3). Par définition des On note Γ ⊂ X conducteurs et de la différente (voir (4) et (8)), on dispose d’isomorphismes naturels ‹ )t + mΓ) ' ω (m Diff (Γ)). ω › (m∆) ' νt∗ ωX t ' νt∗ ι∗ ωX (m X t ) ' ˜ι∗ ω ‹ (m(X › › X [m]

[m]

[m]

Xt

[m]

[m]

X

Xt

La composée de ces isomorphismes étant l’identité de

[m] ω› Xt

t

aux points génériques

›t , il suit que ∆ = Diff (Γ). Comme X t est slc, la paire (X ›t , ∆) est lc par (5), de X ›t X ‹ , Γ + (X ‹ )t ) est lc par inversion de l’adjonction (théorème 2.7). On donc la paire (X déduit que (X , X t ) est slc par (5), qui s’adapte immédiatement au cas des paires. Nous pouvons à présent démontrer la propriété d’unicité dans le théorème 3.1. Soient f1 : X1 → T et f2 : X2 → T des familles stables et φη : X 1,η −∼→ X 2,η un isomorphisme. On souhaite démontrer que φη s’étend en un isomorphisme φ : X 1 −∼→ X 2 . Pour cela, notons X ⊂ X 1 ×T X 2 l’adhérence du graphe de φη . Soit Y → X une modification S2 de X qui est un isomorphisme au-dessus de X η , telle que les composantes irréductibles du lieu non normal de Y dominent toutes T (12). Notons gi : Y → X i les projections naturelles, et choisissons un entier m > 0 tel que les [m] ωX i /T soient inversibles. Si i ∈ {1, 2}, la paire (X i , (X i )t ) est slc par le lemme 3.2. Pour l > 0, on dispose [lm] [lm] P par (2) d’un isomorphisme ωY −∼→ gi∗ ωX i ( E lm·aE (X i )E), où la somme porte sur les diviseurs gi -exceptionnels E de Y t , et où les aE (X i ) sont les discrépances de X i . On P [lm] [lm] en déduit un isomorphisme ωY (lm Y t ) −∼→ (gi∗ ωX i (lm(X i )t ))( E lm · aE (X i )E). En le comparant à l’isomorphisme (3) définissant les discrépances de (X i , (X i )t ), on voit que aE (X i ) = aE (X i , (X i )t ) + bE où bE est la multiplicité de E dans Y t . On a donc aE (X i ) > −1 + 1 = 0 car (X i , (X i )t ) est slc. On en déduit les égalités ÅX ã [lm] [lm] [lm] (9) H 0 (X i , ωX i ) = H 0 (Y , gi∗ ωX i lm · aE (X i )E) = H 0 (Y , ωY ), E

(12)

Pour construire Y , on note Z ⊂ X l’union des composantes irréductibles du lieu non normal de Y qui dominent T , on remarque que les faisceaux O X η sur X η et O‡ X \Z sur X \Z se recollent en un faisceau d’algèbres cohérent A sur X \Zt et on définit Y := SpecOX (j∗ A ), où j : X \Zt ,→ X est l’inclusion et où j∗ A est un faisceau d’algèbres cohérent S2 par [31, Propositions 5.11.1 et 5.10.10].

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

308

O. BENOIST

où seule la première égalité est à justifier. Que le membre de gauche soit inclus dans celui de droite est une conséquence de la positivité des aE (X i ). Pour voir l’autre inclusion, notons Ui ⊂ X i l’ouvert au-dessus duquel gi est un isomorphisme. [lm] P [lm] Si σ ∈ H 0 (Y , gi∗ ωX i ( E lm · aE (X i )E)), la restriction σ | ∈ H 0 (Ui , ωUi ) se relève Ui

[lm]

à H 0 (X i , ωX i ) par propriété S2 de X i , car X i \Ui a codimension > 2 dans X i . On conclut en définissant φ par la chaîne d’isomorphismes naturels suivante, où [m] [m] nous utilisons l’amplitude de ωX 1 et ωX 2 : M M [lm] [lm] X 1 ' ProjT H 0 (X 1 , ωX 1 ) ' ProjT H 0 (Y , ωY ) l>0

l>0

' ProjT

M

[lm]

H 0 (X 2 , ωX 2 ) ' X 2 .

l>0

La preuve ci-dessus fait clairement apparaître le rôle de la condition (v) sur les discrépances dans la définition 2.1 : c’est elle qui permet d’identifier les algèbres m-canoniques de X 1 et X 2 , donc X 1 et X 2 . 3.2. Fibre générique normale Passons à l’assertion d’existence dans le théorème 3.1. On suppose dans ce paragraphe que la variété stable X sur K est normale, donc lc. Ce cas particulier crucial est dû à Hacon et Xu [36, Corollary 1.5]. Il repose sur le programme des modèles minimaux par le biais de [36, Theorem 1.1] que nous discuterons plus amplement au §3.4. 3.2.1. Construction du modèle stable. — Soit f : X → T un morphisme projectif et plat tel que X η ' X. Par le théorème de réduction semi-stable de Kempf, Knudsen, Mumford et Saint-Donat [45, p. 198] (voir le théorème 1.1) sous la forme plus précise énoncée dans [59, Theorem 7.17], on peut supposer, quitte à remplacer R par une extension finie et X par le changement de base normalisé, qu’il existe une modification µ : Y → X telle que Y soit régulier et Y t soit réduit, et telle que si l’on note ∆ ⊂ Y l’adhérence du lieu exceptionnel de µη , le diviseur ∆ + Y t est à croisements normaux stricts dans Y . Cette application du théorème de réduction semi-stable est le seul moment où, dans la preuve du théorème 3.1, on doit modifier l’anneau de valuation discrète de base. [m] Soit m > 0 un entier tel que ωX soit inversible. Comme X est à singularités lc, on a a∆i (X) > −1 pour toute composante irréductible ∆i de ∆. On déduit, [lm] par un argument analogue à celui qui a démontré (9), que H 0 (X, ωX ) = [lm] [m] H 0 (Y η , ωY (lm∆η )) pour tout l > 0. Comme ωX est ample, l’algèbre m-canonique η M [lm] AK := H 0 (Y η , ωY (lm∆η )) η

l>0

ASTÉRISQUE 422

(1158)

RÉDUCTION STABLE EN DIMENSION SUPÉRIEURE

309

est de type fini sur K et Proj(AK ) ' X. Par [36, Theorem 1.1] (voir le théorème 3.5) appliqué au morphisme f ◦ µ : Y → T , l’algèbre m-canonique M [lm] A := H 0 (Y , ωY (lm∆ + lm Y t )) l>0

de (Y , ∆ + Y t ) est de type fini sur R. On peut donc former le modèle canonique relatif f : X := ProjT A → T de (Y , ∆ + Y t ) au-dessus de T . Notons φ : Y 99K X l’application rationnelle naturelle. On affirme que f : X → T est la famille stable recherchée. Comme X η ' X, il reste à démontrer que f est stable. C’est le but des §§ 3.2.2– 3.2.4. 3.2.2. Étude de l’espace total. — On commence par étudier l’espace total X du morphisme f : X → T . Pour ce faire, on s’appuie sur des propriétés élémentaires des modèles canoniques relatifs, rassemblées dans [53, Theorem 1.26]. On montre ainsi que X est normal, que l’application birationnelle φ : Y 99K X est une contraction rationnelle (13) et que, quitte à remplacer m par un multiple, le faisceau [m] ωX (mφ∗ (∆ + Y t )) est inversible et f -ample. Comme X ' X η et comme ∆η est contracté par µη , on a φ∗ ∆ = 0. La multiplication par une uniformisante de R induit [m] un isomorphisme O X −∼→ O X (X t ) = O X (φ∗ Y t ) ; on voit donc que ωX est inversible et f -ample. Enfin, une dernière assertion de [53, Theorem 1.26] est que comme la paire (Y , ∆ + Y t ) est à singularités lc, il en va de même pour (X , φ∗ (∆ + Y t )) = (X , X t ). 3.2.3. Étude de la fibre spéciale. — Il est temps de démontrer que la fibre spéciale X t de f est stable. Il ne reste plus qu’à voir que ses singularités sont slc. Comme la fibre spéciale Y t de Y est réduite et que φ est une contraction birationnelle, on voit que X t est génériquement réduite. De plus, X t est S1 comme diviseur de Cartier dans X qui est normal donc S2 . Ces deux faits combinés montrent exactement que X t est réduite. Nous avons vérifié la condition (i) de la définition 2.1. La condition (ii) selon laquelle X t est au plus nodale en codimension 1 résulte du fait que (X , X t ) est à singularités lc et d’une étude fine des paires à singularités lc en un point de codimension 2 se situant sur une composante affectée d’un coefficient 1 du bord [53, Corollary 2.32]. Qu’une telle étude soit possible est à rapprocher du fait que l’on sache classifier les singularités lc des surfaces [59, §4.1]. Comme (X , X t ) est à singularités lc, il un diviseur au-dessus de X dont l’image L’inégalité aE (X ) > aE (X , X t ) + 1 > 0 log canonique de X . Il suit du théorème (13)

en va a fortiori de même pour X . Soit E dans X se situe sur la fibre spéciale X t . montre que X t ne contient aucun centre 2.10 que prof(O X ,x ) > min(3, dim(O X ,x ))

Cela signifie que son inverse ne contracte pas de diviseurs.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

310

O. BENOIST

pour tout x ∈ X t . Comme X t est un diviseur de Cartier dans X , on déduit que prof(O X t ,x ) > min(2, dim(O X t ,x )) pour tout x ∈ X t , ce qui est la condition (iii). [m]

[m]

Le faisceau ωX | est inversible car ωX Xt

[m]

l’est. Il coïncide donc avec ωX t car ces [m]

deux faisceaux sont S2 et isomorphes en codimension 1. Ceci démontre que ωX t est inversible, donc que la condition (iv) est satisfaite. ›t , Diff (0)) Enfin, la paire (X , X t ) étant à singularités lc, il en va de même pour (X ›t X

par adjonction (théorème 2.7). Nous avons vu dans la preuve du lemme 3.2 que Diff X› (0) est le conducteur de X t . On déduit donc de (5) que X t est slc. t

3.2.4. Stabilité de la famille. — Il reste enfin à démontrer que la famille f : X → T est stable au sens de la définition 2.4. Le morphisme f est plat puisque X est réduit et que toutes ses composantes irréductibles dominent T . Nous avons déjà montré que ses fibres sont à singularités slc. [n]

Soit n ∈ Z. Le faisceau ωX /T est plat car il est S1 par construction et car les composantes irréductibles de son support dominent T . Nous avons déjà vu au §3.2.3 que X t ne contient aucun centre log canonique de X . Le théorème 2.10 montre [n] donc que prof(ωX /T,x ) > min(3, dim(O X ,x )) pour tout x ∈ X t . Comme X t est un [n]

diviseur de Cartier dans X , on déduit que ωX /T |

Xt

[n]

est S2 . Les deux faisceaux ωX /T |

Xt

[n]

et ωX t sont S2 et isomorphes en codimension 1 ; ils coïncident donc. Cela entraîne la stabilité de la famille f et achève la preuve du théorème 3.1 quand X est normale. 3.3. Fibre générique non normale Expliquons maintenant l’énoncé d’existence du théorème 3.1 dans le cas général. 3.3.1. Normalisation. — La preuve, due à Kollár [54], procède par réduction au cas normal. On applique le théorème de réduction stable à la normalisation de X qui est justiciable des arguments du §3.2, et on construit f : X → T en recollant le modèle stable obtenu le long de lui-même pour faire apparaître les singularités non normales requises. L’étape de recollement est surprenamment délicate à mettre en œuvre et constitue le cœur du livre [53]. Expliquons son principe. ‹ → X sa normalisation et Γ son Soit X une variété à singularités slc. Notons π : X ‹ Γ) est lc. Le morphisme π | : Γ → π(Γ) est conducteur. On sait par (5) que la paire (X, Γ

de degré deux au-dessus de l’ouvert dense de π(Γ) le long duquel X est à croisements normaux doubles. On en déduit une involution rationnelle τ : Γ 99K Γ, qui s’étend en e→Γ e génériquement sans point fixe de la normalisation une involution régulière τ : Γ e → Γ de Γ. Géométriquement, τ échange les deux branches des singularités ν : Γ à croisements normaux doubles de X. En comparant l’équation (8) définissant la e est τ -invariant. différente et son pull-back par τ , on voit que le Q-diviseur Diff Γe (0) de Γ

ASTÉRISQUE 422

(1158)

RÉDUCTION STABLE EN DIMENSION SUPÉRIEURE

311

Donnons deux exemples de ces constructions. Si X = {x2 = yz 2 } ⊂ A3k est le ‹ = A2k , la normalisation π : X ‹ → X est donnée parapluie de Whitney, on a X 2 2 e = {u = 0} ⊂ Ak et τ : v 7→ −v, et Diff e (0) = 0. par (u, v) 7→ (uv, v , u), on a Γ = Γ Γ 3 Si X = {xyz = 0} ⊂ Ak est le point à croisements normaux triples, la ‹ est une union disjointe de trois espaces affines de dimension 2, normalisation X e est une le conducteur Γ est l’union de leurs axes de coordonnées, de sorte que Γ e union de six droites, et on calcule que Diff Γe (0) ⊂ Γ est la réunion de leurs origines. e → Γ e échange ces droites deux par deux. Dans cet exemple, L’involution τ : Γ l’involution rationnelle τ : Γ 99K Γ n’est pas régulière en les trois points singuliers de Γ. Kollár a remarqué que, sous des hypothèses appropriées, on peut construire la ‹ Γ, τ ). Un exemple prototypique (qui n’est pas variété X à partir des données (X, l’énoncé précis dont on aura besoin pour la preuve du théorème 3.1) est [53, Theorem 5.13]. Théorème 3.3. — Les constructions ci-dessus induisent une bijection   ) (  Classes d’isomorphisme de paires lc stables Classes d’isomorphisme ∼  ‹ Γ) munies d’une involution génériquement −→ (X,  de variétés stables X   e Diff (0)) sans point fixe τ de (Γ, e Γ

   

.

  

3.3.2. Étapes du recollement. — Il est facile de voir que l’application du théorème 3.3 est injective [53, Proposition 5.3]. C’est sa surjectivité qui est difficile. Le triplet ‹ Γ, τ ) étant donné, il s’agit de construire X en recollant X ‹ sur elle-même le long (X, de Γ de la manière indiquée par τ . Plutôt que d’expliquer la démonstration, dont la structure inductive est complexe, décrivons les difficultés qu’il faut surmonter, qui correspondent aussi aux étapes de la preuve du théorème 3.3. ‹ par la relation d’équivalence (i) On souhaite construire X comme quotient de X e Comme le morphisme qui identifie ν(x) et ν(τ (x)) pour tout point géométrique x ∈ Γ. ‹ π : X → X à construire est fini, il faut que la relation d’équivalence engendrée par ces relations ait des classes d’équivalence finies. Ce n’est pas du tout une évidence ! ‹ = A3k et Γ = {xy = 0} de sorte que Γ e est l’union de deux Par exemple, prenons X plans affines de coordonnées respectives (y1 , z1 ) et (x2 , z2 ) et que Diff Γe (0) est l’union des deux droites d’équations {y1 = 0} et {x2 = 0}. Définissons une involution τ échangeant ces deux plans par l’équation τ (y1 , z1 ) = (x2 , z2 + 1). Pour ces choix ‹ Γ, τ ), on voit que les points (0, 0, n) ∈ X ‹ pour n ∈ Z sont tous équivalents. de (X, ‹ Dans le cadre du théorème 3.3, ce sont les hypothèses globales de projectivité de X et d’amplitude de ωX f(Γ) qui assureront la finitude de ces classes d’équivalences [53, Corollary 5.37]. La preuve de ce fait repose en dernier lieu sur des résultats de finitude

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

312

O. BENOIST

pour des groupes d’automorphismes birationnels de paires dont le fibré canonique a des propriétés de positivité [53, Corollary 10.69]. (ii) Supposons le problème décrit en (i) résolu. On dispose alors d’une relation ‹ dont on souhaite construire le quotient comme variété d’équivalence finie sur X algébrique. Ce serait la variété X recherchée. Il n’est malheureusement pas du tout évident que ce soit possible. ‹ l’union de deux espaces Donnons un exemple en suivant [53, Example 9.7]. Soient X ‹ affines de dimension 3, de coordonnées respectives (x1 , y1 , z1 ) et (x2 , y2 , z2 ), et Γ ⊂ X 3 2 e défini par les équations {y = z } pour i ∈ {1, 2}. La normalisation Γ de Γ est i

i

une union de deux plans affines, de coordonnées respectives (u1 , v1 ) et (u2 , v2 ), et e → Γ est donné par (ui , vi ) 7→ (ui , v 2 , v 3 ). Choisissons pour τ le morphisme ν : Γ i i l’involution échangeant ces deux plans, définie par la formule τ (u1 , v1 ) = (u1 + v1 , v1 ). On vérifie aisément que la relation d’équivalence engendrée par ν(x) ∼ ν(τ (x)) est finie, de sorte que le problème soulevé en (i) n’apparaît pas. De plus, cette relation d’équivalence admet bien un quotient catégorique dans la catégorie des k-schémas : le spectre de la sous-k-algèbre de k[x1 , y1 , z1 ] × k[x2 , y2 , z2 ] engendrée par les idéaux hy1 , z1 i et hy2 , z2 i. Cette algèbre n’est pas de type fini sur k (ni même noethérienne). ‹ par la relation d’équivalence considérée n’est donc pas une variété. Le quotient de X ‹ Γ) n’est pas lc. C’est seulement Le problème avec cet exemple est que la paire (X, ‹ sous l’hypothèse que les singularités de (X, Γ) sont lc que Kollár montre l’existence du quotient X recherché [53, Theorem 5.32]. Cette hypothèse est utilisée de la manière suivante. La variété X est obtenue par un procédé inductif qui consiste, en simplifiant, ‹ Γ), en commençant à d’abord construire les quotients des centres log canoniques de (X, par ceux qui ont dimension minimale. Pour ce faire, on utilise de manière essentielle des propriétés de seminormalité des centres log canoniques [53, §4.20], qui permettent en un sens de les manipuler topologiquement. Dans l’exemple ci-dessus, c’est le défaut de seminormalité de Γ qui pose véritablement problème. (iii) Maintenant que la variété X est construite, il faut vérifier qu’elle a les propriétés requises. Si la plupart sont faciles à vérifier, l’existence d’un entier m > 0 [m] tel que ωX soit inversible est hautement non triviale. À nouveau, illustrons-le sur un exemple. ‹ l’union disjointe de trois plans affines de coordonnées (x1 , y1 ), (x2 , y2 ) Soient X ‹ le diviseur défini par les équations {y1 = 0}, {x2 y2 = 0} et (x3 , y3 ), et Γ ⊂ X e de Γ est une union disjointe de quatre droites affines et {x3 = 0}. La normalisation Γ e de coordonnées respectives x1 , x2 , y2 et y3 . Choisissons pour τ l’involution de Γ échangeant les deux premières droites par la formule τ (x1 ) = x2 , et les deux dernières par τ (y2 ) = y3 . Aucun des problèmes décrits en (i) et (ii) ne se pose et l’on peut ‹ par la relation d’équivalence engendrée donc considérer la variété X quotient de X par ν(x) ∼ ν(τ (x)). Avec les notations de (6), on a X = C(Y, L), où Y est une chaîne

ASTÉRISQUE 422

(1158)

RÉDUCTION STABLE EN DIMENSION SUPÉRIEURE

313

de trois droites projectives et où le fibré en droites ample L sur Y a degré 1 sur chacune de ces trois composantes. On vérifie alors en adaptant [53, Proposition 3.14 [m] (4)] que ωX n’est inversible pour aucun m > 0. e est l’union Pour expliquer cela, remarquons que la différente Diff Γe (0) ⊂ Γ e On voit donc des origines de la deuxième et de la troisième composante de Γ. que τ ne préserve pas Diff Γe (0). Dans la preuve du théorème 3.3, c’est l’hypothèse [m] que Diff Γe (0) soit τ -invariant qui assure l’existence d’un m > 0 tel que ωX est inversible [53, Theorem 5.38]. Cette hypothèse est utilisée comme suit. Soit m > 0 [m] [m] tel que ω f (mΓ) est inversible. On souhaite descendre ω f (mΓ) (ou une de ses X

X

[m]

puissances) en un faisceau inversible sur X, isomorphe à ωX (ou à une de ses puissances). Pour ce faire, on raisonne géométriquement en considérant l’espace total e→X ‹ du fibré en droites associé à ω [m] (mΓ) sur X. ‹ Notons ∆ := pe−1 (Γ). Le fait pe : L f X que la différente Diff Γe (0) soit τ -invariante implique que τ se relève naturellement en ‹ de ∆. On peut alors appliquer les étapes (i) une involution σ de la normalisation ∆ e ∆, σ). On construit de la sorte et (ii) de la technique de recollement au triplet (L, une variété p : L → X qu’on vérifie être (quitte à remplacer m par un multiple) le [m] [m] fibré en droites associé à ωX . Cela implique en particulier que ωX est inversible, ce qu’on désirait montrer. 3.3.3. Réduction stable. — Expliquons maintenant, en suivant [54], comment la méthode de recollement est utilisée pour démontrer l’assertion d’existence dans le théorème 3.1. ‹ sa normalisation, Γ son conducteur Soit X une variété stable sur K. Notons X e e et τ : Γ → Γ l’involution naturelle, qui préserve Diff e (0). Le théorème de réduction Γ

stable pour les variétés normales (voir §3.2), convenablement étendu au cas des paires, ‹ , Γ ) → T sur T . Le lemme 3.2, ‹ Γ) admet un modèle stable fe : (X montre que (X, ‹, Γ + X ‹ t ) est lc, et on déduit adapté au cas des paires, montre que la paire (X ‹ t )) = (Γ e , Diff ‹ (X e , Diff ‹ (0) + Γ et ) est lc. donc de l’adjonction (théorème 2.7) que (Γ Γ Γ [m] [m] De plus, pour m > 0 bien choisi, ω‹ (m Diff Γ‹ (0)) = ω ‹ (mΓ )|‹ est un faisceau Γ Γ X inversible ample relativement à T . Argumentant comme aux §§3.2.3–3.2.4, on voit e , Diff ‹ (0)) → T est une famille stable. Par l’énoncé d’unicité dans le théorème que (Γ Γ de réduction stable (voir §3.1), convenablement étendu au cas des paires, l’involution τ e , Diff ‹ (0)) → sur la fibre générique s’étend en une involution encore notée τ : (Γ Γ e (Γ , Diff Γ‹ (0)). On applique alors la technique de recollement décrite au §3.3.2 (14) au (14)

L’étape (i) du procédé de recollement est plus facile à mettre en œuvre ici que dans le cadre du ‹ η , Γη , τη ), ‹ Γ, τ ) = (X théorème 3.3. En effet, on peut exploiter l’existence du recollement X de (X, ‹ , Γ ) n’est inclus dans la fibre et le fait (déjà expliqué au §3.2.3) qu’aucun centre log canonique de (X ‹ t , et appliquer [53, Lemma 9.55]. Les étapes (ii) et (iii) sont en revanche inchangées. spéciale X

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

314

O. BENOIST

‹ , Γ , τ ), ce qui donne lieu à un morphisme f : X → T , dont on vérifie qu’elle triplet (X est la famille stable recherchée. La preuve que nous venons de décrire ne permet pas de se limiter aux variétés ‹ d’une variété stable stables qui sont Cohen-Macaulay. En effet, la normalisation X Cohen-Macaulay X peut ne pas être elle-même Cohen-Macaulay [52, Example 23]. 3.4. Finitude de l’algèbre canonique Revenons sur le théorème de Hacon et Xu que nous avons utilisé au §3.2, et qui est un ingrédient décisif de la preuve du théorème 1.6. Soit (X, ∆) une paire à singularités slc. Définissons l’algèbre canonique de (X, ∆) L [l] 0 comme étant A(X, ∆) := >0 H (X, ωX (bl∆c)), où bl∆c est le diviseur de Weil sur X obtenu en arrondissant les coefficients de l∆ à l’entier inférieur. On conjecture (voir par exemple [24, Conjecture A]) la propriété suivante. Conjecture 3.4. — L’algèbre canonique d’une paire projective lc est de type fini. Les premiers résultats concernant la conjecture 3.4 en dimension arbitraire ont été obtenus par Birkar, Cascini, Hacon et McKernan [12]. Ils la résolvent en particulier pour les paires de type général (15) à singularités klt. Ce travail remarquable a déjà fait l’objet d’un exposé dans ce séminaire [16] et est à la base des développements ultérieurs. De manière surprenante, la conjecture 3.4 tombe en défaut pour les variétés slc : Kollár a donné un exemple de surface projective slc qui est de type général mais dont l’algèbre canonique n’est pas de type fini [51, Proposition 1]. Les singularités slc se comportent donc moins bien vis-à-vis du programme des modèles minimaux que leurs homologues normales que sont les singularités klt, lc, ... C’est pour cette raison que nous avons dû traiter séparément, dans la preuve du théorème de réduction stable, les variétés normales au §3.2 et les variétés non normales au §3.3. Le théorème de Hacon et Xu constitue un progrès sur ces questions dans le cas lc, dans un contexte adapté à la preuve du théorème 3.1 : ils travaillent dans une situation relative, et supposent connue l’existence du modèle canonique de la fibre générique. Énonçons le cas particulier (16) de [36, Theorem 1.1] qui nous a été utile.

(15)

[m]

La paire (X, ∆) est de type général s’il existe un entier m > 0 tel que ωX (m∆) soit inversible et induise une application rationnelle X 99K PN k qui est birationnelle sur son image. (16) La finitude des algèbres canoniques dans l’énoncé du théorème 3.5 est équivalente à l’existence des bons modèles minimaux dans l’énoncé de [36, Theorem 1.1], par [34, Lemma 2.9.1].

ASTÉRISQUE 422

(1158)

RÉDUCTION STABLE EN DIMENSION SUPÉRIEURE

315

Théorème 3.5. — Soit f : X → T un morphisme projectif, avec X régulier et ∆ ⊂ X un diviseur à croisements normaux stricts. Supposons que (X η , ∆η ) est de type général. Si A(X η , ∆η ) est de type fini sur K, alors A(X , ∆) est de type fini sur R. La preuve utilise de manière cruciale les techniques de [12]. Nous nous contentons d’en décrire la structure. Après avoir peut-être remplacé (X , ∆) par un modèle birationnel (un modèle minimal, construit en adaptant les techniques de [12]), on souhaite démontrer qu’il [m] existe un entier m > 0 tel que ωX (m∆) est inversible et sans point base : ceci entraîne en effet la finitude de l’algèbre canonique. Il est bien sûr nécessaire de [m] savoir démontrer que la restriction ωX (m∆)| est elle-même sans point base, et ∆ un théorème d’extension dû à Fujino [21, Theorem 1.1] montre que cela serait en fait suffisant. On voudrait obtenir cette information dans le cadre d’une récurrence sur la dimension. Malheureusement, ∆ n’est en général pas normal : il a seulement des singularités slc et on ne peut lui appliquer l’hypothèse de récurrence. L’idée de Hacon et Xu est de plutôt appliquer l’hypothèse de récurrence à la normalisation de ∆, puis de redescendre l’information obtenue à ∆ à l’aide de la technique de recollement de Kollár que nous avons décrite aux §§3.3.1–3.3.2.

4. CONSTRUCTION DE L’ESPACE DE MODULES Cette section est consacrée à la preuve du théorème 2.6. Si la stratégie est connue depuis longtemps [60, 47, 79], beaucoup de détails cruciaux n’ont été mis au point que très récemment [57, 53, 36, 34, 22]. Le lecteur pourra consulter avec profit les textes de survol [61, 52], ainsi que le livre [54] pour une présentation détaillée. La démonstration exploite à nouveau les plongements pluricanoniques des variétés stables. Ils permettent de paramétrer les variétés stables de fonction de Hilbert fixée par une union de sous-schémas localement fermés d’un schéma de Hilbert (§§4.1–4.2) qu’on quotiente ensuite par le groupe des transformations projectives pour construire l’espace de modules recherché (§§4.3–4.4). 4.1. Caractère borné Fixons une fonction de Hilbert F : Z → Z. La première étape de la construction de M F est la recherche d’une famille de variétés projectives, dans laquelle toutes les variétés stables de fonction de Hilbert F apparaissent et qui soit bornée au sens où la base de la famille est elle-même une variété, donc de type fini sur le corps de base k. Pour cela, il suffit de démontrer l’énoncé suivant.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

316

O. BENOIST

Théorème 4.1. — Il existe un entier m tel que pour toute variété stable X de [m] fonction de Hilbert F , le faisceau ωX est inversible, très ample et sans cohomologie supérieure. En effet, la famille universelle g : Y → H au-dessus du schéma de Hilbert H F (m)−1 paramétrant les sous-schémas fermés de Pk de fonction de Hilbert n 7→ F (nm) a alors les propriétés requises. En restriction aux variétés lisses, le théorème 4.1 est un cas particulier du grand théorème de Matsusaka [65]. Le cas des courbes est facile (on peut prendre m = 3) et c’est Alexeev qui a résolu le cas des surfaces [5]. En général, le théorème 4.1 a été démontré par Hacon, McKernan et Xu [34]. On ne donnera ici aucune indication sur sa preuve, qui repose sur le programme des modèles minimaux : on renvoie le lecteur au texte de survol [35].

4.2. Représentabilité de la stabilité La seconde étape de la preuve consiste à isoler, dans le schéma de Hilbert H construit au §4.1, le lieu paramétrant des variétés stables m-canoniquement plongées de fonction de Hilbert F . Théorème 4.2. — Il existe un morphisme ι : H 0 → H tel que le changement de base g 0 : Y 0 → H 0 de f par ι soit une famille de variétés stables m-canoniquement plongées de fonction de Hilbert F , et qui soit universel pour cette propriété. On procède par étapes, en effectuant plusieurs changements de base successifs, chacun améliorant les propriétés du morphisme g : Y → H. Remarquons que g est déjà plat par définition du schéma de Hilbert. 4.2.1. — On commence par remplacer H par l’ouvert H1 ⊂ H paramétrant des variétés réduites, S2 et équidimensionnelles [32, Théorème 12.2.1], et dont les singularités en codimension 1 sont au plus des croisements normaux doubles (pour ce dernier point, on remarque que cette condition est équivalente à avoir des singularités au plus nodales aux points de codimension 1 et on utilise le fait que les déformations des singularités nodales sont au plus nodales ; voir [53, §1.41.2] pour un énoncé précis). Notant g1 : Y 1 → H1 le changement de base, on peut alors définir le faisceau [n] canonique relatif ωY 1 /H1 et ses puissances réflexives ωY /H1 pour n ∈ Z, comme au 1 §2.2.1.

ASTÉRISQUE 422

(1158)

317

RÉDUCTION STABLE EN DIMENSION SUPÉRIEURE

[n]

4.2.2. — La seconde étape consiste à assurer que les faisceaux ωY /H1 soient plats de 1 formation commutant à tout changement de base, pour tout 1 6 n 6 m. Cette étape est cruciale si l’on souhaite munir M F d’une structure schématique raisonnable. Elle a été entièrement clarifiée par Kollár [57] ; d’autres approches avaient été proposées par Hassett et Kovács [39] (17) et par Abramovich et Hassett [1]. [n]

Kollár construit, pour 1 6 n 6 m, des décompositions Hull(ωY

1

/H1 )

→ H1 de H1 [n]

en sous-schémas localement fermés au-dessus desquels les faisceaux cohérents ωY 1,s pour s ∈ H1 s’organisent en une famille plate, et qui sont universelles pour cette [1] [m] propriété. Il ne reste plus qu’à définir H2 := Hull(ωY /H1 ) ×H1 · · · ×H1 Hull(ωY /H1 ) 1 1 comme étant la décomposition de H1 en sous-schémas localement fermés qui les raffine toutes, et à considérer le morphisme g2 : Y 2 → H2 obtenu par changement de base. Un des attraits du point de vue de Kollár est sa généralité : il n’utilise pas de propriétés particulières des variétés stables, ni des faisceaux pluricanoniques. Il considère plutôt un morphisme projectif p : X → S arbitraire et un faisceau cohérent F sur X. Dans cette situation, il construit une décomposition Hull(F ) → S de S en sous-schémas localement fermés au-dessus de laquelle les hulls Fs[∗∗] des Fs pour s ∈ S s’organisent en une famille plate, et qui est universelle pour cette propriété [57, Theorem 21]. Si Xs est S2 et Supp(Fs ) = Xs , le hull Fs[∗∗] n’est autre que le double dual Fs∗∗ de Fs (voir [57, Definition 14] ou ci-dessous pour une définition générale des hulls). Ceci s’applique dans la situation que nous avons considérée. Avec [n] [n] [n] les notations ci-dessus, on a donc (ωY /H1 ,s )[∗∗] = (ωY /H1 ,s )∗∗ = ωY ,s et la 1

[n]

décomposition Hull(ωY

1

1

1

/H1 ) a bien les propriétés voulues.

Pour construire Hull(F ), Kollár en identifie une compactification naturelle : l’espace de modules QHusk(F ) des husks quotients cohérents de F . Un husk quotient cohérent de F relativement à S est un morphisme de faisceaux cohérents q : F → G sur X où G est f -plat, tel que pour tout s ∈ S, le faisceau G s sur Xs est pur et q est surjectif aux points génériques du support de G s [57, Definition 9]. Ce husk quotient est un hull si pour tout s ∈ S, le morphisme qs est un isomorphisme aux points génériques du support de G s , est surjectif aux points de codimension 1 du support de G s et est maximal pour ces propriétés [57, Definition 17]. Par des techniques inspirées de la construction des schémas Quot de Grothendieck, on démontre [57, Theorem 10] que le foncteur qui à un S-schéma T associe l’ensemble des hulls quotients cohérents q : F T → G de F T relativement à T est représentable par une union dénombrable d’espaces algébriques propres sur S, qu’on note QHusk(F ) : c’est l’espace de modules QHusk(F ) des husks quotients cohérents de F . On vérifie enfin que le sous-foncteur des hulls est représentable par un ouvert Hull(F ) de QHusk(F ) (17)

L’article [39] utilise la condition de Viehweg plutôt que celle de Kollár (voir §2.2.1).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

318

O. BENOIST

et que Hull(F ) est une décomposition de S en sous-schémas localement fermés [57, Theorem 21]. [m]

4.2.3. — On remplace ensuite H2 par l’ouvert H3 ⊂ H2 au-dessus duquel ωY /H2 est 2 un faisceau inversible. Pour construire un tel ouvert, on procède comme suit. [m]

Par le lemme de Nakayama, l’ensemble {y ∈ Y 2 | dimκ(y) (ωY /H2 ⊗ κ(y)) > 1} est 2 fermé (voir [37, III Example 12.7.2]). On note H3 ⊂ H2 le complémentaire de son [m] image dans H2 et g3 : Y 3 → H3 le changement de base. Montrons que F := ωY /H3 est 3 inversible. Soit y ∈ Y 3 et soit s ∈ F y engendrant F y ⊗κ(y). Par le lemme de s Nakayama, le morphisme O Y 3 ,y − → F y est surjectif ; on note N son noyau. La suite courte 0 → N ⊗κ(g3 (y)) → O Y 3 ,y ⊗κ(g3 (y)) → F y ⊗κ(g3 (y)) → 0 est exacte car F y est O H3 ,g3 (y) -plat par §4.2.2. Comme le support ensembliste de F est Y 3 et que O Y ,y ⊗κ(g3 (y)) est réduit, on déduit que N ⊗κ(g3 (y)) = 0. A fortiori, 3 N ⊗κ(y) = 0, donc N = 0 par le lemme de Nakayama. On a bien montré que F est inversible en y. [n]

On voit maintenant en écrivant n = am + b avec 1 6 b 6 m que ωY /H3 est plat 3 de formation commutant à tout changement de base, pour tout n ∈ Z. 4.2.4. — On se restreint alors à l’ouvert H4 ⊂ H3 le long duquel les fibres de g3 sont à singularités slc (et on note g4 : Y 4 → H4 le changement de base). L’existence d’un tel ouvert est démontrée dans [1, Proposition A.1.1], où la preuve est attribuée à Alexeev. L’argument repose crucialement sur l’inversion de l’adjonction (voir § 2.4.1). Voir que le lieu {x ∈ H3 | Y 3,x a des singularités slc} est un sous-ensemble constructible de H3 est aisé. En effet, si η est le point générique d’une composante irréductible de H3 , une log résolution de Y 3,η s’étend en une log résolution des fibres de g3 au-dessus d’un voisinage U de η dans la variété réduite H3red . En calculant les discrépances des fibres de g3 au-dessus de U sur ces log résolutions, on montre que l’une est slc si et seulement si les autres le sont. On conclut par récurrence noethérienne. Il reste à démontrer que ce lieu est stable par générisation. On se ramène à une situation relative sur le spectre T d’un anneau de valuation discrète, de point fermé t et de point générique η. On dispose d’un morphisme propre et plat f : X → T dont [m] les fibres satisfont les conditions (i)-(iv) de la définition 2.1, tel que X t est slc et ωX /T inversible. Le lemme 3.2, dont la preuve reposait sur l’inversion de l’adjonction, assure que (X , X t ) est slc, donc que X η est slc. 4.2.5. — On dispose de deux fibrés en droites naturels sur Y 4 : le faisceau [m] m-canonique ωY /H4 , qui est inversible par le §4.2.3, et le fibré tautologique 4

ASTÉRISQUE 422

(1158)

RÉDUCTION STABLE EN DIMENSION SUPÉRIEURE

319

induit par O PF (m)−1 (1). On souhaite maintenant se restreindre au sousk schéma localement fermé H5 ⊂ H4 au-dessus duquel ces deux fibrés en droites coïncident, Zariski-localement sur H5 . L’existence d’un tel sous-schéma n’est pas évidente, car comme les fibres de g4 peuvent ne pas être irréductibles, le foncteur de Picard PicY 4 /H4 pourrait ne pas être séparé. Par conséquent, H5 pourrait ne pas être fermé dans H4 . Par [30, Corollaire 7.8.7], le faisceau g4,∗ O Y 4 est localement libre de formation commutant au changement de base. Les fibres de g4 étant réduites par le §4.2.1, le morphisme naturel H40 := SpecH4 (g4,∗ O Y 4 ) → H4 est fini étale. En considérant la factorisation de Stein g40 : Y 4 → H40 de g4 , on se ramène aisément au cas où les fibres de g4 sont connexes, ce qu’on suppose désormais. Dans ce cas, l’argument qui suit est donné dans [79, Lemma 1.19]. [m] On note L := ωY /H4 ⊗ O Y 4 /H4 (−1). Si 0 → L → E 0 → E 1 → · · · est une 4 résolution de L par des sommes de fibrés en droites assez amples et si l’on pose i i 0 1 F := g4,∗ E , la cohomologie du complexe de fibrés vectoriels 0 → F → F → · · · sur H4 calcule les Ri g4,∗ L , et ce après tout changement de base (par cohomologie et changement de base). Soit Q := Coker(F 0 → F 1 ). On commence par se restreindre à l’ouvert où Q a rang 6 rg(F 1 ) − rg(F 0 ) + 1, puis au fermé défini par l’annulation des mineurs de taille rg(F 0 ) de F 0 → F 1 . Le faisceau Q est maintenant localement libre de rang rg(F 1 ) − rg(F 0 ) + 1 par [18, Proposition 20.8]. Il suit que le noyau 0 1 K := Ker(F → F ) est localement libre de rang 1, de formation commutant à tout changement de base. On déduit que g4,∗ L = K est inversible et de formation commutant à tout changement de base. Il suffit pour conclure de se restreindre à l’ouvert H5 au-dessus duquel le morphisme d’adjonction g4∗ g4,∗ L → L est un isomorphisme. On note bien sûr g5 : Y 5 → H5 le changement de base. O Y /H4 (1) 4

4.2.6. — Considérons l’ouvert H6 ⊂ H5 au-dessus duquel O Y 5 /H5 (1) n’a pas de cohomologie supérieure [37, Theorem 12.8]. Notant g6 : Y 6 → H6 le changement de base, le faisceau g6,∗ O Y 6 /H6 (1) est un fibré vectoriel par [37, Theorem 12.11]. F (m)−1

On se restreint finalement à l’ouvert H 0 ⊂ H6 où le morphisme H 0 (Pk , O (1)) → g6,∗ O Y 6 /H6 (1) de fibrés vectoriels sur H6 est un isomorphisme. Ce dernier point assure que la famille g 0 : Y 0 → H 0 obtenue par changement de base est m-canoniquement plongée et achève la preuve du théorème 4.2. 4.3. Le champ de modules On peut maintenant construire le champ de modules M F . Le groupe PGLF (m) F (m)−1

agit sur Pk par changement de coordonnées, donc aussi sur son schéma de Hilbert H. Comme le morphisme ι : H 0 → H est défini par une propriété universelle, cette action se relève naturellement en une action sur H 0 . J’affirme que la catégorie

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

320

O. BENOIST

fibrée en groupoïdes M F définie en (7) s’identifie canoniquement au champ quotient [H 0 / PGLF (m) ] (18) et est donc un champ algébrique [63, (4.6.1)]. Intuitivement, cette assertion est claire : H 0 paramètre les variétés stables de F (m)−1 fonction de Hilbert F qui sont m-canoniquement plongées dans Pk , et deux telles F (m)−1 sous-variétés de Pk sont isomorphes comme variétés abstraites si et seulement si elles diffèrent par un changement de coordonnées projectives. Justifions-le plus formellement. On se contente ici de construire un 1-morphisme M F → [H 0 / PGLF (m) ] ; il est aisé de vérifier que c’est un isomorphisme. Considérons un B-point de M F , qui correspond à une famille stable f : X → B dont les fibres [m] ont fonction de Hilbert F comme en (7). Le faisceau ωX /B est plat et inversible sur les fibres de f par le théorème 4.1. Il est donc inversible par l’argument du §4.2.3. Par cohomologie et changement de base [37, III Theorem 12.11], qui s’applique par [m] [m] le théorème 4.1 et comme ωX /B est f -plat, le faisceau f∗ ωX /B est localement libre [m]

de rang F (m). Le faisceau inversible ωX /B est très ample relativement à f , et plonge X

[m]

dans le fibré projectif PB (f∗ ωX /B ) sur B. Soit I le schéma des isomorphismes F (m)−1

[m]

IsomB (PB , PB (f∗ ωX /B )) : c’est un PGLF (m) -torseur sur B. En tirant f : X → B sur I et en utilisant l’isomorphisme universel au-dessus de I, on obtient un morphisme λ : I → H, qui factorise à travers un morphisme µ : I → H 0 par la propriété universelle de H 0 . Le couple (I, µ) est le B-point de [H 0 / PGLF (m) ] que nous cherchions à construire. Remarquons que l’action de PGLF (m) se relève naturellement à l’espace total Y 0 de la famille g 0 : Y 0 → H 0 . Notant U F := [Y 0 / PGLF (m) ], on voit que le champ M F porte une famille stable universelle u : U F → M F . Le champ M F est propre. En effet, le critère valuatif de propreté [68, Theorem 11.5.1] est vérifié par le théorème de réduction stable, sous sa forme donnée au théorème 3.1 (la séparation de M F correspondant à la propriété d’unicité dans le théorème de réduction stable). On en déduit la finitude des groupes d’automorphismes des variétés stables. En effet, le critère valuatif de propreté pour ces groupes d’automorphismes est un cas particulier du critère valuatif de séparation pour M F et est donc vérifié. Ces groupes d’automorphismes sont donc propres. Comme ils sont de plus affines (ce sont des sous-groupes de PGLF (m) ), ils sont finis. Le schéma en groupes des automorphismes d’une variété stable est de plus réduit, comme tout schéma en groupes en caractéristique nulle. Appliquant [68, Theorem 8.3.3, Remark 8.3.4], on voit que M F est un champ de Deligne-Mumford. Rappelons qu’un B-point du champ quotient [H 0 / PGLF (m) ] est la PGLF (m) -torseur I sur B, et d’un morphisme PGLF (m) -équivariant µ : I → H 0 .

(18)

ASTÉRISQUE 422

donnée

d’un

(1158)

RÉDUCTION STABLE EN DIMENSION SUPÉRIEURE

321

4.4. L’espace de modules grossier C’est un théorème de Keel et Mori [44] que tout champ séparé de type fini sur un corps admet un espace de modules grossier, qui est un espace algébrique séparé de type fini sur ce corps. Notons M F l’espace de modules grossier de M F . La propreté de M F entraîne celle de M F . Il reste à démontrer la projectivité de M F . Les premières approches à ce problème ont reposé sur une autre stratégie de construction de M F que celle présentée ici : la théorie géométrique des invariants de Mumford [66], dont l’avantage est de produire des variétés qui sont, par construction, munies d’un fibré ample. C’est ainsi que Knudsen [46] et Gieseker et Mumford [67, §5] ont démontré la projectivité de M g . Cette technique a également permis à Gieseker de démontrer la quasi-projectivité des espaces de modules de surfaces lisses canoniquement polarisées [28], et Viehweg a réussi, dans un véritable tour de force, à faire de même en dimension arbitraire [79]. Cette méthode se heurte cependant à des difficultés sérieuses, déjà soulevées par Mumford [67, §3] et Shah [75], dans le cas des variétés singulières. Kollár a proposé dans [47] une autre méthode pour démontrer la projectivité d’un espace de modules qu’on sait être propre. Expliquons comment elle s’applique à M F . L’espace algébrique M F porte de nombreux fibrés en droites naturels. Rappelons que u : U F → M F est la famille universelle construite au §4.3. Si n > 0 est un [n] est un fibré en droites u-ample dont les entier assez divisible, le faisceau ω U F /M F restrictions aux fibres de u n’ont pas de cohomologie supérieure. Pour un tel n, le [n] faisceau u∗ ω est un fibré vectoriel sur M F . Pour N > 0 assez divisible, le fibré U F /M F

en droites det(u∗ ω

[n]

U F /M F

)⊗N sur M F descend en un unique fibré en droites L n,N

sur M F par [74] (voir aussi [79, Lemma 9.26]). Théorème 4.3. — Si n est assez divisible, L n,N est un fibré ample sur M F . Ce théorème a été démontré par Kollár dans [47, Corollary 5.6] pour les espaces de modules de surfaces stables et par Fujino [22] en général. Kollár a remarqué qu’il suffisait de vérifier que pour toute courbe projective lisse C [n] et pour tout morphisme ψ : C → M F , le fibré vectoriel ψ ∗ (u∗ ω ) est nef [47, U F /M F

Theorem 2.6]. Qu’on puisse déduire le théorème 4.3, qui est un énoncé de positivité stricte, d’un tel résultat de positivité au sens large est remarquable. L’argument repose sur le critère d’amplitude de Nakai-Moishezon. Le gain de positivité est fourni par la variation, dans une famille de variétés stables, des équations de ces variétés dans leurs plongements pluricanoniques (voir [47, §2.9]). [n] La vérification du fait que ψ ∗ (u∗ ω ) est nef est due à Kollár [47, U F /M F

Theorem 4.12] pour les familles de surfaces et à Fujino [22, Theorem 1.7] en

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

322

O. BENOIST

général. Elle s’appuie sur des théorèmes de semipositivité en théorie de Hodge, qui remontent à Fujita [25] et qui sont démontrés dans la généralité requise dans [23, Corollary 5.23]. Patakfalvi et Xu [72] ont montré l’amplitude d’un autre fibré en droites, défini seulement sur la normalisation de M F : le fibré en droites CM. Comme M F est propre, cela fournit une autre preuve de sa projectivité (voir [29, Proposition 2.6.2]). Remerciements Merci à Olivier Debarre, Stéphane Druel, Javier Fresán, Christopher Hacon, János Kollár et Bertrand Rémy pour leurs utiles commentaires.

RÉFÉRENCES [1] D. Abramovich & B. Hassett – Stable varieties with a twist, in Classification of algebraic varieties, EMS Ser. Congr. Rep., Eur. Math. Soc., 2011, p. 1–38. [2] D. Abramovich & K. Karu – Weak semistable reduction in characteristic 0, Invent. math. 139 (2000), no 2, p. 241–273. [3] N. A’Campo, L. Ji & A. Papadopulos – On the early history of moduli and Teichmüller spaces, in Lipman Bers, a life in mathematics, Amer. Math. Soc., 2015, p. 175–262. [4] K. Adiprasito, G. Liu & M. Temkin – Semistable reduction in characteristic 0, prépublication arXiv:1810.03131. [5] V. Alexeev – Boundedness and K 2 for log surfaces, Internat. J. Math. 5 (1994), no 6, p. 779–810. [6]

, Moduli spaces Mg,n (W ) for surfaces, in Higher-dimensional complex varieties (Trento, 1994), de Gruyter, 1996, p. 1–22.

[7]

, Complete moduli in the presence of semiabelian group action, Ann. of Math. 155 (2002), no 3, p. 611–708.

[8]

, Limits of stable pairs, Pure Appl. Math. Q. 4 (2008), no 3, Special Issue : In honor of Fedor Bogomolov. Part 2, p. 767–783.

[9] K. Altmann & J. Kollár – The dualizing sheaf on first-order deformations of toric surface singularities, J. reine angew. Math. 753 (2019), p. 137–158. [10] M. Artin & G. Winters – Degenerate fibres and stable reduction of curves, Topology 10 (1971), p. 373–383. [11] P. Berthelot – Altérations de variétés algébriques (d’après A. J. de Jong), Séminaire Bourbaki, vol. 1995/1996, exp. no 815, Astérisque, vol. 241, Société Mathématique de France, 1997, p. 273–311.

ASTÉRISQUE 422

(1158)

RÉDUCTION STABLE EN DIMENSION SUPÉRIEURE

323

[12] C. Birkar, P. Cascini, C. D. Hacon & J. McKernan – Existence of minimal models for varieties of log general type, J. Amer. Math. Soc. 23 (2010), no 2, p. 405–468. [13] B. Conrad – Grothendieck duality and base change, Lecture Notes in Math., vol. 1750, Springer, 2000. [14] P. Deligne & D. Mumford – The irreducibility of the space of curves of given genus, Publ. Math. IHÉS (1969), no 36, p. 75–109. [15] R. Dervan & J. Ross – Stable maps in higher dimensions, Math. Ann. 374 (2019), nos 3-4, p. 1033–1073. [16] S. Druel – Existence de modèles minimaux pour les variétés de type général (d’après Birkar, Cascini, Hacon et McKernan), Séminaire Bourbaki, vol. 2007/2008, exp. no 982, Astérisque, vol. 326, Société Mathématique de France, 2009, p. 1–38. [17] P. Du Bois – Complexe de de Rham filtré d’une variété singulière, Bull. Soc. Math. France 109 (1981), no 1, p. 41–81. [18] D. Eisenbud – Commutative algebra, Graduate Texts in Math., vol. 150, Springer, 1995. [19] R. Elkik – Rationalité des singularités canoniques, Invent. math. 64 (1981), no 1, p. 1–6. [20] M. Franciosi, R. Pardini & S. Rollenske – Gorenstein stable Godeaux surfaces, Selecta Math. (N.S.) 24 (2018), no 4, p. 3349–3379. [21] O. Fujino – Basepoint-free theorems : saturation, b-divisors, and canonical bundle formula, Algebra Number Theory 6 (2012), no 4, p. 797–823. [22]

, Semipositivity theorems for moduli problems, Ann. of Math. 187 (2018), no 3, p. 639–665.

[23] O. Fujino & T. Fujisawa – Variations of mixed Hodge structure and semipositivity theorems, Publ. Res. Inst. Math. Sci. 50 (2014), no 4, p. 589–661. [24] O. Fujino & Y. Gongyo – On log canonical rings, in Higher dimensional algebraic geometry—in honour of Professor Yujiro Kawamata’s sixtieth birthday, Adv. Stud. Pure Math., vol. 74, Math. Soc. Japan, Tokyo, 2017, p. 159–169. [25] T. Fujita – On Kähler fiber spaces over curves, J. Math. Soc. Japan 30 (1978), no 4, p. 779–794. [26] W. Fulton & R. Pandharipande – Notes on stable maps and quantum cohomology, in Algebraic geometry—Santa Cruz 1995, Proc. Sympos. Pure Math., vol. 62, Amer. Math. Soc., 1997, p. 45–96. [27] P. Gallardo – On the moduli space of quintic surfaces, Thèse, State University of New York at Stony Brook, 2014, p. 99.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

324

O. BENOIST

[28] D. Gieseker – Global moduli for surfaces of general type, Invent. math. 43 (1977), no 3, p. 233–282. [29] A. Grothendieck – Éléments de géométrie algébrique. III. Étude cohomologique des faisceaux cohérents. I, Publ. Math. IHÉS (1961), no 11, p. 167. [30]

, Éléments de géométrie algébrique. III. Étude cohomologique des faisceaux cohérents. II, Publ. Math. IHÉS (1963), no 17, p. 91.

[31]

, Éléments de géométrie algébrique. IV. Étude locale des schémas et des morphismes de schémas. II, Publ. Math. IHÉS (1965), no 24, p. 231.

[32]

, Éléments de géométrie algébrique. IV. Étude locale des schémas et des morphismes de schémas. III, Publ. Math. IHÉS (1966), no 28, p. 255.

[33] P. Hacking – Compact moduli of plane curves, Duke Math. J. 124 (2004), no 2, p. 213–257. [34] C. D. Hacon, J. McKernan & C. Xu – Boundedness of moduli of varieties of general type, J. Eur. Math. Soc. (JEMS) 20 (2018), no 4, p. 865–901. [35]

, Boundedness of varieties of log general type, in Algebraic geometry : Salt Lake City 2015, Proc. Sympos. Pure Math., vol. 97, Amer. Math. Soc., 2018, p. 309–348.

[36] C. D. Hacon & C. Xu – Existence of log canonical closures, Invent. math. 192 (2013), no 1, p. 161–195. [37] R. Hartshorne – Algebraic geometry, Graduate Texts in Math., vol. 52, Springer, 1977. [38] B. Hassett – Moduli spaces of weighted pointed stable curves, Adv. Math. 173 (2003), no 2, p. 316–352. [39] B. Hassett & S. J. Kovács – Reflexive pull-backs and base extension, J. Algebraic Geom. 13 (2004), no 2, p. 233–247. [40] E. Horikawa – On deformations of quintic surfaces, Invent. math. 31 (1975), no 1, p. 43–85. [41] A. J. de Jong – Smoothness, semi-stability and alterations, Publ. Math. IHÉS (1996), no 83, p. 51–93. [42] M. Kawakita – Inversion of adjunction on log canonicity, Invent. math. 167 (2007), no 1, p. 129–133. [43] Y. Kawamata – On singularities in the classification theory of algebraic varieties, Math. Ann. 251 (1980), no 1, p. 51–55. [44] S. Keel & S. Mori – Quotients by groupoids, Ann. of Math. 145 (1997), no 1, p. 193–213. [45] G. Kempf, F. F. Knudsen, D. Mumford & B. Saint-Donat – Toroidal embeddings. I, Lecture Notes in Math., vol. 339, Springer, 1973.

ASTÉRISQUE 422

(1158)

RÉDUCTION STABLE EN DIMENSION SUPÉRIEURE

325

[46] F. F. Knudsen – The projectivity of the moduli space of stable curves. III. The line bundles on Mg,n , and a proof of the projectivity of M g,n in characteristic 0, Math. Scand. 52 (1983), no 2, p. 200–212. [47] J. Kollár – Projectivity of complete moduli, J. Differential Geom. 32 (1990), no 1, p. 235–268. [48] J. Kollár (éd.) – Flips and abundance for algebraic threefolds, Astérisque, vol. 211, Société Mathématique de France, 1992. [49] J. Kollár – Flatness criteria, J. Algebra 175 (1995), no 2, p. 715–727. [50] , New examples of terminal and log canonical singularities, prépublication arXiv:1107.2864, 2011. [51] , Two examples of surfaces with normal crossing singularities, Sci. China Math. 54 (2011), no 8, p. 1707–1712. [52] , Moduli of varieties of general type, in Handbook of moduli. Vol. II, Adv. Lect. Math. (ALM), vol. 25, Int. Press, 2013, p. 131–157. , Singularities of the minimal model program, Cambridge Tracts in [53] Mathematics, vol. 200, Cambridge Univ. Press, 2013. [54] , Families of varieties of general type, https://web.math.princeton. edu/~kollar/book/modbook20170720.pdf, 2017. [55] , Mumford’s influence on the moduli theory of algebraic varieties, prépublication arXiv:1809.10723, 2018. [56] , Families of divisors, prépublication arXiv:1910.00937, 2019. , Hulls and husks, prépublication arXiv:0805.0576. [57] [58] J. Kollár & S. J. Kovács – Log canonical singularities are Du Bois, J. Amer. Math. Soc. 23 (2010), no 3, p. 791–813. [59] J. Kollár & S. Mori – Birational geometry of algebraic varieties, Cambridge Tracts in Mathematics, vol. 134, Cambridge Univ. Press, 1998. [60] J. Kollár & N. I. Sheperd-Barron – Threefolds and deformations of surface singularities, Invent. math. 91 (1988), p. 299–338. [61] S. J. Kovács – Young person’s guide to moduli of higher dimensional varieties, in Algebraic geometry—Seattle 2005. Part 2, Proc. Sympos. Pure Math., vol. 80, Amer. Math. Soc., 2009, p. 711–743. [62] S. J. Kovács & Z. Patakfalvi – Projectivity of the moduli space of stable log-varieties and subadditivity of log-Kodaira dimension, J. Amer. Math. Soc. 30 (2017), no 4, p. 959–1021. [63] G. Laumon & L. Moret-Bailly – Champs algébriques, Ergebn. Math. Grenzg.. 3. Folge., vol. 39, Springer, 2000. [64] C. Li, X. Wang & C. Xu – On the proper moduli spaces of smoothable KählerEinstein Fano varieties, Duke Math. J. 168 (2019), no 8, p. 1387–1459.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

326

O. BENOIST

[65] T. Matsusaka – Polarized varieties with a given Hilbert polynomial, Amer. J. Math. 94 (1972), p. 1027–1077. [66] D. Mumford – Geometric invariant theory, Ergebn. Math. Grenzg., Neue Folge, vol. 34, Springer, 1965. [67] , Stability of projective varieties, Enseign. Math. 23 (1977), nos 1-2, p. 39– 110. [68] M. Olsson – Algebraic spaces and stacks, American Mathematical Society Colloquium Publications, vol. 62, Amer. Math. Soc., 2016. [69] M. A. van Opstall – Moduli of products of curves, Arch. Math. ( 84 (2005), no 2, p. 148–154. [70] Z. Patakfalvi – Fibered stable varieties, Trans. Amer. Math. Soc. 368 (2016), no 3, p. 1837–1869. [71] , On the projectivity of the moduli space of stable surfaces in characteristic p > 5, prépublication arXiv:1710.03818. [72] Z. Patakfalvi & C. Xu – Ampleness of the CM line bundle on the moduli space of canonically polarized varieties, Algebr. Geom. 4 (2017), no 1, p. 29–39. [73] J. Rana – A boundary divisor in the moduli spaces of stable quintic surfaces, Internat. J. Math. 28 (2017), no 4, 1750021, 61. [74] D. Rydh – Do line bundles descend to coarse moduli spaces of Artin stacks with finite inertia ?, https://mathoverflow.net/q/206117, 2015. [75] J. Shah – Stability of two-dimensional local rings. I, Invent. math. 64 (1981), no 2, p. 297–343. [76] V. V. Shokurov – Three-dimensional log perestroikas, Izv. Ross. Akad. Nauk Ser. Mat. 56 (1992), no 1, p. 105–203. [77] M. Temkin – Stable modification of relative curves, J. Algebraic Geom. 19 (2010), no 4, p. 603–677. [78] R. Vakil – Murphy’s law in algebraic geometry : badly-behaved deformation spaces, Invent. math. 164 (2006), no 3, p. 569–590. [79] E. Viehweg – Quasi-projective moduli for polarized manifolds, Ergebn. Math. Grenzg. 3 Folge, vol. 30, Springer, 1995.

Olivier BENOIST CNRS, DMA École normale supérieure 45 rue d’Ulm 75005 Paris, France E-mail : [email protected]

ASTÉRISQUE 422

Séminaire BOURBAKI 71e année, 2018–2019, no 1159, p. 327 à 354 doi:10.24033/ast.1138

Mars 2019

HIGHER RANK TEICHMÜLLER THEORIES by Maria Beatrice POZZETTI

INTRODUCTION Let Γg be the fundamental group of a compact surface Sg with negative Euler characteristic, and let G denote PSL(2, R), the group of isometries of the hyperbolic plane H2 . Goldman observed that the Teichmüller space, the parameter space of marked hyperbolic structures on Sg , can be identified with a connected component of the character variety Hom(Γg , G)//G, which can be selected by means of a characteristic invariant. Thanks to the work of Labourie, Burger-Iozzi-Wienhard, FockGoncharov and Guichard-Wienhard we now know that, surprisingly, this is a much more general phenomenon: there are also many higher rank semisimple Lie groups G admitting components of the character variety consisting only of injective homomorphisms with discrete image, the so-called higher rank Teichmüller theories. The richness of these theories is partially due to the fact that, as for the Teichmüller space, truly different techniques can be used to study them: bounded cohomology, Higgs bundles, positivity, harmonic maps, incidence structures, geodesic currents, real algebraic geometry, dynamics are just some of those. In this survey, after introducing the two known families of higher rank Teichmüller theories, the Hitchin components and the maximal representations, we will describe a conjectural unifying framework, Θ-positive representations. This theory, due to Guichard-Wienhard, encompasses both families of higher rank Teichmüller theories as well as, potentially, new families associated to orthogonal groups. In Section 3, after reinterpreting Higher Teichmüller theories as moduli spaces of locally symmetric spaces, we will discuss several geometric properties of such locally symmetric spaces, highlighting analogies and differences with geometric properties of hyperbolic surfaces, points in the Teichmüller spaces. We will be particularly concerned with the (vector valued) length functions associated to these locally symmetric spaces, and

© Astérisque 422, SMF 2020

328

M.B. POZZETTI

with various techniques to study them, based on dynamics, as well as incidence geometry and positivity. After a short digression, in Section 4, on harmonic maps and minimal surfaces, which provide a more analytic tool to study higher rank Teichmüller theories, we will focus, in the last section of the survey, on the interplay with other geometric structures, particularly in rank 2. This short survey is not intended to be exhaustive, but it is rather a concise description of a few of the many ideas and tools that are being developed in the study of character varieties. In particular, for lack of space, we decided not to discuss the related theory of Anosov representations nor to detail the Higgs bundles perspective on character varieties and higher rank Teichmüller theories. We will instead discuss some of the applications of the theory of Higgs bundles, emphasizing results which can be formulated purely in terms of synthetic geometry, despite the only available proofs make heavy use of the more analytic approach. We refer the reader to the surveys [3, 39] and references therein for an introduction to Higgs bundles and their use in the study of character varieties, to the survey [92] for a discussion of other aspects of higher rank Teichmüller theories, and to the surveys [43, 54] for an introduction to Anosov representations and their link with geometric structures.

1. TEICHMÜLLER THEORY In this section we recall some basic facts about Teichmüller theory that will play an important role in the higher rank generalizations that we will discuss in the rest of the survey. We refer the reader to [37, Part 2] for an introduction to these themes close to the viewpoint we will follow here. Let Sg be a closed oriented surface of genus g ≥ 2. We will define the Teichmüller space T (Sg ) as the space of homotopy classes of marked hyperbolic structures on Sg . (1) The Teichmüller space is isomorphic to R6g−6 , as can be seen using FenchelNielsen coordinates: the choice of a maximal collection {c1 , . . . , c3g−3 } of pairwise disjoint simple closed curves decomposes the surface Sg as a union of pairs of pants {P1 , . . . , P2g−2 }; the parametrization of T (Sg ) can then be obtained recording the 3g − 3 lengths of the curves ci and how much twist is involved in the glueings; indeed any three holed sphere (pair of pants) admits a unique hyperbolic structure for each choice of boundary lengths. Whenever we fix a hyperbolic metric h on Sg , we can identify the metric universal covering (Seg , e h) with the hyperbolic plane H2 ; the identification is natural up to (1)

This is historically inaccurate, as the Teichmüller space is the space of marked conformal structures on Sg , while the space of marked hyperbolic structures should be referred to as Fricke space. However it is a consequence of the uniformization theorem that these two objects can be identified.

ASTÉRISQUE 422

(1159)

HIGHER RANK TEICHMÜLLER THEORIES

329

post-composition with an element in PSL2 (R), the group of orientation-preserving isometries of H2 . Throughout the survey we will denote by Γg the fundamental group of the surface Sg . The action of Γg on Seg as deck transformations induces, via the identification Seg ∼ = H2 , a homomorphism ρ : Γg → PSL(2, R), which is then welldefined up to conjugation in PSL(2, R). This homomorphism is called the holonomy of the hyperbolic structure (Sg , h). We will denote by Hom(Γg , PSL2 (R))//PSL2 (R) the character variety, namely the largest Hausdorff quotient of the set of homomorphisms ρ : Γg → PSL2 (R) for the equivalence relation that identifies two homomorphisms ρ, η if there exists g ∈ PSL(2, R) such that for every γ ∈ Γg , ρ(γ) = gη(γ)g −1 . The choice of a finite generating set S of Γg allows to realize Hom(Γg , PSL2 (R)) as a subset of PSL2 (R)|S| defined by polynomial equations (induced by the relations of the group Γg ); this also induces a natural semi-algebraic structure on the character variety [19]. It is a basic fact in covering theory that the homomorphisms ρ arising as holonomies of hyperbolizations are injective and have discrete image. In his thesis Goldman showed that this procedure actually gives an identification of the Teichmüller space T (Sg ) with a connected component of the character variety Hom(Γg , PSL2 (R))//PSL2 (R), which can be selected by means of a cohomological invariant, the Euler class. (2) Theorem 1.1 (Goldman [40]). — The Euler class eu(ρ) distinguishes connected components in Hom(Γg , PSL2 (R))//PSL2 (R) and has values in Z ∩ [χ(Sg ), −χ(Sg )]. The representations for which |eu(ρ)| is maximal correspond to holonomies of hyperbolic structures on Sg (resp. hyperbolic structures on Sg endowed with the opposite orientation). It could be natural to think that there are connected components of the PSL(2, R)-character variety only consisting of injective homomorphisms with discrete image because the cohomological dimension of the group Γg equals the dimension of H2 and thus Γg can act properly discontinuously and co-compactly on H2 . We will discuss in the rest of the survey that the existence of such components is, instead, a much more general phenomenon: there are various classes of semisimple Lie groups G for which Hom(Γg , G)//G has connected components only consisting of injective homomorphisms with discrete image, the so-called Higher Teichmüller theories. A lot of the richness of Teichmüller theory can be tracked back to the local isogenies between semisimple Lie groups in low ranks: PSL(2, R) is isomorphic to PSp(2, R), PU(1, 1) and PO(2, 1). In turn these correspond to different models for the hyperbolic (2)

We will not need the definition of the Euler class in the rest of the text. The interested reader can read more about it for example in [24].

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

330

M.B. POZZETTI

plane (respectively, the upper-half plane H2 ⊂ C, the Poincaré disk D ⊂ CP1 , and the Klein model K ⊂ RP2 ) and therefore different perspectives on the same theory. We won’t have this at our disposal when dealing with a general Lie group G, but we will discuss in Section 5 how the interplay between different geometric structures associated to G can give new insight on representations in Higher Teichmüller theories. We conclude our very short account of Teichmüller theory by discussing an important property of hyperbolizations, which will have an avatar of fundamental importance in higher rank Teichmüller theory: the existence of boundary maps. Recall that the hyperbolic plane H2 has a boundary ∂∞ H2 isomorphic to the circle S1 and consisting of equivalence classes of asymptotic rays. Given any two hyperbolic structures (Sg , h1 ), (Sg , h2 ) on the surface Sg with holonomies ρi , we obtain, via the identifications (Seg , e hi ) ∼ = H2 , a continuous (ρ1 , ρ2 )-equivariant map fρ1 ,ρ2 : H2 → H2 . This extends to a monotone, Hölder continuous map ξρ1 ,ρ2 : ∂∞ H2 → ∂∞ H2 . Here monotonicity is defined with respect to the cyclic orientation of the circle: the map ξρ1 ,ρ2 is monotone if for every positively oriented triple (x, y, z) the image (ξρ1 ,ρ2 (x), ξρ1 ,ρ2 (y), ξρ1 ,ρ2 (z)) is positively oriented. We fix for simplicity (3) an auxiliary hyperbolic structure on the surface Sg with holonomy ρ, and denote by ∂∞ Γg the boundary ∂∞ H2 together with the action of Γg induced by ρ. The discussion above shows that the Hölder structure of ∂∞ Γg , as well as its cyclic order, is intrinsic and doesn’t depend on the choice of ρ. It is then possible to characterize holonomies of hyperbolization using boundary maps: a representation η : Γg → PSL(2, R) is the holonomy of a hyperbolization if and only if there exists a monotone, Hölder continuous map ξη : ∂∞ Γg → ∂∞ H2 .

2. HIGHER RANK TEICHMÜLLER THEORIES Let us now consider a connected, adjoint, semisimple Lie group G of non-compact type and higher rank. Natural examples that will play a role in the text are PSL(n, R), the projective classes of matrices of determinant one, PSp(2n, R), the projective classes of matrices of determinant one preserving a symplectic form on R2n or PO0 (2, n), the projectivization of the connected component of the identity in the group preserving a symmetric bilinear form on Rn+2 of signature (2, n). In this survey we will mostly regard G as the identity component of the group Isom(X ), where X = G/K is the Riemannian symmetric space associated to G, a non-positively curved Riemannian manifold in which the geodesic reflections about any point are induced by isometries. (3)

With basic tools of geometric group theory one can give an intrinsic definition of the boundary ∂∞ Γg , but this won’t be necessary for our purposes.

ASTÉRISQUE 422

(1159)

HIGHER RANK TEICHMÜLLER THEORIES

331

Definition 2.1. — A higher rank Teichmüller theory is a connected component of the character variety Hom(Γg , G)//G only consisting of injective homomorphisms with discrete image. For most of the survey we will think of such higher rank Teichmüller theories as parametrizing special classes of locally symmetric spaces ρ(Γg )\X covered by the Riemannian symmetric space X , and whose fundamental group is Γg . Observe that, being a connected component of a character variety in a reductive algebraic group, any higher rank Teichmüller theory has a natural structure of a real semi-algebraic variety, and is thus amenable to the tools of real semi-algebraic geometry [19, 2, 38]. 2.1. Hitchin components Let G be a real split simple Lie group, such as PSL(n, R) or PSp(2n, R). By the work of Kostant [58] there exists a principal homomorphism τ : PSL(2, R) → G: the unique homomorphism for which the image of a unipotent element is a regular unipotent element. In particular the image of any diagonalizable element under τ is diagonalizable with distinct eigenvalues. If G = PSL(n, R), the principal homomorphism is the irreducible representation τ : PSL(2, R) → PSL(n, R) induced by the natural action of PSL(2, R) on the homogeneous polynomials of degree n − 1. In [51] Hitchin initiated the study of the connected component in Hom(Γg , G)//G of the composition τ ◦ ρ where ρ : Γg → PSL(2, R) is the holonomy of a hyperbolization: Definition 2.2. — Let G be a real split simple Lie group, τ : PSL(2, R) → G the principal homomorphism, ρ : Γg → PSL(2, R) the holonomy of a hyperbolization. The Hitchin component Hit(Γg , G) is the connected component of [τ ◦ρ] in Hom(Γg , G)//G. Using analytic techniques, and in particular the theory of Higgs bundles developed by Hitchin [50], Simpson [82, 83], Corlette [31] and Donaldson [34], Hitchin was able to show that, as in the case of Teichmüller space, the Hitchin component Hit(Γg , G) is homeomorphic to the Euclidean space of dimension (2g − 2) dim G. The geometric relevance of representations in Hit(Γg , PSL(n, R)) was singled out by Labourie using dynamical techniques: in [66] Labourie introduced the notion of Anosov representation, and proved that representations in the Hitchin component are injective, have discrete image, and are purely loxodromic, which means that for every element γ ∈ Γg , the image ρ(γ) is diagonalizable with distinct real eigenvalues. In particular Hitchin components form examples of higher rank Teichmüller theories, according to Definition 2.1. An independent approach to the study of Hitchin components was developed by Fock and Goncharov [38], based on Lusztig’s generalization [73] of the notion of totally positive matrices, namely matrices whose minors are all positive. Lusztig associated

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

332

M.B. POZZETTI

to every split semisimple real Lie group G a positive submonoid G>0 with remarkable algebraic properties. Let F = G/B denote the full flag variety associated to G, which, in the case of G = PSL(n, R), is nothing but the collection of full flags {0} = V (0) ( V (1) ( · · · ( V (n) = Rn . Fock and Goncharov [38] used the tools provided by Lusztig’s theory of positivity to define the notion of positivity for a k-tuple (F1 , . . . , Fk ) of flags in F . This began the study of the space of positive decorated representations: representations ρ : Γg → G admitting a positive decoration, a map from the cyclically ordered set X ⊂ ∂Γg of fixed points of hyperbolic elements to F for which the image of any cyclically ordered k-tuple is a positive k-tuple of flags. (4) One of the crucial differences between higher rank symmetric spaces and their rank one analogues, such as the hyperbolic plane, is that the visual boundary ∂∞ X of the symmetric space is not anymore a homogeneous G-space, but stratifies in orbits isomorphic to partial flag varieties: compact homogeneous G-spaces G/P , determined by the choice of a parabolic subgroup P . When considering boundary maps, it is thus natural to consider, instead of maps ξ : ∂Γg → ∂∞ X , maps of the form ξP : ∂Γg → G/P for a suitable choice of a parabolic subgroup P . It was proven by Labourie and Guichard, that Hitchin representations in PSL(n, R) can be characterized by the properties of the boundary map they admit with value in the projective space RPn−1 . We say that the map ξ : ∂Γg → RPn−1 is hyperconvex Ln if for every pairwise distinct points x1 , . . . , xn ∈ ∂Γg the sum k=1 ξ(xk ) is direct. Theorem 2.1 (Labourie [66], Guichard [42]). — Let ρ : Γg → PSL(d, R) be a homomorphism. Then [ρ] belongs to the Hitchin component Hit(Γg , PSL(n, R)) if and only if there exists a continuous ρ-equivariant hyperconvex map ξ : ∂Γg → RPn−1 . More precisely Labourie proved that Hitchin representations admit equivariant hyperconvex boundary maps, while Guichard proved that this property is enough to characterize such representations. Hitchin representations also admit continuous boundary maps with values in the full flag manifold F extending the decoration described above. 2.2. Maximal representations Let now G be an Hermitian Lie group, such as PSp(2n, R) or PO0 (2, n). By definition the symmetric space X admits a G-invariant complex structure, and is thus a Kähler manifold with Kähler form ω. It is possible to define the volume of a representation ρ by setting Z 1 T (ρ) = π∗ f ∗ ω, 2π Sg (4)

The work of Fock and Goncharov mostly deals with representations of surfaces with punctures, in which a decoration is only required above the punctures.

ASTÉRISQUE 422

(1159)

HIGHER RANK TEICHMÜLLER THEORIES

333

where f : Seg → X is any smooth ρ-equivariant map and π : Seg → Sg is the universal covering. The characteristic number T (ρ) is the Toledo invariant of the representation ρ, it generalizes the Euler number eu(ρ) appearing in Theorem 1.1, and, as the Euler number, it satisfies a Milnor-Wood inequality: |T (ρ)| ≤ (2g − 2)rkR (G) where the real rank rkR (G) is the maximal dimension of a flat subspace of X [24, Proposition 3.1]. Definition 2.3. — Let G be a Hermitian Lie group. A representation ρ : Γg → G is maximal if its Toledo invariant satisfies the equality in the Milnor-Wood inequality. We will denote by Max(Γg , G) ⊂ Hom(Γg , G)//G the set of maximal representations. The Toledo invariant for representations ρ : Γg → PU(1, n) was first introduced by Toledo [90] who used it to prove rigidity for Fuchsian subgroups acting on complex hyperbolic spaces. Burger, Iozzi and Wienhard [21, 23] initiated the study of the Toledo invariant for general Hermitian Lie groups in the framework of bounded cohomology. With this tool they proved that maximal representations are other instances of higher rank Teichmüller theories: they form unions of connected components of the character variety consisting of classes of injective homomorphisms with discrete image. Furthermore an analogue of Theorem 2.1 holds for maximal representations as well. In this case the suitable parabolic to consider is the stabilizer Q of a point in the Shilov boundary Sˇ of the Hermitian symmetric space (this is the set of Lagrangians in the case of G = PSp(2n, R) and the set of isotropic lines in the case of G = PO0 (2, n)). ˇ and maximal representaThe Maslov cocycle induces a partial cyclic order on S, tions can be characterized as those representations admitting a monotone equivariant boundary map, namely a map ξ : ∂Γg → Sˇ such that for every positively oriented triple (x, y, z) ∈ ∂Γ3g the image (ξ(x), ξ(y), ξ(z)) is Maslov-positively oriented. Using the theory of Higgs bundles together with ideas from [51], Bradlow, GarcíaPrada and Gothen [14] managed to count the connected components of Max(Γg , G) and showed that the components can be selected with the aid of secondary characteristic invariants; in the case of G = PSp(2n, R), Guichard-Wienhard gave another interpretation of the invariants distinguishing components of maximal representations based on properties of the associated boundary map [45]. Apart from 2g − 3 exceptional components in Max(Γg , PSp(4, R)), that are often referred to as the Gothen components and consist entirely of Zariski-dense representations, every maximal component admits a Fuchsian locus, consisting of representations that preserve a totally geodesic copy of H2 in X whose quotient modulo the representation is a point in the Teichmüller space T (Sg ). Model representations in the Gothen components have been constructed by Guichard-Wienhard as amalgams of representations [45] and by

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

334

M.B. POZZETTI

Kydonakis by establishing a gluing construction for Higgs bundles over a connected sum of Riemann surfaces [59]. The only family of split simple Lie groups of Hermitian type is given by PSp(2n, R). In this case Hitchin representations are maximal, but the set of maximal representations includes more connected components of the character variety [21]. 2.3. Θ-positive representations A common framework explaining the various higher rank Teichmüller theories is now emerging thanks to the work of Guichard-Wienhard [47] and work in progress of Guichard-Labourie-Wienhard. Let G be a semisimple Lie group with finite center and PΘ a self-opposite parabolic subgroup corresponding to a subset Θ of the simple roots. Given E ∈ G/PΘ denote by (G/PΘ )E the set of points F in G/PΘ that are transverse (5) to E. Guichard-Wienhard say that the group G admits a Θ-positive structure if there are two transverse points E, F ∈ G/PΘ such that a connected component of (G/PΘ )E ∩ (G/PΘ )F has the structure of a semigroup. In this case one can talk about Θ-positive triples, and define Definition 2.4. — Let G be a semisimple Lie group with a Θ-positive structure. A representation ρ : Γg → G is Θ-positive if there exists a ρ-equivariant boundary map ξ : ∂Γg → G/PΘ sending positive triples to Θ-positive triples. Guichard-Labourie-Wienhard conjecture that Θ-positive representations also form higher rank Teichmüller spaces, namely they form connected components of the character variety consisting of injective representations with discrete image. Using a more algebraic characterisation of Θ-positivity, inspired by the work of Lustzig, Guichard and Wienhard classify the groups G admitting a Θ-positive structure. They show that split real Lie groups admit a Θ-positive structure induced by Lustzig positivity, and for such structure Θ-positive representations are Hitchin representations, similarly Hermitian Lie groups have a Θ-positive structure such that Θ-positive representations are precisely maximal representations. The only other classical family of Lie groups admitting a Θ-positive structure is given by PO(p, q). The count of the connected components of Hom(Γg , PO(p, q))//PO(p, q) has been carried out, using techniques from the theory of Higgs bundles, by Aparicio-Arroyo, Bradlow, Collier, García-Prada, Gothen and Oliveira [7]. If the conjecture of GuichardLabourie-Wienhard is true, their work also gives a parametrization of the space of Θ-positive representations in terms of holomorphic data. They show that exceptional components, only consisting of Zariski-dense representations, can only exist for the group PO(p, p + 1). The PO(p, p + 1)-character variety admits n(2g − 2) − 1 (5)

This means that the pair (E, F ) belongs to the unique open G-orbit in G/PΘ ×G/PΘ . This notion agrees with the standard notion of transversality when G/PΘ corresponds to a partial flag manifold.

ASTÉRISQUE 422

(1159)

HIGHER RANK TEICHMÜLLER THEORIES

335

connected components, previously parametrized by Collier, which conjecturally only consists of Zariski-dense representations [28]. These would be generalized Gothen components.

3. METRIC PROPERTIES OF THE ASSOCIATED LOCALLY SYMMETRIC SPACES: ANALOGIES AND DIFFERENCES WITH TEICHMÜLLER SPACE In order to discuss some of the striking geometric properties of the locally symmetric spaces associated to Hitchin and maximal representations, we will need to discuss some more properties of the geometry of a symmetric space X . An important difference between higher rank symmetric spaces and their rank one relatives is that, in higher rank, the isometry group G does not act transitively on the unit tangent bundle, and a fundamental domain for the G-action on pairs of points in X is the Weyl chamber a+ , which can be identified with a closed convex cone in a maximal flat subspace a of X . For example, in the case of the classical groups that will play a role in the sequel, we have P a+ = {(λ1 , . . . , λn ) | λ1 ≥ . . . ≥ λn , λi = 0} PSL(n,R) a+ PSp(2n,R)

= {(λ1 , . . . , λn ) | λ1 ≥ . . . ≥ λn ≥ 0}

a+ PO(2,n)

= {(λ1 , λ2 ) | λ1 ≥ λ2 ≥ 0}.

Parreau observed that it is possible to use the projection that associates to a pair of points in X × X the unique representative of their G-orbit in the Weyl chamber + to define a vector valued distance da : X × X → a+ , which, she proves, satisfies a suitable triangular inequality. This is a universal distance in the sense that any + G-invariant Finsler (6) distance d on X is induced by the composition of da with a suitable Weyl group invariant norm on a. As we will see, an important role in the study of higher rank Teichmüller theories will be played by the Finsler norms given by the symmetrized `∞ norm in the case of representations in Hit(Γg , PSL(n, R)) and by the `1 norm in the case of representations in Max(Γg , PSp(2n, R)); we will denote these two norms by `F . We then have (1)

on a+ PSL(n,R) on a+ PSp(2n,R)

`F (λ1 , . . . , λn ) = λ1 − λn X `F (λ1 , . . . , λn ) = λi .

Observe both these norms can be obtained as value of a linear functional which is always positive on the Weyl chamber. We will denote it by φF . (6)

A Finsler distance on a smooth manifold X is the length function associated to a Finsler metric, a smooth choice of a, not necessarily Euclidean, norm on every tangent space.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

336

M.B. POZZETTI

The Weyl chamber valued distance can be used to give a geometric interpretation of the Lyapunov and Cartan projections from the theory of Lie groups, which will be needed in the rest of the section. The Cartan projection, that we will denote by σ : G → a+ depends on the choice of a maximal compact subgroup K of G (or equivalently of a point o in the symmetric space), and is induced by the Cartan decomposition: in the case of G = PSLn (R), the vector σ(g) is nothing but the ordered list of the logarithms of the singular values of the matrix g. We then have +

σ(g) = da (o, g · o). The Lyapunov projection λ : G → a+ is induced by the Jordan decomposition of G: in the case of G = PSLn (R), the vector λ(g) is the ordered list of the logarithms of the absolute values of the eigenvalues of g. The Lyapunov projection can be geometrically reinterpreted as the translation length: +

λ(g) = inf da (x, g · x) x∈X

here the infimum can be understood as the vector of smaller Euclidean norm in the closure, and it is possible to prove that this is unique [77, Proposition 4.1]. 3.1. Marked length spectra and compactifications A lot of the geometry of a locally symmetric space associated to a representation ρ can be encoded in the marked length spectrum of ρ, the point in (a+ )Γg that records, for every element γ in Γg , the Weyl chamber valued translation length λ(ρ(γ)). It is possible to verify that the map Hom(Γg , G)//G → (a+ )Γg [ρ] 7→ (γ 7→ λ(ρ(γ))) is injective when restricted to a Hitchin or maximal component, and it is an interesting question to determine what is the minimal collection of lengths necessary to reconstruct the representation. Bridgeman, Canary and Labourie recently showed that, for Hitchin components, the knowledge of the absolute value of the top eigenvalue (the spectral radius) of all the elements in Γg corresponding to simple closed curves is enough [16]. The projectivization of the marked length spectrum was used by Parreau to construct compactifications of the space of reductive representations of finitely generated groups in semisimple Lie groups [77]. In her work she interprets boundary points as projective classes of marked length spectra of actions on affine buildings: geometric objects that can be thought of as rescaled limits of the symmetric spaces. In affine buildings the curvature is replaced by branching and thus the geometry is encoded in a rich combinatorial structure.

ASTÉRISQUE 422

(1159)

HIGHER RANK TEICHMÜLLER THEORIES

337

We are just beginning to understand more detailed properties of such compactifications for higher rank Teichmüller theories. In [25] Burger and Pozzetti initiated the study of the actions on buildings arising in the compactifications of maximal representations, and Burger-Iozzi-Parreau-Pozzetti [20] described large domains of discontinuity for the mapping class group action on the boundary, a new phenomenon not present in Teichmüller theory. The combinatorial study of actions on buildings arising in the boundary of the Hitchin components was investigated by Martone [74] using techniques inspired by the work of Fock and Goncharov, while the work of KazarkovNoll-Pandit-Simpson [55, 56] aims at understanding the actions in Parreau’s compactification from a more analytic point of view (cf. also the work of Collier-Li for a special class of degeneration [29]). Le [68], following ideas of Fock-Goncharov, used techniques of tropical geometry to interpret points in the boundary of the Hitchin component as higher laminations. 3.2. Parametrizations, Bers constants, Hamiltonian flows and entropy Parametrizations provide a fundamental tool to construct examples of representations in the higher rank Teichmüller spaces, and explore finer geometric properties of the associated actions. These often generalize well known parametrizations of the classical Teichmüller space. Analogues of the shear coordinates on Teichmüller space have been developed in higher rank by Fock-Goncharov [38] in the case of Hitchin representations and by Alessandrini-Guichard-Rogozinnikov-Wienhard [5] in the case of maximal representations. Analogues of Fenchel-Nielsen parametrization were developed by Bonahon-Dreyer [13] and Zhang [94] for Hitchin representations and by Strubel [86] for maximal representations. In all such parametrizations of Hitchin components new parameters associated to pairs of pants arise, the so-called internal parameters. These are not present in classical Teichmüller theory and account for many new higher rank phenomena. Most of these parametrizations are furthermore very concrete, and allow to compute examples of representations in higher rank Teichmüller thoeries with desired properties. For example, using Strubel’s coordinates, Burger constructed examples of maximal representations with value in PSp(4, Z), in striking contrast with what happens in Teichmüller space (see also [72] for some integral points in Hit(Γg , PSL(3, R))). In the rest of the subsection we will emphasize few other geometric features of Hitchn or maximal representations that have been also studied with the aid to suitable parametrizations. The Bers constant is a universal constant Cg , depending on the genus g of Sg only, such that every hyperbolic structure on the surface Sg admits a pair of pants decomposition along curves of length bounded by Cg . This property of hyperbolizations has been of fundamental importance in the study of geometric properties of

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

338

M.B. POZZETTI

classical Teichmüller theory, for example in the construction of combinatorial models for the Teichmüller space [18]. In his thesis [94] Zhang used a parametrization of Hit(Γg , PSL(n, R)) inspired by Fenchel-Nielsen coordinates to show that this tool will not be available in higher rank Techmüller theory: Zhang constructs sequences of representations ρk in Hit(Γg , PSL(n, R)) such that φF (λ(ρk (γ))) > k for every γ ∈ Γg , therefore no Bers constant can exist for Hitchin representations. Suitable parametrizations also played an important role in the recent work of SunWienhard-Zhang on the symplectic geometry of the Hitchin component. In his seminal paper [41] Goldman constructed a symplectic form on character varieties of fundamental groups of surfaces, which, on the Teichmüller space, restricts to the Weil-Petersson symplectic form. In the case of the Hitchin component Sun-Wienhard-Zhang constructed a half dimensional family of commuting flows that are Hamiltonian for Goldman’s symplectic form: these are associated to a pair of pants decomposition and are distinguished in two classes, the generalized twists along the curves in the decomposition, and the eruption flows, which only change the restriction of the representation to the fundamental group of the pair of pants, without changing the boundary holonomy [93, 87, 88]. The second kind of flows does not arise in classical Teichmüller theory, as there is a unique hyperbolic metric on a pair of pants with prescribed boundary holonomy. Let φ : a+ → R+ be the restriction of a seminorm on a, or more generally a size function, as for example a positive linear functional. The orbit growth rate log |{γ ∈ Γg | φ(σ(ρ(γ))) < T }| T →∞ T

hσ,φ := lim ρ and the entropy hλ,φ := lim ρ

T →∞

log |{[γ] ∈ [Γg ] | φ(λ(ρ(γ))) < T }| T

are important invariants measuring the complexity of a locally symmetric space, and in particular of the locally symmetric spaces of the form ρ(Γg )\X for a representation ρ in a higher rank Teichmüller theory. Here, as before, σ is the Cartan projection, and λ is the Lyapunov projection, while [Γg ] denotes the set of conjugacy classes in Γg . Both these quantities depend on the choice of a seminorm φ on a+ ; of particular interest are the seminorms induced by those linear functionals φ that are positive on λ(ρ(γ)) for every γ ∈ Γg . The orbit growth rate measures the exponential growth of the number of homotopy classes of loops based at a chosen base point and of φ-length bounded by T ; on the other hand the entropy has a dynamical meaning as it can be reinterpreted, in many interesting cases, as the entropy of a suitable flow. Sambarino proved [81] that orbit growth rate and entropy associated to a positive functional φ agree for representations in Hit(Γg , PSL(n, R)), or more generally for a suitable class

ASTÉRISQUE 422

(1159)

HIGHER RANK TEICHMÜLLER THEORIES

339

of Anosov representations, but not much is known about the relations between these two invariants in full generality. Using again a version of Fenchel-Nielsen parametrization of Hit(Γg , PSL(n, R)) F Zhang managed to construct sequences of representations ρk with hσ,φ → 0 [94] ρk (cf. also [76] where a similar result was proven for Hit(Γg , PSL(3, R))). This is again in strong contrast with the classical theory, in which the entropy is constant and equal to one, and along such degenerations most orbit points escape to infinity, a phenomenon that, in rank one, is prohibited by the compactness of the surface Sg . More recently Martone-Zhang [75] proved, for both Hitchin and maximal representations, F that the quantity hσ,φ Syst(ρ) is uniformly bounded away from zero and infinity with ρ constants depending only on the genus of the surface; here Syst(ρ) is the panted systole, namely the length (with respect to the norm defined above) of the shortest curve not belonging to a pants decomposition of minimal length. Using the thermodynamical formalism, and deep results of Sinai-Ruelle-Bowen, Potrie and Sambarino [78] proved that for every point ρ ∈ Hit(Γg , PSL(n, R)) the entropy log |{[γ] ∈ [Γg ]| αi (λ(ρ(γ)) < T )}| i := lim hλ,α ρ T →∞ T is constant and equal to 1 for every simple root αi , namely every linear functional αi : a+ → R of the form αi (λ(g)) = λi (g) − λi+1 (g). Observe that this is not the restriction of a Weyl-invariant seminorm on a and therefore it is not associated to a Finsler norm on X . Nevertheless, as a consequence of this result, they deduce that the orbit growth rate with respect to the Riemannian metric is smaller or equal to 1 and equality characterizes the Fuchsian locus, provided the metric is normalized so that the embedding of the hyperbolic plane equivariant with the principal PSL(2, R) has curvature −1. 3.3. Crossratios, identities, currents, and metrics A fundamental tool in classical projective geometry is the projective crossratio on FP1 which extends the invariant of fourtuples in the affine chart F ⊂ FP1 given by (z − x)(t − y) b(x, y, z, t) = . (y − x)(t − z) This is the only invariant for the action of PSL(2, F) on distinct 4-tuples in FP1 , and has been of fundamental importance both in projective geometry and hyperbolic geometry, through the identification RP1 = ∂∞ H2 . Various other geometric structures on surfaces can also be understood using generalized crossratios on the boundary ∂Γg . Let ∂Γ4∗ g denote the set of 4-tuples

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

340

M.B. POZZETTI

(x, y, z, t) ∈ ∂Γ4g with x ∈ / {y, z} and t ∈ / {y, z}. For our purposes (7), a crossratio will be a function b : ∂Γ4∗ g →R that is invariant under the diagonal Γg -action and satisfies the cocycle relations b(x, y, z, w) = b(x, y, t, w)b(x, t, z, w), b(x, y, z, w) = b(t, y, z, w)b(x, y, z, t). A crossratio is furthermore symmetric if b(x, y, z, t) = b(z, t, x, y) and positive if b(x, y, z, t) > 1 for every positively oriented 4-tuple (x, y, z, t), all these properties are satisfied by the classical crossratio. Given an element γ ∈ Γg its period for the crossratio b is perb (γ) = log |b(γ − , x, γ · x, γ + )| for any point x distinct from γ + , γ − . It is easy to check that the period doesn’t depend on the choice of x. Observe that for the projective crossratio on RP1 = ∂∞ H2 , the period perb (γ) equals the translation length of γ on H2 . Labourie [61] associated, to every representation in Hit(Γg , PSL(n, R)) and Max(Γg , PSp(2n, R)), a crossratio whose periods are given by the translation lengths of the element ρ(γ) with respect to the norm `F defined in (1). HartnickStrubel [49] extended Labourie’s construction to maximal representations in any Hermitian Lie group; their normalization is furthermore natural in the sense that whenever a Lie group homomorphism (8) η : G → H induces an inclusion η∗ : Max(Γg , G) ⊂ Max(Γg , H), the restriction of the crossratio of Max(Γg , H) is the crossratio of Max(Γg , G). More generally, for every k = 1, . . . , bn/2c Martone and Zhang [75] associated, to any Hitchin representation, a symmetric crossratio whose periods are given by k X

log(λi (ρ(γ))) − log(λn−i (ρ(γ))).

i=1

In the case of maximal representations Burger-Pozzetti [25] also studied a vector valued generalization of such crossratios, which allows to study finer geometric properties of the symmetric spaces associated to such representations. These crossratios are a starting point to obtain generalizations, to higher rank Teichmüller spaces, of various beautiful identities between lengths of curves, which were previously known for hyperbolic surfaces. Labourie-McShane [67] proved McShanetype identities for Hitchin and maximal representations (see also [52] for a more recent approach), the Basmajian identity was generalized by Vlamis-Yarmola [91] (7)

The reader should be warned that there are various different pairwise not equivalent conventions in the definition of a crossratio [69, 48, 61, 75, 11], we adopted here the order convention of [25]. (8) Such Lie group homomorphisms are precisely the tight embeddings defined and studied in [22].

ASTÉRISQUE 422

(1159)

HIGHER RANK TEICHMÜLLER THEORIES

341

to Hitchin representations and by Fanoni-Pozzetti for maximal representations [36]. Strictly speaking all the aforementioned identities hold for surfaces with boundary, which therefore are not encompassed in Definition 2.1. However, on the one hand it is possible to define higher rank Teichmüller theories for surfaces with boundary [38, 23], on the other hand the identities we just discussed give interesting corollaries also for compact connected surfaces, when one considers the restriction of the representation to subsurfaces with boundary. Another important application of the theory of crossratios for higher rank Teichmüller spaces is the construction of geodesic currents associated to representations in these components. Geodesic currents C (Sg ) are Γg -invariant Radon measures on the space of unoriented, unparametrized geodesics in Seg ; these objects were introduced by Bonahon [12] in the study of the geometry of hyperbolic surfaces, as this theory includes both hyperbolic structures and closed geodesics on surfaces: to a closed geodesic γ ⊂ Sg corresponds the geodesic current δγ which is the sum of a Dirac mass on each lift of γ to Seg . A key feature of the theory of geodesic currents is that the geometric intersection of closed geodesics extends to a bilinear form i : C (Sg )× C (Sg ) → R which encodes a lot of the geometry of the surface. To every continuous symmetric positive crossratio b one can naturally associate a Liouville geodesic current µb , whose intersection with simple closed curves gives the period of the crossratio: i(µb , δγ ) = perb (γ). Note that this last property completely characterize the current µb . As a result higher rank Teichmüller theories are part of the theory of geodesic currents [75]. An important consequence of this fact is that the length functions associated to maximal representations satisfy a length shortening under surgery property: if a closed geodesic representing an element γ has a self intersection point x ∈ Sg and γ = γ1 γ2 ∈ π1 (Sg , x) where γi are the two sub-paths of γ beginning and ending at x, then `F (λ(ρ(γ1 ))) + `F (λ(ρ(γ2 ))) ≤ `F (λ(ρ(γ))) and `F (λ(ρ(γ1 γ2−1 ))) ≤ `F (λ(ρ(γ))) [75, Proposition 4.5]. This is one of the many features showing that representation in higher rank Teichmüller theories remember a lot of the topology of the underlying surface. Using the thermodynamical formalism, Bridgeman-Canary-Labourie-Sambarino defined Riemannian metrics on Hitchin and maximal components (and more generally on spaces of Anosov representations), the so-called pressure metric [15]. It is obtained as the Hessian of the renormalized intersection J φ (ρ, η) =

hλ,φ ρ

lim

T →∞ hλ,φ η

1 |Lφρ (T )|

X γ∈Lφ ρ (T )

φ(λ(η(γ))) , φ(λ(ρ(γ)))

where φ is the maximum eigenvalue in the case of Hit(Γg , PSL(n, R)) while it is the sum of the eigenvalues for Max(Γg , PSp(2n, R)), and Lφρ (T ) denotes the set of

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

342

M.B. POZZETTI

conjugacy classes in Γg for which φ(λ(ρ(γ))) < T . They can show that the restriction of the pressure metric to the Fuchsian locus agrees with the Weil–Petersson metric. Labourie-Wentworth [65] combined holomorphic and dynamical techniques to compute an expression for the pressure metric on the Fuchsian locus in the Hitchin component; in the same article they generalize Gardiner’s formula for the translation length of closed geodesics to a variational formula of the p-th largest eigenvalue of the holonomy of a Hitchin representation along a simple closed geodesic. More recently, Brigeman-Canary-Labourie-Sambarino defined a new metric on the Hitchin component, the so-called Liouville pressure metric [17], which is obtained as a renormalized intersection with respect to the first root α1 (λ) = λ1 − λ2 . Since 1 hλ,α = 1 [78], no normalization is required for this new intersection function; furρ thermore they reinterpret the intersection J φ (ρ, η) as a ratio of pairings of the nonsymmetrized Liouville currents with the simple root flow associated to the two Hitchin representations. Bridgeman-Pozzetti-Sambarino-Wienhard pointed out that the Liouville pressure metric has the additional property that, as the Weil–Petersson metric on Teichmüller space, it can be reinterpreted as the Hessian of the Hausdorff dimension in purely imaginary directions, when Hit(Γg , G) is considered as a subspace of the character variety in the complexified group GC [79]. 3.4. Collar lemma A fundamental geometric property of hyperbolic surfaces is given by the collar lemma, first established by Keen [57]. It states that any simple closed geodesic in a hyperbolic surface admits an embedded collar whose width can be explicitly determined as a function of the length of the geodesic, and diverges logarithmically as the length shrinks to zero. In particular this can be used to obtain a lower bound on the length of any geodesic intersecting a simple geodesic β in terms of the length of β. Surprisingly, the same holds for Hitchin and maximal representations, although the sets of minimal displacement of two elements ρ(α), ρ(β) corresponding to intersecting simple closed curves need not intersect in the symmetric space: Theorem 3.1 (Lee-Zhang [70]). — Let ρ : Γg → PSL(n, R) be a Hitchin representation, and let α, β ∈ Γg be such that the axis of the corresponding isometries intersect. Then for every k = 0, . . . , n − 2 it holds λ1 (ρ(α)) λk (ρ(β)) ≥ . λn (ρ(α)) λk (ρ(β)) − λk+1 (ρ(β)) A similar result for maximal representations was proven, with different techniques, by Burger-Pozzetti [25], and shows that a lot of the topology of the surface Sg is reflected in the geometry of locally symmetric spaces associated to representations in higher rank Teichmüller theories. It is worth remarking that both the collar lemma

ASTÉRISQUE 422

(1159)

HIGHER RANK TEICHMÜLLER THEORIES

343

for Hitchin representations and the one for maximal representations relate the Finsler length of one element with the logarithm of the eigenvalue gap of the other, and thus measure a finer geometric property than what can be seen by the crossratios discussed above.

4. MINIMAL SURFACES An important analytic tool to study higher rank Teichmüller theories are harmonic maps and minimal surfaces, a standard reference for this is [80]. As the Zariski closure of any Hitchin or maximal representation is a reductive group, for every choice of a conformal structure Σ on the surface Sg there exists a unique equivariant harmonic map f : Seg → X : this is a minimizer of the Dirichlet energy Z kdf k2 dV. Σ

The harmonic map f crucially depends on extrinsic choice of the conformal structure Σ, and therefore it is natural to look for a preferred choice of a complex structure, which should reflect better the properties of the locally symmetric space associated to the representation ρ. A branched minimal immersion is a harmonic map f that is furthermore weakly conformal; in this case it is also an area minimizer. It follows from the properness of the mapping class group action on the Hitchin and maximal representations [63] that minimal harmonic maps always exist. Conversely Labourie conjectured uniqueness for such a map: Conjecture 4.1 (Labourie). — For every ρ ∈ Hit(Γg , G) there exists a unique ρ-equivariant minimal immersion f : Seg → X . A positive answer to Labourie’s conjecture would be of fundamental interest for a number of reasons. In particular, using the theory of Higgs bundles, it would allow to obtain a mapping class group equivariant parametrization of the associated higher rank Teichmüller theories in terms of holomorphic data. A second important reason emerged from Collier-Alessandrini’s work [4]: they showed that, on every component on which Labourie’s conjecture holds, there is a natural complex structure which is, again, equivariant for the mapping class group action. Significant progress on Labourie’s conjecture has only been achieved in rank 2: for Hit(Γg , PSL(3, R)) the uniqueness of minimal harmonic maps was obtained independently by Labourie [60, 62] and Loftin [71]. More recently, also building on ideas of Baraglia about cyclic Higgs bundles [8], Labourie developed [64] the theory of cyclic surfaces that he used to give a unified affirmative solution to the uniqueness of

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

344

M.B. POZZETTI

minimal harmonic maps for Hit(Γg , PSL(3, R)), Hit(Γg , PSp(4, R)) and Hit(Γg , G2 ). The same techniques were then generalized by Collier [27] to the Gothen components in Max(Γg , PSp(4, R)), and by Alessandrini-Collier for the other components in Max(Γg , PSp(4, R)) [4]. Using completely different techniques, which we will partially discuss in the last section of the survey, the validity of the conjecture has been established for Max(Γg , PO0 (2, n)) by Collier-Tholozan-Toulisse [30].

5. RELATIONS WITH GEOMETRIC STRUCTURES Given a Lie group G and a model manifold X on which G acts transitively and effectively, a (G, X)-geometric structure on a manifold M of dimension dim(M ) = dim(X) is the datum of an atlas of M with image in X so that the transition functions are elements of G. Every (G, X) structure is determined by its associated holonomy f → X. As semisimple Lie groups G act ρ : π1 (M ) → G and developing map dev : M on various homogeneous manifolds X, we will see that we can often reinterpret representations in higher rank Teichmüller theories, and more generally Anosov representations, as holonomies of geometric structures on non-necessarily compact manifolds. Given a representation ρ : Γg → G, Guichard-Wienhard [46] constructed the first examples of domains of proper discontinuity Ωρ for the action of ρ(Γg ) on G/P where P is a suitable parabolic subgroup. They observed that it is in most cases possible to choose a parabolic subgroup P , so that, after removing a closed subset Kξ determined by the image of the ρ-equivariant boundary map ξ, the action on the complement Ωρ = (G/P ) \ Kξ is properly discontinuous; for many choices of P , even if not all, such action is also cocompact. The representation ρ can then be re-interpreted as the holonomy of a (G, G/P )-structure on the manifold Ωρ /ρ(Γg ). In more recent work Kapovich-Leeb-Porti gave a general criterion to construct a much more general class of domains of discontinuity, where the set Kξ depends on the choice of a balanced ideal in the Weyl group [53]; Stecker proved [84] that for Hitchin representations every cocompact domain of discontinuity in the full flag manifold F is one of the domains constructed by Kapovich-Leeb-Porti. The even richer theory of domains of discontinuity in oriented flag manifolds has been developed by Stecker-Treib [85]. Dumas-Sanders conjecture that the set Ωρ is, in these cases, a fiber bundle over the surface Sg with compact fiber [35]. This conjecture has been settled by Alessandrini-Li [1] for representations in the Hitchin component provided the rank is smaller than 63. In general a problem in this interpretation of higher rank Teichmüller theories as holonomies of (G, X)-structures is that it is not always easy to characterize what geometric structures arise with this construction, nor the topology of the quotient

ASTÉRISQUE 422

(1159)

HIGHER RANK TEICHMÜLLER THEORIES

345

manifold M (9). In some specific cases, and in particular in low ranks, it is however possible to use harmonic maps, and more generally the theory of Higgs bundles to give a more precise answer to some of these questions. We will discuss, in the next sections, some geometric implications of this approach, but we refer the reader to the survey [3] for details about the Higgs bundles perspective on these same themes. 5.1. Convex projective structures Convex projective structures are an important example of geometric structures: these are (PSL(d + 1, R), RPd )-structures on a manifold M with the additional propf with an erty that there exists a compatible identification of the universal covering M d open subset Ωρ contained in an affine chart of RP . In other terms the developing map f → RPd is injective and its image is contained in an affine chart and is convex dev : M therein. If we furthermore require M to be compact, then M can be homeomorphic to Sg only if d = 2. In this case Choi-Goldman [26] proved that the Hitchin component Hit(Γg , PSL(3, R)) bijectively corresponds to the parameter space of convex projective structures on Sg . Baraglia, in his thesis [9], used Higgs bundles, together with the solution, due to Labourie and Loftin, of Labourie’s conjecture to give an analytic construction of the convex projective structure associated to a representation ρ ∈ Hit(Γg , PSL(3, R)). The interpretation of the Hitchin component as parameter space for convex projective structures on Sg gives further geometric significance to the norm `F introduced at the beginning of Section 3: every properly convex projective domain Ωρ is endowed with a Finsler distance dH , the Hilbert metric, which is invariant under the group of projective automorphisms of Ωρ . The value `F (λ(ρ(γ))) is nothing but the translation length of ρ(γ) on (Ωρ , dH ). Improving on work of Benoist-Hulin [10], Tholozan [89] gave a precise relation of the Hilbert metric with the Blaschke metric, another invariant metric on a properly convex projective domain, whose analytic definition arises from the theory of affine spheres. Such comparison allowed him to deduce that for every representation ρ ∈ Hit(Γg , PSL(3, R)) there exists a representation η ∈ Hit(Γg , PSL(2, R)) = T (Sg ) which is strictly dominated by ρ in the sense that there exists a constant K > 1 such that for every γ ∈ Γg , φH (λ(ρ(γ))) > KφH (λ(η(γ))). Here the right hand side is nothing but the translation length in H2 . More generally, Danciger-Guéritaud-Kassel [33] and Zimmer [95] independently proved that Hitchin representations in odd dimensions are holonomies of convex projective structures on non-compact manifolds, which are however convex cocompact. Again φF (λ(ρ(γ))) can be reinterpreted as the translation length for the (9)

Dumas-Sanders compute the homology of the quotient of the associated domain of discontinuity in GC /P C .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

346

M.B. POZZETTI

Hilbert metric in these manifolds. Similarly Danciger-Guéritaud-Kassel show that every ρ ∈ Max(Γg , PO0 (2, n)) is the holonomy of a convex projective structure on a non-compact manifold which is convex cocompact [32]. 5.2. Properly convex foliated projective contact structures In the case of Hit(Γg , PSp(4, R)) Guichard and Wienhard [44] interpreted the quotient of the domain of discontinuity Ωρ ⊂ RP3 as a (marked) properly convex foliated projective contact structure on the unit tangent bundle T 1 Sg and proved that the Hitchin component can be reinterpreted as the moduli space of such structures. Here a projective contact structure is a (PSp(4, R), RP3 )-geometric structure and this refers to the fact that RP3 admits a contact structure invariant for the PSp(4, R)-action which is thus inherited by the geometric structure on M ; properly convex refers to the fact that, while the full image of dev : T 1 Seg → RP3 will not be convex, when T 1 Seg is identified with PSL(2, R), the image, under the developing map, of every parabolic subgroup is required to be a properly convex subspace of RP3 . In his thesis Baraglia [9] gave a different construction of these projective structures developing a good understanding of the geometric properties of the Higgs bundle associated to a representation in Hit(Γg , PSp(4, R)); using such analytic input he found a surprising bridge with different geometric structures. To be more precise, he used the Higgs bundles theory to associate to any ρ-equivariant harmonic map f X : Seg → X with values in the symmetric space X , a map f Q : Seg → Q with values in the Klein quartic Q, which is nothing but the Plücker embedding of the Grassmannian Gr2 (R4 ) in RP5 . Thus every point q ∈ Q corresponds on the one hand to a 2-dimensional subspace of R4 , or equivalently to a projective line RP1 ⊂ RP3 , and on the other hand to the projective class of an elementary vector v ∧ w. When regarded as a subset of RP5 , the Klein quartic Q can be identified with the set of isotropic vectors for the canonical bilinear form b on R6 = ∧2 R4 : this is defined by requiring that v ∧ w ∧ z ∧ t = b(v ∧ w, z ∧ t)e1 ∧ e2 ∧ e3 ∧ e4 , and is clearly preserved by the induced action of PSp(4, R) ⊂ PSL(4, R). Such metric has signature (3, 3). We thus get that Q = Is(R3,3 ) inherits a conformal class of pseudo-Riemannian metrics of signature (2, 2). Baraglia shows that the map f Q : Seg → Q is space-like, namely the restriction of the conformal class of metrics to any tangent plane is positive definite. He deduces from this that the projective lines associated to any pair of distinct points in the image of f Q are disjoint and contained in the domain of discontinuity Ωρ , which therefore can be identified with the unit tangent bundle T 1 Seg . Furthermore Baraglia shows that the fibers of the induced projection Ωρ → Seg , are transverse to the contact distribution on RP3 induced by the symplectic structure on R4 ; along the way he also describes how to use the map f Q to construct a ρ-equivariant minimal immersion in the pseudo-Riemannian symmetric space H2,3 .

ASTÉRISQUE 422

(1159)

HIGHER RANK TEICHMÜLLER THEORIES

347

More generally, both in Guichard-Wienhard [44] and Baraglia’s work [9] it is possible to find a geometric interpretation of the Hitchin component Hit(Γg , PSL(4, R)) as moduli space of properly convex foliated projective structures. Ideas similar to the ones developed by Baraglia were used more recently in the work of Alessandrini-Li [6] to understand a class of representations in PO0 (2, 2) giving rise to compact Anti-de Sitter 3-manifolds. These representations, however, do not belong to a higher rank Teichmüller theory. 5.3. The geometry of maximal representations in PO0 (2, n) Collier-Tholozan-Toulisse [30] recently obtained a major generalization Baraglia’s work outlined in the previous section for Max(Γg , PO0 (2, n + 1)). Again, combining Higgs bundles techniques with the study of different geometric structures, they gave a precise answer to most of the questions outlined in Sections 2 and 3. Let R2,n+1 denote a real vector space endowed with a bilinear form h of signature (2, n + 1) preserved by the group PO0 (2, n + 1). In Collier-Tholozan-Toulisse’s work four different homogeneous PO0 (2, n + 1)-spaces play an important role: the symmetric space X = PO0 (2, n + 1)/P(O(2) × O(n + 1)) which can be identified with the set of two dimensional subspaces of R2,n+1 on which h is positive definite, the pseudo-Riemannian symmetric space H2,n = PO0 (2, n + 1)/PO0 (2, n) which corresponds to the set of negative definite lines in P(R2,n+1 ) , as well as the two maximal parabolic quotients of PO0 (2, n + 1): the photon space Pho(R2,n+1 ), namely the set of isotropic planes in Gr2 (R2,n+1 ), and the Einstein universe Ein(1, n) which coincides with the set of isotropic lines in P(R2,n+1 ); this is the Shilov boundary of the Hermitian symmetric space X . Let now ρ ∈ Max(Γg , PO0 (2, n + 1)). A ρ-equivariant map f 2,n : Seg → H2,n is a space-like embedding if the restriction of h to the tangent plane to f (x) is positive definite for every x ∈ Seg . In this case f is canonically associated, via the Gauss map, to a ρ-equivariant map f X : Seg → X , simply defined as f X (x) := [df 2,n (Tx Seg )] ∈ X . In order to prove Labourie’s conjecture for ρ (cf. Section 4), Collier-Tholozan-Toulisse observe that the Dirichlet energy can also be defined for space-like embeddings f 2,n and, using Higgs bundles, prove that the critical points for the functional, namely the maximal space-like embeddings f 2,n , correspond bijectively, via the Gauss map, to minimal harmonic maps f X . They then prove the uniqueness of maximal space-like embeddings in H2,n using techniques from pseudo-Riemannian geometry. Interestingly, for most representations ρ ∈ Max(Γg , PO0 (2, n + 1)), the group Γg cannot act properly discontinuously on the whole H2,n but it will admit a do2,n main of discontinuity ΩH . As was the case in Section 5.2 for representations ρ in Hit(Γg , PSL(3, R)), the length function `F that we associated, in Section 3, to

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

348

M.B. POZZETTI

the maximal representation ρ, can be reinterpreted, in this context, as a generalized translation distance in the pseudo-Riemannian setting. Maximal space-like embeddings always exist, and Collier-Tholozan-Toulisse observe that, by their very definition, the curvature of these embeddings is always bounded above by −1; as a consequence they obtain that for every representation ρ ∈ Max(Γg , PO0 (2, n + 1)) that doesn’t belong to the Fuchsian locus, there exists a representation η ∈ T (Sg ) which is strictly dominated by ρ in the sense that there exists a constant K > 1 such that for every γ ∈ Γg , φF (λ(ρ(γ))) > KφF (λ(η(γ))). Furthermore η can be chosen to be the hyperbolic structure whose conformal structure provides the solution to Labourie’s conjecture. This gives a very strong comparison between the length function associated to a maximal representations and the ones associated to hyperbolic structures, and allows, for example, in this cases, to give a different proof of the result of Potrie-Sambarino recalled at the end of Section 3.2, as well as of different versions of the identities from Section 3.3 and of the collar lemma from Section 3.4. Another important application of the theory of maximal, ρ-equivariant, space-like surfaces in H2,n is a precise description of the topology of the quotient of the domain of discontinuity for the ρ-action on Pho(R2,n+1 ), as well as a characterization of which geometric structures arise this way: in agreement with the conjecture of DumasSander, the quotient of the domain is a fiber bundle over the surface Sg with fiber Pho(R2,n ). In order to prove this last result, Collier-Tholozan-Toulisse use again the unique maximal space-like embedding f 2,n , and observe that to every point x in the image of f 2,n , the restriction of h to the orthogonal x⊥ has signature (2, n) and thus there is a naturally associated subspace Pho(x⊥ ) ⊂ Pho(R2,n+1 ). In order to conclude, they observe that, as the surface is space-like, for every pair of distinct points x, y the subspaces Pho(x⊥ ), Pho(y ⊥ ) are disjoint and contained in the domain of discontinuity Pho(R2,n+1 ) \ Kξ . Their result is much more precise than what we discussed here: not only they manage to explicitly describe the topology of the bundle in terms of holomorphic data associated to the representation, but they also show that any fibered photon structure arises with this construction, thus giving an interpretation of the higher rank Teichmüller spaces Max(Γg , PO0 (2, n + 1)) as parameter spaces of concrete geometric structures on explicit compact manifolds.

Acknowledgements. — I would like to thank D. Alessandrini, O. Guichard, A. Sambarino, F. Stecker and A. Wienhard for insightful conversations, and N. Bourbaki for a careful reading of the manuscript and for his wise comments that helped improving the exposition. I acknowledge funding by the Deutsche Forschungsgemeinschaft within the Priority Program SPP 2026 “Geometry at Infinity”.

ASTÉRISQUE 422

(1159)

HIGHER RANK TEICHMÜLLER THEORIES

349

REFERENCES [1] Alessandrini & Q. Li – “Projective structures with (Quasi-)Hitchin holonomy,” in preparation. [2] D. Alessandrini – “Tropicalization of group representations,” Algebr. Geom. Topol. 8 (2008), no. 1, p. 279–307. [3]

, “Higgs bundles and geometric structures on manifolds,” SIGMA Symmetry Integrability Geom. Methods Appl. 15 (2019), Paper 039, 32.

[4] D. Alessandrini & B. Collier – “The geometry of maximal components of the PSp(4, R) character variety,” Geom. Topol. 23 (2019), no. 3, p. 1251–1337. [5] D. Alessandrini, O. Guichard, E. Rogozinnikov & A. Wienhard – “Coordinates for maximal representations,” in preparation. [6] D. Alessandrini & Q. Li – “AdS 3-manifolds and Higgs bundles,” Proc. Amer. Math. Soc. 146 (2018), no. 2, p. 845–860. [7] M. Aparicio-Arroyo, S. Bradlow, B. Collier, O. García-Prada, P. Gothen & A. Oliveira – “SO(p,q)-Higgs bundles and higher Teichmüller components,” preprint arXiv:1802.08093. [8] D. Baraglia – “Cyclic Higgs bundles and the affine Toda equations,” Geom. Dedicata 174 (2015), p. 25–42. [9] D. Baraglia – “G2 geometry and integrable systems,” preprint arXiv:1002.1767. [10] Y. Benoist & D. Hulin – “Cubic differentials and hyperbolic convex sets,” J. Differential Geom. 98 (2014), no. 1, p. 1–19. [11] J. Beyrer – “Cross ratios on boundaries of symmetric spaces and Euclidean buildings,” preprint arXiv:1701.09096. [12] F. Bonahon – “The geometry of Teichmüller space via geodesic currents,” Invent. math. 92 (1988), no. 1, p. 139–162. [13] F. Bonahon & G. Dreyer – “Parameterizing Hitchin components,” Duke Math. J. 163 (2014), no. 15, p. 2935–2975. [14] S. B. Bradlow, O. García-Prada & P. B. Gothen – “Maximal surface group representations in isometry groups of classical Hermitian symmetric spaces,” Geom. Dedicata 122 (2006), p. 185–213. [15] M. Bridgeman, R. Canary, F. Labourie & A. Sambarino – “The pressure metric for Anosov representations,” Geom. Funct. Anal. 25 (2015), no. 4, p. 1089– 1179. [16] M. Bridgeman, R. Canary & F. Labourie – “Simple Length Rigidity for Hitchin Representations,” preprint arXiv:1703.07336.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

350

M.B. POZZETTI

[17] M. Bridgeman, R. Canary, F. Labourie & A. Sambarino – “Simple roots flows for Hitchin representations,” Geom. Dedic. 192 (2018), p. 57–86. [18] J. F. Brock – “Pants decompositions and the Weil-Petersson metric,” 311 (2002), p. 27–40. [19] G. W. Brumfiel – “The tree of a non-Archimedean hyperbolic plane,” in Geometry of group representations (Boulder, CO, 1987), Contemp. Math., vol. 74, Amer. Math. Soc., 1988, p. 83–106. [20] M. Burger, A. Iozzi, A. Parreau & M. B. Pozzetti – “Currents, Systoles, and Compactifications of Character Varieties,” preprint arXiv:1902.07680. [21] M. Burger, A. Iozzi, F. Labourie & A. Wienhard – “Maximal representations of surface groups: symplectic Anosov structures,” Pure Appl. Math. Q. 1 (2005), p. 543–590. [22] M. Burger, A. Iozzi & A. Wienhard – “Tight homomorphisms and Hermitian symmetric spaces,” Geom. Funct. Anal. 19 (2009), no. 3, p. 678–721. [23]

, “Surface group representations with maximal Toledo invariant,” Ann. of Math. 172 (2010), no. 1, p. 517–566.

[24]

, “Higher Teichmüller spaces: from SL(2, R) to other Lie groups,” in Handbook of Teichmüller theory. Vol. IV, IRMA Lect. Math. Theor. Phys., vol. 19, Eur. Math. Soc., 2014, p. 539–618.

[25] M. Burger & M. B. Pozzetti – “Maximal representations, non-Archimedean Siegel spaces, and buildings,” Geom. Topol. 21 (2017), no. 6, p. 3539–3599. [26] S. Choi & W. M. Goldman – “Convex real projective structures on closed surfaces are closed,” Proc. Amer. Math. Soc. 118 (1993), no. 2, p. 657–661. [27] B. Collier – “Maximal Sp(4, R) surface group representations, minimal immersions and cyclic surfaces,” Geom. Dedicata 180 (2016), p. 241–285. [28] B. Collier – “SO(n,n+1)-surface group representations and their Higgs bundles,” preprint arXiv:1710.01287. [29] B. Collier & Q. Li – “Asymptotics of Higgs bundles in the Hitchin component,” Adv. Math. 307 (2017), p. 488–558. [30] B. Collier, N. Tholozan & J. Toulisse – “The geometry of maximal representations of surface groups into SO(2,n),” preprint arXiv:1702.08799. [31] K. Corlette – “Flat G-bundles with canonical metrics,” J. Differential Geom. 28 (1988), no. 3, p. 361–382. [32] J. Danciger, F. Guéritaud & F. Kassel – “Convex cocompactness in pseudoRiemannian hyperbolic spaces,” Geom. Dedicata 192 (2018), p. 87–126.

ASTÉRISQUE 422

(1159)

HIGHER RANK TEICHMÜLLER THEORIES

351

[33] J. Danciger, F. Guéritaud & F. Kassel – “Convex cocompact actions in real projective geometry,” preprint arXiv:1704.08711. [34] S. K. Donaldson – “Twisted harmonic maps and the self-duality equations,” Proc. London Math. Soc. 55 (1987), no. 1, p. 127–131. [35] D. Dumas & A. Sanders – “Geometry of compact complex manifolds associated to generalized quasi-Fuchsian representations,” preprint arXiv:1704.01091. [36] F. Fanoni & M. B. Pozzetti – “Basmajian-type inequalities for maximal representations,” preprint arXiv:1611.00286. [37] B. Farb & D. Margalit – A primer on mapping class groups, Princeton Mathematical Series, vol. 49, Princeton Univ. Press, 2012. [38] V. Fock & A. Goncharov – “Moduli spaces of local systems and higher Teichmüller theory,” Publ. Math. Inst. Hautes Études Sci. (2006), no. 103, p. 1–211. [39] O. García-Prada – “Higgs bundles and higher Teichmüller spaces,” preprint arXiv:1901.09086. [40] W. M. Goldman – “Discontinuous groups and the euler class,” Ph.D. Thesis, University of California, Berkeley, 1980. [41]

, “The symplectic nature of fundamental groups of surfaces,” Adv. in Math. 54 (1984), no. 2, p. 200–225.

[42] O. Guichard – “Composantes de Hitchin et représentations hyperconvexes de groupes de surface,” J. Differential Geom. 80 (2008), no. 3, p. 391–431. [43]

, “Groupes convexes-cocompacts en rang supérieur,” Séminaire Bourbaki, vol. 2017–2018, exp. no 1138, Astérisque 414 (2019), p. 95–124.

[44] O. Guichard & A. Wienhard – “Convex foliated projective structures and the Hitchin component for PSL4 (R),” Duke Math. J. 144 (2008), no. 3, p. 381–445. [45]

, “Topological invariants of Anosov representations,” J. Topol. 3 (2010), no. 3, p. 578–642.

[46]

, “Anosov representations: domains of discontinuity and applications,” Invent. math. 190 (2012), no. 2, p. 357–438.

[47]

, “Positivity and higher Teichmüller theory,” in European Congress of Mathematics, Eur. Math. Soc., 2018, p. 289–310.

[48] U. Hamenstädt – “Cocycles, Hausdorff measures and cross ratios,” Ergodic Theory Dynam. Systems 17 (1997), no. 5, p. 1061–1081. [49] T. Hartnick & T. Strubel – “Cross ratios, translation lengths and maximal representations,” Geom. Dedicata 161 (2012), p. 285–322. [50] N. J. Hitchin – “The self-duality equations on a Riemann surface,” Proc. London Math. Soc. 55 (1987), no. 1, p. 59–126.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

352

M.B. POZZETTI

, “Lie groups and Teichmüller space,” Topology 31 (1992), no. 3, p. 449–

[51] 473.

[52] Y. Huang & Z. Sun – “McShane identities for Higher Teichmüller theory and the Goncharov-Shen potential,” preprint arXiv:1901.02032. [53] M. Kapovich, B. Leeb & J. Porti – “Dynamics on flag manifolds: domains of proper discontinuity and cocompactness,” Geom. Topol. 22 (2018), no. 1, p. 157– 234. [54] F. Kassel – “Geometric structures and representations of discrete groups,” preprint arXiv:1802.07221. [55] L. Katzarkov, A. Noll, P. Pandit & C. Simpson – “Harmonic maps to buildings and singular perturbation theory,” Comm. Math. Phys. 336 (2015), no. 2, p. 853–903. [56]

, “Constructing buildings and harmonic maps,” in Algebra, geometry, and physics in the 21st century, Progr. Math., vol. 324, Birkhäuser, 2017, p. 203–260.

[57] L. Keen – “Collars on Riemann surfaces,” in Discontinuous groups and Riemann surfaces (Proc. Conf., Univ. Maryland, College Park, Md., 1973), Ann. of Math. Studies, vol. 79, Princeton Univ. Press, N.J., 1974, p. 263–268. [58] B. Kostant – “The principal three-dimensional subgroup and the Betti numbers of a complex simple Lie group,” Amer. J. Math. 81 (1959), p. 973–1032. [59] G. Kydonakis – “Model Higgs bundles in exceptional components of the Sp(4, R)-character variety,” preprint arXiv:1805.10497. [60] F. Labourie – “RP2 -structures et differentielles cubiques holomorphes,” in Proceedings of the GARC Conference in Differential Geometry, Seoul National University, 1997. [61] F. Labourie – “Cross ratios, surface groups, PSL(n, R) and diffeomorphisms of the circle,” Publ. Math. Inst. Hautes Études Sci. (2007), no. 106, p. 139–213. [62]

, “Flat projective structures on surfaces and cubic holomorphic differentials,” Pure Appl. Math. Q. 3 (2007), p. 1057–1099.

[63]

, “Cross ratios, Anosov representations and the energy functional on Teichmüller space,” Ann. Sci. Éc. Norm. Supér. 41 (2008), no. 3, p. 437–469.

[64]

, “Cyclic surfaces and Hitchin components in rank 2,” Ann. of Math. 185 (2017), no. 1, p. 1–58.

[65] F. Labourie & R. Wentworth – “Variations along the Fuchsian locus,” Ann. Sci. Éc. Norm. Supér. 51 (2018), no. 2, p. 487–547. [66] F. Labourie – “Anosov flows, surface groups and curves in projective space,” Invent. math. 165 (2006), no. 1, p. 51–114.

ASTÉRISQUE 422

(1159)

HIGHER RANK TEICHMÜLLER THEORIES

353

[67] F. Labourie & G. McShane – “Cross ratios and identities for higher Teichmüller-Thurston theory,” Duke Math. J. 149 (2009), no. 2, p. 279–345. [68] I. Le – “Higher laminations and affine buildings,” Geom. Topol. 20 (2016), no. 3, p. 1673–1735. [69] F. Ledrappier – “Structure au bord des variétés à courbure négative,” Sémin. Théor. Spectr. Géom., vol. 13, Univ. Grenoble I, 1995, p. 97–122. [70] G.-S. Lee & T. Zhang – “Collar lemma for Hitchin representations,” Geom. Topol. 21 (2017), no. 4, p. 2243–2280. [71] J. C. Loftin – “Affine spheres and convex RPn -manifolds,” Amer. J. Math. 123 (2001), no. 2, p. 255–274. [72] D. D. Long, A. W. Reid & M. Thistlethwaite – “Zariski dense surface subgroups in SL(3, Z),” Geom. Topol. 15 (2011), no. 1, p. 1–9. [73] G. Lusztig – “Total positivity in reductive groups,” in Lie theory and geometry, Progr. Math., vol. 123, Birkhäuser, 1994, p. 531–568. [74] G. Martone – “Positive configurations of flags in a building and limits of positive representations,” Math. Z. 293 (2019), nos. 3-4, p. 1337–1368. [75] G. Martone & T. Zhang – “Positively ratioed representations,” Comment. Math. Helv. 94 (2019), no. 2, p. 273–345. [76] X. Nie – “Entropy degeneration of convex projective surfaces,” Conform. Geom. Dyn. 19 (2015), p. 318–322. [77] A. Parreau – “Compactification d’espaces de représentations de groupes de type fini,” Math. Z. 272 (2012), nos. 1-2, p. 51–86. [78] R. Potrie & A. Sambarino – “Eigenvalues and entropy of a Hitchin representation,” Invent. math. 209 (2017), no. 3, p. 885–925. [79] B. Pozzetti, A. Sambarino & A. Wienhard – “Conformality for a robust class of non-conformal attractors,” preprint arXiv:1902.01303. [80] J. Sacks & K. Uhlenbeck – “Minimal immersions of closed Riemann surfaces,” Trans. Amer. Math. Soc. 271 (1982), no. 2, p. 639–652. [81] A. Sambarino – “Quantitative properties of convex representations,” Comment. Math. Helv. 89 (2014), no. 2, p. 443–488. [82] C. T. Simpson – “Constructing variations of Hodge structure using Yang-Mills theory and applications to uniformization,” J. Amer. Math. Soc. 1 (1988), no. 4, p. 867–918. [83]

, “Higgs bundles and local systems,” Inst. Hautes Études Sci. Publ. Math. (1992), no. 75, p. 5–95.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

354

M.B. POZZETTI

[84] F. Stecker – “Balanced ideals and domains of discontinuity of Anosov representations,” preprint arXiv:1810.11496. [85] F. Stecker & N. Treib – “Domains of discontinuity in oriented flag manifolds,” preprint arXiv:1806.04459. [86] T. Strubel – “Fenchel-Nielsen coordinates for maximal representations,” Geom. Dedicata 176 (2015), p. 45–86. [87] Z. Sun, A. Wienhard & T. Zhang – “Flows on the PSL(V)-Hitchin component,” preprint arXiv:1709.03580. [88] Z. Sun & T. Zhang – “The Goldman symplectic form on the PSL(V)-Hitchin component,” preprint arXiv:1709.03589. [89] N. Tholozan – “Volume entropy of Hilbert metrics and length spectrum of Hitchin representations into PSL(3, R),” Duke Math. J. 166 (2017), no. 7, p. 1377– 1403. [90] D. Toledo – “Representations of surface groups in complex hyperbolic space,” J. Differential Geom. 29 (1989), no. 1, p. 125–133. [91] N. G. Vlamis & A. Yarmola – “Basmajian’s identity in higher teichmüller– thurston theory,” Journal of Topology 10 (2017), no. 3, p. 744–764. [92] A. Wienhard – “An invitation to higher teichmüller theory,” preprint arXiv:1803.06870. [93] A. Wienhard & T. Zhang – “Deforming convex real projective structures,” Geom. Dedicata 192 (2018), p. 327–360. [94] T. Zhang – “Degeneration of Hitchin representations along internal sequences,” Geom. Funct. Anal. 25 (2015), no. 5, p. 1588–1645. [95] A. Zimmer – “Projective Anosov representations, convex cocompact actions, and rigidity,” preprint arXiv:1704.08582.

Maria Beatrice POZZETTI Ruprecht-Karls Universität Heidelberg Mathematisches Institut Im Neuenheimer Feld 205 69120 Heidelberg, Germany E-mail : [email protected]

ASTÉRISQUE 422

Séminaire BOURBAKI 71e année, 2018–2019, no 1160, p. 355 à 389 doi:10.24033/ast.1139

Mars 2019

HOMFLY POLYNOMIALS FROM THE HILBERT SCHEMES OF A PLANAR CURVE [after D. Maulik, A. Oblomkov, V. Shende, ...] by Luca MIGLIORINI

INTRODUCTION Among the most interesting invariants one can associate with an oriented link ⊂ S 3 is its homfly-pt polynomial P(L , v, s) ∈ Z[v ±1 , (s−s−1 )±1 ] ([12, 35]). In 2010 A. Oblomkov and V. Shende ([30]) conjectured that this polynomial can be expressed in algebraic geometric terms when L is an algebraic link, that is, it is obtained as the intersection of a plane curve singularity (C, p) ⊂ C2 with a small sphere centered at p. [n] More precisely, let Cp be the punctual Hilbert scheme of C at p, parameterizing the [n] length n subschemes of C supported at p. If m : Cp → Z is the function associating [n] with the subscheme Z ∈ Cp the minimal number m(I) of generators of its defining ideal I in the local ring OC,p , they conjecture that the generating function Z X Z(C, v, s) = s2n (1 − v 2 )m(I) dχtop L

[n]

n≥0

Cp

µ(f )−1 coincides with P(L , v, s), up to the monomial term vs , where µ(f ) is the Milnor number. In the formula the integral is done with respect to the Euler characteristic measure dχtop . Shortly afterwards, this surprising identity was generalized in two different directions: 1. In [29], Oblomkov, Rasmussen and Shende propose a “homological version”: while the equality of Oblomkov and Shende is at the level of Euler characteristics, they conjecture a relation between the homfly homology of Khovanov and Rozansky and the virtual Poincaré polynomial of the Hilbert schemes of (C, p). This conjecture, still open, will be shortly discussed in Section 7. 2. In [7], E. Diaconescu, Z. Hua and Y. Soibelman conjectured an equality in case − the data of C and L are “colored” by choosing an array → µ of partitions, one for

© Astérisque 422, SMF 2020

356

L. MIGLIORINI

every branch of the curve, or equivalently for every component of the link. This choice allows one to define two enhancements of the original objects: − — On the algebraic geometric side a thickening C→ µ of C, using the correspondence between partitions and monomial ideals in the plane (see Definition 5.8). − — On the link side a “satellite link” L→ µ = L ∗ (Qµ1 , . . . , QµN ), by associating special braids with the partitions, closing them to links Qµ and finally wrapping them around L (see Eq. (61)).

In this setting, the Hilbert schemes are replaced by the moduli spaces − P (Y, C, µ, r, n) of stable pairs framed on C→ µ , whereas P(L , v, s) is replaced by → − the colored homfly-pt polynomial W (L , µ ; v, s). Diaconescu, Hua and Soibelman conjectured that a generating function arising from the topological Euler − characteristic of the spaces P (Y, C, µ, r, n) should coincide with W (L , t → µ ; v, s), − t→ where µ is the vector of transposed partitions, see Theorem 5.41 for the precise statement. It is shown in [29] that choosing all partitions to be trivial yields the conjecture of Oblomkov and Shende as a special case. The conjecture of Diaconescu, Hua and Soibelman was proved by D. Maulik in 2012 in the striking paper [23]. The proof proceeds by showing that the two sides of the identity have the same behavior when the singular point is blown up, thus reducing to the case when the singularity is a single node, where a direct verification is possible. It is worth noticing that, even starting in the original uncolored setting of Oblomkov and Shende, the blow-up procedure leads to colored links and curves. Therefore, even though the set-up in the colored version is much more technical than the one required to explain the original conjecture, we need to discuss this level of generality, besides its intrinsic interest and beauty. As the details of the proof of Theorem 5.41 are quite involved, but well presented in the original paper [23], this seminar will only give a sketch of the main ideas used in the proof, and focus instead on presenting the definitions and foundations needed, along with some examples, so as to provide the necessary background for the reading of [23].

1. ALGEBRAIC LINKS We summarize a few classical facts on singular points of a plane curve and their links (see [27] for a historical account and references to the original papers). Let (C, p) be a germ of a reduced plane curve singularity, defined as the zero set of a local equation f = 0, where f ∈ C[X, Y ], with f (0, 0) = 0. We denote by m the maximal ideal of functions vanishing at the point p = (0, 0). We denote also by f and m their

ASTÉRISQUE 422

(1160)

HOMFLY POLYNOMIALS FROM THE HILBERT SCHEMES

357

images in C[[X, Y ]]. The point p is singular if ∂x f, ∂y f ∈ m. Under these hypotheses, the ideal (∂x f, ∂y f ) is m-primary, and the quotient algebra C[[X, Y ]]/(∂x f, ∂y f ) is a finite-dimensional vector space, whose dimension µ(f ) is the Milnor number of the P singular point. If f = k∈N fk , with fk homogeneous of degree k, let fd be the first nonzero homogeneous component. Then d =: multp (C) is called the multiplicity of C at p, and the scheme defined by fd (X, Y ) = 0 is the tangent cone. It is a union of ›2 (C) → A2 (C) be the blow up at p. The lines, possibly with multiplicities. Let Blp : A ‹ of C with the exceptional divisor points in the intersection of the proper transform C correspond to the lines in the tangent cone. By the theorem on embedded resolution of singularities, [40, Theorem 3.4.4], there exists a sequence of blow-ups so that the (reduced) total transform of C is a normal crossing curve. Q Let f = i fi , with fi ∈ m, be the factorization in irreducibles of f in C[[X, Y ]]: since C is reduced, no multiple factors appear. The curves Ci defined by the equations fi = 0 are called the branches of the germ (C, p). Let S3 ⊂ A2 (C) be a sphere of radius  centered at p. For small enough  the sphere and C intersect transversally, therefore L := S3 ∩ C is a nonsingular oriented one-dimensional submanifold of S3 ' S 3 , whose isotopy class is independent of , the link of the singularity. If f is irreducible in C[[X, Y ]], then its link is connected, so actually a knot. More generally, the connected components of L correspond to the branches of (C, p). Example 1.1. — Let f = y r − xs , with r ≤ s. If r < s, the tangent cone is the line y = 0 with multiplicity r, while if r = s it consists of the r distinct lines y − ξ i x = 0, with ξ a primitive r-th root of unity. If r and s are coprime there is a unique branch, whose link is the toral (r, s) knot Lr,s ⊂ S 1 × S 1 , parameterized by √ √ x = exp( −1rt), y = exp( −1st) with t ∈ [0, 2π]. Otherwise, let r = da, s = db, with a and b coprime, where d is the greatest common divisor of r and s. Letting ξ be a primitive d-th root of unity, the factorization (1)

y r − xs = (y a )d − (xb )d =

d−1 Y

(y a − ξ ` xb )

`=0

shows that Lr,s has d connected components, each isomorphic to the (a, b) toral knot. Notice that for r = s = 2 we obtain the Hopf link. As every link (Alexander’s Theorem), Lr,s can be obtained as the closure of a braid: it is isomorphic to the closure of (βr )s , where βr is the braid with r strands in which the first strand passes under all the other ones (if the strands are oriented from top to bottom, see Section 3.1 for the sign convention), that is, the product of the standard generators σi of the braid group Br .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

358

L. MIGLIORINI

Definition 1.2. — Given two germs of curves C (resp D) through p, of equations f = 0 (resp g = 0), with no common factor, their intersection number at p is (2)

C • D = dim C[[X, Y ]]/(f, g).

The corresponding notion on the link side is that of linking number ([18, Chapter I]): Definition 1.3. — Given two disjoint oriented knots K1 , K2 ⊂ S 3 , let U1 be a tubular neighborhood, homeomorphic to S 1 × D2 , of K1 , disjoint from K2 . The homology group H1 (S 3 \ U1 ) is canonically isomorphic to Z, and generated by a meridian of U1 , i.e., a circle bounding a disk in U1 and meeting K1 positively in only one point. Then the linking number of K1 and K2 is defined as the homology class L(K1 , K2 ) ∈ Z of K2 ⊂ S 3 \ U1 . It is easy to see that L(K1 , K2 ) = L(K2 , K1 ) (see [18, Chapter I]). The relation between the two notions just defined is: Proposition 1.4. — If K1 is the link of C and K2 is the link of D, then L(K1 , K2 ) = C • D. In particular the linking numbers of components of algebraic knots are strictly positive. The links arising from curve singularities via this construction are called algebraic links, and, among their several distinctive features, probably the most important is the description of their single components as iterated torus knots (also called cable knots), which is the topological counterpart of the Newton–Puiseux theorem: assume that f is irreducible in C[[x, y]] and f (x, y) 6= x. Up to a change of coordinates we can assume that it is a monic polynomial in y with coefficients in C[[X]]. Then one can “solve in y as a function of x” and the Newton–Puiseux theorem states that y can be expressed as a power series in fractional powers of x. It will be useful to write this series as (3)

q0

q1

q2

y(x) = x p0 (a0 + x p0 p1 (a1 + x p0 p1 p2 (a2 + · · · )))

where ai 6= 0, each Newton pair (pi , qi ) consists of relatively prime positive integers, and, eventually, pk = 1. This leads to an inductive description of the knot as an q0 iterated toral knot: We consider y(x) = x p0 as the first approximation (a toral knot K0 q0 q1 of type (p0 , q0 )). Then y(x) = x p0 (a0 + a1 x p0 p1 ) gives the second approximation, describing a toral knot K1 wrapped around K0 and so on. In order to state this iterative description precisely, one needs at each step to have a framing of the knot: this notion will be discussed in a more general framework later (Section 5.2.1) and for the time being we shall limit ourselves to a “carousel” description of a specific example.

ASTÉRISQUE 422

(1160)

359

HOMFLY POLYNOMIALS FROM THE HILBERT SCHEMES

Example 1.5 ([9]). — Let f (x, y) = y 4 − 2x3 y 2 − 4x5 y + x6 − x7 . There is a unique branch which admits the parameterization (4)

3

7

x = t4 , y = t6 + t7 , or equivalently the Puiseux series y = x 2 + x 4 .

Up to a rescaling, the link L is described by √ √ √ x = exp(4 −1t), y = exp(6 −1t) + ρ exp(7 −1t), with ρ  1. Since ρ is small, L is contained in a tubular neighborhood of the “leading √ √ knot” L of equations x = exp(4 −1t), y = exp(6 −1t) (a (2, 3) knot) of which L is a satellite: for any point of L there are two points orbiting around. In a proper parametrization of the tubular neighborhood they can be seen describing a torus knot of type (2, 13) (with respect to the natural framing, see Example 5.15). In general the Puiseux parameterization may contain infinitely many terms, but only a finite number of them will be relevant for the topology of the knot, which will be then described as an iteration of the construction of Example 1.5, in which the types of the toric knots can be determined by the series of the Puiseux exponents [40, 9]. Remark 1.6. — Another important distinctive property of algebraic links is that their topology is uniquely determined by the topology of their components and their pairwise linking numbers ([27, Theorem 1.1]).

2. PUNCTUAL HILBERT SCHEMES AND NESTED HILBERT SCHEMES Given a plane curve C ⊂ A2 (C) and a point p ∈ C, its punctual Hilbert scheme [n] of length n, denoted Cp , parameterizes 0-dimensional subschemes Z ⊂ C, such that dim Γ(Z, OZ ) = n and Zred = p. Let OC,p be the local ring of C at p and denote [n] by mp its maximal ideal. The points Z ∈ Cp will be identified with their defining √ ideals I ⊂ OC,p . The condition that Zred = p translates into I = mp , and there is a [n] natural constructible function m : Cp → Z>0 , defined as (5)

m(I) = minimal number of generators of I = dimC I/mp I,

the last equality stemming from Nakayama’s lemma. A variant of this construction, which is relevant for our purposes, is the nested Hilbert scheme: given `, n ∈ N,  (6) Cp[`,`+n] = mp J ⊂ I ⊂ J, I ∈ Cp[`+n] , J ∈ Cp[`] ⊂ Cp[`+n] × Cp[`] .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

360

L. MIGLIORINI

[`,`+n]

[`]

Remark 2.1. — The projection Cp → Cp , sending (I, J) to J is, when restricted to a level set of m, a fibration, with fiber the Grassmannian Gr(n, m(I)). In fact, by Nakayama’s lemma we have dim J/mp J = m(J), and, given J, every n-codimensional subspace W ⊂ J/mp J defines the colength ` + n ideal W + mp J ⊂ OC,p .

3. KNOTS AND LINKS AND THE HOMFLY-PT POLYNOMIAL 3.1. Diagrams of links An oriented link is represented by a planar diagram, a collection of oriented closed curves, which we will assume differentiable, with at most simple crossings and the indication of which arc lies over the other. In other words, a neighborhood of a crossing is oriented diffeomorphic to one of the following: (7)

L+

:

L−



=1



:

 = −1





As indicated in (7), we associate a sign  with a crossing. We will often use, without explicit mention, two basic theorems on knots: — The theorem of Reidemeister, stating that two different diagrams represent the same link if and only if they are related by a sequence of the three Reidemeister moves and an oriented diffeomorphism of the plane (see [18, Chapter I]).

I

II

−→

III

−→

−−→

The three Reidemeister moves — The theorem of Alexander, stating that every link can be realized as the closure of an appropriate braid (see [13, §2.3]). 3.2. The - polynomial The homfly-pt polynomial of an oriented link L is defined as the unique element in P(L , v, s) ∈ Z[v ±1 , (s − s−1 )± ] normalized by (8)

ASTÉRISQUE 422

P(unknot, v, s) =

v − v −1 , s − s−1

(1160)

HOMFLY POLYNOMIALS FROM THE HILBERT SCHEMES

361

and satisfying the following skein relation (for which we follow the convention of [23]): Assume the diagrams of three links L+ , L− , L0 coincide except in the neighborhood of a point, where they look like: (9)

b
µ(`+1) = 0, there is a corresponding monomial m-primary ideal of C[X, Y ] (see [25, §7.2]), namely the one generated by the monomials (31)

(j)

X j−1 Y µ , for j = 1, . . . , ` + 1.

We denote by Zµ ⊂ A2 (C) the corresponding subscheme. Recall that C is embedded in Y, the total space of OP1 (−1) ⊕ OP1 (−1), as a complete intersection with equations − f (ξ1 , ξ2 ) = 0 and z = 0. We will thicken C to a one-dimensional scheme C→ µ , whose

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

370

L. MIGLIORINI

intersection with a two-dimensional slice through a smooth point of Ci is the monomial scheme Zµi . − Definition 5.8. — Let → µ := (µ1 , . . . , µN ) denote the partitions attached to the com(1) (` ) ponents, where µi = (µi , . . . , µi i ) is the partition associated with the component Ci = {fi = 0}. Let Ci,µi be the subscheme defined by the ideal generated by (32)

(j)

z j−1 fi (ξ1 , ξ2 )µi , for j = 1, . . . , `i + 1,

where z is the local coordinate on P1 vanishing at 0 introduced above. The (nonre− duced) one-dimensional subscheme C→ µ ⊂ Y is defined as the schematic closure of N [

Ci,µi ∩ (Y \ zero section) .

1

SN Since 1 Ci,µi ∩ (Y \ zero section) is Cohen–Macaulay, and the schematic closure − does not create new associated points, it follows that C→ µ is Cohen–Macaulay. Notice − that on the generic (nonsingular) point of the branch Ci , the scheme C→ µ is analytically isomorphic to the product of Zµi with the germ of a nonsingular curve. − Remark 5.9. — When all the partitions are (1) we write → µ = (1). In this case C(1) = C. − We now consider C→ µ -framed stable pairs (F , σ), as in Section 5.1.1, asking the restriction of σ to Y \ E to coincide with the canonical surjection OY −→ OC→ . As − µ − discussed in Section 5.1.1, there are projective moduli spaces P (Y, E, C→ , Z) . In β,χ µ this case the class β is the generic multiplicity r along E of the support of F (see Remark 5.7). We denote

(33)

P (Y, C,

→ − − µ , r, n) := P (Y, E, C→ µ , Z)r[E],n

and we define the generating function of the Euler characteristics of the moduli spaces of pairs P → − n r r,n q Q χtop (P (Y, C, µ , r, n)) → − 0 Q (34) Z (Y, C, µ ; q, Q) = ∈ C[[q, Q]]. k k k (1 + q Q) − Notice that, when → µ = (1), we recover the C-framed stable pairs, and that setting Q = 0 amounts to consider only the moduli spaces of pairs (F , σ) with − Supp(F ) = C→ µ. − Remark 5.10. — Even in the uncolored case, the identity relating Z 0 (Y, C, → µ ; q, Q) to its analogue for the total transform of C by a blow-up, which lies at the heart of Maulik’s proof (see Theorem 6.6 and Proposition 6.4 in Section 6.1), requires arbitrary partition labels on the total transform of C.

ASTÉRISQUE 422

(1160)

HOMFLY POLYNOMIALS FROM THE HILBERT SCHEMES

371

Remark 5.11. — In [7, Thm.1.1], Diaconescu, Hua and Soibelman prove that, in the R P set-up of Section 5.1.2, Z 0 (Y, C, (1); s2 , −v 2 ) and `≥0 s2` C [`] (1 − v 2 )m(I) dχtop (I) p coincide after multiplying by a power of s, depending on the normalization chosen here for the invariant χ of (F , σ). 5.2. Colored - polynomials The link invariants we are going to discuss first arose in connection with the quantum groups Uq (sl(N )) in the seminal works [36, 37]. We will avoid this approach, though, and, following [23], adopt a more down to earth point of view, ultimately relying on the classical construction of a satellite knot (see [18]). In order to have a well-posed definition one needs to consider framed knots, which we now discuss. Good references for this section are the introductory parts of [1, 19]. 5.2.1. Framing. — Recall that we associated a sign with every crossing in the diagram ∆L of a link L (see (7)). Definition 5.12. — The writhe w(∆L ) is the sum, over all crossings, of their signs. Remark 5.13. — 1. The second and third Reidemeister moves preserve the writhe, whereas the first changes it: adding a positive curl increases the writhe by one. 2. If the link is represented by a diagram in the plane, the linking number L(K1 , K2 ) can be computed as the sum X (35) L(K1 , K2 ) = i , K

i∈ K1

2

K1 K2

where is the set of crossings in which K1 passes over K2 , and i = ±1 is the sign of the crossing. S Definition 5.14. — Given a link L = Li , a framing is the choice of a normal, never vanishing, vector field on each component. A framing defines a parallel curve, obtained by a little movement along the vector field. Intuitively, the choice of a framing replaces every component of the link with a “ribbon” (homeomorphic with an annulus, since the boundary consists of two connected components). The self-linking number of a framed knot is defined to be the linking number of the link with its parallel. This number fixes the framing up to isotopy. Example 5.15. — 1. If a link lies on a two-dimensional torus, as in Example 1.1, a natural framing is given by choosing at each point x ∈ L a normal vector completing the tangent vector in x to a positively oriented basis.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

372

L. MIGLIORINI

2. The unlinked, or natural, framing is given by choosing for each component Li of the link the unique, up to isotopy, nearby knot which has zero linking number with Li . 3. The choice of a diagram representing the link selects the blackboard framing, in which each curve of the link diagram is thought of as a “ribbon” lying on the plane containing the diagram. In this case the self-linking number equals its writhe (Definition 5.12). 4. Since the blackboard framing is not invariant under the first Reidemeister move, every framing can be realized as a blackboard framing of a diagram just adding a few curls. Remark 5.16. — The framing of a toral knot (Example 1.1) inherited by its embedding in the torus differs from the blackboard one associated with the presentation as the closure of the braid (βr )s defined in Example 1.1. In order to fix this discrepancy it is enough to add a positive curl to the diagram of βr . One may get an intuition of this fact imagining a braid that is wrapping around the outside of the torus and smashing it onto the plane, thus obtaining the curl. We denote by βr,# the diagram thus obtained.

β3,# 5.2.2. Skein theory. — In this section we collect some facts of skein theory, an efficient way to organize the colored homfly-pt polynomials of a link. In particular, the skein algebra of a rectangle, with n inputs and n outputs, and that of an annulus, play a major role. They turn out to be isomorphic respectively to the Hecke algebra of type An and to a commutative algebra, see Theorem 5.26. Let F be a surface, possibly with boundary and with two sets of marked points P, Q on the boundary. For our purpose F will be one of the following surfaces 1. F = R2 , the euclidean plane, with P = Q = ∅, 2. the annulus A = {(x, y) ∈ R2 such that1 < x2 + y 2 < 4} with P = Q = ∅, 3. the square Sn = [0, 1] × [0, 1] with n marked points Q = {q1 , . . . , qn } on the top side and n marked points P = {p1 , . . . , pn } on the bottom side.

ASTÉRISQUE 422

(1160)

HOMFLY POLYNOMIALS FROM THE HILBERT SCHEMES

373

It will be useful to think of the square Sn as embedded in the annulus A as an angular sector 1 ≤ ρ ≤ 2, θ ∈ [0, π/2]. Definition 5.17. — A diagram ∆ in F is a series of oriented closed curves and oriented arcs joining the points in P to those in Q, with the condition that every point of P is the starting point of a unique arc and every point of Q is the end point of a unique arc. As in the diagram of a generic planar projection of a link, these arcs and curves are allowed to have only simple crossings. We identify diagrams obtained by an ambient isotopy (fixing the boundary) or obtained one from the other by a sequence of Reidemeister moves II and III. Remark 5.18. — Notice that an element of the braid group Bn defines a diagram in the square Sn . Remark 5.19. — Given a diagram ∆ in Sn , thought of as a subset of A, this can “ in A by joining, for every i = 1, . . . n, the point qi to the be closed to a diagram ∆ point pi with the circular arc θ ∈ [π/2, 2π]. For diagrams given by braids this is just the standard operation of closure of a braid. Remark 5.20. — The embedding of A into R2 sends diagrams in A to diagrams in R2 . Let Λ be the ring Λ = Z[v ±1 , s±1 , (sr − s−r )−1 ] for all r ≥ 1.

(36)

Definition 5.21. — The framed homfly skein of F , denoted S [F ], is the Λ-module generated by diagrams in F (up to isotopy and II and III Reidemeister moves), modulo the skein relations: 1. If L+ , L− , L0 are as in the diagram (9), then (37)

L+

− L− = (s − s−1 )L0 .



unknot =

Å

ã v −1 − v ∆, s−1 − s

|=

(38)

|=

2. If ∆ is a diagram in F , then

where is meant to denote that ∆ and the unknot are unlinked. In particular, if F = R2 or F = A, we have (39)

v −1 − v v −1 − v [∅] = ∈ Λ, s−1 − s s−1 − s by setting the empty diagram to equal 1. unknot =

3. Deleting a curl with positive crossing amounts to multiplying by v −1 , deleting a curl with negative crossing amounts to multiplying by v:

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

374

L. MIGLIORINI

= v −1

,

=v .

In this framework diagrams should be thought of as endowed with the “blackboard framing”. Remark 5.22. — Given the local nature of the relations in Definition 5.21, the em“ discussed in beddings Sn ,→ A and A ,→ R2 , and the closure operation ∆ → ∆, Remarks 5.19 and 5.20, define Λ-module morphisms (40)

S [Sn ]

−→ S [A] −→ S [R2 ]. b

Stacking a square on top of the other (and rescaling) defines an associative product on S [Sn ]. Similarly, the operation of putting an annulus inside another defines an associative product on S [A], which is commutative, as one can “slide” the diagram contained in the inner annulus under the other one by using the Reidemeister moves II and III, thus exchanging the two diagrams. To identify the algebra S [Sn ], we recall the following definition: Definition 5.23. — The Hecke algebra Hn (of type An ) is the associative Z[s, s−1 ]-algebra (with unit), defined by a set of generators S = {S1 , . . . , Sn−1 }, subject to the relations: (41) (42) (43)

Si Sj = Sj Si if |i − j| ≥ 2, Si Si+1 Si = Si+1 Si Si+1 , (Si − s)(Si + s−1 ) = Si2 − (s − s−1 )Si − 1 = 0.

Remark 5.24. — The specialization s = 1 gives the group algebra of the symmetric group, with Si corresponding to the transposition (i, i + 1). Hence, the Hecke algebra can be considered a one-parameter deformation of this group algebra. Remark 5.25. — The standard set of generators S = {σ1 , . . . , σn−1 } of the braid group on n strands Bn verifies Eqs. (41) and (42), hence Hn is the quotient of the group algebra of Bn obtained imposing the relation Eq. (43). In particular, a braid defines an element of Hn . It is easily seen that Eq. (43) is just a rewriting of Eq. (37). We will often extend the coefficients of Hn to Λ. The resulting algebra will still be denoted Hn .

ASTÉRISQUE 422

(1160)

HOMFLY POLYNOMIALS FROM THE HILBERT SCHEMES

375

Theorem 5.26. — 1. The skein algebra S [Sn ] is isomorphic to the Hecke algebra Hn with coefficients in Λ. This isomorphism sends a braid γ ∈ Bn , thought of as a diagram in Sn , to its class in Hn (see Remark 5.25). 2. Set Cn := S’ [Sn ] ⊂ S [A], where, as in Remark 5.22, b denotes the closure map. There is a graded isomorphism (44)

τ : C → S•Λ S between the graded subalgebra C ⊂ S [A] generated by n Cn , and the graded algebra S•Λ of symmetric functions in infinitely many variables with coefficients in Λ. It is proved in [39] that C is freely generated as a polynomial algebra by ¤ the elements Am := σ m−1 · · · σ1 , placed in degree m, where, as above, the σi ’s are the standard generators of Bm .

3. In R2 every diagram can be represented uniquely as a multiple of the empty diagram. In other words, there is a canonical isomorphism: (45)

h i : S [R2 ] −→ Λ, the framed homfly-pt polynomial, differing from the homfly-pt polynomial by the multiplicative term v −w(∆L ) , accounting for the framing.

Remark 5.27. — A particularly significant basis of S [Sn ] (as a Λ-module) is given by positive permutation braids. Given a permutation π = (π(1), . . . , π(n)) we consider the unique braid ωπ associated with π (i.e., the i-th point at the bottom joins the π(j)-th point at the top) in which each pair of strands cross at most once with positive sign (a useful way to visualize these braids is to imagine them disposed in layers, with the first strand at the very back and the last at the front. Notice that the standard generator σi of Bn are the positive permutation braids of the transpositions (i, i + 1). 5.2.3. The idempotents of Gyoja. — By Maschke’s Theorem, the complex group algebra C[G] of a finite group decomposes into a direct product of matrix algebras indexed by the irreducible representations: For each such irreducible one can choose a primitive idempotent, giving the projection on a copy of the irreducible representation inside C[G]. Let G = Sn be the symmetric group: the irreducible representations are indexed by the set of partitions of n, which we will identify with their associated Young diagrams, and explicit formulas for these idempotents, depending on the choice of a standard tableau of shape λ, are given by the Young symmetrizers {eλ }λ`n (see [10, §4.1]). It is known that if s is not a root of unity, then the Hecke algebra specialized at s is semisimple and isomorphic to the group algebra of Sn . In [11] Gyoja defines primitive idempotents, which we will still denote eλ ∈ Hn , specializing to the Young symmetrizers when s → 1. These idempotents are studied as elements of the skein

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

376

L. MIGLIORINI

S [Sn ]

in [1], which also provides a vivid three-dimensional description of them as linear combination of positive permutation braids. The following two propositions, characterizing the two maps S [Sn ] −→ S [A] and S [A] −→ S [R2 ], are important from the computational point of view (see [22, §I.3] for the definition of the Schur functions): Proposition 5.28 ([1, 20]). — Let λ ` n be a partition of n, and eλ ∈ Hn be the corresponding Gyoja idempotent. The composition (46)

Hn

'

τ

−→ S [Sn ] −→ S [A] −→ S•Λ b

sends eλ to the Schur function sλ . Let Qλ = e“λ ∈ S [A] be the closure of the Gyoja idempotent eλ ∈ Hn ' S [Sn ]. By Proposition 5.28, Qλ corresponds to sλ under the isomorphism C ' S•Λ , but we prefer to keep a separate notation for the two objects. The family {Qλ }λ`n is a basis for Cn . h i

The next proposition describes the composition C −→ S [R2 ] −→ Λ in terms of the elements of the basis Qλ by giving their framed homfly-pt polynomials: Proposition 5.29 ([21]). — Let λ ` n be a partition, and, for any box  in its Young diagram, let c() and h() denote its content (2) and its hook-length (3) respectively. Then: (47)

hQλ i =

Y v −1 sc() − vs−c() . sh() − s−h()

∈λ

Remark 5.30. — It follows from Eq. (47) that, setting hQλ ilow :=

Y ∈λ

sc() , sh() − s−h()

we have (48)

 hQλ i = v −|λ| hQλ ilow + vO(v) ,

where O(v) denotes a function with no poles at v = 0. More generally, we can give the following (2)

If the box being considered is in the i-th row and j-th column, then c() = j − i. The hook length h() of a box in a Young diagram is defined as a + b + 1 where a is the number of boxes lying at its right and b the number of boxes lying below. (3)

ASTÉRISQUE 422

(1160)

HOMFLY POLYNOMIALS FROM THE HILBERT SCHEMES

Definition 5.31. — Given X =

P

γ`m cγ (v, s)Qγ

hXilow := v m−A hXi|

377

∈ Cm , we set

v=0

,

 where A = minγ ordv=0 cγ (v, s). One always has hXi = v A−m hXilow + vO(v) as in Eq. (48). 5.2.4. Satellites. — The diagrams in S [A] may be used as decorating patterns for links: given a framed link L , with components K1 , . . . Kr , we have, for every i, the annulus AKi , bounded by Ki and its parallel curve. Choose diffeomorphisms ' A −→ AKi . Given the diagrams Q1 , . . . Qr in the standard annulus A, the (framed) link L ∗ (Q1 , . . . Qr ), called a satellite of L , is obtained transplanting, for every i = 1, . . . r, the diagram Qi in AKi with the help of the diffeomorphism above. Example 5.32. — The link L of an irreducible curve singularity, with Puiseux development as in Eq. (3), is represented by the diagram  q0 q1 qs ’ ’ (49) L = β’ ∈ S [A], p0 ,# ∗ βp1 ,# ∗ · · · ∗ βps ,# n is the n-th power of the diagram βm,# ∈ S [Rm ] defined in Remark 5.16, where βm,# and b denotes the closure operation.

Remark 5.33. — In order to describe the link of a general (i.e., not necessarily irreducible) plane curve singularity as an iterated satellite construction, one also n , the n-th power of the diagram needs to consider satellites of the closure of γm,# γm,# ∈ S [Rm+1 ] obtained adding an extra strand, linked to the curl, to βm,# ([23, Eq. (11)]). This diagram may be thought of as obtained by smashing down on the plane the braid wrapping around the outside of a solid torus, along with a single strand running through its core.

γ3,# 5.2.5. Gyoja idempotents and the framing operator. — In this section we discuss a theorem which relates the operation of taking a satellite of a toral knot with the framing operator. Although this result is not needed for the formulation of the conjecture of Diaconescu, Hua and Soibelman, it plays an important role in its proof (see Section 6.2.1).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

378

L. MIGLIORINI

Definition 5.34. — Let β‘ 1,# be the closure of the braid with one strand and one curl (Remark 5.16). The operator Φ : S [A] −→ S [A], defined as Φ(X) = β‘ 1,# ∗ X

(50)

is called the framing operator. It corresponds to a total twist of all the strands of a diagram in S [A].

−→ The framing operator Φ

Notice that Φ(Cm ) ⊆ Cm for every m. One important property of the Qλ ’s is that they give a basis of eigenvectors for Φ: Proposition 5.35 ([1, Thm. 17]). — Let λ = {λ(1) ≥ · · · ≥ λ(`) > 0}. Then: Φ(Qλ ) = sκλ v −|λ| Qλ , P P with |λ| = j λ(j) and κλ = 2 ∈λ c(), where c() is the content of the box in the Young tableau associated with λ. (51)

Example 5.36. — For n = 2 there are only two partitions, (2) and 12 , and the corresponding elements, expressed in the basis introduced in Theorem 5.26, are   s 1 (52) Q2 = 2 sA2 + A21 , Q12 = 2 −A2 + sA21 . s +1 s +1 The framing operator acts as Φ(Q2 ) = v −2 s2 Q2 ,

(53)

Φ(Q12 ) = v −2 s−2 Q12 .

Proposition 5.29 gives: (54)

hQ2 i =

(v −1 − v)(v −1 s − vs−1 ) , (s − s−1 )(s2 − s−2 )

hQ12 i =

(v −1 − v)(v −1 s−1 − vs) . (s − s−1 )(s2 − s−2 )

Given a partition λ ` r, let Qλ [pm ] ∈ Crm be the element corresponding to the symmetric function sλ (z1m , z2m , . . . ) under the isomorphism τ . Since {Qν }ν`rm is a basis for Crm we have an expression X (55) Qλ [pm ] = aνλ (m)Qν . ν`rm

ASTÉRISQUE 422

(1160)

HOMFLY POLYNOMIALS FROM THE HILBERT SCHEMES

We define n

Φ m (Qλ [pm ]) :=

(56)

X

379

n äm Ä aνλ (m) sκν v −|ν| Qν .

ν`rm

Theorem 5.37 ([24]). — Let m, n be coprime. Then, for every partition λ: n n m (Q [p β’ λ m ]) . m,# ∗ Qλ = Φ

(57) Remark 5.38. —

1. If m and n have a common factor d, then

(58)

Y  n ’ n d β’ Qλi , m,# ∗ (Qλ1 , . . . Qλd ) = β m ,# ∗

d

d

1

where the product on the right hand side is computed in C . n 2. A formula analogous to the one of Theorem 5.37 holds for γ’ m,# ∗ (Qµ , Qλ ) ([23, Lemma 3.2]), where γm,# is the diagram defined in Remark 5.33, and Qλ is the decoration of the extra strand.

In principle, Theorem 5.37 and the analogous formulæ for the reducible case (Remark 5.38) allow one to compute the (colored) homfly-pt polynomial of any algebraic knot. 3 Example 5.39. — We apply Theorem 5.37 to compute β‘ 2,# ∗ Q1 , which corresponds to the toric knot (2, 3) (the trefoil). Q1 [2] corresponds to the sum of squares, which equals h2 − e2 , where h2 is the complete symmetric function of order two, also equal to s2 , and e2 the elementary symmetric function of order two, which equals s12 . Thus Q1 [2] = Q2 − Q12 . It follows from Eq. (53) that  3 3 −3 3 2 2 (59) β‘ s3 Q2 − s−3 Q12 . 2,# ∗ Q1 = Φ (Q1 [2]) = Φ (Q2 − Q12 ) = v

Applying Eq. (54) we find (60)

3 hβ‘ 2,# ∗ Q1 i =

 v − v −1 v 2 (s2 + s−2 ) − v 4 ) , v 6 (s − s−1 )

which coincides, up to a monomial normalization, with the homfly-pt polynomial of the trefoil (Eq. (13)). Finally, we define the meridian operator as follows: We consider the Hopf link H ∈ S [A] by choosing the first component to be homotopic to zero, and choosing a positive generator of the fundamental group of A as the second component. Then, given X, Y ∈ S [A], we set MX (Y ) = H ∗ (X, Y ). It is proved in [21] that also this operator is diagonalized by the basis {Qµ }, namely, for every partition µ we have MX (Qµ ) = tµ (X)Qµ for some tµ (X) ∈ Λ.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

380

L. MIGLIORINI

5.2.6. The colored homfly-pt polynomial and the Diaconescu–Hua–Soibelman conjecture. — The operation ∗ can be extended by Λ-linearity. Given the framed link SN → − L = i=1 Li , decorated with the partition λ = (λ1 , . . . , λN ), let, as above, Qλi be the closure of the Gyoja idempotent eλi ∈ Hn ' S [Sn ] for i = 1, . . . , N . We construct the satellite (61)

L

− := L ∗ (Qλ1 , . . . , QλN ), ∗ Q→ λ

and set → − Definition 5.40. — The colored homfly-pt polynomial of L with the coloring λ is → − → − → − −i (62) W (L , λ , v, s) = v j(L , λ ) sk(L , λ ) hL ∗ Q→ λ → − → − → − where j(L , λ ) and k(L , λ ) are integers, depending on λ and w(L ), (see [23, §3.2] for the exact expression) making the polynomial independent of the choice of the framing of L . → − Remark that when λ = (1), we recover the original definition of the homfly-pt polynomial, up to a normalization by a monomial. We are finally ready to state the refined version of the conjecture of Oblomkov and Shende, due to Diaconescu, Hua and Soibelman [7], proved by D. Maulik in [23]: Theorem 5.41. — There exist integers a, b and a sign , all depending on C and → − µ , such that the following equality holds: (63)

− − Z 0 (Y, C, → µ ; s2 , −v 2 ) = v a sb W (L , t → µ ; v, s),

− where t → µ := ( tµ1 , . . . , tµN ). − As a special case, picking → µ = (1), and applying Remark 5.11, we have the original statement conjectured by Oblomkov and Shende, Theorem 4.1.

6. A SKETCH OF THE PROOF The line of the proof of Theorem 5.41 is quite direct: both sides of Eq. (63) are shown to change in the same way after a blow-up. By the theorem on embedded resolution of singularities, one is reduced to checking the equality in the case of a smooth point (an unknot) or a node (a Hopf link), where a direct verification is possible. The single steps in the proof, however, are technically involved, and a detailed exposition is impossible here for reasons of space. We will therefore limit ourselves to a summary of the main points of the proof, in the hope that it may help the reading of the original paper.

ASTÉRISQUE 422

(1160)

HOMFLY POLYNOMIALS FROM THE HILBERT SCHEMES

381

We start by introducing some notation for the blow-up: we are in the set-up of Section 5.1.2 and Assumption 5.1 holds. We have the flop φ : Y 99K Y 0 . The proper transform C 0 = φ(C \ E) of C is the blow-up of C at p, and we set C 0 ∩ E 0 = {p1 , . . . , p` }. As recalled in Section 1, these points correspond to the lines in the tangent cone of C at p. For k = 1, . . . , `, we denote by Bk the singularity of C 0 at pk , and by Dk the reduced singularities of C 0 ∪ E 0 at pk , namely Dk = Bk ∪ E 0 . For each k = 1, . . . , `, − − the array → µ defines an array of partitions → µ [k], corresponding to the components 0 0 of C meeting E at pk , which may be used to decorate Bk . Given a partition λ, − we may color Dk = Bk ∪ E 0 with the partition (→ µ [k], λ), attaching the partitions → − in the array µ [k] to the irreducible components of Bk and the partition λ to the component E 0 . Ä ä 0 0 − Finally, C→ denotes the scheme theoretic closure of φ(C→ = C 0. − − µ \ E). Clearly C→ µ µ red − As explained in Section 5.1.1, there exist moduli spaces P (Y 0 , C 0 , → µ , r, n), with the − 0 0 0 → associated generating function Z (Y , C , µ ; q, Q), and, for each k = 1, . . . , `, moduli − − spaces P (Y, Dk , (→ µ [k], λ), r, n), with generating functions Z 0 (Y, Dk , (→ µ [k], λ); q, Q). − t→ Similarly, on the link side, we have the link LC , decorated with µ , the links LBk , decorated with tµ[k], and the links LDk decorated with ( tµ[k], t λ). Notation 6.1. — Most of the results in this section are identities between rational functions in two variables. For the sake of simplicity we will state some of the main theorems in the form of identities which hold up to a monomial which we will not specify and adopt the notation “≈” to indicate this. These monomials are computed explicitly in [23]. 6.1. The blow-up relation for framed stable pairs 6.1.1. The flop invariance theorem. — The hardest technical step in [23] is probably the proof of Theorem 6.3 below. The argument relies on the wall-crossing results due to Bridgeland ([3, 4]) and Calabrese ([5]), and on the comparison between Donaldson– Thomas invariants and stable pairs invariants, properly adapted to the set-up of framed stable pairs, see [23, §2.4]. In order to rely on the available results on wallcrossing quoted above, Maulik compactifies the set-up, introducing projective Calabi– Yau varieties X+ , X− with maps (64)

φ

X+ π

!

X0 ,

}

/ X− π0

where π (resp. π 0 ) contracts the curve E+ ' P1 (C) (resp. E− ' P1 (C)), both with normal bundle OP1 (−1) ⊕ OP1 (−1), and φ is the flop along E and E 0 , and containing

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

382

L. MIGLIORINI

surfaces S+ , S− such that the formal completions of X± along S± ∪E± are isomorphic ›2 (C) ∪ E 0 respectively. to the formal completions of Y, Y 0 along A2 (C) ∪ E and A Remark 6.2. — It follows from the main result in [3], that, in this case, there is an equivalence of (unbounded) derived categories of coherent sheaves D(X) ' D(X 0 ) extending the natural identification D(X \ E) ' D(X 0 \ E 0 ). Theorem 6.3 ([23, Prop. 2.2]). — In the set-up above − − Z 0 (Y, C, → µ ; q, Q−1 ) ≈ Z 0 (Y 0 , C 0 , → µ ; q, Q).

(65)

6.1.2. Localization. — The second step consists in splitting the right hand side of Theorem 6.3 into local contributions corresponding to the points in C 0 ∩ E 0 . This is done by considering the C× -action on Y 0 which fixes the proper transform of A2 (C) and scales its normal bundle. Since the Euler characteristic of a one-dimensional ∗ − − C× -orbit vanishes, we have χtop (P (Y, C, → µ , r, n)) = χtop P (Y, C, → µ , r, n)C , so − that the computation of Z 0 (Y 0 , C 0 , → µ ; q, Q) reduces to the study of the contributions − of the fixed points of this action on the various moduli spaces P (Y 0 , C 0 , → µ , r, n). × These fixed points correspond to framed stable pairs supported on a C -invariant Cohen–Macaulay scheme. In particular, the nonreduced structure along E 0 is given by a monomial ideal associated with a partition λ of r. Proposition 6.4 ([23, Prop 2.6]). — There exists function Uλ (q, Q) (explicitly determined in [23]) such that (66)

− Z (Y , C , → µ ; q, Q) ≈ 0

0

0

X

` Y

Uλ (q, Q)

λ

− Z 0 (Y, Dk , (→ µ [k], λ); q, 0)

k=1

where the sum is extended to all partitions λ. − Remark 6.5. — As already noticed, taking Q = 0 in Z 0 (Y, Dk , (→ µ [k], λ); q, Q) amounts to considering sheaves supported on Dk i.e., not containing the projective line E in their support. Finally, joining Proposition 6.4 with Theorem 6.3 we obtain the description of − the behavior of Z 0 (Y, C, → µ ; q, Q) under blow-up, which will be compared with the analogous formula for the colored homfly-pt polynomial (Section 6.2). Theorem 6.6. — We have: (67)

− Z 0 (Y, C, → µ ; q, Q−1 ) ≈

X λ

ASTÉRISQUE 422

Uλ (q, Q)

` Y k=1

− Z 0 (Y, DK , (→ µ [k], λ); q, 0).

(1160)

HOMFLY POLYNOMIALS FROM THE HILBERT SCHEMES

383

6.2. Blow-up relation for colored - polynomials The next goal is to prove an identity analogous to Eq. (67) for the homfly-pt polynomials of algebraic links. The starting point is the presentation of LC or of n n ’ ’ − as an iteration of the operations β LC ∗ Q→ m,# ∗ ( ) and γm,# ∗ ( ) (see Example 5.32 λ and Remark 5.33). 6.2.1. The effect of blowing up on the link. — The second step is relating the colored homfly-pt polynomials of the links of C, Bk , Dk . Instead of giving the complete statement, which is quite involved, we will limit ourselves to give an idea of what happens in the case when C has a single branch, with a Puiseux parameterization q0

q1

q2

y(x) = x p0 (a0 + x p0 p1 (a1 + x p0 p1 p2 (a2 + · · · ))), as in Eq. (3). As in Example 5.32, the associated knot has a presentation  qs q1 q0 ’ ’ ∈ C ⊂ S [A]. LC = β’ p0 ,# ∗ βp1 ,# ∗ · · · ∗ βps ,# Assume pq00 > 1: blowing up the singular point amounts to the change of variables y = xw, and the Puiseux parameterization for C 0 is: q0

q1

q2

w(x) = x p0 −1 (a0 + x p0 p1 (a1 + x p0 p1 p2 (a2 + · · · ))), from which we see that only the first Puiseux pair changes, and the class in C of the link for C 0 is, by Example 5.32, LC 0

 q0 −p0 q1 qs ’ ’ = β÷ . p0 ,# ∗ βp1 ,# ∗ · · · ∗ βps ,#

q0 −p0 By Theorem 5.37, relating the operator β÷ p0 ,# ∗ ( ) with the fractional power of the framing operator Φ, the equality

(68)

LC 0

= Φ−1 (LC )

holds in C , and clearly also holds if LC and LC 0 are decorated with a Qλ . More generally, let us assume that pq00 > 1 in the Puiseux development of every component of C. Since  ’ n−m n (69) γ’ m,# ∗ (Qλ , Φ (Qµ )) = Φ γm,# ∗ (Qλ , Qµ ) , there is an analogue of Eq. (68) in this case too (see Remark 5.38). A slight modification of the argument fixes the general case, with no assumption on the terms pq00 of the components, expressing the link LC in term of the LBi ’s and the operations Φ 0 0 and γ‘ 1,# ∗. Finally, the link of Dk = Bk ∪ E , colored with λ on E , can be expressed simply as LDk = Mλ (LBk ), where Mλ is the meridian operator introduced at the end of Section 5.2.5.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

384

L. MIGLIORINI

6.2.2. The inductive step. — The main step is establishing the following identity in Λ, which is then applied to X = LC (under the hypothesis that x = 0 is not a branch of the curve): P Theorem 6.7. — Let X = v A γ`m cγ (s)Qγ ∈ Cm . Then X 1 (70) (−1)m v m+A hXi = Q (−v −2 )|λ| s−κλ hQλ ilow hMλ Φ−1 Xilow . 2k −2 k (1 − s v ) k λ

−1

Here Mλ and Φ denote the meridian operator and the inverse of the framing operator respectively, whereas h ilow , a function only of s, is as in Definition 5.31. Notice that in each summand the only term depending on v is (−v −2 )|λ| . Eq. (70) is first established for X = Qµ , where it follows from the “vertex flop” identity proved in [15], a combinatorial formula expressing hQµ i (Eq. (47)) as a sum over the set of partitions of a product of Schur functions, after interpreting each term in this sum as (−v 2 )|λ| s−κλ hQλ ilow hMλ Φ−1 Qµ ilow , using the knowledge of the eigenvalues of Φ (Eq. (51)) and those of Mλ (Theorem 4.4 in [21]), and Remark 5.30. 6.3. Conclusion of the proof Finally one has to compare the identitites in Theorem 6.7 and Theorem 6.6. The proof of Theorem 5.41 is reduced to checking the lowest degree part of the identity by the following: Proposition 6.8 ([23, Proposition 6.4]). — Assume Z 0 (Y, Dk , (µ[k], λ); s2 , 0) ≈ hLDk ∗ (Q t µ[k] , Qt λ )ilow

(71)

holds for every k = 1, . . . , `, and for every partition λ. Then Theorem 5.41 holds for C − decorated with → µ. Remark 6.9. — In turn, Theorem 5.41 implies that − − ilow , Z 0 (Y, C, → µ ; s2 , 0) ≈ hL ∗ Q t → C

µ

low − as soon as one proves that hLC ∗ Q t → 6= 0. µi

Eq. (71) is verified for the Hopf link (a node) colored with any pair of partition. Recall that, by Eq. (67), − Z 0 (Y, C, → µ ; s2 , −v −2 ) ≈

X

Uλ (s2 , −v 2 )

λ

` Y

 − Z 0 Y, Dk , (→ µ [k], λ); s2 , 0 .

k=1

The proof of Proposition 6.8 consists in matching every term (72)

Uλ (s2 , −v 2 )

` Y k=1

ASTÉRISQUE 422

 − Z 0 Y, Dk , (→ µ [k], λ); s2 , 0

(1160)

HOMFLY POLYNOMIALS FROM THE HILBERT SCHEMES

385

in Eq. (67) with the corresponding term low − (−v 2 )|λ| s−κ tλ hQt λ ilow hMt λ Φ−1 LC ∗ Qt → µi − low − in Eq. (70). By hypothesis Z 0 (Y, DK , (→ µ [k], λ); s2 , 0) ≈ hLDk ∗ Q( t → . Using µ [k],t λ) i the results sketched in Section 6.2.1 on the relation between LC and the LDk ’s, the Q low − term in Eq. (73) turns out to be ≈ k hLDk ∗ Q( t → . At the end the quantities µ [k],t λ) i in Eq. (72) and in Eq. (73) differ by a monomial, a priori depending on λ, and the last step is proving that in fact the monomial is the same for all the partitions λ. A byproduct of the proof of this last fact is the nonvanishing hLC ∗ Q t µ ilow 6= 0 for − every C and → µ , which completes the argument, see Remark 6.9. In this last step, an important role is played by the following evaluation of the term − in C in the basis {Qµ }: of lowest order in v and s in the expansion of L ∗ Q→ λ

(73)

Theorem 6.10. — Assume x = 0 is not a component of C, let mi denote the number of strands diagram of the i-th connected component of LC , and set S S in the annulus m m µm = µ1 1 ∪ · · · ∪ µ` ` , where ∪ denotes the concatenation of partitions. Then, there exist exponents A and B, depending on the Puiseux pairs of C, such that the following holds in C :   X A B LC ∗ (Qµ1 , . . . , Qµr ) = ±v s Qµm + cγ (s)Qγ γµm

where the function cγ (s) has no poles at s = 0, and  denotes the natural order on partitions.

7. A HOMOLOGICAL VERSION Theorem 4.1 is an equality of Euler characteristics: this is evident for the left P [`,`+n] hand side `,n≥0 s2` (−v 2 )n χtop (Cp ), but, thanks to the work of Khovanov and Rozansky [14], the homfly-pt polynomial turns out to be the Euler characteristic of a complex as well. More precisely, for every link L , there are the triply graded knot homology groups H i,j,k (L ), such that, up to some normalization (see the discussion in [29] for the numbering conventions), X (−1)k v i sj dim H i,j,k (L ) = P(L , v, s). i,j,k

It is natural to consider the “superpolynomial” X (74) P (v, s, t) = tk v i sj dim H i,j,k (L ), i,j,k

specializing to the homfly-pt for t = −1, and wonder whether it has an algebraic geometric interpretation, in the spirit of Theorem 4.1.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

386

L. MIGLIORINI

Example 7.1. — If L is the trefoil knot, then P (v, s, t)

=

 vt + v −1 2 −2 v s + v 4 t3 + v 2 s2 t2 . −1 s −s

On the other hand, a polynomial invariant of an algebraic variety which is finer than the Euler characteristic is the weight polynomial : its definition is based on the theory of mixed Hodge structures, created by P. Deligne in the early ’70’s. The cohomology groups with rational coefficients, compactly supported or not, of a complex algebraic variety are endowed with an increasing filtration W• , the weight filtration, natural with respect to all the maps between cohomology groups induced by maps of the corresponding varieties. An important property of the weight filtration is that these maps between cohomology groups are strict with respect to it: if 0 → H1 → H2 → H3 → 0 is an exact sequence of mixed Hodge structures, then for every k W W 0 → GrW k H1 → Grk H2 → Grk H3 → 0

is exact. If X is a complex algebraic variety, we set X j w(X) := (−1)j+k tk dim GrW k Hc (X). j,k

For instance w(C) = t , and w(C× ) = t2 − 1, since H1c (C× ) has dimension one and Hi (X) = Hic (X), as in the case weight zero. Note that if for every i we have GrW Pi k c of nonsingular proper varieties, then w(X) = k t dim Hkc (X) is just the Poincaré polynomial. The most important property of the weight polynomial is its additivity: if Y ⊂ X is a closed algebraic subvariety of X, then w(X) = w(Y ) + w(X \ Y ), which follows from the fact that the long exact sequence 2

· · · → Hic (Y ) → Hic (X) → Hic (X \ Y ) → Hi+1 c (Y ) → · · · is an exact sequence of mixed Hodge structures, and the strictness property above. In [29], Oblomkov, Rasmussen and Shende conjecture a “homological” refinement of Eq. (14), for which they provide some evidence, relating the superpolynomial of the algebraic link L with the generating function for the weight polynomials of nested Hilbert schemes: Conjecture 7.2. — Let L be the link of a plane curve singularity (C, p) Then:  v µ(f )−1 X 2 (75) P (L , v, s, t) = s2l v 2m tm w(Cp[l,l+m] ). s l,m

Recent development and perspectives on the new emerging picture on algebraic links, stemming from this conjecture, are thoroughly discussed in the lecture notes [26, 28].

ASTÉRISQUE 422

(1160)

HOMFLY POLYNOMIALS FROM THE HILBERT SCHEMES

387

Acknowledgments. — It is a pleasure to thank N. Bourbaki for giving me the honor of delivering this seminar, D. Maulik for writing the beautiful paper [23] and for his help in preparing this text, and J. Fresán for his many comments and suggestions. Finally, I thank my friends of the Algebra and Geometry group in Bologna for listening to my preparatory talks, helping me to clarify some points and get some computations right: Nicoletta, Fabrizio, Giovanni, Luca, Stefano, with Andrea Maffei, who also made precious comments on a first draft of the paper, as a special guest. REFERENCES [1] A. Aiston & H. Morton – “Idempotents of Hecke algebras of type A,” J. Knot Theory Ramifications 7 (1998), no. 4, p. 463–487. [2] M. F. Atiyah – “On analytic surfaces with double points,” Proc. Roy. Soc. London. Ser. A 247 (1958), p. 237–244. [3] T. Bridgeland – “Flops and derived categories,” Invent. math. 147 (2002), no. 3, p. 613–632. [4]

, “Hall algebras and curve-counting invariants,” J. Amer. Math. Soc. 24 (2011), p. 969–998.

[5] J. Calabrese – “Donaldson-Thomas invariants and flops,” J. Reine angew. Math 716 (2016), p. 103–145. [6] A. Campillo, F. Delgado & S. M. Gusein-Zade – “The Alexander polynomial of a plane curve singularity via the ring of functions on it,” Duke Math. J. 117 (2003), no. 1, p. 125–156. [7] E. Diaconescu, Z. Hua & Y. Soibelman – “HOMFLY polynomials, stable pairs and motivic Donaldson-Thomas invariants,” Commun. Number Theory Phys. 6 (2012), no. 3, p. 517–600. [8] E. Diaconescu, V. Shende & C. Vafa – “Large n duality, Lagrangian cycles, and algebraic knots,” Comm. Math Phys. 319 (2013), no. 3, p. 813–863. [9] D. Eisenbud & W. Neumann – Three-dimensional link theory and invariants of plane curve singularities, Annals of Math. Studies, vol. 110, Princeton Univ. Press, 1985. [10] W. Fulton & J. Harris – Representation Theory. A first course, Graduate Texts in Math., vol. 129, Springer, 1991. [11] A. Gyoja – “A q-analogue of Young symmetrizer,” Osaka J. Math. 23 (1986), no. 4, p. 841–852. [12] J. Hoste, A. Ocneanu, K. Millett, P. Freyd, W. B. R. Lickorish & D. Yetter – “A new polynomial invariant of knots and links,” Bull. Amer. Math. Soc. 12 (1985), p. 239–246.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

388

L. MIGLIORINI

[13] C. Kassel & V. Turaev – Braid Groups, Graduate Texts in Math., vol. 247, Springer, 2008. [14] M. Khovanov & L. Rozansky – “Matrix factorizations and link homology, II,” Geom. Topol. 12 (2008), no. 3, p. 1387–1425. [15] Y. Konishi & S. Minabe – “Flop invariance of the topological vertex,” Internat. J. Math. 19 (2008), no. 1, p. 27–45. [16] J. Le Potier – Systèmes cohérents et structures de niveau, Astérisque, vol. 214, Société Mathématique de France, 1993. [17]

, “Faisceaux semi-stables et systèmes cohérents,” in Vector Bundles in Algebraic Geometry, Durham, 1993, London Math. Soc. Lecture Note Ser., vol. 208, Cambridge Univ. Press, 1995, p. 179–239.

[18] W. B. R. Lickorish – An introduction to the theory of knots, Graduate Texts in Math., vol. 175, Springer, 1997. [19] S. Lukac – “HOMFLY skeins and the Hopf link,” Ph.D. Thesis, University of Liverpool, 2001, http://www.liv.ac.uk/~su14/papers/lukacthesis.pdf. [20]

, “Idempotents of the Hecke algebra become Schur functions in the skein of the annulus,” Math. Proc. Cambridge Philos. Soc. 138 (2005), no. 1, p. 79–96.

[21] S. Lukac & H. Morton – “The HOMFLY polynomial of the decorated Hopf link,” J. Knot Theory Ramifications 12 (2003), no. 3, p. 395–416. [22] I. G. Macdonald – Symmetric functions and Hall polynomials, second ed., Oxford Classic Texts in the Physical Sciences, The Clarendon Press Univ. Press, 2015. [23] D. Maulik – “Stable pairs and the HOMFLY polynomial,” Invent. math. 204 (2016), no. 2, p. 787–831. [24] H. Morton & P. Manchón – “Geometrical relations and plethysms in the HOMFLY skein of the annulus,” J. Lond. Math. Soc. 78 (2008), no. 2, p. 305– 328. [25] H. Nakajima – Lectures on the Hilbert schemes of points on surfaces, University Lecture Series, vol. 18, Amer. Math. Soc., 1988. [26] S. Nawata & A. Oblomkov – “Lectures on knot homology,” in Physics and mathematics of link homology, Contemp. Math., vol. 680, Centre Rech. Math. Proc., Amer. Math. Soc., 2016, p. 137–177. [27] W. Neumann – “Topology of hypersurface singularities,” in Erich Kaehler: Mathematische Werke (R. Berndt & O. Riemenschneider, eds.), de Gruyter, 2003, p. 727–736. [28] A. Oblomkov – “Notes on matrix factorizations and knot homology,” Notes for the CIME Summer School June 2018, arXiv:1901.04052.

ASTÉRISQUE 422

(1160)

HOMFLY POLYNOMIALS FROM THE HILBERT SCHEMES

389

[29] A. Oblomkov, J. Rasmussen & V. Shende – “The Hilbert scheme of a plane curve singularity and the HOMFLY homology of its link,” Geom. Topol. 22 (2018), no. 2, p. 645–691, with an appendix by E. Gorsky. [30] A. Oblomkov & V. Shende – “The Hilbert scheme of a plane curve singularity and the Hhomfly polynomial of its link,” Duke Math. J. 161 (2012), no. 7, p. 1277– 1303. [31] R. Pandharipande & R. P. Thomas – “Curve counting via stable pairs in the derived category,” Invent. math. 178 (2009), no. 2, p. 407–447. [32]

, “Curve counting via stable pairs in the derived category,” Invent. math. 178 (2009), p. 407–447.

[33]

, “Stable pairs and BPS invariants,” J. Amer. Math. Soc. 23 (2010), no. 1, p. 267–297.

[34]

, “13/2 ways of counting curves,” in Moduli spaces, London Math. Soc. Lecture Note Ser., no. 411, Cambridge Univ. Press, 2014, p. 282–333.

[35] J. Przytycki & P. Traczyk – “Conway Algebras and Skein Equivalence of Links,” Proc. Amer. Math. Soc. 100 (1987), p. 744–748. [36] N. Reshetikhin & V. Turaev – “Ribbon graphs and their invariants derived from quantum groups,” Comm. Math. Phys. 127 (1990), p. 1–26. [37]

, “Invariants of 3manifolds via link polynomials and quantum groups,” Invent. math. 103 (1991), p. 547–597.

[38] D. Sullivan – “Combinatorial invariants of analytic spaces,” in Proceedings of Liverpool Singularities Symposium I, Lectures Notes in Math., vol. 192, 1971, p. 165–177. [39] V. Turaev – “The Conway and Kauffman modules of a solid torus,” in Zap. Nauchn. Sem. Leningrad. Otdel. Mat. Inst. Steklov. (LOMI), vol. 167, Issled. Topol., no. 6, 1988; English translation: J. Soviet Math. 52 (1990), 2799–2805., p. 79–89. [40] C. T. C. Wall – Singular points of plane curves, London Mathematical Society Student Texts, vol. 63, Cambridge Univ. Press, 2004.

Luca MIGLIORINI Dipartimento di Matematica Università di Bologna Piazza Porta S. Donato 5 40126 Bologna ITALY E-mail : [email protected]

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

Séminaire BOURBAKI 71e année, 2018–2019, no 1161, p. 391 à 414 doi:10.24033/ast.1140

Mars 2019

THE RIEMANN ZETA FUNCTION IN SHORT INTERVALS [after Najnudel, and Arguin, Belius, Bourgade, Radziwiłł and Soundararajan] by Adam J. HARPER

INTRODUCTION The Riemann zeta function ζ(s) is one of the most important and fascinating functions in mathematics. When the complex number s has 1, we have ∞ X Y  1 1 −1 ζ(s) = = 1 − , ns ps n=1 primes p

and already from these equivalent expressions we see some of the key themes that dominate the study of ζ(s). Firstly, since ζ(s) is given by a Dirichlet series over all natural numbers n, without any difficult number theoretic coefficients, we can hope to use general analytic methods to obtain information about ζ(s). For example, one could hope to approxP∞ imate n=1 n1s or its partial sums by an integral. In this way, one can extend the definition of ζ(s) to all 0, and with more work to the entire complex plane. It turns out that this analytic continuation of ζ(s) is meromorphic, with only a simple P pole at s = 1. Furthermore, when 0 the zeta function is the sum n6X n1s plus some easily understood other terms, for suitable X = X(s). Secondly, since ζ(s) is given by an Euler product over all primes p, we can hope to use results about the zeta function to draw conclusions about the distribution of primes. One can also go in the reverse direction, and hope to put in information about the primes to deduce things about the zeta function (from which, perhaps, we will later deduce other number theoretic information that we didn’t have before). In this article we will discuss various results of this nature. Thirdly, note that the Euler product is absolutely convergent when 1, and none of the individual factors (1 − p1s )−1 vanish, so we have ζ(s) 6= 0 when 1. It is well known that the zeros of the zeta function encode number theoretic

© Astérisque 422, SMF 2020

392

A.J. HARPER

information, and here one can glimpse why—if one knows that ζ(s) doesn’t vanish in a certain part of the complex plane, this suggests that something like the Euler product formula persists there, which implies something about the regularity of the primes. Again there is a kind of duality, since not only does the non-vanishing of zeta imply results about primes and products, but our methods for proving non-vanishing tend to involve establishing the influence of some kind of product formula in the region under study. The most interesting subset of the complex plane on which to study ζ(s) is the critical line 1, and let p1 , . . . , pk , pk+1 , . . . , p` be any primes (not necessarily distinct). Let (Xp )p prime be a sequence of independent random variables, each distributed uniformly on the complex unit circle. Then Qk Q` Z Å ` Å ã ã k k ` Y Y min{ j=1 pj , j=k+1 pj } 1 2T Y −it Y −it Xpj + O . pj pj dt = E Xpj T T j=1 T j=1 j=k+1

j=k+1

Proof of Lemma 1.2. — We can rewrite the integral on the left as Z k ` n X o X 1 2T exp −it log pj − log pj dt. T T j=1 j=k+1

Pk

P`

So if j=1 log pj = j=k+1 log pj then the integral is exactly 1. And since this is equivalent (by uniqueness of prime factorisation) to saying that the (pj )`j=k+1 are just some reordering, with the same multiplicities, of the (pj )kj=1 , we see that, in this Qk Q` case as well, E j=1 Xpj j=k+1 Xpj = 1 since every Xp is paired with a conjugate copy. Pk P` If j=1 log pj 6= j=k+1 log pj , then on the right some Xp is not paired with a conjugate copy, so by independence and symmetry of the distributions of the Xp we Qk Q` have E j=1 Xpj j=k+1 Xpj = 0. The integral on the left may be calculated explicitly as "  #2T Pk P` 1 exp −it( j=1 log pj − j=k+1 log pj ) 1   Qk  . Pk P` pj T −i( j=1 log pj − j=k+1 log pj ) T log Q` j=1 p T j=k+1 j Qk Q` Qk Q` If j=1 pj < (3/4) j=k+1 pj or if j=1 pj > (4/3) j=k+1 pj then the logarithmic term here isQ> log 4/3, so we get an acceptable error term O(1/T ). Otherwise, we can Q` Qk    k p  j=k+1 pj j=1 pj − j=1 j Q` = log 1 + and use the Taylor expansion of write log Q` pj j=k+1 pj Qk j=k+1 Q` the logarithm. Since we know that j=1 pj − j=k+1 pj 6= 0, in fact it is > 1 and we get a lower bound  Q` 1 p from the Taylor expansion. Since we are in the case j Qk Q` j=k+1 where j=1 pj and j=k+1 pj differ at most by a multiplicative factor 4/3, this can . also be written as  min{Qk p 1,Q` p } j=1

j

j=k+1

j

Lemma 1.2 implies that if we examine the t-average of some polynomial expression in the p−it , this will be close to the corresponding average of the genuinely random Xp provided that when we expand things out, the product of the primes involved is small compared with T . Since one can approximate quite general functions using polynomials (with the degree and coefficient size increasing as one looks for better approximations), one can hope to show rigorously that the distribution of sums of the p−it is often close to the distribution of sums of the Xp . A particular instance of this is the well known method of moments from probability theory. For example, if

ASTÉRISQUE 422

(1161)

THE RIEMANN ZETA FUNCTION IN SHORT INTERVALS

395

P = P (T ) is some large quantity, (ap )p prime = (ap (T ))p prime are complex numbers, and if one can show that for each k ∈ N one has Z k 1 2T  X < ap p−it dt → EN (0, 1)k as T → ∞, T T p6P P then it follows that the distribution of < p6P ap p−it converges to the standard norR∞ 2 mal distribution as T → ∞. (Here we wrote EN (0, 1)k = (2π)−1/2 −∞ wk e−w /2 dw to denote the k-th power moment of the standard normal distribution.) In view of the above discussion, if the size of the ap is under control then one could hope to prove such convergence (presuming it actually holds!) when P (T ) = T o(1) , so that the error terms in Lemma 1.2 don’t contribute too much. Our other basic principle is the following. Principle 1.3. — For many purposes (especially statistical questions not directly involving the zeta zeros), for any σ > 1/2 the Riemann zeta function ζ(σ+it) “behaves Q 1 like” an Euler product primes p6P (1 − pσ+it )−1 of “suitable” length P = P (σ, t). As discussed in the Introduction, the reason for believing that something like Principle 1.3 could prevail is that ζ(σ + it) is equal to an Euler product when σ > 1, and if the primes are well distributed then one expects this identity to continue to influence the behavior of the zeta function for smaller σ. Indeed, the Riemann Hypothesis is the statement that it does continue to have an influence, at least to the extent that ζ(σ + it) 6= 0 (like a finite product of non-vanishing terms) when σ > 1/2. It is much harder to prove rigorous statements corresponding to Principle 1.3 than it was for Principle 1.1, and we shall discuss several examples of such statements in the sequel. One also needs to think carefully about the appropriate sense of “behaves like” here, especially when σ = 1/2, since the Riemann zeta function does have infinitely many zeros on the critical line which don’t reflect Euler product type behavior. But to fix ideas a little we state one nice result, which we will also come back to later. Proposition 1.4 (Radziwiłł and Soundararajan, 2017). — For all T 6 t 6 2T , except for a set whose measure is o(T ) as T → ∞, we have   nX o 1 W + it = (1 + o(1)) exp , ζ 1/2 + log T kpk(1/2+W/ log T +it) k p 6P

where the sum is over prime powers pk . Here W = (log log log T )4 , and 2 P = T 1/(log log log T ) , and the o(1) term tends to 0 as T → ∞. The reader needn’t be too concerned about the exact choices of W and P here, and in any event there is some flexibility in those (they are related though, as W increases one can take P smaller). Proposition 1.4 says that ζ(s) behaves like an Euler product

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

396

A.J. HARPER

(or the exponential of a prime number sum) provided one shifts away from the critical line 0. Then for any u > 0, we have 2  2   e−u /2 e−u /2 1 − e−Θ n 1+u 6 P max Zi > uσ  n . 16i6n 1+u In particular, for any  > 0 we have   max16i6n Zi √ 61 →1 P 1−6 σ 2 log n

as n → ∞.

Proof of Lemma 1.6. — Using the union bound, we have P(max16i6n Zi > uσ) 6 Pn i=1 P(Zi > uσ). And P(Zi > uσ) is just the probability that a N (0, 1) random −u2 /2

variable is > u, which is  e 1+u . This proves the first upper bound. To prove the lower bound, it will suffice to show that P(max16i6n Zi 6 uσ) 6  −u2 /2 Qn −Θ n e 1+u e . But by independence, this probability is equal to i=1 P(Zi 6 uσ).  −u2 /2  −u2 /2  And again, P(Zi 6 uσ) is 1 − Θ e 1+u = exp −Θ e 1+u , which gives the result. √ For the second statement, we just note that if we take u = (1 − ) 2 log n, −u2 /2

where  > 0 is small and n is large, then n e 1+u

→ ∞ as n → ∞ and so √ −u2 /2 P(max16i6n Zi > uσ) > 1 − o(1). Similarly, if we take u = 2 log n then n e 1+u → 0 as n → ∞, and so P(max16i6n Zi > uσ) = o(1). Note that we made little use of the assumption that the Zi were Gaussian/normal random variables. This just gave us a rather explicit form for the tail probabilities P(Zi > uσ) that arose in the argument. It would also be easy to replace the second

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

398

A.J. HARPER

statement with something more precise, and later we shall extensively discuss the precise asymptotics of the maxima of Gaussian random variables.

2. GENERAL LANDSCAPE OF THE VALUES OF ZETA To set the scene for our discussion of ζ(1/2 + it) in short intervals of t, we now review some of the key information we have (both unconditional, conditional and conjectural) when t varies over a wide range. Firstly one might ask about the “typical” size of ζ(1/2 + it). A natural way to make this precise is to ask about the distribution of |ζ(1/2 + it)|, where T 6 t 6 2T (say) is chosen uniformly at random. This situation is described by a beautiful classical result of Selberg. Theorem 2.1 (Selberg Central Limit Theorem, 1946). — For any z ∈ R, we have n o 1 log |ζ(1/2 + it)| meas T 6 t 6 2T : p 6 z → Φ(z) as T → ∞, T (1/2) log log T where meas{·} denotes Lebesgue measure, and where Φ(z) := standard normal cumulative distribution function.

2

/2 e−w √ dw −∞ 2π

Rz

is the

Let us remark that although we will have ζ(1/2 + it) = 0 (and therefore log |ζ(1/2 + it)| will be undefined) for some points T 6 t 6 2T (in fact for  T log T points), since these points form a discrete set they contribute nothing from the point of view of measure, so are irrelevant to the statement of Theorem 2.1. The Selberg Central Limit Theorem is the prototypical manifestation of the Basic Principles discussed in the previous subsection. Looking at things heuristically, we have  X X 1  1 log |ζ(1/2 + it)| = < log ζ(1/2 + it) ≈ −< log 1 − 1/2+it ≈ < , 1/2+it p p p6P p6P for “suitable” P = P (T ). Then as T 6 t 6 2T varies, the terms p−it behave like independent random variables, and so log |ζ(1/2 + it)| behaves roughly like a sum of many independent random variables. This is exactly the situation where one expects to have convergence in distribution to a normal random variable. The second part of the heuristic is rather easy to make rigorous to an acceptable level of preciP 1 and showing sion in this setting, by computing moments of the sums < p6P p1/2+it that they converge to the moments of a normal distribution. The approximation P 1 log |ζ(1/2 + it)| ≈ < p6P p1/2+it has traditionally been more difficult to establish

ASTÉRISQUE 422

(1161)

THE RIEMANN ZETA FUNCTION IN SHORT INTERVALS

399

rigorously. As we already discussed, nothing like this can hold pointwise on the critical line because the left hand side will be undefined at some points t, so one wants P 1 to show that log |ζ(1/2 + it)| ≈ < p6P p1/2+it in some kind of average sense. The classical proofs of this entailed quite complicated manipulations to work around the zeros of zeta, but recently Radziwiłł and Soundararajan [18] have given a very neat and conceptual proof using Proposition 1.4. Another key question is about the largest values attained by |ζ(1/2+it)| as t varies. Unconditionally, our best upper bounds for the size of ζ(1/2 + it) are rather weak despite the application of some very powerful methods to the problem. Theorem 2.2 (Bourgain, 2017). — For any  > 0 and all large t, we have the upper bound |ζ(1/2 + it)|  t13/84+ (where the implicit constant may depend on ). Bourgain [7] proved this result by combining the Hardy–Littlewood approximaP 1 tion ζ(1/2 + it) ≈ n6t n1/2+it , exponential sum methods of Bombieri–Iwaniec, and progress in the theory of “decoupling” from harmonic analysis. For comparison, general complex analysis arguments (“convexity”) can prove a bound  t1/4+ , and long ago Hardy and Littlewood proved the bound  t1/6+ . Bourgain’s exponent 13/84 ≈ 0.155 is the latest in a long line of improvements. Meanwhile the classical Lindelöf Hypothesis (the truth of which follows from the Riemann Hypothesis) conjectures that |ζ(1/2 + it)|  t for any  > 0 and all large t. The bound t proposed by the Lindelöf Hypothesis is still rather soft, so what upper bound should we really expect, in other words what is the true size of maxT 6t62T |ζ(1/2 + it)|? There isn’t a universal consensus about this, but the following results set some limits on where the truth can lie. Theorem 2.3 (Littlewood, 1924). — If the Riemann Hypothesis is true, then for all large t we have ™ ß log t , |ζ(1/2 + it)| 6 exp C log log t for a certain absolute constant C > 0. Theorem 2.4 (Bondarenko and Seip, 2018). — For all large T , we have   ® ´ log T log log log T , max |ζ(1/2 + it)| > exp (1 + o(1)) 16t6T log log T where the o(1) term tends to 0 as T → ∞. Apart from a sequence of improvements to the value of C, Littlewood’s [15] result in Theorem 2.3 hasn’t been improved for almost a century. Theorem 2.4 is a recent breakthrough of Bondarenko and Seip [5, 6], improving on earlier lower bounds of

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

400

A.J. HARPER

a similar shape but without the log log log T factor inside the square root. By further elaboration of their method, the constant 1 + o(1) has even more recently been √ improved to 2 + o(1) by La Bretèche and Tenenbaum [8]. To appreciate these bounds, and contemplate where the truth might lie between them, it is instructive to consider a rough outline of the proofs. Assuming the truth of the Riemann Hypothesis, one can prove upper bounds of roughly the following shape: for any large t and any parameter x 6 t, we have ã Å X log t 1 . +O (1) log |ζ(1/2 + it)| . < log x p1/2+it p6x

See, for example, the Main Proposition of Soundararajan [19]. Note that this is another very nice manifestation of Principle 1.3: if we are only interested in upper bounds, we can control log |ζ(1/2 + it)| by sums over primes at every point t, even on the critical line. As noted previously, one cannot hope for a similar lower bound at every point, since when ζ(1/2 + it) = 0 the left hand side will be undefined (equal to −∞, informally). It is difficult to give a pointwise bound for this sum over primes except in a trivial P P 1/2 1 way (especially when x is small), namely < p6x p1/2+it 6 p6x √1p ∼ 2x log x . So to obtain the best possible upper bound for log |ζ(1/2 + it)|, we choose x to balance the size of this term and the “big Oh” term. Choosing x  log2 t is optimal, and yields the claimed bound log |ζ(1/2 + it)|  logloglogt t assuming the Riemann Hypothesis. To prove their lower bound, Bondarenko and Seip [5] work to compare the sizes RT RT (roughly speaking) of 1 ζ(1/2 + it)|R(t)|2 dt and 1 |R(t)|2 dt, where R(t) is an auxiliary “resonator” function that is chosen to concentrate its mass at points where ζ(1/2 + it) should be large. For any choice of R(t), upper bounding |ζ(1/2 + it)| by max16t6T |ζ(1/2 + it)| implies that RT | 1 ζ(1/2 + it)|R(t)|2 dt| , max |ζ(1/2 + it)| > RT 16t6T |R(t)|2 dt 1 and if R(t) is well chosen one can hope for this lower bound to be fairly efficient. One of Bondarenko and Seip’s main innovations, as compared with previous arP −it guments, is to choose R(t) = for certain intricately constructed m∈M r(m)m coefficients r(m) whose support is not constrained to the interval [1, T ] (as would be usual to allow one to control error terms when evaluating the integrals). Instead they allow r(m) 6= 0 even when m is extremely large, although only on a very sparse sequence of m so that the error terms remain under control. Very roughly speaking, Bondarenko and Seip’s resonator R(t) concentrates its mass on those t for which P 1 P eu . T log T 16j6log T

If Assumption 1 is correct, and if we assume to simplify the writing that √ u > log log T , then each summand here will be ã √ Å log log T −u2 / log log T u ≈ e . ≈ P N (0, 1) > p u (1/2) log log T In particular, if u = log log T − (1/4) log log log T + U for some U > 0 then the right hand side is 2 1 −2U −Θ(U 2 / log log T ) 1 e−(log log T −(1/4) log log log T +U ) / log log T  √ e e . log T log log T Summing over 1 6 j 6 log T , we find that if U is large then the sum will be small, in other words we can expect that for most t, the maximum max06h61 |ζ(1/2 + it + ih)| has size at most elog log T −(1/4) log log log T +O(1) . For a lower bound, we note that if Assumption 3 is correct then for any u ∈ R, n  o 1 j  meas T 6 t 6 2T : max ζ 1/2 + it + i 6 eu 16j6log T T log T n  o Y j  1 meas T 6 t 6 2T : log ζ 1/2 + it + i ≈ 6u . T log T 16j6log T

And using Assumption 1 as before to estimate each term in the product, we find the above is √ Å ãblog T c log log T −u2 / log log T ≈ 1− e . u In particular, if we take u = log log T − (1/4) log log log T − U for some fixed U > 0 e2U (note that we have −U here, not U ) then each bracket will be ≈ (1 − log T ), and the product of blog T c copies of this will be small. So we can expect that for most t, the

ASTÉRISQUE 422

(1161)

THE RIEMANN ZETA FUNCTION IN SHORT INTERVALS

405

maximum max06h61 |ζ(1/2 + it + ih)| has size at least elog log T −(1/4) log log log T +O(1) as well. We shall revisit this heuristic argument later, but record a few immediate observations. Firstly, the typical size of the maximum derived above is close to elog log T , as √ Θ( log log T ) at a typical point t provided by the Selberg Central opposed to the size e Limit Theorem. So, if the above heuristic is roughly accurate, there should be a real difference between these situations. Note, however, that this size is still much smaller than the regime considered in Theorems 2.3 and 2.4, so we are much less far into the tails of the distribution and can have hopes of a good rigorous analysis of the situation. Another striking contrast is that in the Selberg Central Limit Theorem, the distribution of log |ζ(1/2 + it)| is shown to have mean zero and to vary around this on √ a scale of log log T . In our heuristic for the short interval maximum of log zeta, the random variation occurs on a smaller scale O(1), whilst one has a deterministic main term of size ∼ log log T . Let us also note that Assumption 3, the independence assumption, was only required for the proof of the lower bound. Thus one might suspect, and it will turn out to be the case, that it should be easier to make our heuristic argument rigorous for the upper bound than for the lower bound. As well as proposing the study of Problem 3.1, Fyodorov, Hiary and Keating [10, 11] also made a precise conjecture about the answer. Conjecture 3.2 (Fyodorov–Hiary–Keating, 2012). — For any real function g(T ) that tends to infinity with T , we have that  1 meas 0 6 t 6 T : max log |ζ(1/2+it+ih)|−(log log T −(3/4) log log log T ) 6 g(T ) T |h|61 tends to 1 as T → ∞. In fact, Fyodorov–Hiary–Keating make an even more precise conjecture than this, about the distribution of the difference between max|h|61 log |ζ(1/2 + it + ih)| and (log log T − (3/4) log log log T ). But this seems far beyond anything that is rigorously attackable at present, so we shall not discuss it further here. We also note that the choice of the interval |h| 6 1 is rather arbitrary, and in fact Fyodorov–Hiary–Keating looked primarily at the interval 0 6 h 6 2π, which corresponds more naturally with the random matrix setting. But one will have an analogous conjecture and results for any interval of fixed non-zero length. Fyodorov, Hiary and Keating were led to their conjecture via a two step process, which we shall briefly explain. For given t, in order to understand the behavior

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

406

A.J. HARPER

of max|h|61 log |ζ(1/2 + it + ih)| one might try to compute quantities such as Z Z t+1 e2β log |ζ(1/2+it+ih)| dh = |ζ(1/2 + iw)|2β dw, |h|61

t−1

for varying β > 0. The idea is that as β becomes larger, the size of the integral will be increasingly dominated by the largest values attained by log |ζ(1/2 + it + ih)|. In the language of mathematical physics, this kind of integral is the partition function associated with log |ζ(1/2 + it + ih)|. Since we are interested in what happens as t varies, we could further try to understand this by computing quantities such as åq Z T ÇZ t+1 |ζ(1/2 + iw)|2β dw

0

dt,

t−1

where now q > 0 is a further parameter. For given β, if we can understand the size of these integrals for all (or many) q we might hope to get a good understanding of the R t+1 distribution of t−1 |ζ(1/2 + iw)|2β dw. And in turn, if one can understand this for suitable β one might hope to get a good understanding of max|h|61 log |ζ(1/2+it+ih)|. To understand how all these objects might behave, Fyodorov, Hiary and Keating turned to the well known idea that ζ(1/2 + it) behaves like the characteristic polynomial of suitable random matrices. In the random matrix setting, they were able to compute the analogous integrals for a certain range of q ∈ N (depending on β), when β < 1. Although this amount of information is not sufficient to rigorously draw conclusions about the maximum, even in the random matrix setting, they noticed that the quantities computed agreed with some analogous integrals arising in statistical mechanics. The Fyodorov–Hiary–Keating conjecture then arises from supposing that characteristic polynomials of random matrices, and further the Riemann zeta function, behave in the way suggested by those statistical mechanics models. We shall not say more about Fyodorov, Hiary and Keating’s motivation for their conjecture, referring the reader instead to the original papers [10, 11], which also describe some interesting numerical evidence. We just note that one of the important features of their statistical mechanics problem is a logarithmic correlation structure, which we shall discuss much further below. We also note that some parts of Fyodorov, Hiary and Keating’s conjectures in the random matrix setting, and about the partition R t+1 function t−1 |ζ(1/2+iw)|2β dw, have recently been proved using ideas related to those we shall describe here. See the papers [1, 4, 17], for example. Conjecture 3.2 suggests that our earlier heuristic analysis isn’t quite right, but almost, since the first order term log log T that we obtained was the same. But this suggestion is a little misleading. As we shall now explain, it is possible to modify the heuristic to give another supporting heuristic for Conjecture 3.2 (and possible to

ASTÉRISQUE 422

(1161)

THE RIEMANN ZETA FUNCTION IN SHORT INTERVALS

407

prove some of this rigorously, as we shall come to later), but this requires quite careful thought about our Assumptions 2 and 3. Recall that we assumed earlier that |ζ(1/2 + it + ih1 )|, |ζ(1/2 + it + ih2 )| are “roughly the same” when |h1 − h2 | 6 1/ log T , and “roughly independent” when |h1 − h2 | > 1/ log T . The reason for these starting assumptions is that when T 6 t 6 2T is large, we have rigorously (the Hardy–Littlewood approximation) that  1  X 1 +O √ , ζ(1/2 + it) = 1/2+it n T n6T and we have heuristically (as in Principle 1.3) that X

log |ζ(1/2 + it)| ≈
1/ log T . To explain this more precisely, note that we can decompose X X X 1 (2) < = < 1/2+it p k−1 k 1/3 06k6log log T p6T

ee

1/ log T , then max06h61 |ζ(1/2 + it + ih)| should be smaller than our initial analysis predicted. This is fully consistent with Conjecture 3.2. There is no such soft argument for determining exactly how much smaller we should expect the maximum to be in the presence of positive correlation, but in recent years the probabilistic tools to do this have become available. Theorem 3.3 (Harper, 2013). — Let (Xp )p prime be a sequence of independent random variables, each distributed uniformly on the complex unit circle. Then with probability tending to 1 as T → ∞, we have X Xp max < > log log T − 2 log log log T − C(log log log T )3/4 1/2+ih |h|61 p p6T and

max
0 is a certain absolute constant.

ASTÉRISQUE 422

p

log log log T ,

(1161)

THE RIEMANN ZETA FUNCTION IN SHORT INTERVALS

409

Theorem 3.4 (Arguin, Belius and Harper, 2017). — Let (Xp )p prime be a sequence of independent random variables, each distributed uniformly on the complex unit circle. Then for any  > 0, with probability tending to 1 as T → ∞ we have X Xp > log log T − (3/4 + ) log log log T max < |h|61 p1/2+ih p6T and

max
0 we have  1 meas 0 6 t 6 T : max log |ζ(1/2 + it + ih)| > (1 − ) log log T → 1 as T → ∞. T |h|61 Theorem 4.2 (Arguin, Belius, Bourgade, Radziwiłł, Soundararajan, 2019) Najnudel’s Theorem is true without the need to assume the Riemann Hypothesis.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

410

A.J. HARPER

Before we turn to the proofs of these results, we make a few explanatory remarks. Najnudel’s paper [16] appeared in preprint form on the arXiv in November 2016, and the independent paper of Arguin, Belius, Bourgade, Radziwiłł and Soundararajan [2], which didn’t require the assumption of the Riemann Hypothesis, was posted to the arXiv in December 2016. Najnudel proves analogous results (assuming RH) for the imaginary part of log ζ(1/2 + it + ih) as well. It is possible, but not certain, that some of these could also be made unconditional using the methods of Arguin, Belius, Bourgade, Radziwiłł and Soundararajan. The upper bounds in Theorems 4.1 and 4.2 are much easier than the lower bounds, and aside from differences in detail are proved in similar ways. Essentially the same argument was also sketched at the end of the introduction to the author’s preprint [13]. If we looked at a discrete maximum over points h = j/ log T with |j| 6 log T , instead of the maximum over a continuous interval |h| 6 1, we could argue that n  o 1 j  meas 0 6 t 6 T : max log ζ 1/2 + it + i > log log T + g(T ) T log T |j|6log T n  o X 1 j  meas 0 6 t 6 T : log ζ 1/2 + it + i 6 > log log T + g(T ) T log T |j|6log T

6

X |j|6log T

1 T

Z 0

T

|ζ(1/2 + it)|2 e2(log log T +g(T ))

dt.

RT It is a classical result of Hardy and Littlewood that 0 |ζ(1/2 + it)|2 dt ∼ T log T as T → ∞, so the right hand side is  e−2g(T ) , which indeed tends to 0 as T → ∞. To pass from the continuous maximum to the discrete maximum, one can just use classical analytic techniques such as the Sobolev–Gallagher inequality (essentially estimating the average size of the derivative of ζ(1/2+it)). See e.g., the paper of Arguin– Belius–Bourgade–Radziwiłł–Soundararajan [2]. Note that this argument is really quite similar to the heuristic one we gave before, with the second moment asymptotic for the zeta function (which is an exponential moment calculation for log |ζ(1/2 + it)|) providing the necessary large deviation estimate for log |ζ(1/2 + it)|. The fact that we don’t get the extra subtracted term −(1/4) log log log T in the rigorous argument reflects a standard inefficiency when bounding large deviation probabilities/measures using exponential moments. To prove the lower bound in Theorem 4.1, Najnudel’s main number theoretic input is a striking estimate of the following shape: if the Riemann Hypothesis is true, and if t is large and 1 6 x  t is a parameter, then  log t X xC  1 + O + . (3) max log |ζ(1/2 + it + ih)| & max < C (log x) t |h|61 |h|61/2 p1/2+it+ih p6x

ASTÉRISQUE 422

(1161)

THE RIEMANN ZETA FUNCTION IN SHORT INTERVALS

411

The reader should compare this with Soundararajan’s upper bound (1). The correct statement of this lower bound is a bit more complicated, in particular the sum P 1 p6x p1/2+it+ih should really be an infinite sum with a smooth cutoff that decays when p > x, and there is some contribution from prime squares as well. But to get an idea of the argument one can just think of (3). As in many similar situations (e.g., Soundararajan’s [19] proof of (1)), Najnudel assumes the Riemann Hypothesis when proving (3) to avoid the appearance of other large terms corresponding to possible zeros of the zeta function off the critical line. This reflects the general duality between prime numbers being well distributed, Euler product type formulae roughly holding, and the zeros of the zeta function being well behaved, as discussed at the very beginning of this paper. The other important thing to note here is the role played by the maximum over h. We have remarked several times that it would be impossible to prove a pointwise lower bound comparable to (1) or (3), because at a zero of the zeta function the prime number sum is finite but log zeta becomes undefined. Roughly speaking, in the course of proving (3) Najnudel exploits the fact that Z log0.99 x max0.99 log |ζ(1/2 + it + ih)| > log |ζ(1/2 + it + ih)|dh. 2 |h|61/ log x |h|61/ log0.99 x On the one hand, one can cover the interval |h| 6 1 by small intervals of length 2/ log0.99 x (with a small error at the ends, hence the change to the interval |h| 6 1/2 on the right hand side of (3)), and hope that replacing the maximum in each small interval by its average (whilst still taking the maximum over all the intervals) won’t reduce the size too much. On the other hand, since an interval of length 2/ log0.99 x is large compared with the average spacing  1/ log t of zeta zeros with imaginary part around t, by integrating over such an interval one smooths out (and removes the effect of) the blow-up at the zeros. The inequality (3) is the manifestation of Principle 1.3 in Najnudel’s argument. Having passed to prime number sums, with some flexibility in the choice of the length x, Najnudel shows that they behave like sums of independent random variables (Principle 1.1) by moment calculations, similarly as discussed following Lemma 1.2. P 1 Thus he can argue about the size of max|h|61/2 < p6x p1/2+it+ih with a similar style of argument, motivated by branching random walk, as Arguin, Belius and Harper [3] used for their randomized model of zeta. For their unconditional lower bound, Arguin, Belius, Bourgade, Radziwiłł and Soundararajan use a result like Proposition 1.4 to serve as their realization of Principle 1.3. The choices of W and P are a bit different than in Proposition 1.4, but the proof is essentially the same as the one we sketched for that proposition. To apply this to give lower bounds for max|h|61 log |ζ(1/2 + it + ih)|, a couple of other auxiliary

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

412

A.J. HARPER

manoeuvers are required. Since Proposition 1.4 concerns points slightly off the critical line, one wants to know that for most t, if there is a large value slightly off the critical line there will also be one nearby on the critical line. This is swiftly proved using, essentially, an average bound for the size of the derivative of zeta, obtained by manipulatP 1 ing the Hardy–Littlewood approximation ζ(1/2 + it) = n6T n1/2+it + O( √1T ). Also, whereas Proposition 1.4 supplies information at most individual points T 6 t 6 2T , Arguin–Belius–Bourgade–Radziwiłł–Soundararajan need results that hold for most intervals [t − 1, t + 1]. This extension is obtained by noting that in the proof of Proposition 1.4, the individual steps (such as the approximation ζ(s)M (s) = 1 + o(1)) hold uniformly for most intervals [t − 1, t + 1], thanks again to classical Sobolev–Gallagher type manipulations. By shifting a little off the critical line, and only seeking to approximate (the shifted version of) max|h|61 log |ζ(1/2 + it + ih)| by prime number sums for most t, Arguin– Belius–Bourgade–Radziwiłł–Soundararajan can avoid Najnudel’s appeal to the Riemann Hypothesis. Having reached this stage, moment calculations with the prime number sums again show that they behave like sums of independent random variables (Principle 1.1), and one can conclude with a branching random walk style argument. We finish with a glance at what remains to be done to prove Conjecture 3.2. Both Theorems 4.1 and 4.2 are less precise than the conjecture, but it seems quite reasonable to think that the methods have not yet been fully perfected, so that more precise results could be extracted. On the other hand, to increase the precision in these methods one needs to approximate the zeta function by prime number sums that are longer, and at points that are closer to the critical line. At a certain point the influence of the zeta zeros, and (more technically) of off-diagonal terms that would start to appear in the analysis, obstructs progress. Because the scale log log T on which one is working grows so slowly with T , one has quite a lot of flexibility in truncating sums, etc. if one just wants to get close to the answer, but this starts to disappear if one wants a precise answer. One particular landmark en route to proving Conjecture 3.2, which might be achievable, would be to prove that usually max log |ζ(1/2 + it + ih)| 6 log log T − c log log log T

|h|61

for some c > 1/4. The conjecture predicts that one can take c = 3/4 + o(1), whereas we have seen (in our initial heuristic argument) that one would get c = 1/4 + o(1) if |ζ(1/2 + it + ih1 )|, |ζ(1/2 + it + ih2 )| behaved “roughly independently” when |h1 − h2 | > 1/ log T . We saw in our later analysis that this shouldn’t really be the

ASTÉRISQUE 422

(1161)

THE RIEMANN ZETA FUNCTION IN SHORT INTERVALS

413

case, and proving an upper bound with some fixed c > 1/4 would give a concrete (if rather subtle) manifestation of this failure of independence. Acknowledgements. — The author would like to thank Louis-Pierre Arguin, Paul Bourgade, and N. Bourbaki for their comments and suggestions on a draft of this paper.

REFERENCES [1] L.-P. Arguin, D. Belius & P. Bourgade – “Maximum of the characteristic polynomial of random unitary matrices,” Comm. Math. Phys. 349 (2017), no. 2, p. 703–751. [2] L.-P. Arguin, D. Belius, P. Bourgade, M. Radziwiłł & K. Soundararajan – “Maximum of the Riemann zeta function on a short interval of the critical line,” Comm. Pure Appl. Math. 72 (2019), no. 3, p. 500–535. [3] L.-P. Arguin, D. Belius & A. J. Harper – “Maxima of a randomized Riemann zeta function, and branching random walks,” Ann. Appl. Probab. 27 (2017), no. 1, p. 178–215. [4] L. P. Arguin, F. Ouimet & M. Radziwiłł – “Moments of the Riemann zeta function on short intervals of the critical line,” preprint arXiv:1901.04061. [5] A. Bondarenko & K. Seip – “Large greatest common divisor sums and extreme values of the Riemann zeta function,” Duke Math. J. 166 (2017), no. 9, p. 1685– 1701. [6]

, “Extreme values of the Riemann zeta function and its argument,” Math. Ann. 372 (2018), nos. 3-4, p. 999–1015.

[7] J. Bourgain – “Decoupling, exponential sums and the Riemann zeta function,” J. Amer. Math. Soc. 30 (2017), no. 1, p. 205–224. [8] R. de la Bretèche & G. Tenenbaum – “Sommes de Gál et applications,” Proc. Lond. Math. Soc. 119 (2019), no. 1, p. 104–134. [9] D. W. Farmer, S. M. Gonek & C. P. Hughes – “The maximum size of L-functions,” J. reine angew. Math. 609 (2007), p. 215–236. [10] Y. V. Fyodorov, G. A. Hiary & J. P. Keating – “Freezing transition, characteristic polynomials of random matrices, and the Riemann zeta-function,” Phys. Rev. Lett. 108 (2012), no. 170601, p. 5 pp. [11] Y. V. Fyodorov & J. P. Keating – “Freezing transitions and extreme values: random matrix theory, and disordered landscapes,” Philos. Trans. R. Soc. Lond. Ser. A Math. Phys. Eng. Sci. 372 (2014), no. 2007, 20120503, 32.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

414

A.J. HARPER

[12] A. J. Harper – “Bounds on the suprema of Gaussian processes, and omega results for the sum of a random multiplicative function,” Ann. Appl. Probab. 23 (2013), no. 2, p. 584–616. [13]

, “A note on the maximum of the Riemann zeta function, and logcorrelated random variables,” preprint arXiv:1304.0677.

[14] N. Kistler – “Derrida’s random energy models. From spin glasses to the extremes of correlated random fields,” in Correlated random systems: five different methods, Lecture Notes in Math., vol. 2143, Springer, 2015, p. 71–120. [15] J. E. Littlewood – “On the zeros of the Riemann zeta-function,” Cambr. Phil. Soc. Proc 22 (1924), p. 295–318. [16] J. Najnudel – “On the extreme values of the Riemann zeta function on random intervals of the critical line,” Probab. Theory Related Fields 172 (2018), nos. 1-2, p. 387–452. [17] E. Paquette & O. Zeitouni – “The maximum of the CUE field,” Int. Math. Res. Not. 2018 (2018), no. 16, p. 5028–5119. [18] M. Radziwiłł & K. Soundararajan – “Selberg’s central limit theorem for log |ζ(1/2 + it)|,” Enseign. Math. 63 (2017), nos. 1-2, p. 1–19. [19] K. Soundararajan – “Moments of the Riemann zeta function,” Ann. of Math. 170 (2009), no. 2, p. 981–993.

Adam J. HARPER Mathematics Institute, Zeeman Building University of Warwick, Coventry CV4 7AL, England E-mail : [email protected]

ASTÉRISQUE 422

Séminaire BOURBAKI 71e année, 2018–2019, no 1162, p. 415 à 435 doi:10.24033/ast.1141

Juin 2019

TRANSITION DE PHASE ABRUPTE EN PERCOLATION VIA DES ALGORITHMES RANDOMISÉS [d’après Duminil-Copin, Raoufi et Tassion] par Marie THÉRET

INTRODUCTION Le modèle de percolation a été introduit par Broadbent et Hammersley [7] dans les années 50 pour modéliser un milieu poreux. Par son étude, on s’attache à comprendre comment la porosité du milieu à une échelle macroscopique, i. e. à l’échelle d’un morceau de roche tout entier, est créée par la circulation de l’eau à un échelle microscopique. Comme on va le voir par la suite, la porosité du milieu est codée dans le modèle par le choix d’un paramètre p ∈ [0, 1]. C’est un modèle très intéressant du point de vue mathématique, car c’est un des modèles les plus simples qu’on puisse imaginer qui présente un phénomène de transition de phase, c’est à dire un changement drastique des propriétés du système lorsque le paramètre p passe par une valeur critique pc . Ce modèle a été intensivement étudié depuis son introduction dans les années 50 et continue à l’être, car il est loin d’être encore complètement compris. En particulier, comprendre le comportement du modèle de percolation lorsque p = pc est un défi que bon nombre de mathématiciens tentent de relever. Dans cet exposé, nous allons nous intéresser à certaines propriétés de la transition de phase dans le modèle de percolation, qui en font une transition qu’on dit abrupte — on reviendra sur ce terme par la suite. Le caractère abrupt de la transition de phase dans le modèle de percolation classique n’est pas nouveau : ce résultat fondamental est connu depuis les années 80 grâce aux travaux de Menshikov [25] d’une part, et d’Aizenman et Barsky [2] d’autre part. Cependant, les deux preuves proposées dans ces travaux utilisent de façon cruciale des propriétés spécifiques du modèle, ce qui les rend inadaptables à d’autres modèles d’intérêt qui sont des variantes ou des généralisation du modèle de percolation classique. C’est pourquoi le besoin d’inventer une nouvelle technique de preuve s’est fait sentir. Face à ce besoin, deux nouvelles techniques de preuves ont été successivement proposées. La première,

© Astérisque 422, SMF 2020

416

M. THÉRET

imaginée par Duminil-Copin et Tassion [13, 14], repose sur le choix d’une définition plus efficacement manipulable du paramètre critique pc . Cette preuve est très élégante et plus robuste que les preuves de Menshikov et d’Aizenman-Barsky, mais bien qu’elle puisse se généraliser à certains modèles proches du modèle de percolation classique, son application à nombre de modèles d’intérêt restait impossible. La deuxième, proposée tout récemment par Duminil-Copin, Raoufi et Tassion [12, 10, 11], repose sur l’utilisation d’algorithmes randomisés. C’est à cette dernière technique de preuve que nous nous intéressons ici. L’objectif de Duminil-Copin, Raoufi et Tassion étant d’étendre la preuve du phénomène de transition de phase abrupte à d’autres modèles que le modèle de percolation classique, c’est dans le cadre de ces autres modèles qu’ils ont rédigé leurs travaux. L’adaptation de leur méthode à tel ou tel modèle présente des difficultés (éventuellement importantes) propres au modèle considéré. Plutôt que de s’intéresser aux différences qui séparent donc les preuves proposées dans les articles [12, 10, 11], notre objectif est au contraire de faire apparaître leur similitude. Pour ce faire, nous allons appliquer leur méthode dans le cas le plus simple, c’est à dire que nous allons exposer la preuve du caractère abrupte de la transition de phase via des algorithmes randomisés dans le cadre de la percolation classique. Nous utiliserons dans cette preuve certains outils mathématiques sans les démontrer (inégalité OSSS, formule de Russo).

1. LE MODÈLE DE PERCOLATION Le modèle de percolation se construit sur un graphe. Ici nous nous intéresserons exclusivement au graphe G = (V, E) de sites V = Zd et d’arêtes E qui désigne l’ensemble des arêtes reliant des sites à distance euclidienne égale à 1. Le paramètre d ∈ N∗ représente la dimension de l’espace ambiant, et sera dans toute la suite une constante fixée satisfaisant d ≥ 2. Nous nous donnons également un paramètre p ∈ [0, 1]. Aux arêtes de E, nous associons une famille de variables aléatoires (ωe )e∈E indépendante et de même loi la loi de Bernoulli de paramètre p. Une arête e est dite ouverte si ωe = 1, et fermée si ωe = 0. Plus formellement, on se donne un espace d’états Ω = {0, 1}E , dont tout élément ω = (ωe )e∈E est appelé une configuration de percolation. On considère F la σ-algèbre des sous-ensembles de Ω générée par les cylindres fini-dimensionnels. Finalement, on Q se donne sur (Ω, F ) la mesure produit Pp = e∈E µe où µe est la mesure de Bernoulli sur {0, 1} définie par µe (ωe = 1) = p = 1 − µe (ωe = 0). On notera Ep l’espérance associée à cette probabilité.

ASTÉRISQUE 422

(1162)

TRANSITION DE PHASE ABRUPTE EN PERCOLATION

417

Une telle configuration ω ∈ Ω peut être vue comme un sous-graphe Gω du graphe G, de sites V = Zd et d’arêtes {e ∈ E | ωe = 1} l’ensemble des arêtes ouvertes pour la configuration ω. Le modèle que nous venons de décrire, abusivement appelé dans l’introduction de cet exposé modèle de percolation classique, correspond plus précisément au modèle dit de percolation de Bernoulli i.i.d. par arêtes sur Zd . L’étude du modèle de percolation correspond à l’étude du graphe aléatoire Gω ainsi construit, en particulier à ses propriétés de connectivité. En effet, gardons en tête que la percolation modélise un milieu poreux. Vu sous cet angle, les arêtes ouvertes du graphe correspondent à des petits tuyaux microscopiques qui laissent circuler l’eau dans la roche. Le paramètre p correspond à la densité de ces petits tuyaux, donc quantifie la porosité de la roche. Pour que l’eau puisse s’infiltrer dans la roche et la traverser à grande échelle, il faut donc que des points arbitrairement éloignés dans le graphe soient connectés dans Gω , qui correspond au réseau de tuyaux microscopiques. Introduisons quelques notations. Pour x, y ∈ V , on notera {x ↔ y} l’évènement « x et y sont connectés dans Gω ». On notera {x ↔ Y } l’évènement « x est connecté à un site y ∈ Y ∩V » (pour Y ⊂ Rd ), {X ↔ Y } l’évènement « un site x ∈ X∩V est connecté à un site y ∈ Y ∩ V dans Gω » (pour X, Y ⊂ Rd ), et {x ↔ ∞} l’évènement « la composante connexe de x dans Gω est infinie ». On notera également Λn = [−n, n]d la boîte centrée en l’origine 0 du graphe et de taille n ∈ N∗ . Le résultat fondateur dans l’étude du modèle de percolation est l’existence d’une transition de phase, prouvée par Broadbent et Hammersley [7] et Hammersley [18, 19]. Ce résultat peut s’énoncer comme suit. Théorème 1.1 (Transition de phase). — Pour tout d ≥ 2, il existe un paramètre critique pc = pc (d) ∈ ]0, 1[ tel que : • si p < pc , alors Pp (0 ↔ ∞) = 0 ; • si p > pc , alors Pp (0 ↔ ∞) > 0. On notera dans la suite θ(p) = Pp (0 ↔ ∞). Le fait que p 7→ θ(p) soit croissant est une conséquence simple du fait qu’on peut facilement coupler les processus de percolation pour tous les paramètres p ∈ [0, 1] à la fois. On a trivialement θ(0) = 0 et θ(1) = 1. La partie intéressante du théorème est le fait que 0 < pc < 1, ce qui implique l’existence d’une phase sous-critique correspondant à p < pc et d’une phase sur-critique correspondant à p > pc , séparées par la phase critique correspondant à p = pc . Ce théorème peut en fait être renforcé comme ceci (voir par exemple la preuve de Burton et Keane [9]). Théorème 1.2 (Existence et unicité de la composante connexe infinie) Pour tout d ≥ 2, il existe un paramètre critique pc = pc (d) ∈ ]0, 1[ tel que :

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

418

M. THÉRET

• si p < pc , alors Pp -p.s. il n’existe pas de composante connexe infinie dans Gω ; • si p > pc , alors Pp -p.s. il existe une unique composante connexe infinie dans Gω . L’existence d’une composante connexe infinie ne dépend pas de la configuration de percolation sur un ensemble fini d’arêtes, donc la probabilité de cet évènement vaut 0 ou 1 par la loi du 0 − 1. La difficulté de ce résultat est de montrer l’unicité p.s. de la composante connexe infinie dans la phase sur-critique. Deux questions qui viennent naturellement en tête à la lecture de ce théorème sont d’une part quelle est la valeur de pc , et d’autre part quelles sont les propriétés du graphe Gω pour p = pc . Ce sont en fait des questions auxquelles il est très difficile de répondre. Pour d = 2, nous savons grâce aux travaux de Harris [20], Russo [27], Seymour et Welsh [29] et Kesten [22] que pc (2) = 1/2 et que pour p = 1/2 p.s. il n’existe pas de composante connexe infinie dans Gω . Ces deux questions sont ouvertes pour d = 3, et prouver l’absence de composante connexe infinie dans la phase critique de percolation en dimension 3 est un des problèmes ouverts majeurs du domaine. Nous ne pouvons pas présenter ici l’étendue des résultats connus sur le modèle de percolation classique, et nous renvoyons le lecteur intéressé au livre de Grimmett [17] qui fait référence sur le sujet.

2. UNE TRANSITION DE PHASE ABRUPTE Nous avons défini le paramètre critique de percolation pc en nous intéressant au comportement de Pp (0 ↔ ∞). On peut réécrire cette probabilité de deux façons différentes. D’une part, l’évènement {0 ↔ ∞} est l’intersection des évènements emboîtés {0 ↔ ∂Λn }, où ∂Λn désigne le bord de la boîte Λn = [−n, n]d de taille n centrée en l’origine, donc Pp (0 ↔ ∞) = lim Pp (0 ↔ ∂Λn ), n→∞

ce qui implique que pc = sup{p ∈ [0, 1] : lim Pp (0 ↔ ∂Λn ) = 0}. n→∞

Nous manipulerons beaucoup les probabilités qui apparaissent ici, et nous utiliserons les notations suivantes : pour tout p ∈ [0, 1] et pour tout n ∈ N∗ , θn (p) = Pp (0 ↔ ∂Λn ) et θ(p) = Pp (0 ↔ ∞) = limn→∞ θn (p). D’autre part, si on note C la composante connexe de 0 dans Gω , et |C| le nombre de sites dans C, l’évènement {0 ↔ ∞} peut aussi se réécrire sous la forme {|C| = ∞}, d’où Pp (0 ↔ ∞) = Pp (|C| = ∞)

ASTÉRISQUE 422

(1162)

TRANSITION DE PHASE ABRUPTE EN PERCOLATION

419

et pc = sup{p ∈ [0, 1] : |C| < ∞ p.s.}. À la lumière de ces réécritures, on se rend compte que d’autres définitions de paramètres critiques, un peu différentes, peuvent s’avérer tout aussi pertinentes, en particulier pˆc = sup{p ∈ [0, 1] : Ep [|C|] < ∞} et p˜c = sup{p ∈ [0, 1] : lim Pp (Λn ↔ ∂Λ2n ) = 0}. n→∞

Une question d’importance est dès lors de savoir si ces différentes définitions sont équivalentes, c’est à dire s’il y a égalité des points critiques pc = pˆc = p˜c . Outre l’intérêt de la question en soi, il faut préciser que certaines propriétés du modèle ne sont prouvées que sous l’hypothèse Ep [|C|] < ∞ ou limn→∞ Pp (Λn ↔ ∂Λ2n ) = 0, et donc l’égalité des points critiques permet d’étendre les propriétés en question à toute la phase sous-critique p < pc . La réponse à cette question est positive, il y a bien égalité des points critiques : Théorème 2.1 (Égalité des points critiques). — Pour tout d ≥ 2, on a l’égalité suivante : pc = pˆc = p˜c . Dans le modèle de percolation de Bernoulli i.i.d. par arêtes sur Zd (d ≥ 2), l’égalité des points critiques a été démontrée pour la première fois dans les années 80 indépendamment par Menshikov [25] et Aizenman et Barsky [2]. Une présentation complète des deux preuves se trouve dans le livre de Grimmett [17]. La preuve de l’égalité des points critiques repose en fait sur l’étude de la décroissance des probabilités de connexion en régime sous-critique. En effet, pour p < pc , on sait que θn (p) := Pp (0 ↔ ∂Λn ) tend vers θ(p) = 0 quand n tend vers l’infini, mais à quelle vitesse ? Ces mathématiciens ont montré que cette décroissance est exponentiellement rapide en n : c’est ce qu’on appelle un phénomène de transition de phase abrupte (sharp en anglais). Théorème 2.2 (Décroissance exponentielle des probabilités de connexion) Soit p < pc . Il existe une constante c(p) > 0 telle que θn (p) = Pp (0 ↔ ∂Λn ) ≤ e−c(p)n . Ce résultat de décroissance exponentielle des probabilités de connexion est fondamental. Là encore, de nombreuses propriétés du modèle de percolation sont prouvées uniquement sous cette hypothèse de décroissance exponentielle, donc le theorème 2.2 implique qu’elles sont valables pour toute la zone sous-critique de percolation. Par ailleurs, en dimension 2, une partie de la preuve de pc (2) = 1/2 de

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

420

M. THÉRET

Kesten [22] repose sur une construction géométrique délicate ; de nombreuses preuves alternatives ont été proposées depuis, en s’appuyant sur le résultat de décroissance exponentielle des probabilités de connexion (voir [17]). De plus, comme annoncé, le théorème 2.2 implique immédiatement l’égalité des points critiques. Cette implication est simple, et pour en convaincre le lecteur, nous allons présenter la preuve du théorème 2.1 en admettant dans un premier temps le théorème 2.2. Une preuve de pc = pˆc = p˜c . — En remarquant que Ep [|C|] < ∞ implique |C| < ∞ p.s., on obtient immédiatement que pˆc ≤ pc , il suffit donc de montrer que pc ≤ pˆc pour prouver que pˆc = pc . Soit p < pc , en utilisant le théorème 2.2 on obtient X X Pp (x ∈ C) Ep [|C|] = n∈N x∈∂Λn



X X

Pp (0 ↔ ∂Λn )

n∈N x∈∂Λn



X

κ(d)nd−1 e−c(p)n < ∞ ,

n∈N

où κ(d) est une constante dépendant uniquement de la dimension. Ceci implique p ≤ pˆc , ce qui achève la preuve de pˆc = pc . De même, en remarquant que Pp (0 ↔ ∂Λ2n ) ≤ Pp (Λn ↔ ∂Λ2n ), on obtient immédiatement que p˜c ≤ pc . Pour montrer que p˜c = pc , il suffit donc de montrer que p˜c ≥ pc . Soit p < pc . On peut décomposer l’évènement {Λn ↔ ∂Λ2n } en l’union sur x ∈ ∂Λn ∩ Zd des évènements {x ↔ ∂Λ2n }. Pour tout x ∈ ∂Λn , la boîte Λn (x) = [x − n, x + n]d centrée en x et de taille n est incluse dans Λ2n . On en déduit que tout chemin ouvert qui relie x à ∂Λ2n doit sortir de Λn (x). On obtient, en utilisant l’invariance du graphe par translation et le théorème 2.2, X Pp (Λn ↔ ∂Λ2n ) ≤ Pp (x ↔ ∂Λ2n ) x∈∂Λn ∩Zd



X x∈∂Λn

Pp (x ↔ ∂Λn (x))

∩Zd

≤ κ(d)nd−1 Pp (0 ↔ ∂Λn ) ≤ κ(d)nd−1 e−c(p)n −→ 0. n→∞

On en déduit que p ≤ p˜c , et donc pc ≤ p˜c , ce qui achève la preuve de l’égalité des points critiques. L’objet de cet exposé est de présenter la preuve du théorème 2.2 en suivant la méthode proposée par Duminil-Copin, Raoufi et Tassion [12, 10, 11]. Pour ce faire, nous devons introduire la notion d’arbres de décision, et l’inégalité OSSS, qui jouent un rôle crucial dans leur preuve.

ASTÉRISQUE 422

(1162)

TRANSITION DE PHASE ABRUPTE EN PERCOLATION

421

3. L’INÉGALITÉ OSSS Soit N ∈ N∗ , et E un ensemble à N éléments. Soit f une fonction booléenne définie sur {0, 1}E à valeurs dans {0, 1}. Un arbre de décision associé à f est un algorithme qui prend une configuration ω ∈ {0, 1}E comme donnée, et qui choisit un par un des éléments e ∈ E pour explorer la valeur de ωe . Le choix du prochain élément e pour lequel l’algorithme va révéler la valeur de ωe dépend de la fonction booléenne f , des éléments de E déjà choisis et des valeurs correspondantes de la configuration déjà révélées. L’algorithme se poursuit jusqu’à ce que l’ensemble des valeurs de la configuration déjà révélées permettent de connaître la valeur de f (ω). Cet arbre de décision peut être choisi aléatoire, on parle alors d’algorithme randomisé. Les arbres de décisions, éventuellement aléatoires, sont largement utilisés et étudiés en informatique (voir par exemple l’article de synthèse [8]), mais aussi en mathématiques. On peut citer par exemple l’usage d’arbres de décisions aléatoires par Schramm et Steif [28] pour l’étude de la sensibilité au bruit de fonctions booléennes, et son application à l’étude de la percolation (voir aussi le livre de Garban et Steif [15] pour les liens entre théorie de la percolation et étude des fonctions booléennes). Nous introduisons à présent quelques notations en collant au plus près de celles qui apparaissent dans [11]. Pour un N -uplet e = (e1 , . . . , eN ) de E N et t ≤ N , on note e[t] = (e1 , . . . , et ) et ωe[t] = ω(e1 ,...,et ) = (ωe1 , . . . , ωet ). Un arbre de décision va toujours commencer par choisir le même premier élément fixé e1 de E , et va observer ωe1 . En fonction de la valeur de ωe1 , l’algorithme choisit ensuite un deuxième élément e2 ∈ E différent de e1 , et observe à son tour ωe2 . À chaque étape de l’algorithme, le prochain élément de E qui va être choisi peut dépendre de tous les éléments déjà choisis et de la valeur de la configuration observée en chacun de ces éléments. Si les éléments choisis par l’algorithme aux étapes 1 à t − 1 ≤ N − 1 sont notés (e1 , . . . , et−1 ), l’élément et choisi par l’algorithme à l’étape t est une fonction déterministe de tout ce que l’algorithme a déjà exploré auparavant :  et = φt (e1 , . . . , et−1 ), ω(e1 ,...,et−1 ) ∈ E \ {e1 , . . . , et−1 }. Un arbre de décision T est donc la donnée d’un couple T = (e1 , (φt )2≤t≤N ) où e1 est le premier élément de E que l’algorithme choisit, et (φt )2≤t≤N est la suite des règles de décision appliquées par l’algorithme pour choisir les éléments de E qu’il va successivement explorer. Étant donné un arbre de décision T = (e1 , (φt )2≤t≤N ) et une configuration ω ∈ {0, 1}E , on peut numéroter les éléments de E dans l’ordre dans lequel ils sont explorés par T pour obtenir un N -uplet (e1 , . . . , eN ). Étant donnée également une fonction booléenne f : {0, 1}E 7→ {0, 1}, on définit τf,T (ω) = inf{t ≥ 1 : ∀ω 0 ∈ {0, 1}E , ωe0 [t] = ωe[t] ⇒ f (ω) = f (ω 0 )}.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

422

M. THÉRET

C’est le nombre minimum t d’étapes de l’algorithme à effectuer pour connaître la valeur de f (ω) en observant uniquement les valeurs de ω(e1 ,...,et ) déjà révélées par l’algorithme. Autrement dit, si on fait tourner l’algorithme T pour connaître la valeur prise par f , on arrêtera l’algorithme après τf,T (ω) étapes. Munissons à présent l’espace {0, 1}E de la σ-algèbre complète P ({0, 1}E ) et Q d’une mesure de probabilité produit µ ˆ = e∈E µ ˆe . L’importance (pour la mesure µ ˆ) de la valeur de la configuration ω en un élément e ∈ E au regard de la fonction booléenne f peut être quantifiée par deux grandeurs. D’une part, étant donné un arbre de décision T qu’on arrête après τf,T étapes, on peut regarder la probabilité que la valeur ωe de la configuration en e ait été révélée par l’algorithme : c’est la révélation (revealment en anglais) δe (f, T ) de e, définie formellement par δe (f, T ) = µ ˆ[∃t ≤ τf,T (ω) : et = e]. D’autre part, l’influence de e sur f est définie par Inf e (f ) = µ ˆ[f (ω) 6= f (ω e )] où ω e est la configuration égale à ω en tout élément sauf en e, i. e. ωge = ωg pour tout g ∈ E \ {e} et ωee = 1 − ωe . L’influence Inf e (f ) est donc la probabilité que changer la valeur de la configuration uniquement en e change la valeur prise par la fonction f . L’inégalité OSSS, introduite par O’Donnell, Saks, Schramm et Servedio dans [26], relie la variance de f pour la mesure produit µ ˆ à l’influence et la révélation des éléments de E . Théorème 3.1 (Inégalité OSSS). — Pour tout fonction booléenne f : {0, 1}E 7→ {0, 1}, pour toute probabilité produit µ ˆ, pour tout arbre de décision T , on a X Varµˆ (f ) ≤ δe (f, T ) Inf e (f ). e∈E

Nous ne démontrerons pas ici cette inégalité, dont la preuve repose sur un argument de type Efron-Stein. Le lecteur intéressé pourra consulter la preuve proposée dans [26], ou la preuve d’une généralisation de l’inégalité OSSS à des mesures qui ne sont pas de forme produit dans [11]. Revenons à l’étude du modèle de percolation de Bernoulli i.i.d. par arêtes sur Zd . Pour prouver le caractère abrupt de la transition de phase, c’est à dire le théorème 2.2, nous devons étudier le comportement pour n grand de la probabilité θn (p) := Pp (0 ↔ ∂Λn ). L’évènement An = {0 ↔ ∂Λn } qui apparaît ici ne dépend des valeurs prises par la configuration de percolation que sur les arêtes à l’intérieur de la boîte Λn . Étant donné un entier n ∈ N∗ , nous voulons donc appliquer l’inégalité OSSS dans le cadre suivant :

ASTÉRISQUE 422

(1162)

TRANSITION DE PHASE ABRUPTE EN PERCOLATION

423

• E = En est l’ensemble des arêtes dont les deux extrémités sont incluses dans la boîtes Λn = [−n, n]d ; • la mesure produit µ ˆ est (la restriction à En de) la mesure Pp ; • la fonction booléenne fn : {0, 1}E 7→ {0, 1} est la fonction fn = 1An = 1{x↔∂Λn } . Si on se donne un arbre de décision T , une application directe de l’inégalité OSSS (théorème 3.1) implique X δe (fn , T ) Inf e (fn ) VarPp (fn ) ≤ e∈En

c’est à dire (1)

θn (p)(1 − θn (p)) ≤

X

δe (fn , T ) Inf e (fn ).

e∈En

Si l’utilisation d’arbres de décision et de la notion de révélation en percolation est novatrice, la notion d’influence d’une arête a par contre été déjà largement utilisée, notamment à travers la formule de Russo que nous allons énoncer à présent. Il est à noter que la formule de Russo était déjà un élément clé des preuves de la décroissance exponentielle des probabilités de connexion proposées par Menshikov [25] et Aizenman et Barsky [2]. Soit A un évènement ne dépendant des valeurs prises par la configuration ω que sur un ensemble fini d’arêtes E . On dit que l’évènement A est croissant si pour tout couple de configurations (ω, ω 0 ) tel que pour toute arête e on a ωe ≥ ωe0 , alors 1A (ω) ≥ 1A (ω 0 ). Autrement dit, la réalisation de l’évènement A est facilitée par la présence d’arêtes ouvertes : si A est réalisé pour une certaine configuration ω 0 , et qu’on ouvre des arêtes supplémentaires pour obtenir une configuration ω (en gardant ouvertes toutes les arêtes qui l’étaient déjà), alors l’évènement A sera également réalisé pour la configuration ω. On dit qu’une arête e est pivot pour l’évènement A si 1A (ω) 6= 1A (ω e ) ; l’influence Inf e (1A ) de e sur l’évènement A est donc égale à la probabilité que e soit une arête pivot pour A. La formule de Russo permet de relier la dérivée en p de Pp (A) à l’espérance du nombre aléatoire N (A) d’arêtes pivots dans E pour A, c’est à dire à la somme des influences des arêtes. Théorème 3.2 (Formule de Russo). — Soit A un évènement croissant ne dépendant de la configuration de percolation que sur un ensemble fini d’arêtes E . Alors X d Pp (A) = Ep [N (A)] = Inf e (1A ). dp e∈E

On trouvera une preuve simple de la formule de Russo dans le livre de Grimmett [17], nous l’admettons ici.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

424

M. THÉRET

L’évènement An ne dépend que des arêtes de En et il est croissant, on peut donc lui appliquer la formule de Russo. Puisque θn (p) désigne Pp (An ), on obtient X X Inf e (fn ). (2) θn0 (p) = Inf e (1An ) = e∈En

e∈En

En combinant l’inégalité OSSS (1) et la formule de Russo (2), pour tout arbre de décision T on obtient Å ã (3) θn (p)(1 − θn (p)) ≤ max δe (fn , T ) θn0 (p). e∈E

L’enjeu est alors de choisir un arbre de décision T pour lequel la révélation δe (fn , T ) est petite, uniformément pour e ∈ E . Imaginons un instant que pour un arbre de décision T bien choisi nous ayons la majoration uniforme maxe∈En δe (fn , T ) ≤ 1/n pour tout p < pc . Alors on obtiendrait pour p < pc , en combinant (3) et la majoration θn (p) ≤ θ1 (pc ), l’inégalité θn (p)(1 − θ1 (pc )) ≤ θn (p)(1 − θn (p)) ≤ max δe (fn , T ) · θn0 (p) ≤ e∈En

1 0 θ (p), n n

d’où θn0 (p) ≥ (1 − θ1 (pc ))n. θn (p) En intégrant cette inégalité sur [p, pc ] (pour p < pc ) on obtiendrait θn (p) ≤ θn (pc )e−(1−θ1 (pc ))n ≤ e−(1−θ1 (pc ))n et donc la décroissance exponentielle désirée. Nous ne pouvons pas obtenir la majoration uniforme annoncée pour un choix d’algorithme T , mais une version un peu plus élaborée de ce raisonnement peut être rendue rigoureuse en moyennant les révélations des arêtes calculées sur une famille d’arbres de décision Tk , k ∈ {0, . . . , n}.

4. LA PREUVE La preuve du théorème 2.2 se déroule en deux étapes : • La première étape consiste à appliquer l’inégalité OSSS pour des choix judicieux d’arbres de décision (voir lemme 4.1), de façon à obtenir via la formule de Russo une famille d’inégalités différentielles satisfaites par les fonctions θn (p). C’est cette étape qui concentre la partie probabiliste de la preuve. • La deuxième étape consiste à exploiter ces inégalités différentielles pour en déduire des propriétés de θn (p) (voir lemme 4.2). Ce lemme est purement analytique.

ASTÉRISQUE 422

(1162)

TRANSITION DE PHASE ABRUPTE EN PERCOLATION

425

Commençons par la partie probabiliste de la preuve. On rappelle que pour n ∈ N∗ , on a adopté les notations suivantes : Λn = [−n, n]d , En désigne l’ensemble des arêtes dont les deux extrémités sont dans Λn , An = {0 ↔ ∂Λn }, fn = 1An et θn (p) = Pp (An ). Lemme 4.1. — Pour tout n ∈ N∗ , on a θn (p)(1 − θn (p)) ≤

4

Pn−1 k=0

n

θk (p)

θn0 (p).

Nous voulons appliquer l’inégalité OSSS à un arbre de décision T choisi pour obtenir un contrôle de δe (fn , T ) uniforme en e ∈ En . L’algorithme va découvrir si les arêtes de En sont ouvertes ou fermées les unes après les autres jusqu’à ce qu’il puisse déterminer de façon certaine si l’évènement An = {0 ↔ ∂Λn } a lieu ou non. Le premier algorithme auquel on peut penser est d’explorer la composante connexe de l’origine 0 dans le graphe aléatoire Gω en partant de l’origine et en s’éloignant vers le bord de Λn : l’algorithme choisit d’abord l’une après l’autre les 2d arêtes qui touchent 0 et explore la valeur de la configuration ω sur ces arêtes. Si elles sont toutes fermées, alors l’évènement An n’a pas lieu. Sinon, l’algorithme a trouvé l’ensemble des points qui sont à distance de graphe 1 de l’origine dans Gω . Il choisit ensuite un de ces points dans un ordre fixé à l’avance, et choisit d’explorer chacune des arêtes adjacentes à ce point encore non révélées, puis de proche en proche soit l’algorithme finit par révéler un chemin d’arêtes ouvertes entre 0 et ∂Λn (auquel cas An a lieu), soit l’algorithme finit par déterminer complètement la composante connexe de 0 dans Gω sans avoir atteint un site de ∂Λn (auquel cas An n’a pas lieu). Dans cet algorithme, la probabilité de révéler l’état de la configuration d’une arête loin de l’origine est assez faible. Par contre, les 2d arêtes qui touchent 0 sont choisies à coup sûr, leur révélation vaut donc 1. On peut alors imaginer un algorithme qui part des sites de ∂Λn et qui explore leurs composantes connexes dans Gω en choisissant progressivement des arêtes de plus en plus proches de 0. Dans ce cas, la situation est inversée, les arêtes proches de 0 ont peu de chances d’être révélées, mais les arêtes qui touchent ∂Λn ont une révélation qui vaut 1. L’idée proposée par Duminil-Copin, Raoufi et Tassion pour contourner ce problème est simple : ils choisissent d’abord un nombre K uniformément entre 1 et n, puis ils construisent un arbre de décision qui explore les composantes connexes des sites de ∂ΛK dans Λn . L’évènement An a lieu si et seulement si au moins une de ces composantes connexe touche à la fois 0 et un site de ∂Λn . De façon équivalente, ils définissent pour chaque k ∈ {1, . . . , n} un arbre de décision Tk qui explore les composantes connexes des sites de ∂Λk , ils appliquent l’inégalité OSSS à chacun des arbres de décision Tk , et ils moyennent les résultats obtenus. La révélation moyenne d’une arête e est alors bien contrôlée, uniformément en e.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

426

M. THÉRET

Preuve du lemme 4.1. — Soit n ∈ N∗ . Pour tout k ∈ {1, . . . , n}, nous allons définir un arbre de décision Tk qui explore les composantes connexes des points de ∂Λk dans Λn . Pour ce faire, nous allons définir par récurrence une suite croissante (Vi )i≥0 d’ensembles de sites dans Λn ∩ Zd et une suite croissante (Fi )i≥0 d’ensembles d’arêtes dans En . On pose V0 = ∂Λk ∩ Zd et F0 = ∅. Après t étapes de l’algorithme, Ft représente l’ensemble des arêtes dont l’état a été révélé et Vt l’ensemble des sites dont on sait, grâce à ces arêtes déjà explorées, qu’ils sont reliés par un chemin ouvert à un site de ∂Λk . On note et l’arête choisie par l’algorithme à la t-ième étape, c’est à dire que l’algorithme révèle la valeur de ωet . On se donne un ordre déterministe fixé sur les arêtes de En . On note hx, yi l’arête d’extrémités x et y. Si V0 = ∂Λk ∩ Zd ⊂ V1 ⊂ · · · ⊂ Vt et F0 = ∅ ⊂ F1 ⊂ · · · ⊂ Ft sont connus, l’algorithme choisit à l’étape t + 1 l’arête et+1 comme suit : (i) S’il existe une arête e = hx, yi ∈ En \ Ft telle que x ∈ Vt et y ∈ / Vt , alors on choisit et+1 = e (si plus d’une telle arête existe, on choisit la plus petite pour l’ordre qu’on s’est donné), Ft+1 = Ft ∪ {et+1 } et ( Vt ∪ {y} si ωe = 1, Vt+1 = Vt si ω0 = 0. (ii) Si une telle arête e n’existe pas, on définit et+1 comme étant la plus petite arête de En \ Ft et on pose Ft+1 = Ft ∪ {et+1 } et Vt+1 = Vt . Tant que l’algorithme est dans le cas (i), il continue de découvrir quels sont les sites qui sont connectés à ∂Λk . Il bascule dans le cas (ii) lorsque les composantes connexes des sites de ∂Λk ont toutes été entièrement explorée. En notant τT0 k (ω) = inf{t : @ e = hx, yi ∈ En \ Ft avec x ∈ Vt et y ∈ / Vt } le numéro de la dernière étape dans laquelle l’algorithme est encore dans le cas (i), on a pour tout t ≥ τT0 k (ω) Vt = Vτ 0 (Tk ) = {x ∈ Λn ∩ Zd : x ↔ ∂Λk }. On se souvient que τfn ,Tk (ω) est le premier instant auquel l’algorithme Tk a collecté suffisamment d’informations sur la configuration ω pour déterminer si l’évènement An = {0 ↔ ∂Λn } a lieu. Si An n’a pas lieu, l’algorithme Tk permet de le savoir dès que les composantes connexes des sites de ∂Λk ont toutes été entièrement explorées, c’est à dire précisément juste avant que l’algorithme ne tombe dans le cas (ii). Si l’évènement An a lieu, l’algorithme Tk permet de le savoir dès qu’un chemin ouvert d’arêtes reliant 0 à ∂Λn a été révélé, c’est à dire au plus tard juste avant que l’algorithme ne tombe dans le cas (ii) (éventuellement bien avant cela). Dans tous les cas, on peut en déduire que τfn ,Tk (ω) ≤ τT0 k (ω).

ASTÉRISQUE 422

(1162)

TRANSITION DE PHASE ABRUPTE EN PERCOLATION

427

Une arête e = hx, yi de En ne peut être choisie par l’algorithme à une étape u ≤ τfn ,Tk (ω) que si au moins une de ses extrémités x ou y appartient à l’ensemble Vu−1 ⊂ Vτ 0 (Tk ) = {x ∈ Λn ∩ Zd : x ↔ ∂Λk }. Ainsi pour toute arête e = hx, yi on obtient (4)

δe (fn , Tk ) ≤ Pp ({x ↔ ∂Λk } ∪ {y ↔ ∂Λk }) ≤ Pp (x ↔ ∂Λk ) + Pp (y ↔ ∂Λk ).

Pour tout site x = (x1 , . . . , xd ) ∈ Λn ∩ Zd , on remarque que l’évènement {x ↔ ∂Λk } implique l’évènement {x ↔ ∂Λ||x1 |−k| (x)} où Λr (x) = [x − r, x + r]d est la boîte de taille r centrée en x, car ∂Λk n’intersecte pas l’intérieur de la boîte Λ||x1 |−k| (x). De plus, pour tout x ∈ Λn ∩Zd et k ∈ {1, . . . , n}, ||x1 |−k| est à valeurs dans {0, . . . , n−1}, et lorsque k décrit l’ensemble {1, . . . , n}, chaque valeur i ∈ {0, . . . , n − 1} est atteinte au plus deux fois par ||x1 | − k|. On en déduit que pour tout x ∈ Λn ∩ Zd on a n X

Pp (x ↔ ∂Λk ) ≤

k=1

n X

Pp (x ↔ ∂Λ||x1 |−k| (x))

k=1

≤2

(5)

n−1 X

Pp (x ↔ ∂Λi (x)) = 2

n−1 X

Pp (0 ↔ ∂Λi ),

i=0

i=0

où on a utilisé l’invariance du modèle par translation dans la dernière égalité. En combinant (4) et (5), on en déduit que pour toute arête e ∈ En , (6)

n X

δe (fn , Tk ) ≤ 4

k=1

n−1 X

Pp (0 ↔ ∂Λi ) = 4

n−1 X

i=0

θi (p).

i=0

En appliquant l’inégalité OSSS (théorème 3.1) à chaque arbre de décision Tk et en sommant les inéquations obtenues pour k ∈ {1, . . . , n}, on déduit de (6) que é !Ñ n−1 X X nθn (p)(1 − θn (p)) ≤ 4 θk (p) Inf e (fn ) k=0

e∈En

ce qui, avec l’application directe (2) de la formule de Russo, conclut la preuve du lemme 4.1. Le lemme 4.1 établit que la famille de fonctions (θk (p)) satisfait une famille d’inégalités différentielles, que le lemme suivant va nous permettre d’exploiter. Lemme 4.2. — Soit (gn ) une suite convergente de fonctions gn : [0, p0 ] 7→ [0, M ] croissantes et dérivables telle que pour tout n ∈ N∗ on a n (7) gn0 ≥ Pn−1 gn . k=0 gk Alors il existe p1 ∈ [0, p0 ] tel que (i) pour tout p < p1 , il existe c(p) > 0 tel que pour tout n assez grand, on a gn (p) ≤ e−c(p)n ;

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

428

M. THÉRET

(ii) pour tout p > p1 , g = limn→∞ gn satisfait g(p) ≥ p − p1 . La preuve est complètement indépendante du reste de l’exposé. Il est à noter que la preuve de Menshikov [25] de la décroissance exponentielle des probabilités de connexion en régime sous-critique faisait apparaître une famille d’inégalités différentielles similaires. Pn−1 Preuve du lemme 4.2. — Notons Sn = k=0 gk . On définit ß ™ log(Sn (p)) p1 = inf p ∈ [0, p0 ] : lim sup ≥1 . log(n) n→∞ Cas p < p1 . — Soit δ > 0 tel que p + 2δ < p1 , on note p0 = p + δ et p00 = p + 2δ. Par définition de p1 , on a log(Sn (p00 )) lim sup < 1, log(n) n→∞ donc il existe α > 0 et N tels que pour tout n ≥ N on a Sn (p00 ) ≤ n1−α . Par croissance de chaque fonction gk , on en déduit que pour tout n ≥ N et pour tout q ∈ [0, p00 ], on a également Sn (q) ≤ n1−α . D’après l’hypothèse (7), gn0 ≥ ngn /Sn donc pour tout n ≥ N et pour tout q ∈ [0, p00 ] on obtient gn0 (q) ≥ nα gn (q). En intégrant cette inégalité sur l’intervalle [p0 , p00 ], il ressort que pour tout n ≥ N  p00 δnα = (p00 − p0 )nα ≤ log(gn (q)) p0 , α

donc gn (p0 ) ≤ gn (p00 )e−δn pour tout n ≥ N . Puisque les fonctions gk sont bornées α par M , cela implique que gn (p0 ) ≤ M e−δn pour tout n grand, donc S(p0 ) := P∞ 0 k=0 gk (p ) < ∞. Par croissance et positivité des fonctions gk , on obtient que pour tout q ≤ p0 , pour tout n ∈ N∗ , Sn (q) ≤ Sn (p0 ) ≤ S(p0 ), et donc par l’hypothèse (7) on obtient gn0 (q) ≥ ngn (q)/S(p0 ). En intégrant cette inégalité sur [p, p0 ] on obtient  p0 nδ ≤ log(gn (q)) p 0 S(p ) 0

0

et donc gn (p) ≤ gn (p0 )e−nδ/S(p ) ≤ M e−nδ/S(p ) . Cas p > p1 . — Pour tout n ∈ N∗ , on définit la fonction n

Tn =

1 X gi . log(n) i=1 n

D’après l’hypothèse (7), on a n

(8)

ASTÉRISQUE 422

Tn0 =

n

1 X gi0 1 X gi ≥ . log(n) i=1 n log(n) i=1 Si

(1162)

TRANSITION DE PHASE ABRUPTE EN PERCOLATION

429

Or pour tout q ∈ [0, p0 ] on a (9)

gi (q) Si+1 (q) − Si (q) = ≥ Si (q) Si (q)

Z

Si+1 (q)

Si (q)

dt = log(Si+1 (q)) − log(Si (q)). t

En combinant les inégalités (8) et (9) on obtient Tn0

n   1 X 1 ≥ log(Si+1 ) − log(Si ) = log(Sn+1 ) − log(g0 ) . log(n) i=1 log(n)

Soit p0 ∈ ]p1 , p[. Par croissance et positivité des fonctions gk , et en bornant g0 par M , on obtient pour tout q ∈ [p0 , p]   1 1 log(Sn+1 (p0 )) − log(M ) ≥ log(Sn (p0 )) − log(M ) . Tn0 (q) ≥ log(n) log(n) En intégrant cette inégalité sur [p0 , p] on en déduit que (10)

Tn (p) − Tn (p0 ) ≥

 p − p0 log(Sn (p0 )) − log(M ) . log(n)

Puisque la suite gn converge vers une fonction limite qu’on note g, on montre Pn facilement (en comparant Tn à ( i=1 gi /i)/ log(n)) que Tn converge également vers g. En prenant la lim sup en n de l’inégalité (10), et en utilisant le fait que p0 > p1 , on en déduit que g(p) − g(p0 ) ≥ (p − p0 ) lim sup n→∞

log(Sn (p0 )) ≥ p − p0 . log(n)

0

En faisant tendre p vers p1 , on obtient g(p) ≥ p − p1 , ce qui achève la démonstration du lemme 4.2. Grâce à ces deux lemmes, nous pouvons en fait obtenir le théorème suivant, qui inclut le résultat de décroissance exponentielle annoncé dans le théorème 2.2, mais également un contrôle de θ(p) = limn→∞ θn (p) pour p > pc . Théorème 4.3. — Soit d ≥ 2. Dans le modèle de percolation de Bernoulli i.i.d. par arêtes sur Zd , on a les résultats suivants : (i) Pour tout p < pc (d), il existe c(p) > 0 tel que pour tout n ∈ N on a θn (p) ≤ e−c(p)n ; (ii) Il existe c > 0 tel que pour tout p > pc (d), on a θ(p) := limn→∞ θn (p) ≥ c(p − pc (d)). Preuve du théorème 4.3. — En combinant le résultat du lemme 4.1 et la majoration θn (p) ≤ θ1 (p0 ) pour p ≤ p0 < 1, on obtient pour p ≤ p0 n 4 θ0 (p) ≥ Pn−1 θn (p). 1 − θ1 (p0 ) n k=0 θk (p)

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

430

M. THÉRET

On peut donc appliquer le lemme 4.2 à la suite de fonctions (gn ) où gn : [0, p0 ] 7→ [0, 1] est définie par gn (p) = κ(p0 )θn (p) avec κ(p0 ) = 4/(1 − θ1 (p0 )). On en déduit immédiatement l’existence d’un paramètre p1 ∈ [0, p0 ] tel que • pour tout p ∈ [0, p1 [, il existe c(p) > 0 tel que pour tout n ∈ N on a θn (p) ≤ κ(p0 )−1 e−c(p)n ≤ e−c(p)n ; • pour tout p ∈ ]p1 , p0 ], on a θ(p) := limn→∞ θn (p) ≥ κ(p0 )−1 (p − p1 ). Ainsi p < p1 implique θ(p) = 0 tandis que p ∈ ]p1 , p0 ] implique θ(p) > 0, donc p1 = pc par définition de pc dès qu’on choisit p0 > pc (dans le cas contraire, p1 = p0 et la deuxième propriété est sans objet). Pour p0 > pc fixé, on obtient pour tout p ∈ ]pc , p0 ] la minoration θ(p) ≥ κ(p0 )−1 (p − pc ), mais par monotonie pour tout p ≥ p0 on a aussi θ(p) ≥ θ(p0 ), d’où l’existence d’une constante c > 0 telle que pour tout p > pc on a θ(p) ≥ c(p − pc ). Ceci conclut la preuve du théorème 4.3.

5. APPLICATIONS DE CETTE MÉTHODE Les preuves antérieures de la décroissance exponentielle de θn (p) avec n pour p < pc (théorème 2.2) et de l’égalité des points critiques (théorème 2.1), proposées par Menshikov [25], par Aizenman et Barsky [2] et par Duminil-Copin et Tassion [13, 14], reposaient de façon cruciale sur l’inégalité BK (prouvée par van den Berg et Kesten [4]). Pour vérifier l’inégalité BK, un modèle doit présenter de fortes propriétés d’indépendance. Ainsi, l’égalité des points critiques et la décroissance exponentielle des probabilités de connexion étaient conjecturées dans de nombreux modèles de mécanique statistique, sans que les techniques de preuves précédemment connues ne puissent les démontrer. Il est à noter qu’en dimension 2, des résultats (égalité des points critiques, décroissance rapide des probabilités de connexion, mais aussi calcul de points critiques) ont été prouvés pour tout une variété de modèles planaires (voir [5, 3, 1]) en utilisant notamment d’autres inégalités sur les fonctions booléennes comme l’inégalité BKKKL ([21, 6]) et ses généralisations (voir [30, 16]). Nous ne présenterons pas ici ces résultats, très spécifiques à la dimension 2. Duminil-Copin, Raoufi et Tassion ont déjà appliqué la technique de preuve présentée ici pour obtenir les résultats équivalents dans les modèles suivants, que nous allons présenter de manière très informelle. La FK-percolation. — Il s’agit d’une généralisation du modèle de percolation par arêtes i.i.d. sur Z pour d ≥ 2, dans laquelle dans une boîte finie Λ la probabilité de voir une Q configuration ω est proportionnelle à pk(ω) e∈Λ pωe (1 − p)1−ωe , où k(ω) désigne le nombre de composantes connexes du graphe aléatoire défini par ω (je passe ici sous silence les questions de choix des conditions aux bords de la boîte Λ). Ce modèle doit

ASTÉRISQUE 422

(1162)

TRANSITION DE PHASE ABRUPTE EN PERCOLATION

431

son nom à Fortuin et Kasteleyn qui l’ont introduit à la fin des années 60 pour unifier les modèles de percolation, d’Ising et de Potts (d’autres modèles de mécanique statistique particulièrement étudiés que nous ne présenterons pas ici), et il est généralement appelé random-cluster model en anglais. Il présente également une transition de phase à q fixé quand p varie à un paramètre critique pc (q, d). Dans [11], Duminil-Copin, Raoufi et Tassion prouvent la décroissance exponentielle des probabilités de connexion en régime sous-critique et l’égalité des points critiques pour tout paramètre q ≥ 1. Pour q = 1 on retrouve le modèle de percolation i.i.d. par arêtes sur Zd , où ces résultats étaient connus par [25, 2, 13, 14]. Pour tout q entier, le modèle de FK-percolation est en correspondance avec le modèle de Potts à q couleurs. Les résultats obtenus dans [11] s’appliquent donc aussi au modèle de Potts, pour lequel ils n’étaient connus (en dehors de la dimension 2) que dans le cas q = 2 ([2, 13]) qui correspond au modèle d’Ising, et q grand ([23]). La preuve s’applique également au modèle de FK-percolation sur des graphes plus généraux (graphes quasi-transitifs, avec des poids sur les arêtes), et inclue donc aussi le modèle de FK-percolation sur Zd avec des interactions à portée finie, ce qui revient à ajouter des arêtes entre tout couple de points à une distance inférieure ou égale à un paramètre fini fixé. La difficulté supplémentaire principale de la preuve, par rapport au cas simple présenté dans cet exposé, est que la mesure étudiée n’est pas sous forme produit, donc Duminil-Copin, Raoufi et Tassion doivent commencer par généraliser l’inégalité OSSS à une classe plus large de mesures. La formule de Russo, qui ne s’étend pas au modèle de FK-percolation, est remplacée dans cette preuve par une formule plus robuste. La percolation de Voronoï. — Il s’agit d’un modèle de percolation continue dans Rd (d ≥ 2), dans lequel on jette des points dans Rd suivant un processus ponctuel de Poisson homogène η d’intensité 1. À chaque point x ∈ η, on associe sa cellule C(x) comme étant l’ensemble des points de Rd qui sont plus proches de x que de tout autre point de η. On colorie alors chaque cellule C(x) pour x ∈ η en noir avec probabilité p ou en blanc avec probabilité 1 − p —cela revient à colorier chaque point de η, et à étendre la couleur choisie à toute la cellule de ce point— et on regarde les propriétés de percolation (existence d’une composante connexe non bornée, etc.) du sous-ensemble de Rd formé des points coloriés en noir. Ce modèle présente une transition de phase à un paramètre critique pc (d). Dans [10], Duminil-Copin, Raoufi et Tassion montrent la décroissance exponentielle de la probabilité de connexion en régime sous-critique, ce qui n’était pas connu en dehors de la dimension 2. Pour ce faire, ils doivent discrétiser l’espace pour pouvoir appliquer l’inégalité OSSS à un espace produit. L’aspect délicat de la preuve est dans la construction de l’arbre de décision et le contrôle de la probabilité que l’algorithme révèle les couleurs des points de η, dans la mesure où la couleur d’un point fixé de Rd peut dépendre de la couleur d’un point du processus η très éloigné de lui.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

432

M. THÉRET

Le modèle booléen. — Il s’agit d’un autre modèle de percolation continue dans Rd (d ≥ 2), dans lequel on jette des points dans Rd suivant un processus ponctuel de Poisson homogène η d’intensité λ > 0, puis on centre en chaque point x ∈ η une boule de rayon aléatoire Rx , de sorte que les rayons des boules sont i.i.d. Le modèle booléen Σ est l’union de toutes les boules ainsi créées. À loi des rayons ν fixée, on peut regarder les propriétés de connexion de Σ (existence d’une composante connexe non bornée, etc.) en fonction du paramètre λ. Ce modèle présente une transition de phase à un paramètre critique λc (ν, d). Dans [12], Duminil-Copin, Raoufi et Tassion prouvent l’égalité des points critiques dans ce modèle, sous l’hypothèse que la loi ν des rayons des boules admet un moment d’ordre 5d − 3. Cette hypothèse de moment est sûrement non optimale, mais une hypothèse de moment est par ailleurs nécessaire puisque si ν n’admet pas un moment d’ordre d alors le modèle est dégénéré au sens où Σ = Rd p.s. Dans ce modèle, la difficulté principale pour appliquer la technique de preuve est que la notion d’influence et de points pivots ne sont plus si facilement liés. Les auteurs doivent donc prouver de façon assez délicate un lien entre les influences qui apparaissent dans l’application de l’inégalité OSSS avec la dérivée de la fonction θ. Par ailleurs, la décroissance exponentielle des probabilités de connexion est fausse si la queue de distribution de la loi ν des rayons n’a pas elle-même une décroissance exponentielle. Duminil-Copin, Raoufi et Tassion arrivent en fait à appliquer leur méthode en supposant que les points critiques ne sont pas égaux, et n’obtiennent par cette approche une preuve de la décroissance exponentielle que dans la fenêtre entre les paramètres critiques, concluant ainsi à une absurdité et donc à l’égalité des points critiques. Ils doivent alors à nouveau travailler pour étudier la vitesse de décroissance des probabilités de connexion en fonction de la queue de distribution de ν. Ces résultats (décroissance exponentielle des probabilités de connexion, égalité des points critiques) n’étaient connus en dehors de la dimension 2 que dans le cas de rayons bornés ([32, 24, 31]). Comme nous l’avons déjà dit, la décroissance exponentielle des probabilités de connexion est un outil crucial dans le calcul de points critiques pour des modèles planaires, plus précisément pour montrer que la valeur du point critique prédite par dualité est la bonne. Ainsi, les travaux de Duminil-Copin, Raoufi et Tassion permettent de démontrer ou re-démontrer les valeurs des paramètres critiques des modèles étudiés dans le cas particulier d = 2 : pour le modèle de FK-percolation √ √ sur Zd , pc (q, 2) = q/(1 + q) (les auteurs obtiennent en fait une caractérisation du point critique sur des graphes planaires plus généraux) ; pour la percolation de Voronoï, pc (2) = 1/2. Les trois modèles que nous venons d’introduire présentent tous des corrélations à longue portée. La stratégie de preuve présentée ici a le potentiel de s’appliquer à

ASTÉRISQUE 422

(1162)

TRANSITION DE PHASE ABRUPTE EN PERCOLATION

433

d’autres modèles, même si comme on a pu le constater son adaptation présente des difficultés différentes pour chaque modèle considéré.

RÉFÉRENCES [1] D. Ahlberg, V. Tassion & A. Teixeira – Sharpness of the phase transition for continuum percolation in R2 , Probab. Theory Related Fields 172 (2018), nos 12, p. 525–581. [2] M. Aizenman & D. J. Barsky – Sharpness of the phase transition in percolation models, Comm. Math. Phys. 108 (1987), no 3, p. 489–526. [3] V. Beffara & H. Duminil-Copin – The self-dual point of the two-dimensional random-cluster model is critical for q ≥ 1, Probab. Theory Related Fields 153 (2012), nos 3-4, p. 511–542. [4] J. van den Berg & H. Kesten – Inequalities with applications to percolation and reliability, J. Appl. Probab. 22 (1985), no 3, p. 556–569. [5] B. Bollobás & O. Riordan – The critical probability for random Voronoi percolation in the plane is 1/2, Probab. Theory Related Fields 136 (2006), no 3, p. 417–468. [6] J. Bourgain, J. Kahn, G. Kalai, Y. Katznelson & N. Linial – The influence of variables in product spaces, Israel J. Math. 77 (1992), nos 1-2, p. 55– 64. [7] S. R. Broadbent & J. M. Hammersley – Percolation processes. I. Crystals and mazes, Proc. Cambridge Philos. Soc. 53 (1957), p. 629–641. [8] H. Buhrman & R. De Wolf – Complexity measures and decision tree complexity : a survey, Theoretical Computer Science 288 (2002), no 1, p. 21– 43. [9] R. Burton & M. Keane – Density and uniqueness in percolation, Comm. Math. Phys. 121 (1989), no 3, p. 501–505. [10] H. Duminil-Copin, A. Raoufi & V. Tassion – Exponential decay of connection probabilities for subcritical Voronoi percolation in Rd , Probab. Theory Related Fields 173 (2019), nos 1-2, p. 479–490. [11] , Sharp phase transition for the random-cluster and Potts models via decision trees, Ann. of Math. 189 (2019), no 1, p. 75–99. [12] , Subcritical phase of d-dimensional Poisson-Boolean percolation and its vacant set, prépublication arXiv:1805.00695. [13] H. Duminil-Copin & V. Tassion – A new proof of the sharpness of the phase transition for Bernoulli percolation and the Ising model, Communications in Mathematical Physics 343 (2016), no 2, p. 725–745.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

434

[14] [15]

[16] [17] [18] [19]

[20] [21]

[22] [23]

[24]

[25] [26]

[27] [28] [29]

M. THÉRET

, A new proof of the sharpness of the phase transition for Bernoulli percolation on Zd , Enseign. Math. 62 (2016), nos 1-2, p. 199–206. C. Garban & J. E. Steif – Noise sensitivity of Boolean functions and percolation, Institute of Mathematical Statistics Textbooks, vol. 5, Cambridge Univ. Press, 2015. B. T. Graham & G. Grimmett – Influence and sharp-threshold theorems for monotonic measures, Ann. Probab. 34 (2006), no 5, p. 1726–1745. G. Grimmett – Percolation, Grundl. math. Wiss., vol. 321, Springer, 1999. J. M. Hammersley – Percolation processes : Lower bounds for the critical probability, Ann. Math. Statist. 28 (1957), p. 790–795. , Bornes supérieures de la probabilité critique dans un processus de filtration, in Le calcul des probabilités et ses applications. Paris, 15-20 juillet 1958, Colloques Internationaux du Centre National de la Recherche Scientifique, LXXXVII, Centre National de la Recherche Scientifique, 1959, p. 17–37. T. E. Harris – A lower bound for the critical probability in a certain percolation process, Proc. Cambridge Philos. Soc. 56 (1960), p. 13–20. J. Kahn, G. Kalai & N. Linial – The influence of variables on boolean functions, in Proceeding if the 29th Annual Symposium on Foundations of Computer Science, IEEE, 1988. H. Kesten – The critical probability of bond percolation on the square lattice equals 12 , Comm. Math. Phys. 74 (1980), no 1, p. 41–59. L. Laanait, A. Messager, S. Miracle-Solé, J. Ruiz & S. Shlosman – Interfaces in the Potts model. I. Pirogov-Sinai theory of the Fortuin-Kasteleyn representation, Comm. Math. Phys. 140 (1991), no 1, p. 81–91. R. Meester, R. Roy & A. Sarkar – Nonuniversality and continuity of the critical covered volume fraction in continuum percolation, J. Statist. Phys. 75 (1994), nos 1-2, p. 123–134. M. V. Menshikov – Coincidence of critical points in percolation problems, Dokl. Akad. Nauk SSSR 288 (1986), no 6, p. 1308–1311. R. O’Donnell, M. Saks, O. Schramm & R. Servedio – Every decision tree has an influential variable, in Proceedings of 46th Annual IEEE Symposium on Foundations of Computer Science, Pitssburgh, PA, 2005. L. Russo – A note on percolation, Z. Wahrscheinlichkeitstheorie und verw. Gebiete 43 (1978), no 1, p. 39–48. O. Schramm & J. E. Steif – Quantitative noise sensitivity and exceptional times for percolation, Ann. of Math. 171 (2010), no 2, p. 619–672. P. D. Seymour & D. J. A. Welsh – Percolation probabilities on the square lattice, Ann. Discrete Math. 3 (1978), p. 227–245.

ASTÉRISQUE 422

(1162)

TRANSITION DE PHASE ABRUPTE EN PERCOLATION

435

[30] M. Talagrand – On Russo’s approximate zero-one law, Ann. Probab. 22 (1994), no 3, p. 1576–1587. [31] S. Ziesche – Sharpness of the phase transition and lower bounds for the critical intensity in continuum percolation on Rd , Ann. Inst. Henri Poincaré Probab. Stat. 54 (2018), no 2, p. 866–878. [32] S. A. Zuev & A. F. Sidorenko – Continuous models of percolation theory. I, Teoret. Mat. Fiz. 62 (1985), no 1, p. 76–86.

Marie THÉRET Modal’X, UPL Université Paris Nanterre F92000 Nanterre France. E-mail : [email protected]

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

Séminaire BOURBAKI 71e année, 2018–2019, no 1163, p. 437 à 468 doi:10.24033/ast.1142

Juin 2019

MANOLESCU’S WORK ON THE TRIANGULATION CONJECTURE by András I. STIPSICZ

1. INTRODUCTION Simplicial complexes are topological spaces with a simple underlying combinatorial structure. Indeed (in the compact case) such a space can be described by a system of subsets of a finite set—for the precise definition see Section 3. The combinatorial structure allows us to define invariants in a straightforward, computable manner. In particular, simplicial homology (and cohomology) is among the nicest invariants both from the point of view of definition and computation. The local structure of a simplicial complex can be, however, rather complicated—for example, different dimensional simplices might meet at a point. Another convenient class of topological spaces is provided by manifolds, i.e., topological spaces which near every point look like Euclidean spaces. This definition gives a good idea about the local structure of the space, but gives little information about answers to global questions like homologies, etc. It would be optimal to know that topological spaces having simple local structures also have nice global properties. The Triangulation Conjecture asserts exactly that: Conjecture 1.1. — A manifold is homeomorphic to a simplicial complex. The question in this form has been raised in 1926 by Kneser. The answer turned out to be affirmative in dimensions at most three, and for those manifolds of any dimension which admit a smooth structure. The general case, however, stayed open for almost a century. Work of Casson—relying on groundbreaking results of Freedman regarding topological 4-manifolds—showed that in dimension four (where smooth and topological manifolds are known to be more different than in any other dimensions) Conjecture 1.1 is false. Previous experience with the oddity of this particular dimension, however, warned mathematicians to draw any conclusion about the general case.

© Astérisque 422, SMF 2020

438

A. STIPSICZ

Results of Kirby and Siebenman on piecewise linear structures on manifolds helped to put the question into perspective, while results of Galewski-Stern and Matumoto from the late 70s provided a reformulation of the problem in terms of three-manifolds and cobordism properties of those. More precisely (and rather surprisingly) they showed that every closed topological manifold of dimension at least five is triangulable (i.e., homeomorphic to a simplicial complex) if there is a threemanifold Y which is an integral homology sphere (that is, H∗ (Y ; Z) ∼ = H∗ (S 3 ; Z)), admits Rokhlin invariant µ(Y ) equal to 1 (for the definition of µ(Y ), see Subsection 2.1) and the connected sum Y #Y is the boundary of a smooth four-manifold W with H∗ (W ; Z) ∼ = H∗ (D4 ; Z). (Here S 3 denotes the three-dimensional sphere, while D4 stands for the four-dimensional disk.) In studying the Seiberg-Witten equations and invariants, in 2013 Ciprian Manolescu discovered a new set of invariants of three-manifolds, eventually leading him to show Theorem 1.2 ([23]). — If an integral homology three-sphere Y admits µ(Y ) = 1 then Y #Y does not bound an integral homology disk W . Appealing to further related results of Galewski-Stern, this finding then implied Theorem 1.3. — For every dimension n ≥ 5 there is a closed, connected topological n-manifold which admits no triangulation, i.e., it is not homeomorphic to a simplicial complex. This theorem puts an end to a long-standing question; the importance of Manolescu’s result, however, is not limited to his disproof of Conjecture 1.1, it also lies in the way he proved Theorem 1.2. In [23] he defined a version of Seiberg-WittenFloer (or Monopole Floer) homology groups of integral homology spheres, where a further symmetry of the Seiberg-Witten equations have been taken into account. The new homology groups (admitting an integral grading) then allowed him to define new functions on the abelian group Θ3 formed by equivalence classes of integral homology spheres (where the equivalence relation is given by integral homology cobordisms, see Section 2). This approach not only allows us to understand the group Θ3 better, but also provides ways of using further similar theories (as Heegaard Floer homology) to see invariants from a new angle. Soon after the appearance of Manolescu’s work, Francesco Lin found an extension of the invariants to any (spin) three-manifolds, opening the way to further applications. In this paper we will review the definitions of the main concepts listed above, outline the arguments leading to the (dis)proof of the Triangulation Conjecture, and review some of the further results and constructions originating from the groundbreaking

ASTÉRISQUE 422

(1163)

MANOLESCU’S WORK ON THE TRIANGULATION CONJECTURE

439

ideas of Manolescu. The papers of Ciprian Manolescu provide outstanding introductions to the construction and the application of his invariants, see [20, 21, 22, 23]. (1) For this reason, to avoid repetitions we will try to emphasize aspects which appeared in less detail in the literature, and will try to draw attention to the aftermath of Manolescu’s work in Heegaard Floer homology. In this spirit, in Section 2 we collect some of the most fundamental infinite Abelian groups appearing in low dimensional topology and devote a paragraph to infinite Abelian groups in general. In Section 3 we review the basic notions appearing in the Triangulation Conjecture, while in Section 4 we discuss various obstruction classes. Section 5 gives a short recollection of the reformulation of the conjecture in terms of the integral homology cobordism group. Section 6 contains a (very sketchy) outline of the theory producing the novel invariants of Manolescu, leading to the disproof of Conjecture 1.1 in Subsection 6.3. We close our discussion with Section 7, where further directions and developments inspired by Manolescu’s work is given (without the aim of providing a complete picture of this dynamically changing field). Acknowledgements. — The author would like to thank Antonio Alfieri, Francesco Lin, András Némethi, Péter Pál Pálfy and András Szűcs for helpful discussions. He was partially supported by the Élvonal (Frontier) grant KKP126683 of the NKFIH (Hungary) and by the Lendület (Momentum) grant “Low Dimensional Topology” of the Hungarian Academy of Sciences.

2. ABELIAN GROUPS IN LOW DIMENSIONAL TOPOLOGY Certain infinite groups play central role in low dimensional topology. Mapping class groups (groups of isotopy classes of orientation preserving diffeomorphisms of manifolds) are rather mysterious in most dimensions, and even for two-dimensional compact manifolds there are fundamental open questions regarding these groups— although in these cases various presentations of the groups are known. Surprisingly, there are even Abelian groups in low dimensional topology which capture important information, but we do not have a good grasp on their structure. We list some of these below. 2.1. Homology cobordism groups The three-dimensional (oriented) cobordism group Ω3 is trivial (which is just another way to say that any closed, oriented three-dimensional manifold is the boundary (1) The paper [23] was awarded by the Moore prize of the American Mathematical Society in 2019, recognizing this paper as an outstanding research article.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

440

A. STIPSICZ

of a compact, smooth, oriented four-manifold). In a similar manner, Ωspin (the spin 3 cobordism classes of spin three-manifolds) is also trivial. The homology cobordism group Θ3 , however, is highly nontrivial. Indeed, consider those (oriented, closed) three-manifolds for which the first homology group (with integer coefficient) vanishes. These three-manifolds are traditionally called integral homology spheres, and the condition is obviously equivalent to the requirement that for such a three-manifold Y we have H∗ (Y ; Z) = H∗ (S 3 ; Z). The most notable nontrivial example of such a manifold is the Poincaré homology sphere P , given as P = {(z1 , z2 , z3 ) ∈ C3 | z12 + z23 + z35 = 0, k(z1 , z2 , z3 )k = 1}. This smooth three-manifold has fundamental group π1 (P ) a perfect group of order 120, implying H∗ (P ; Z) = H∗ (S 3 ; Z). In defining the group Θ3 , regard two integral homology three-spheres Y1 and Y2 equivalent if there is a smooth, oriented, compact four-manifold X with boundary ∂X = −Y1 ∪ Y2 and with H∗ (X; Z) = H∗ (S 3 × [0, 1]; Z), that is, we assume that the cobordism (up to homology) is like the trivial cobordism. The group structure is given by the connected sum (Y1 , Y2 ) 7→ Y1 #Y2 as addition, the map Y 7→ −Y as inverse (where −Y denotes the same manifold as Y , with the opposite orientation) and S 3 as the identity element. It is not hard to see that the result is an Abelian group. There are simple variants of this construction, for example the rational homology cobordism group ΘQ 3 is defined in a similar manner, with the exception that all homologies are required to be taken with rational coefficients. In particular, a rational homology sphere Y is a closed, oriented three-manifold with H∗ (Y ; Q) = H∗ (S 3 ; Q), which is equivalent to request H1 (Y ; Z) to be a finite group, or to ask the first Betti number b1 (Y ) to vanish. A further common variant of this constrution is the spinc c rational homology cobordism group Θ3Q, spin , where we consider pairs (Y, s) with the property that Y is a rational homology sphere as above, s is a spinc structure on Y , and two such pairs (Y1 , s1 ) and (Y2 , s2 ) are considered to be equivalent if there is a rational homology cobordism X between Y1 and Y2 , together with a spinc structure t on X with the property that t restricts to s1 over −Y1 ⊂ ∂X and to s2 over Y2 ⊂ ∂X. These groups come with natural maps between them: for example there is the spinc Q forgetful map ΘQ, → ΘQ 3 3 , and the natural map Θ3 → Θ3 induced by the fact that every integral homology sphere (and integral homology cobordism) is also a rational homology sphere (and a rational homology cobordism). As the groups introduced above are all Abelian, one can have the impression that their structure is easy to understand (even if for some reason we might not be able to compute them). At first glance is seems possible that Θ3 (similarly to Ω3 and Ωspin ) 3 is indeed trivial. The Rokhlin homomorphism µ : Θ3 → Z/2Z, however shows that

ASTÉRISQUE 422

(1163)

MANOLESCU’S WORK ON THE TRIANGULATION CONJECTURE

441

this is not the case. For defining µ, recall that an integral homology sphere Y (carrying a unique spin structure) is the boundary of a compact spin four-manifold X (as = 0). Simple algebra (see for example [7, Lemma 1.2.20]) shows that the signaΩspin 3 ture σ(X) of such an X is divisible by 8. Rokhlin’s Theorem (stating that a closed spin four-manifold has signature divisible by 16) implies that the mod 2 reduction of 81 σ(X) is independent of the chosen X, hence by defining µ(Y ) ∈ Z/2Z as the mod 2 reduction of 18 σ(X) we get an invariant of Y . This value is obviously a homology cobordism invariant and provides a homomorphism µ : Θ3 → Z/2Z. Simple calculation shows that µ(P ) = 1 for the Poincaré homology sphere P (as it is the boundary of the negative definite E8 -plumbing), hence µ is onto, consequently |Θ3 | ≥ 2. Indeed, for a while it seemed plausible to expect that µ is an isomorphism between Θ3 and Z/2Z. As one of the early applications of the gauge theoretic techniques introduced by S. Donaldson in the study of four-dimensional manifolds, Furuta showed that c

Q, spin Theorem 2.1. — The Abelian groups Θ3 , ΘQ defined above are not 3 and Θ3 finitely generated.

Therefore, despite being Abelian, their structure might be rather intricate. 2.2. Concordance groups Before going any further, we invoke a further similar important group, the group of concordance classes of knots. Let us consider knots in the three-space, i.e., smoothly embedded circles in S 3 . We say that two knots K1 and K2 are concordant, if there is a smoothly and properly embedded annulus (∼ = S 1 × [0, 1]) in S 3 × [0, 1] intersecting the two ends in K1 and K2 , respectively. The resulting Abelian group C (once again, with connected sum as addition, the mirror image as inverse and the unknot representing the identity element) is called the smooth concordance group. As before, this group has a number of variants. The easiest one is when we define the equivalence relation by considering concordances in integral homology cobordisms between the two copies of S 3 ; the resulting group will be a quotient of C . A slightly larger group can be defined by considering knots in integral homology spheres (and the concordances in integral homology cobordisms), or in rational homology spheres (with rational homology cobordisms between them containing the concordances) and even rational homology spheres (and rational homology cobordisms) together with appropriate spinc structures. Once again, there are various natural maps between these constructions. A further variant of C is provided by the fact that in dimension four the application of smooth or merely continuous maps provide drastically different theories. Here, when we use the term ‘continuous’, we really mean ‘locally flat’, that is, the

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

442

A. STIPSICZ

embedding f : C → S 3 × [0, 1] of the concordance C (i.e., an annulus S 1 × [0, 1]) can be presented as the restriction of a continuous embedding F : C × D2 → S 3 × [0, 1] to C × {0} ⊂ C × D2 . Then we define Ctop by considering smoothly embedded knots in S 3 , with the equivalence relation provided by locally flat concordances. Since a smooth embedding is easily seen to be locally flat, we get a natural map φ : C → Ctop . The kernel ker(φ) of this map (those knots which do bound a locally flat disk, but potentially no smooth disk) consists of topologically slice knots; their subgroup is denoted by CT S . Indeed, a nontrivial element in the kernel of φ can be used to construct an exotic smooth structure on the Euclidean four-space R4 , see for example [7]. As in the case of homology cobordism groups, we have Theorem 2.2. — The Abelian groups C and Ctop (as well as their further variants), and even CT S above, are infinitely generated groups. There are connections between these concordance groups and the homology cobordism groups; for example we can define a map C

→ ΘQ 3

by sending the knot K ⊂ S 3 to the three-manifold Σ(K) we get by considering the double branched cover of S 3 branched along K. (For more on the double branched cover construction, see Subsection 7.3.) It is not hard to see that concordant knots map to homology cobordant three-manifolds: the double branched cover of S 3 × [0, 1] (branched along the concordance C) provides a rational homology cobordism between the two double branched covers. This map even admits a lift c

C

→ Θ3Q, spin ,

since the double branched cover (having first homology H1 (Σ(K); Z) of odd order) admits a unique spin, hence a distinguished spinc structure. For more on questions regarding knot concordance, the interested reader is advised to turn to [18]. 2.3. Infinitely generated Abelian groups To put the above groups into perspective, and motivate the most important questions regarding them, we invoke the very basic notions and constructions of infinitely generated Abelian groups. An Abelian group A is divisible if for any element a ∈ A and any natural number n ∈ N there is an element x ∈ A satisfying nx = a. A simple example of a divisible group is the (additive) group Q of rational numbers. A further such group can be defined by fixing a prime p and considering n

Zp∞ = {ζ ∈ S 1 ⊂ C | ζ p = 1 for some n ∈ N}.

ASTÉRISQUE 422

(1163)

MANOLESCU’S WORK ON THE TRIANGULATION CONJECTURE

443

It is not hard to see that divisible groups are exactly the injective modules over the ring Z. (Recall that a module I over a commutative ring R is injective, if for any two R-modules M1 ⊂ M2 a homomorphism M1 → I extends to a homomorphism M2 → I.) In particular, a divisible subgroup of an Abelian group is necessarily a direct summand. We say that the Abelian group is reduced if it contains no nontrivial divisible subgroup. Remark 2.1. — Divisible groups can be classified: any such group is the direct sum of copies of Q and of Zp∞ for various primes. Another important subgroup of an Abelian group A is the subgroup T (A) of torsion elements: T (A) = {a ∈ A | there is n ∈ N∗ with na = 0}. It is not hard to see that T (A) is a subgroup and A/T (A) is torsion free. Notice that T (Zp∞ ) = Zp∞ and T (Q) = 0. Therefore the first two properties we would like to understand for an infinitely generated Abelian group A is — Does A contain torsion elements? — Does Q or Zp∞ embed into A? We do know that the smooth concordance group C contains torsion elements. Indeed, any amphichiral knot (i.e., a knot which is isotopic to its mirror image) has order at most 2 in C . The figure-8 knot is an example of such a knot, which, by a simple application of the Fox-Milnor condition (claiming that a knot trivial in C must have Alexander polynomial ∆(t) of the form f (t) · f (t−1 )) is non-trivial in C . In fact, there is an infinite family of amphichiral knots which are linearly independent in C , and hence span a subgroup isomorphic to (Z/2Z)∞ in C . No torsion besides 2-torsion is known in C , and no information regarding subgroups isomorphic to Q is available either. In the homology cobordism groups we do not have any knowledge about torsion elements—indeed, the Triangulation Conjecture turns out to be equivalent to the existence of some special 2-torsion elements, and this existence problem is the question which has been successfully resolved by Manolescu. Let us return to the possible structures of infinitely generated Abelian groups: assuming that A is reduced and torsion free, we still have plenty of possibilities, and there is very little knowledge about the structures of these groups in general. A simple example of a reduced, torsion free, infinitely generated countable Abelian L∞ group is Z∞ = i=1 Z, but as the next example shows, things can be much more complicated.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

444

A. STIPSICZ

Consider the subgroup A ⊂ Q generated by the elements {p−1 ∈ Q | p prime}. A is obviously not finitely generated: if { stii }ni=1 is a finite set, the subgroup they generate will not include p1 for those primes p which are relatively prime to all t1 , . . . , tn . An element a ∈ A is a rational number st with (s, t) = 1 and t square free. For this reason, A is reduced: for any st ∈ A and n ∈ N∗ at least |s|, the equation n2 x = st admits no solution x in A. Since Q is torsion free, so is A, and since already Z2 does not embed into Q, we have that A is distinct from Z∞ . A simple modification of the above idea leads to (uncountably many) further examples of torsion free, reduced subgroups of Q: let (an ) be a sequence of positive integers, n and define A(an ) as the subgroup of Q generated by the elements p−a , where pn is n the n-th prime. (Our first example is A(1n ) , where (1n ) is the constant 1 sequence.) It is not hard to see that two such groups are isomorphic if and only if there is an automorphism of the Abelian group Q mapping one into the other, which happens if and only if the two sequences differ at most at finitely many places. For this reason, above we have constructed uncountably many different examples. The rank of an Abelian group A is by definition the dimension of A ⊗Z Q as a Q-vector space. All the above examples A(an ) are of rank 1, and indeed, rank 1 reduced, torsion free Abelian groups are classified, and the complete list is only slightly larger than the list of examples provided above (see [34] for the complete argument). On the other hand, very little is known about classification of higher rank groups. It follows from earlier results (stating that Z∞ is a subgroup of all the groups encountered in Sections 2.1 and 2.2) that our geometric/topological examples are all of infinite rank. Another peculiar behavior of infinitely generated Abelian groups is the following example: there exists a rank-3 group G which decomposes as G = A ⊕ B and as / D. (This phenomenon G = C ⊕ D with A, B, C, D indecomposable, A ∼ = C but B ∼ = is reminiscent to the four-dimensional diffeomorphism between the blow-up of S 2 ×S 2 and the double blow-up of the complex projective space CP 2 .) The details of this example can be found in [34, Section 3.1]. To show that a reduced, torsion free countable Abelian group is free (so in the countable case is isomorphic to Z∞ ), it is sufficient to verify that every finite rank subgroup of it is free. Alternatively, a reduced, torsion free countable group A is free if for every element 0 6= x ∈ A there is a homomorphism ϕ : A → Z with ϕ(x) 6= 0. To conclude this section we would like to point out that the first two questions (whether a group A contains torsion elements or subgroups isomorphic to Q) cannot be studied through homomorphisms into Z, since all such elements will be in the kernel. Therefore it is most desirable to — either find homomorphisms to finite fields (or groups) and to Q—naturally with the property that these homomorphisms do not factor through Z—, or

ASTÉRISQUE 422

(1163)

MANOLESCU’S WORK ON THE TRIANGULATION CONJECTURE

445

— find maps on the infinitely generated Abelian groups at hand mapping to Z but which are not homomorphisms, or — find maps with very different range (such as groups, or modules) which can be used ot detect (or exclude) the presence of torsion and a copy of Q in the Abelian group at hand. The significance of Manolescu’s work (besides the disproof of the Triangulation Conjecture) is the discovery of maps Θ3 → Z which fail to be homomorphisms, so allow us to study phenomena we could not study before.

3. TRIANGULATIONS, SIMPLICIAL COMPLEXES AND MANIFOLDS In this section we recall the basic notions and concepts playing fundamental roles in the Triangulation Conjecture, starting with simplicial complexes and manifolds. 3.1. Simplicial complexes Suppose that V is a finite, nonempty set. Let 2V denote the power set, i.e., the set of all subsets of V . A nonempty set S ⊂ 2V is a simplicial complex on V if A ∈ S and B ⊂ A(⊂ V ) implies that B ∈ S , that is, S is closed under containment. Also, it S is customary to assume that A∈S A = V , meaning that each point of V is actually used. The connection between the above combinatorial concept and topology is given by the following construction. Order V as V = {v1 , . . . , vn }, consider the vector space R|V | and associate to vi ∈ V the i-basis vector ei in R|V | (which is represented by the |V |-tuple with 0’s except at the i-slot, where it is 1). For a subset U ⊂ V we can associate the convex hull of those ei ’s in R|V | for which the corresponding vi is in U . Then the body B(S ) of the simplicial complex S is the union of the simplices in R|V | associated to elements of S in the above way. Definition 3.1. — Suppose that X is a compact topological space. A triangulation of X is a pair of a (finite) simplicial complex (V, S ), together with a homeomorphism ϕ : B(S ) → X. Simplicial homology (with Z/2Z coefficients) can be easily phrased in terms of S ; consider the vector space Ci over Z/2Z generated by all elements A ∈ S with |A| = i + 1 and define the boundary map ∂i : Ci → Ci−1

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2020

446

A. STIPSICZ

on A ∈ S with |A| = i + 1 by the formula X ∂i (A) = A \ {a} ∈ Ci−1 . a∈A

Then the simplicial homology of X is defined as Hi (X; Z/2Z) = ker(∂i )/im (∂i+1 ). This simple and conceptually clear definition then provides an invariant which is easy to calculate. Of course, in order this definition to make sense for a general topological space X we need an existence and a uniqueness result: 1. (Existence) every compact topological space is homeomorphic to the body of a finite simplicial complex, and 2. (Uniqueness) any compact space X admits essentially a unique triangulation. Counterexamples for the first statement (the Triangulability Question) have been found shortly after the above formalism has been found, hence this way of defining homology groups does not apply to all topological spaces. The Triangulation Conjecture asserts that maybe for topological manifolds the answer for the existence question is yes. As Manolescu’s recent results shows, this is not the case. Regarding the second question, it is immediately clear that we cannot expect strict uniqueness, since any simplex can be refined by the baricentric subdivision into further simplices. The meaningful question is called the Hauptvermutung (“Main Conjecture” in German), and is the following: do any two triangulations of a topological space X admit common refinement? Then the proof of homology groups being well-defined would hinge on the fact that the simplicial homology of a simplicial complex and of its refinement are isomorphic. While this second step is a simple exercise, the Hauptvermutung was open for quite some time, finally disproved by Milnor. In conclusion, the approach for defining homologies through triangulations does not always work. This led to the development of singular chains and singular homology, where no extra structure on the topological space is needed, and therefore one does not need to prove independence from choices. Nevertheless, the simplicity of the definition of singular homology comes with a price: direct computations can be performed only for very simple topological spaces. Despite the shortcomings of simplicial complexes, these structures stayed of central importance in topology, leaving the Triangulation Conjecture as one of the most intriguing open questions in manifold topology. 3.2. Smooth, PL and topological manifolds A topological space X is a topological manifold if it is — Hausdorff (also called T2 , requiring that for any two points x, y ∈ X there are disjoint open sets Ux , Uy ⊂ X such that x ∈ Ux and y ∈ Uy ),

ASTÉRISQUE 422

(1163)

MANOLESCU’S WORK ON THE TRIANGULATION CONJECTURE

447

— second countable (also called M2 , meaning that there is a countable set of open sets {Ui }∞ i=1 in X such that every open set can be written as a union of some of the Ui ’s) and — every point x ∈ X admits a neighborhood U which is homeomorphic to Rn through a map φU : U → Rn for some n. (If X is connected, then the invariance of dimension of Euclidean spaces implies that n is the same for all points of X.) Such a neighborhood U is called a chart around x ∈ X. Notice that if U and V are two charts, then on their intersection we have the restrictions of φU and φV , hence we get an identification of two open sets in Rn through φU ◦φ−1 . These functions are usually called the transition functions, V | φV (U ∩V )

and we will denote them by ψU V . A collection of charts A =