Séminaire Bourbaki. Volume 2011/2012. Exposés 1043–1058 2856293719, 9782856293713

200 62 20MB

English; French Pages 556 [595] Year 2013

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

Séminaire Bourbaki. Volume 2011/2012. Exposés 1043–1058
 2856293719, 9782856293713

Table of contents :
1. LE PROBLÈME DE LA RESTRICTION POUR LES GROUPES DE LIE COMPACTS CONNEXES
2. MONOÏDE, CÔNE ET GROUPE DE LA RESTRICTION
3. THÉORIE GÉOMÉTRIQUE DES INVARIANTS
4. LE CÔNE DE LA RESTRICTION
5. COMPLÉMENTS ET QUESTIONS OUVERTES
Références
INTRODUCTION
1. Problème à N corps et système de Vlasov-Poisson
2. Propriétés du système de Vlasov-Poisson
3. Le problème linéarisé
4. La stabilité non-linéaire
5. Conclusion et problèmes ouverts
Références
INTRODUCTION
1. Un algorithme d'approximation pour MAX CUT
2. Programmation semi-définie
3. Algorithmes d'approximation pour SPARSEST CUT
4. MAX ACYCLIC SUBGRAPH et l'inégalité de Grothendieck
5. Difficulté d'approximation
6. Le cas de MAX CUT
7. Hiérarchies
8. Conclusion
Références
1. Existence globale et explosion: un problème modèle
2. Extraction de profils, explosion et existence globale
Références
INTRODUCTION
1. Linear (or Rademacher) type and cotype
2. Metric type and a non-linear 1 theorem
3. Smoothness, convexity and martingale type
4. Markov type and cotype and extensions of Lipschitz maps
5. Metric cotype and the non-linear Maurey-Pisier Theorem
6. The non-linear Dvoretzky Theorem
References
0. INTRODUCTION
1. Formule intégrale
2. Groupe fondamental pro-unipotent et cohomologie
3. Le cas de P1-{0,1,}
4. Les multizêtas motiviques
5. Motifs de Tate mixte
6. L'espace (2,3) de fonctions sur 1(X;1,0)dR
7. Structure de l'adhérence d'orbite MdR
8. Esquisses de preuves
Références
1. INTRODUCTION
2. Previous work of other authors
3. Background: n-diagrams and binary quartic forms
4. Proof of the theorem on 2-Selmer groups
Acknowledgements
References
INTRODUCTION: LE THÉORÈME DE LEFSCHETZ DIFFICILE
1. Dictionnaire
2. Stratégie de la démonstration
3. Fibrés de Higgs sauvages et fibrés méromorphes plats à singularités irrégulières
3.0. Convention
3.1. Fibrés de Higgs sauvages
3.2. Fibrés plats à singularités irrégulières
3.3. La condition « sauvage et bon »
3.4. Fibrés harmoniques sauvages (et bons)
4. Correspondance de Hitchin-Kobayashi sauvage
4.1. Filtrations paraboliques et métriques adaptées
4.2. La filtration de Deligne-Malgrange
4.3. Construction d'une métrique harmonique adaptée
5. Prolongement de fibrés harmoniques sauvages
5.1. Les problèmes du prolongement
5.2. Fibrés holomorphes hermitiens acceptables
5.3. Acceptabilité des fibrés harmoniques sauvages et bons
5.4. Prolongement à fixé
5.5. Prolongement à variable
6. D-modules avec structure de twisteur sauvage
6.1. Les cycles proches
6.2. La catégorie des D-modules holonomes avec structure de twisteur polarisable sauvage
6.3. Fin de la démonstration du théorème de Lefschetz difficile
7. Théorie de Hodge sauvage
Références
INTRODUCTION
1. The hyperbolic and radiative properties of the Einstein vacuum equations
2. More precise statement of the result
3. The gauge and the semi-global existence theorem
4. Free data
5. The short pulse ansatz and hierarchy
6. Proof of Theorem 2.1
7. The proof of Theorem 3.1: a first overview
8. Controlling the connection coefficients from curvature
9. Energy estimates for curvature
10. The logic of the proof
11. The Klainerman-Rodnianski relaxed hierarchy
12. Applications to the incompleteness theorems
13. Data at past null infinity I-
14. Completeness of future null infinity and approach to Kerr
15. Epilogue: weak cosmic censorship
16. Acknowledgements
17. Appendix
References
1. INTRODUCTION
2. The Gaussian Free Field (GFF)
3. The Liouville measures eh
4. Ideas behind the proof of the main Theorem
References
INTRODUCTION
1. Klainerman's vector fields method
2. Normal forms
3. The space time resonance approach
4. Compatible forms, null condition and transparency in other contexts
References
1. INTRODUCTION
2. Higher-order Fourier analysis and Szemerédi's theorem
3. Linear configurations in the primes
4. Polynomial progressions in the primes
5. Concluding remarks
References
1. Introduction : la conjecture VH et ses amies
2. Construction d'une surface à partir de pantalons
3. Démonstration du théorème 1.1
4. Démonstration du théorème 2.14
5. Démonstration du théorème 2.16
6. Applications et généralisations
Appendice : mélange exponentiel du flot des repères
Références
Introduction
1. Un peu de théorie des modèles
2. Types
3. Espaces chapeautés et énoncé du théorème principal
4. Esquisse de la preuve
Références
INTRODUCTION
1. Corps et algèbres perfectoïdes
2. Espaces adiques et perfectoïdes
3. Topologie étale et théorème de presque pureté
4. Espaces adiques et perfectoïdes toriques
5. La conjecture monodromie-poids
Références
Introduction
1. Résultat principal
2. Exemples et applications
3. La mesure aléatoire b
4. Le feuilletage aléatoire expVb
5. Mesures conditionnelles sur les feuilles instables
6. Dynamique mesurée et flot horocyclique
7. L'argument de dérive
Remerciements
Références
Table par noms d'auteurs

Citation preview

352

ASTÉRISQUE

XXXXXXXXXXFIRSTPAGEXXXXXXXXXX

2013

SÉMINAIRE BOURBAKI VOLUME 2011/2012 EXPOSÉS 1043-1058

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Astérisque est un périodique de la Société Mathématique de France. Numéro 352

Comité de rédaction Damien Gaboriau Michael Harris Fabrice Planchon Pierre Schapira Bertrand Toen

Ahmed Abbes Viviane Baladi Laurent Berger Gérard Besson Philippe Biane Hélène Esnault Éric Vasserot (dir.) Diffusion Maison de la SMF Case 916 - Luminy 13288 Marseille Cedex 9 France [email protected]

Hindustan Book Agency O-131, The Shopping Mall Arjun Marg, DLF Phase 1 Gurgaon 122002, Haryana Inde

AMS P.O. Box 6248 Providence RI 02940 USA www.ams.org

Tarifs Abonnement

Vente au numéro : 94 e ($ 141) Europe : 485 e, hors Europe : 523 e ($ 784)

Des conditions spéciales sont accordées aux membres de la SMF. Secrétariat : Nathalie Christiaën Astérisque Société Mathématique de France Institut Henri Poincaré, 11, rue Pierre et Marie Curie 75231 Paris Cedex 05, France Tél : (33) 01 44 27 67 99 • Fax : (33) 01 40 46 90 96 [email protected]



http://smf.emath.fr/

© Société Mathématique de France 2013 Tous droits réservés (article L 122–4 du Code de la propriété intellectuelle). Toute représentation ou reproduction intégrale ou partielle faite sans le consentement de l’éditeur est illicite. Cette représentation ou reproduction par quelque procédé que ce soit constituerait une contrefaçon sanctionnée par les articles L 335–2 et suivants du CPI.

ISSN 0303-1179 ISBN 978-2-85629-371-3 Directrice de la publication : Aline BONAMI

352

ASTÉRISQUE 2013

SÉMINAIRE BOURBAKI VOLUME 2011/2012 EXPOSÉS 1043-1058

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Association des collaborateurs de Nicolas Bourbaki. École normale supérieure, 45, rue d’Ulm, F-75230 Paris Cedex 05. URL : http://www.bourbaki.ens.fr

Mots-clefs et classification mathématique par sujets (2000) Exposé no 1043. — Orbites coadjointes, représentations des groupes de Lie compacts, représentations des groupes algébriques réductifs, théorie géométrique des invariants, variétés de drapeaux — 14L24, 14M15, 17B08, 20G05, 22E46. Exposé no 1044. — Vlasov-Poisson, système stellaire auto-gravitant, champ moyen, stabilité orbitale, réarrangement, Hamiltonien, nonlinéaire, équation aux dérivées partielles, concentration-compacité — 35xx, 35Qxx, 35Q83, 37xx, 37Nxx, 37N20, 82xx, 82Cxx, 85xx, 85Axx. Exposé no 1045. — Algorithme d’approximation, difficulté d’approximation, plongement métrique, programmation semi-définie, choix social — 05C12, 05C85, 46N10, 68Q17, 68R10, 68W25, 90C22, 91B14. Exposé no 1046. — Équations différentielles partielles — 35Qxx. Exposé no 1047. — Programme de Ribe, espaces métriques, espaces normés, rigidité — 46B85. Exposé no 1048. — Multizêtas, motifs de Tate mixtes, groupe de Galois motivique — 11G99. Exposé no 1049. — Courbe elliptique, rang, groupe de Selmer, forme quartique binaire — 11G05, 11E76. Exposé no 1050. — Fibré holomorphe plat, fibré de Higgs, métrique harmonique, singularités irrégulières, D-module holonome, théorie de Hodge, théorème de Lefschetz difficile — 14J60, 32C38, 53C07. Exposé no 1051. — Relativité générale, trous noirs, équations d’Einstein, surfaces enfermées — 83C57, 83C75, 83C05, 35L67. Exposé no 1052. — Formule de KPZ, gravité quantique, cartes planaires, carte brownienne, champ libre gaussien, mesures de Liouville — 60C05, 60F17, 60-02, 05C10, 05C80, 82B20, 82B05, 82B27. Exposé no 1053. — Résonances en espace temps, existence globale, équations non-linéaires dispersives, condition nulle — 35B34, 35E20, 35B60, 35Q60, 35Q35. Exposé no 1054. — Progression arithmétique, configuration polynomiale, norme d’uniformité, principe de transfert — 11B30, 11N13, 11B25. Exposé no 1055. — Mélange exponentiel du fibré des repères, variétés hyperboliques de dimension 3, groupes quasi-fuchsiens — 57-99, 30F99, 53-99. Exposé no 1056. — Espaces de Berkovich, modération topologique, types stablement dominés — 03C64, 03C65, 03C99, 14G22. Exposé no 1057. — Espaces perfectoïdes, espaces adiques, topologie étale, pureté, monodromie-poids — 11G25, 14F20, 14G20, 14G22. Exposé no 1058. — Groupes de Lie, mesures stationnaires, espaces homogènes, marches aléatoires — 22E40, 37D40, 60B99.

SÉMINAIRE BOURBAKI VOLUME 2011/2012 EXPOSÉS 1043–1058

Résumé. — Ce 64e volume du Séminaire Bourbaki regroupe les textes des seize exposés de synthèse sur des sujets d’actualité effectués pendant l’année 2011/2012 : un d’analyse fonctionnelle, un de complexité d’algorithmes, deux d’équations aux dérivées partielles, quatre de géométrie algébrique, un de géométrie différentielle, un de théorie ergodique, trois de théorie des nombres et trois de physique mathématique. Abstract (Séminaire Bourbaki, volume 2011/2012, exposés 1043–1058) This 64th volume of the Bourbaki Seminar contains the texts of the sixteen survey lectures done during the year 2011/2012: one about functional analysis, one about complexity of algorithms, two on partial differential equations, four on algebraic geometry, one about differential geometry, one about ergodic theory, three on number theory and three other lectures on mathematical physics.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

TABLE DES MATIÈRES

Résumés des exposés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

v

vii

NOVEMBRE 2011 1043 1044

1045 1046

M. BRION — Restriction de représentations et projections d’orbites coadjointes (d’après Belkale, Kumar et Ressayre) . . . . . . . . . . . . . . .

1

C. MOUHOT — Stabilité orbitale pour le système de Vlasov-Poisson gravitationnel (d’après Lemou-Méhats-Raphaël, Guo, Lin, Rein et al.) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

35

P. PANSU — Difficulté d’approximation (d’après Khot, Kindler, Mossel, O’Donnell,...) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

83

P. RAPHAËL — Concentration compacité à la Kenig-Merle . . . . . .

121

JANVIER 2012 1047

K. BALL — The Ribe Programme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

147

1048

P. DELIGNE — Multizêtas, d’après Francis Brown . . . . . . . . . . . . . . .

161

1049

B. POONEN — Average rank of elliptic curves (after Manjul Bhargava and Arul Shankar) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

187

C. SABBAH — Théorie de Hodge et correspondance de HitchinKobayashi sauvages (d’après T. Mochizuki) . . . . . . . . . . . . . . . . . . . . .

205

1050

MARS 2012 1051 1052 1053 1054

M. DAFERMOS — The formation of black holes in general relativity (after D. Christodoulou) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

243

C. GARBAN — Quantum gravity and the KPZ formula (after Duplantier-Sheffield) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

315

D. LANNES — Space time resonances (after Germain, Masmoudi, Shatah) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

355

J. WOLF — Arithmetic and polynomial progressions in the primes (after Gowers, Green, Tao and Ziegler) . . . . . . . . . . . . . . . . . . . . . . . .

389

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

vi

TABLE DES MATIÈRES

JUIN 2012 1055 1056 1057 1058

N. BERGERON — La conjecture des sous-groupes de surfaces (d’après Jeremy Kahn et Vladimir Markovic) . . . . . . . . . . . . . . . . . .

429

A. DUCROS — Les espaces de Berkovich sont modérés (d’après Ehud Hrushovski et François Loeser) . . . . . . . . . . . . . . . . . . . . . . . . . . .

459

J.-M. FONTAINE — Perfectoïdes, presque pureté et monodromiepoids (d’après Peter Scholze) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

509

F. LEDRAPPIER — Mesures stationnaires sur les espaces homogènes (d’après Yves Benoist et Jean-François Quint) . . . . .

535

ASTÉRISQUE 352

RÉSUMÉS DES EXPOSÉS

vii

M. BRION — Restriction de représentations et projections d’orbites coadjointes (d’après Belkale, Kumar et Ressayre) Étant donnés un groupe de Lie compact connexe K et un sous-groupe fermé connexe L, quelles sont les représentations irréductibles de L qui apparaissent dans la restriction d’une représentation irréductible de K ? Comment une orbite de K dans la duale de sa représentation adjointe se projette-t-elle sur la représentation co-adjointe de L ? L’exposé présentera des progrès récents dans ces deux problèmes classiques, dus principalement à Belkale, Kumar et Ressayre à la suite de travaux de Klyachko, Berenstein–Sjamaar, Knutson–Tao–Woodward... Ils mettent en œuvre de nouveaux développements du calcul de Schubert et de la théorie géométrique des invariants. C. MOUHOT — Stabilité orbitale pour le système de Vlasov-Poisson gravitationnel (d’après Lemou-Méhats-Raphaël, Guo, Lin, Rein et al.) Le système de Vlasov-Poisson gravitationnel est le principal modèle pour décrire les systèmes stellaires auto-gravitants. C’est un système d’équations aux dérivées partielles nonlinéaire réversible en temps où l’interaction est décrite par le champ de gravitation moyen entre les étoiles. Il était conjecturé depuis longtemps que certaines solutions stationnaires, qui sont des fonctions monotones de l’énergie microscopique, sont non-linéairement stables. Le caractère « orbital » de cette stabilité provient de l’invariance par translation en espace de l’équation. La preuve au niveau linéaire était connue depuis les travaux fondateurs d’Antonov dans les années 1960, mais le problème restait ouvert au niveau non-linéaire. Dans une série d’articles récents, Lemou, Méhats et Raphaël résolvent cette conjecture. Nous évoquerons également les avancées précédentes sur ce problème, et en particulier les travaux de Guo et Rein (ainsi que ceux de Dolbeault, Lin, Sánchez, Schaeffer, Soler, Wolansky...). P. PANSU — Difficulté d’approximation (d’après Khot, Kindler, Mossel, O’Donnell,...) Du point de vue de la complexité algorithmique, de nombreux problèmes d’optimisation combinatoire (comme max 3sat, max cut, sparsest cut) sont équivalents à première vue : ils sont NP-complets. Dans certains cas, même des versions approchées, où on se contente d’une solution qui réalise une fraction donnée de l’optimum, restent NP-complètes. C’est l’essence du théorème PCP (1992). Depuis peu, pour max cut, on conjecture la valeur exacte du seuil d’approximabilité. Cela fait intervenir de la géométrie et de l’analyse harmonique discrète. P. RAPHAËL — Concentration compacité à la Kenig-Merle Dans leur article de référence de 2006 [C.E. Kenig, F. Merle, Global well-posedness, scattering and blow-up for the energy-critical, focusing, non-linear Schrödinger equation in the radial case, Invent. Math. 166 (2006), 645-675], Kenig et Merle obtiennent la première démonstration critique de classification de l’onde solitaire pour une équation dispersive nonlinéaire critique : cette onde exceptionnelle est le premier objet nonlinéaire, car c’est la plus petite dynamique compacte aux symétries du flot près. Je tenterai de tracer l’historique et de montrer quelques ramifications de ce théorème fondamental qui s’inscrit au sein d’une activité internationale très importante, et d’illustrer l’influence de plusieurs domaines de l’analyse, et entre autre une idée simple et profonde issue des techniques variationnelles des années 1980 : la méthode de concentration compacité de P.-L. Lions.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

viii

RÉSUMÉS DES EXPOSÉS

K. BALL — The Ribe Programme Following a remarkable rigidity principle discovered by M. Ribe, Bourgain proposed a programme to transfer the subtle geometric theory of finite-dimensional normed spaces to the class of general metric spaces: a programme which has had some striking successes and a number of intriguing applications to the theory of algorithms. This lecture will describe the most successful part of the programme, from the original work of Bourgain to recent developments by Mendel and Naor. P. DELIGNE — Multizêtas, d’après Francis Brown Les nombres multizêtas ζ(s1 , . . . , sk ) (si entiers ≥ 1), définis par Euler comme sommes infinies, sont aussi des « périodes ». Ils déterminent la structure de Hodge mixte du groupe fondamental rendu unipotent de P1 − {0, 1, ∞}. On s’attend à ce que les relations Q-linéaires entre eux reflètent des structures provenant de la géométrie algébrique sur ce π1 . Nous expliquerons comment F. Brown utilise ces idées pour définir une notion de « bonne » relation Q-linéaire entre multizêtas (on espère que toute relation Q-linéaire est bonne), pour montrer qu’entre les ζ(s1 , . . . , sk ), avec si ∈ {2, 3}, il n’y a pas de bonne relation Q-linéaire non triviale, et pour en déduire que tout nombre multizêta est combinaison linéaire de ces nombres multizêtas particuliers, et que le π1 ci-dessus engendre la catégorie tannakienne de motifs de Tate mixtes sur Z. B. POONEN — Average rank of elliptic curves (after Manjul Bhargava and Arul Shankar) Bhargava and Shankar prove that as E varies over all elliptic curves over Q, the average rank of the finitely generated abelian group E(Q) is bounded. This result follows from an exact formula for the average size of the 2-Selmer group, which in turn follows from an asymptotic formula for the number of binary quartic forms over Z with bounded invariants. We explain their proof, as well as other arithmetic applications. C. SABBAH — Théorie de Hodge et correspondance de Hitchin-Kobayashi sauvages (d’après T. Mochizuki) T. Mochizuki construit une théorie de variations de structure de Hodge « sauvage » pour laquelle la connexion holomorphe plate sous-jacente peut avoir des singularités irrégulières à l’infini. Il propose ainsi une généralisation de la correspondance de Corlette et Simpson entre fibrés plats irréductibles et fibrés de Higgs stables, qui admet des objets à singularités irrégulières. Une application en est la démonstration d’une conjecture de M. Kashiwara sur la validité du théorème de Lefschetz difficile lorsque les coefficients sont le complexe de de Rham d’un D-module holonome simple sur une variété projective lisse complexe. M. DAFERMOS — The formation of black holes in general relativity (after D. Christodoulou) Black holes are one of the most fascinating predictions of General Relativity. Although the most basic explicit solutions (Schwarzschild, Kerr) of the Einstein Vacuum Equations already describe black hole geometries, it remained an open question to understand whether black holes emerge in evolution from the collapse of initially arbitrarily dispersed pure gravitational waves. This talk will describe a recent landmark result of Christodoulou, who proved that this is indeed the case.

ASTÉRISQUE 352

RÉSUMÉS DES EXPOSÉS

ix

C. GARBAN — Quantum gravity and the KPZ formula (after Duplantier-Sheffield) The study of statistical physics models in two dimensions (d = 2) at their critical point is in general a significantly hard problem (not to mention the d = 3 case). In the eighties, three physicists, Knizhnik, Polyakov and Zamolodchikov (KPZ) came up with a novel and far-reaching approach in order to understand the critical behavior of these models. Among these, one finds for example random walks, percolation as well as the Ising model. The main underlying idea of their approach is to study these models along a two-step procedure as follows: – First of all, instead of considering the model on some regular lattice of the plane (such as Z2 for example), one defines it instead on a well-chosen “random planar lattice”. Doing so corresponds to studying the model in its quantum gravity form. In the case of percolation, the appropriate choice of random lattice matches with the so-called planar maps which are currently the subject of an intense activity (for example the recent works by Le Gall and Miermont). – Then it remains to get back to the actual Euclidean setup. This is done thanks to the celebrated KPZ formula which gives a very precise correspondence between the geometric properties of models in their quantum gravity formulation and their analogs in the Euclidean case. The nature and the origin of such a powerful correspondence remained rather mysterious for a long time. In fact, the KPZ formula is still not rigorously established and remains a conjectural correspondence. The purpose of this survey is to explain how the recent work of Duplantier and Sheffield enables to explain some of the mystery hidden behind this KPZ formula. To summarize their contribution in one sentence, their work implies a beautiful interpretation of the KPZ correspondence through a uniformization of the random lattice, seen as a Riemann surface. D. LANNES — Space time resonances (after Germain, Masmoudi, Shatah) Germain, Masmoudi and Shatah recently proved several global existence results for nonlinear dispersive equations with small data. To prove these results, they introduce the notion of space time resonance. We will link this new tool to other concepts developed in Fritz John’s program aiming at proving global existence for small data for many nonlinear partial differential equations: Shatah’s normal forms, Klainerman’s vector fields method and null condition, etc. It is known that Klainerman’s null condition on the nonlinearities plays a central role for global existence of the solutions. In the presentation of the three methods mentioned above, we will point out other structural conditions on the nonlinearities. We will in particular mention compatible and transparent nonlinearities, this latter coming from works of Joly, Métivier and Rauch in nonlinear optics. We will explain how these notions are related to the null condition and mention other examples of application where they are relevant. Finally, we will explain how Germain, Masmoudi and Shatah used the space time resonance approach to obtain a global existence result for 2 dimensional surface water waves (a result that has to be related to a theorem by S. Wu obtained with different methods). J. WOLF — Arithmetic and polynomial progressions in the primes (after Gowers, Green, Tao and Ziegler) In a celebrated theorem from 2004, Green and Tao showed that there exist arbitrarily long arithmetic progressions in the primes. A few years later Tao and Ziegler extended this result to establish the existence of arbitrary polynomial progressions in the primes: given

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

x

RÉSUMÉS DES EXPOSÉS

polynomials P1 , . . . , Pk ∈ Z[m] such that P1 (0) = · · · = Pk (0) = 0, there exist infinitely many integers x, m such that x + P1 (m), . . . , x + Pk (m) are simultaneously prime. In this talk we outline the general strategy of proof that allows one to make structural statements about dense subsets of the integers and the primes, and detail the specific ingredients that are necessary to deal with polynomial configurations. N. BERGERON — La conjecture des sous-groupes de surfaces (d’après Jeremy Kahn et Vladimir Markovic) Suite aux travaux de William Thurston et Grigori Perelman, la compréhension des variétés compactes de dimension 3 se ramène essentiellement à la compréhension de celles d’entre elles qui peuvent être munies d’une structure hyperbolique, c’est-à-dire d’une métrique riemannienne de courbure sectionnelle constante égale à -1. La topologie de ces dernières restait mystérieuse jusqu’à tout récemment. La situation a commencé à changer avec la démonstration, par Jeremy Kahn et Vladimir Markovic, du fait que le groupe fondamental d’une variété hyperbolique compacte de dimension 3 contient toujours le groupe fondamental d’une surface de genre supérieur à 2. Dans cet exposé, j’expliquerai les grandes idées de cette démonstration. Puis je relierai ce résultat aux travaux de Dani Wise et Ian Agol sur la « conjecture virtuellement Haken » et aux travaux de Kahn et Markovic sur la « conjecture d’Ehrenpreis ». A. DUCROS — Les espaces de Berkovich sont modérés (d’après Ehud Hrushovski et François Loeser) Jusqu’à récemment, l’étude homotopique des espaces de Berkovich se fondait sur des théorèmes profonds et difficiles de géométrie arithmétique. Dans cet exposé, nous en présenterons une approche radicalement nouvelle due à Hrushovski et Loeser. Elle repose sur la théorie des modèles des corps valués et a notamment permis de prouver le résultat suivant : si X est une variété algébrique quasi-projective sur un corps ultramétrique complet k, toute partie semi-algébrique de l’espace de Berkovich associé à X est localement contractile, et a le type d’homotopie d’un polyèdre compact. J.-M. FONTAINE — Perfectoïdes, presque pureté et monodromie-poids (d’après Peter Scholze) En théorie de Hodge p-adique, on utilise de façon cruciale le fait que la théorie de Galois d’une extension algébrique suffisamment ramifiée de Qp (par exemple une Zp -extension ramifiée) s’identifie à la théorie de Galois d’un corps valué complet de caractéristique p. En utilisant une vaste généralisation de cette construction, Scholze introduit certains espaces analytiques ultramétriques, les espaces perfectoïdes. À tout espace perfectoïde X sur un corps perfectoïde K, il associe un espace perfectoïde X [ sur le corps perfectoïde K [ de caractéristique p et cette construction est une équivalence de catégories. En outre, le site étale de X s’identifie à celui de X [ . Ceci permet à Scholze de donner une preuve simple du théorème de presque pureté de Faltings et de ramener la conjecture monodromie-poids pour les intersections complètes dans les variétés toriques en caractéristique mixte au théorème de Deligne en égale caractéristique. F. LEDRAPPIER — Mesures stationnaires sur les espaces homogènes (d’après Yves Benoist et Jean-François Quint) Soient G un groupe de Lie réel, Λ un sous-groupe discret tel que le quotient G/Λ a un volume fini, µ une mesure de probabilité sur G à support compact et Γµ le sous-groupe de G engendré par le support de µ. On suppose que l’adhérence de Zariski de Ad(Γ) est un groupe semi-simple sans facteur compact. Yves Benoist et Jean-François Quint ont classifié

ASTÉRISQUE 352

RÉSUMÉS DES EXPOSÉS

xi

les mesures de probabilité sur G/Γ qui sont extrémales parmi les probabilités stationnaires sous l’action de µ : ce ne peuvent être que des volumes (normalisés) sur des orbites fermées, de volume fini, de sous-groupes de G. L’exemple de deux matrices de GL(d, Z) agissant sur Td entre souvent dans ce cadre et est déjà significatif.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

352

ASTÉRISQUE 2013

SÉMINAIRE BOURBAKI VOLUME 2011/2012 EXPOSÉS 1043-1058 (1043) Restriction de représentations et projections d’orbites coadjointes Michel BRION

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Séminaire BOURBAKI 64e année, 2011-2012, no 1043, p. 1 à 33

Novembre 2011

RESTRICTION DE REPRÉSENTATIONS ET PROJECTIONS D’ORBITES COADJOINTES [d’après Belkale, Kumar et Ressayre] par Michel BRION

1. LE PROBLÈME DE LA RESTRICTION POUR LES GROUPES DE LIE COMPACTS CONNEXES 1.1. Introduction Soient K un groupe de Lie compact connexe et L un sous-groupe fermé connexe. Le problème considéré dans cet exposé est de déterminer les représentations irréductibles (continues, complexes) de L qui apparaissent dans la restriction d’une représentation irréductible de K. En théorie, ce problème a une solution complète : rappelons que les représentations irréductibles de K sont paramétrées par les poids dominants. Notons Λ+ K l’ensemble + de ces poids, et VK (λ) le K-module simple de plus haut poids λ ∈ ΛK . Définissons de même Λ+ L et VL (µ) ; on a alors un isomorphisme de L-modules M ∼ m(µ, λ) VL (µ) ResK L VK (λ) = µ∈Λ+ L

où les multiplicités m(µ, λ) sont des entiers naturels uniquement déterminés. En notant χK (λ) le caractère de VK (λ) et χL (µ) celui de VL (µ), on obtient Z L K m(µ, λ) = dim Hom (VL (µ), ResL VK (λ)) = χK (λ) χL (µ) dl L

R où dl désigne la mesure de Haar de L, normalisée de sorte que L dl = 1. Grâce aux formules des caractères et d’intégration de Weyl, on peut donc exprimer la fonction (µ, λ) 7→ m(µ, λ) en termes de données combinatoires associées à K et L. Cependant, la formule ainsi obtenue ([14, Lem. 3.1]) ne permet que rarement de caractériser les couples (λ, µ) tels que m(µ, λ) 6= 0, comme l’illustrent les exemples suivants.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

2

M. BRION

Exemple 1.1. — Prenons pour L un tore maximal T de K. Soit Λ le groupe des + caractères de T ; alors Λ+ := Λ+ K est l’intersection du groupe des poids Λ = ΛT et de la chambre positive C dans l’espace vectoriel réel ΛR := Λ ⊗Z R. De plus, m(µ, λ) est la multiplicité du poids µ dans VK (λ) =: V (λ). La formule des caractères de Weyl se réécrit sous la forme X m(µ, λ) = ε(w) P(w(λ + ρ) − (µ + ρ)) w∈W

où on note W le groupe de Weyl, ε : W → {±1} le déterminant (pour la représentation de W dans ΛR ), ρ la demi-somme des racines positives, et P la fonction de partitions en racines positives ([9, Ch. VIII, §9, Prop. 1]). Ceci exprime m(µ, λ) comme une somme alternée d’entiers positifs, en général très grands. Cependant, l’ensemble des poids de V (λ) admet une description directe très simple : c’est l’intersection du translaté λ+ΛR où ΛR désigne le sous-groupe de Λ engendré par les racines, et de l’enveloppe convexe Conv(W λ) de l’orbite de λ par W ([9, Ch. VIII, §7, Prop. 5 et Exer. 1]). Lorsque K est semi-simple, le polytope Conv(W λ) est formé des µ ∈ ΛR qui sont solutions du système d’inéquations linéaires (µ, w$i ) − (λ, $i ) ≤ 0

(i = 1, . . . , r, w ∈ W/Wi )

où $1 , . . . , $r désignent les poids fondamentaux, Wi le groupe d’isotropie de $i dans W , et (−, −) la forme bilinéaire symétrique sur ΛR provenant de la forme de Killing. Si de plus la représentation de K dans V (λ) a un noyau fini, ces inéquations forment un système minimal : elles sont deux à deux non équivalentes, et chacune définit une face de codimension 1 de Conv(W λ). Exemple 1.2. — Considérons l’inclusion diagonale de K dans K × K. Avec les notations de l’exemple précédent, les K × K-modules simples ne sont autres que les produits tensoriels V (λ) ⊗ V (µ) où λ, µ ∈ Λ+ . Les multiplicités m(ν, λ, µ) sont classiquement notées cνλ,µ et appelées coefficients de Littlewood-Richardson ; on a donc un isomorphisme de K-modules M cνλ,µ V (ν). V (λ) ⊗ V (µ) ∼ = ν∈Λ+

On déduit de la formule des caractères de Weyl l’identité X cνλ,µ = ε(ww0 ) P(w(λ + ρ) + w0 (µ + ρ) − (ν + 2ρ)) (w,w0 )∈W ×W

([9, Ch. VIII, §9, Prop. 2]) où le membre de droite est encore une somme alternée d’entiers positifs. Par ailleurs, les cνλ,µ se déterminent de façon combinatoire, par la règle de Littlewood-Richardson lorsque K est le groupe unitaire Un ([27, I.9]), et par le « modèle des chemins » pour K arbitraire ([26]).

ASTÉRISQUE 352

(1043)

RESTRICTION DE REPRÉSENTATIONS

3

En notant ν ∗ le plus haut poids du G-module simple dual V (ν)∗ , on obtient ∗

cνλ,µ = dim(V (λ) ⊗ V (µ) ⊗ V (ν))G . ∗

En particulier, cνλ,µ est symétrique en λ, µ et ν. Posons ∗

LR(K) := {(λ, µ, ν) ∈ (Λ+ )3 | cνλ,µ 6= 0}. On verra en 2.1 que LR(K) est un sous-monoïde de type fini de (Λ+ )3 , et en 2.2 que le sous-groupe de Λ3 engendré par LR(K) est formé des (λ, µ, ν) tels que λ+µ+ν ∈ ΛR . Lorsque K = Un , on pose LR(K) := LRn ; on identifie les poids dominants aux suites décroissantes (λ1 ≥ . . . ≥ λn ) formées d’entiers relatifs. Une description récursive de LRn est obtenue par la combinaison de travaux de Klyachko ([21]) et de Knutson et Tao ([23]) : (λ, µ, ν) ∈ LRn si et seulement si on a l’égalité n X

λi +

i=1

n X

µj +

j=1

n X

νk = 0

k=1

et les inégalités X a∈A

λa +

X b∈B

µb +

X

νc ≤ 0

c∈C

pour tous les sous-ensembles A, B, C de {1, . . . , n} qui ont le même nombre r d’éléments (où r = 1, . . . , n − 1) et qui satisfont (λ(A), λ(B), λ(C) − (n − r)r ) ∈ LRr où λ(A) := (n − r + 1 − a1 , . . . , n − ar ) lorsque A = (a1 < · · · < ar ), et où on pose (n − r)r := (n − r, . . . , n − r). Knutson, Tao et Woodward ont montré (cr −r,...,c1 −1) que les inéquations pour lesquelles cλ(A),λ(B) = 1 forment un système minimal ([24, Sec. 6]). Pour un groupe K arbitraire, le « monoïde de Littlewood-Richardson » LR(K) est en général inconnu. Mais le cône qu’il engendre est convexe, polyédral et rationnel, et on sait le décrire par des inéquations ; le résultat le plus fin est dû à Belkale et Kumar ([4]) après de nombreux travaux antérieurs. La mystérieuse condition sur les triplets d’indices (A, B, C) s’interprète et se généralise en termes de calcul de Schubert. Plus généralement, le monoïde associé de façon analogue au problème de la restriction est de type fini ; les inéquations minimales du cône qu’il engendre ont été obtenues par Ressayre dans l’article [32]. Après quelques préliminaires de théorie géométrique des invariants, on exposera une partie de cet article, pour aboutir à la description du « cône de la restriction » (théorème 4.9) et, en particulier, du « cône de LittlewoodRichardson » (théorèmes 4.10 et 4.11). On terminera par une brève présentation des résultats de [4], ainsi que de travaux ultérieurs et de questions ouvertes.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

4

M. BRION

1.2. Projection d’orbites coadjointes Un lien entre restriction de représentations et projection d’orbites coadjointes a été découvert par Heckman ([14]), puis généralisé par Guillemin et Sternberg ([13]) dans le cadre de la géométrie hamiltonienne. Pour présenter ce lien, introduisons quelques notations. Le groupe K opère dans son algèbre de Lie k par la représentation adjointe ; on note k∗ l’espace de la représentation duale, appelée coadjointe. On définit de même l et l∗ . L’inclusion de l dans k se transpose en la projection p : k∗ → l∗ qui est équivariante relativement à L. Soient TK un tore maximal de K, et tK son algèbre de Lie ; alors le groupe ΛK des caractères de T s’identifie à un réseau de l’espace vectoriel réel t∗K , et ce dernier, au sous-espace de k∗ formé des points fixes de T . On identifie ainsi la chambre CK ⊂ t∗K à un domaine fondamental pour l’action de K dans k∗ ; on a de même la chambre CL ⊂ t∗L ⊂ l∗ . Théorème 1.3. — Soient λ ∈ CK et O = Kλ son orbite dans k∗ . La projection p( O) rencontre CL suivant un polytope convexe, rationnel si λ l’est. Sous cette hypothèse, les points rationnels de ce polytope ne sont autres que les µ ∈ CL tels qu’il existe un entier + n ≥ 1 qui satisfait aux conditions suivantes : nλ ∈ Λ+ K , nµ ∈ ΛL et m(nµ, nλ) 6= 0. Preuve (esquisse). — La variété différentielle compacte O est munie d’une structure symplectique invariante par K, pour laquelle l’inclusion dans k∗ est l’application moment ; la projection p : O → l∗ est donc l’application moment pour l’action de L. La première assertion résulte alors d’un théorème général de convexité ([19, Th. 2.1]). Les autres assertions seront démontrées à la suite du lemme 3.1. Exemple 1.1 (suite) — Pour la projection p : k∗ → t∗ , le théorème 1.3 entraîne que l’image de l’orbite Kλ est l’enveloppe convexe des wλ où w ∈ W . Ce résultat est dû à Kostant ([25, Th. 4.1]) par une méthode différente. Lorsque K = Un , le K-module k∗ s’identifie à l’espace Hn des matrices hermitiennes de taille n, dans lequel Un opère par conjugaison ; la chambre C est l’ensemble des matrices diagonales à coefficients réels décroissants, c’est-à-dire des spectres (ordonnés) des matrices hermitiennes. Les orbites coadjointes sont formées des matrices hermitiennes ayant un spectre donné, et la projection p associe à chaque matrice la suite de ses coefficients diagonaux. On retrouve ainsi un résultat de Schur et Horn : les suites des coefficients diagonaux des conjugués d’une matrice hermitienne A forment un polytope convexe dont les sommets sont le spectre de A et ses images par les permutations.

ASTÉRISQUE 352

(1043)

RESTRICTION DE REPRÉSENTATIONS

5

Exemple 1.2 (suite) — La projection k∗ × k∗ → k∗ est donnée par la somme ; ainsi, la somme de deux orbites coadjointes rencontre chaque chambre suivant un polytope convexe. Lorsque K = Un , on obtient que les spectres des sommes de deux matrices hermitiennes ayant des spectres donnés forment un polytope convexe. La description de ce polytope en termes d’inéquations linéaires fait l’objet d’une conjecture de Horn ([15]), résolue par Klyachko et Knutson-Tao. Comme précédemment, on peut la reformuler sous une forme symétrique : les spectres de trois matrices hermitiennes de taille n et de somme nulle ne sont autres que les solutions réelles du système récursif d’inéquations de l’exemple 1.2.

2.

MONOÏDE, CÔNE ET GROUPE DE LA RESTRICTION

2.1. Un résultat de finitude Soit K C le complexifié de K ; c’est un groupe algébrique complexe, réductif et connexe. Toute représentation (continue, complexe, de dimension finie) de K s’étend en une unique représentation (rationnelle, de dimension finie) de K C ; ainsi, K et K C ont les mêmes représentations irréductibles. On peut donc reformuler le problème de la restriction en termes des groupes réductifs connexes LC ⊂ K C ; on va appliquer des méthodes classiques de théorie des invariants pour obtenir un résultat qualitatif de finitude. “ le « grand » groupe Il s’avérera commode de noter G le « petit » groupe LC , et G C “ K . Choisissons un sous-groupe de Borel B de G, puis un sous-groupe de Borel B “ qui contient B, si bien que B = B “ ∩ G. Soient T un tore maximal de B, et Tb de G “ “ = TbU “ un tore maximal de B qui contient T ; alors T = Tb ∩ G. On a B = T U et B “) désigne la partie unipotente de B (resp. B) “ ; de plus, U = U “ ∩ G. où U (resp. U Soient Λ = X ∗ (T ) le groupe des caractères de T (qu’on notera additivement), W le groupe de Weyl, et R le système des racines de (G, T ) ; soient aussi R+ le sousensemble de racines positives formé des racines de (B, T ), et Λ+ l’ensemble des poids dominants associé à R+ . On a Λ+ = Λ ∩ C où C désigne la chambre de ΛR associée à R+ . Rappelons que C est un cône convexe polyédral, rationnel relativement au réseau Λ. De plus, Λ+ est un sous-monoïde de type fini de Λ ; autrement dit, il existe ν1 , . . . , νm ∈ Λ+ tels que Λ+ = {n1 ν1 + · · · + nm νm | n1 , . . . , nm ∈ N}. Lorsque G est semi-simple et simplement connexe, on peut prendre pour ν1 , . . . , νm les poids fondamentaux. b W c, Λ b + et C “ ; posons Définissons de même Λ, “ := {(ν, νb) ∈ Λ+ × Λ b + | m(ν, νb) 6= 0}. Λ+ (G, G)

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

6

M. BRION

“ est un sous-monoïde de type fini de Λ+ × Λ b +. Théorème 2.1. — Λ+ (G, G) Preuve. — Observons que m(ν, νb) est la dimension du sous-espace vectoriel VG ν )U ν b(b de VG ν ), formé des invariants de U qui sont vecteurs propres de T de poids ν. On va b(b “ notée interpréter ce sous-espace en termes de l’algèbre des fonctions régulières sur G, “ “ “ “ “ sur C[G]. Cette algèbre est un G × G-module pour l’action induite par celle de G × G “ “ “ G par multiplication à gauche et à droite, et on a un isomorphisme de G × G-modules “ ∼ C[G] =

M b ν ∈b Λ+

ν ) ⊗ VG ν )∗ . VG b(b b(b

“− le sous-groupe de Borel de G “ tel que B “− ∩ B “ = Tb, et U “− sa partie Soient B − b est une droite de poids −b ∗ U “− = TbU “− , et le Tb-module (V (b unipotente ; alors B ν. b ν) ) G b Puisqu’on a un isomorphisme de T × T -modules “ U ×Ub− ∼ C[G] =

M b ν ∈b Λ+



VG ν )U ⊗ (VG ν )∗ )Ub , b(b b(b

on obtient (avec des notations évidentes) “ U ×Ub− . m(ν, νb) = dim VG ν )U ν = dim C[G]ν,−b b(b ν “ U ×Ub− est une sous-algèbre de l’algèbre intègre C[G], “ il en résulte que Comme C[G] + + + “ est un sous-monoïde de Λ × Λ b . Pour montrer que ce monoïde est de type Λ (G, G) − “ fini, il suffit de vérifier que l’algèbre C[G]U ×Ub est de type fini. Mais c’est le cas pour l’algèbre “ Ub− ∼ C[G] =

M b ν ∈b Λ+

VG ν ). b(b

(En effet, cette décomposition est une graduation, qui correspond à l’action de Tb. b + ; alors on vérifie aussitôt que Choisissons des générateurs νb1 , . . . , νbm du monoïde Λ “ “ Ub− ). De même, les G-modules simples VG ν1 ), . . . , VG νm ) engendrent l’algèbre C[G] b(b b(b l’algèbre C[G]U est de type fini. D’après un théorème de Hilbert et Nagata, l’algèbre “ Ub− )G est aussi de type fini, où G opère diagonalement des invariants (C[G]U ⊗ C[G] “ Ub− . On conclut grâce à l’isomorphisme d’algèbres dans C[G]U ⊗ C[G] “ Ub− )G ∼ “ U ×Ub− (C[G]U ⊗ C[G] = C[G] P P donné par i ϕi ⊗ ψi 7→ i ϕi (e) ψi , l’isomorphisme réciproque provenant de la « co“ → C[G] ⊗ C[G] “ ∼ “ f 7→ ((g, gb) 7→ f (g gb)). action » C[G] = C[G × G],

ASTÉRISQUE 352

(1043)

RESTRICTION DE REPRÉSENTATIONS

7

2.2. Le groupe de la restriction “ est le monoïde Définition 2.2. — Avec les notations de 2.1, on dit que Λ+ (G, G) “ comme le de la restriction ; on définit aussi le groupe de la restriction Λ(G, G) + b “ sous-groupe de Λ × Λ engendré par Λ (G, G), et de même le cône de la restriction “ ⊂ C × C. “ C(G, G) “ est convexe, polyédral et rationnel ; on D’après le théorème 2.1, le cône C(G, G) peut donc le décrire par un système d’inéquations linéaires, rationnelles et en nombre “ est d’intérieur non vide dans ΛR × Λ b R , un tel système est unique fini. Lorsque C(G, G) (à multiplication près de chaque inéquation par un rationnel strictement positif) s’il est minimal. On a visiblement “ ⊂ Λ(G, G) “ ∩ C(G, G) “ Λ+ (G, G) “ est saturé lorsque cette inclusion est une égalité ; en d’autres et on dit que Λ+ (G, G) “ et m(nν, nb termes, si (ν, νb) ∈ Λ(G, G) ν ) 6= 0 pour un entier n ≥ 1, alors m(ν, νb) 6= 0. “ Le groupe Λ(G, G) est décrit par le résultat suivant dû à Ressayre (non publié) : Proposition 2.3. — Soit H := “ contenu dans G. Alors de G

T g −1 le plus grand sous-groupe distingué b gbGb b g ∈G

“ = {(ν, νb) ∈ Λ × Λ b | ν(t) = νb(t) pour tout t ∈ T ∩ H}. Λ(G, G) Preuve. — Il suffit de montrer que “ = {(t, t) | t ∈ T ∩ H}. {(t, b t) ∈ T × Tb | ν(t) = νb(b t) pour tout (ν, νb) ∈ Λ(G, G)} Soit I le groupe de gauche ; d’après la preuve du théorème 2.1, c’est aussi le noyau “ U ×Ub− . C’est donc aussi le noyau de l’action de l’action de T × Tb dans l’algèbre C[G] de T × Tb dans le corps des fractions de cette algèbre, qui n’est autre que le corps des “ U ×Ub− , où C(G) “ désigne le corps des fonctions rationnelles sur G. “ Mais invariants C(G) “ × Tb × U “− → G “ (donnée par le d’après la décomposition de Bruhat, l’application U “ produit dans G) est une immersion ouverte, d’où des isomorphismes de corps “ U ×Ub− ∼ “ × Tb)U ∼ “/U × Tb). C(G) = C(U = C(U “/U × Tb, donnée par Par suite, I est le noyau de l’action induite de T × Tb dans U −1 −1 (t, b t) · (b uU, x b) = (tb ut U, tb xb t ). On a donc I = {(t, t) | t ∈ J} où J désigne le noyau “ “ par conjugaison. de l’action de T dans U /U provenant de l’action dans U “/U est fixé par l’action de T , et l’espace Le point de base de l’espace homogène U tangent en ce point est le quotient des algèbres de Lie, b u/u. D’après le lemme 2.4

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

8

M. BRION

ci-après, J est le noyau de l’action de T dans b u/u, et donc dans le quotient analogue b g/g en raison de l’isomorphisme de T -modules b g/g ∼ u/u) ⊕ (bt/t) ⊕ (b u/u)∗ . = (b En appliquant une nouvelle fois le lemme 2.4, on voit que J est le noyau de l’action de T “ “ par conjugaison, c’est-à-dire, J = T ∩ H. dans G/G provenant de son action dans G

Lemme 2.4. — Soit X une variété algébrique dans laquelle opère un groupe réductif G avec un point fixe x. Alors les actions de G dans X et dans l’espace tangent de Zariski Tx X ont le même noyau. Preuve. — Il suffit de montrer que si g ∈ G fixe Tx X (point par point), alors il fixe l’anneau local OX,x . Notons mx l’idéal maximal de cet anneau ; alors g fixe mx /m2x = (Tx X)∗ , donc aussi chaque puissance symétrique S n (mx /m2x ) et chaque quo. Comme OX,x /mxn+1 est un G-module rationnel de dimension finie, et tient mnx /mn+1 x T donc semi-simple, il est aussi fixé par g. On conclut grâce au fait que n≥1 mnx = {0}. On déduit aussitôt de la proposition 2.3 le résultat suivant, où Zb désigne le centre “ (si bien que Zb ⊂ Tb et Z b ∩ G ⊂ T ∩ H) : de G Corollaire 2.5. — On a l’inclusion “ ⊂ {(ν, νb) ∈ Λ × Λ b | ν(t) = νb(t) pour tout t ∈ Z b ∩ G}, Λ(G, G) “ contenu dans G est contenu dans Z. b avec l’égalité si tout sous-groupe distingué de G Voici une autre conséquence immédiate de la proposition 2.3 : Corollaire 2.6. — Les conditions suivantes sont équivalentes : “ est d’indice fini dans Λ × Λ. b (i) Λ(G, G) “ b R. (ii) C(G, G) est d’intérieur non vide dans ΛR × Λ “ (iii) G ne contient aucun sous-groupe distingué fermé connexe non trivial de G. (iv) g ne contient aucun idéal non nul de b g. “ arbitraire, on se ramène facilement à une situation où ce Pour un couple (G, G) “ par un revêtement fini, dernier corollaire s’applique : en effet, quitte à remplacer G et G par la composante neutre de son image réciproque dans ce revêtement, on peut “ = H0 × G “1 et G = H 0 × G1 , où H 0 désigne la composante neutre du supposer que G “ s’identifie à Λ+ (G1 , G “1 ), et G1 groupe H défini à la proposition 2.3 ; alors Λ+ (G, G) “ ne contient aucun sous-groupe distingué fermé connexe non trivial de G1 . Exemple 1.1 (suite) — Le corollaire 2.5 s’applique, et on retrouve ainsi le fait que le groupe Λ(T, G) est formé des couples (µ, λ) de Λ tels que µ − λ ∈ ΛR . On a vu que le

ASTÉRISQUE 352

(1043)

RESTRICTION DE REPRÉSENTATIONS

9

cône C(T, G) est engendré par les (wλ, λ) où w ∈ W et λ ∈ Λ+ ; de plus, le monoïde Λ+ (T, G) est saturé (mais en général, on ne sait pas en construire des générateurs). Exemple 1.2 (suite) — Le corollaire 2.5 s’applique aussi, et montre que le groupe engendré par LR(G) est formé des triplets (λ, µ, ν) de Λ tels que λ + µ + ν ∈ ΛR . Le rang de ce groupe abélien libre est donc 3r − z, où r désigne le rang de G, et z la dimension de son centre. On a vu que le monoïde LR(GLn ) = LRn est saturé ; la situation est beaucoup plus compliquée pour un groupe G arbitraire, et on essaiera de faire le point sur le « problème de saturation » en 5.3.

3. THÉORIE GÉOMÉTRIQUE DES INVARIANTS 3.1. Le théorème de Borel-Weil On va traduire le problème de la restriction en termes géométriques, à l’aide du classique théorème de Borel-Weil dont on rappelle l’énoncé. Avec les notations de 2.1, on considère chaque caractère ν de T comme un caractère de B, et on note L (ν) le fibré en droites homogène sur la variété des drapeaux G/B associé à la représentation de B dans C de poids −ν. L’espace des sections globales H 0 (G/B, L (ν)) est alors un G-module rationnel, et on a ( VG (ν)∗ si ν est dominant, 0 ∼ H (G/B, L (ν)) = 0 sinon. “ Considérons la variété des drapeaux de G × G, “ := G/B × G/ “ B “ X = X(G, G) b le fibré en droites homogène sur X et, pour tout (ν, νb) ∈ Λ × Λ,

L (ν, νb) := L(ν)  L (bν ) avec des notations évidentes. Lorsque ν et νb sont dominants, le théorème de Borel-Weil “ donne un isomorphisme de G × G-modules H 0 (X, L (ν, νb)) ∼ ν )∗ . = VG (ν)∗ ⊗ VG b(b

“ En notant νb∗ le plus haut poids du G-module simple VG ν )∗ (si bien que νb∗ = −w b0 νb b(b c où w b0 désigne l’unique élément de plus grande longueur de W ), on a donc b (b ∗ 0 G m(ν, νb∗ ) = dim HomG (VG (ν), ResG G VG b ν ) ) = dim H (X, L (ν, νb)) . On en déduit aussitôt le b + . Alors (ν, νb∗ ) ∈ C(G, G) “ si et seulement s’il Lemme 3.1. — Soit (ν, νb) ∈ Λ+ × Λ 0 ⊗n G existe un entier n ≥ 1 tel que H (X, L (ν, νb) ) 6= 0.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

10

M. BRION

Cette observation permet de compléter la preuve du théorème 1.3 : par construc“ de G, “ tels que K ⊂ K, “ tion, on a des sous-groupes compacts maximaux K de G et K ∗ ∗ b et donc une projection p : k → k . En outre, C s’identifie à une chambre de K, et “ à une chambre de K. “ Avec ces notations, il suffit de montrer que, pour de même C “ “νb) ∩ C est l’intersection du cône tout point rationnel νb de C, le polytope convexe p(K “ et de l’espace affine ΛR × {b C(G, G) ν }. b + . L’orbite coadjointe O := K “νb s’identifie alors à On peut supposer que νb ∈ Λ “ l’unique orbite fermée de G dans l’espace projectif P(VG ν )) des droites de VG ν) : b(b b(b c’est l’orbite de la droite de plus haut poids νb. Ainsi, O est une variété algébrique complexe, projective et lisse ; de plus, l’application moment issue de ce plongement “ projectif et K-équivariant est l’inclusion de O dans bk∗ . Par suite, p : O → k∗ est b (b l’application moment pour le plongement K-équivariant de O dans P(ResG G VG b ν )). L’assertion est donc conséquence du lemme 3.1 et d’un résultat de Mumford ([30, App. (A1)]). 3.2. Le critère de Hilbert-Mumford Le lemme 3.1 permettra d’obtenir des inéquations linéaires qui définissent le cône “ grâce au critère de Hilbert-Mumford ([29, Ch. 2]). Pour rappeler l’énoncé C(G, G), de ce critère et l’adapter à nos besoins, on se place dans une situation un peu plus générale. Considérons une variété algébrique complexe complète X dans laquelle opère le groupe réductif connexe G ; soit L un fibré en droites sur X. On suppose que L est G-linéarisé, c’est-à-dire qu’on se donne une action de G dans L qui relève l’action dans X et qui est linéaire dans les fibres. Définition 3.2. — On dit qu’un point x ∈ X est semi-stable relativement à L s’il existe un entier n ≥ 1 et une section σ ∈ H 0 (X, L ⊗n ) tels que x ∈ Xσ (l’ouvert de X où σ ne s’annule pas). Ceci diffère de la définition originale de Mumford ([29, Def. 1.7]), qui demande de plus que l’ouvert Xσ soit affine ; cependant, les deux définitions coïncident lorsque L est ample. On note X ss ( L ) l’ensemble des points semi-stables de X ; c’est un ouvert de X, stable par G et inchangé lorsqu’on remplace L par une puissance strictement positive L ⊗n . Définition 3.3. — On dit que L est G-effectif si X ss ( L ) est non vide ; autrement dit, s’il existe un entier n ≥ 1 tel que H 0 (X, L ⊗n )G 6= 0.

ASTÉRISQUE 352

(1043)

RESTRICTION DE REPRÉSENTATIONS

11

Rappelons par ailleurs qu’un sous-groupe à un paramètre de G est un homomorphisme de groupes algébriques λ : C∗ → G. L’ensemble des sous-groupes à un paramètre de G, noté X∗ (G), est muni d’opérations de puissance n-ième (n ∈ Z) qu’on note λ 7→ nλ. Lorsque G = T est un tore, X∗ (T ) est un groupe abélien pour la multiplication ; c’est le dual du groupe des poids, Λ. Dans le cas général, G opère dans X∗ (G) par conjugaison, et un domaine fondamental pour cette action est formé des sous-groupes à un paramètre de T qui sont dominants (relativement à R+ ). Étant donnés λ ∈ X∗ (G) et x ∈ X, le morphisme C∗ → X, t 7→ λ(t)x s’étend en un morphisme ϕ : C → X (car X est complète). Notons y = limt→0 λ(t)x l’image de 0 par ϕ ; c’est un point fixe de C∗ opérant dans X par λ. Comme L est G-linéarisé, il en résulte que C∗ opère linéairement dans la fibre L y ; le poids de cette action est un entier relatif, noté −µ L (x, λ). (Ce choix de signe s’explique par l’exemple où X = P(V ) pour un G-module rationnel V , et L = OP(V ) (1) muni de sa linéarisation naturelle : si x est l’image de v ∈ V , alors µ L (x, λ) est l’ordre en 0 de la fonction rationnelle t 7→ λ(t)v.) On énonce quelques propriétés immédiates de µ L (x, λ) : (i) µ L (gx, gλg −1 ) = µ L (x, λ) pour tout g ∈ G. (ii) µ L (x, nλ) = n µ L (x, λ) pour tout n ∈ Z. (iii) µ L 1 ⊗ L 2 (x, λ) = µ L 1 (x, λ) + µ L 2 (x, λ) pour tous fibrés en droites G-linéarisés L 1, L 2. En notant PicG (X) le groupe des classes d’isomorphisme de ces fibrés (relativement au produit tensoriel), on voit donc que l’application L 7→ µ L (x, λ) définit un homomorphisme de groupes µ• (x, λ) : PicG (X) → Z. (iv) Si X 0 est une G-variété complète et f : X → X 0 un morphisme équivariant, alors ∗ 0 0 µf ( L ) (x, λ) = µ L (f (x), λ) pour tout L 0 ∈ PicG (X 0 ). On aura besoin également de l’interprétation suivante du signe de µ L (x, λ) en termes de « limites » dans le fibré L (où on identifie X à la section nulle) : Lemme 3.4. — Soient x ∈ X et x ˜ ∈ L x \ {x}. Alors   x = y, < 0 ⇔ limt→0 λ(t)˜  L µ (x, λ) = 0 ⇔ limt→0 λ(t)˜ x ∈ L y \ { y},   > 0 ⇔ lim x n’existe pas dans L . t→0 λ(t)˜ Preuve. — Le morphisme ϕ : C → X est équivariant pour l’action de C∗ dans C par multiplication, et pour son action dans X par λ. De plus, le fibré en droites ϕ∗ ( L ) est C∗ -linéarisé ; on vérifie que c’est le fibré trivial C2 → C dans lequel C∗ opère par t · (z, w) = (tz, t−µ w). L’énoncé en résulte aussitôt.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

12

M. BRION

On obtient à présent une version du critère de Hilbert-Mumford pour les fibrés en droites semi-amples (c’est-à-dire, dont une puissance strictement positive est engendrée par ses sections globales) : Proposition 3.5. — Soient L un fibré en droites G-linéarisé sur une G-variété complète X, et x un point de X. (i) Si x ∈ X ss ( L ), alors µ L (x, λ) ≤ 0 pour tout λ ∈ X∗ (G). (ii) Si x ∈ X ss ( L ) et λ ∈ X∗ (G), alors on a : µ L (x, λ) = 0 ⇔ limt→0 λ(t)x ∈ X ss ( L ). (iii) Si L est semi-ample et µ L (x, λ) ≤ 0 pour tout λ ∈ X∗ (G), alors x ∈ X ss ( L ). Preuve. — (i) Soit σ ∈ H 0 (X, L ⊗n )G telle que x ∈ Xσ . Considérons σ comme une fonction régulière sur le fibré dual L −1 , et choisissons x ˜ ∈ L −1 x) 6= 0, x \ {x}. Alors σ(˜ −1 donc par invariance de σ, on ne peut pas avoir limt→0 λ(t)˜ x = y dans L . D’après −1 le lemme 3.4, on a µ L (x, λ) ≥ 0 pour tout λ ∈ X∗ (G), d’où l’assertion. (ii) Avec les notations précédentes, supposons que µ L (x, λ) = 0. Toujours d’après le lemme 3.4, on a y˜ := limt→0 λ(t)˜ x ∈ L y \{y}. Par suite, σ(˜ x) = σ(˜ y ), d’où y ∈ X ss ( L ). Réciproquement, si y ∈ X ss ( L ), alors il existe σ ∈ H 0 (X, L ⊗n )G tel que σ(˜ y ) 6= 0 −nµ L (x,λ) L (x, λ) = 0. pour tout y˜ ∈ L −1 \ {0}. Mais σ(˜ y ) = σ(λ(t)˜ y ) = t σ(˜ y ), d’où µ y (iii) Lorsque L est ample, l’assertion est due à Mumford ([29, Th. 2.1]). Le cas où L est semi-ample s’y ramène : en effet, quitte à remplacer L par une puissance strictement positive, on peut le supposer engendré par ses sections globales. Puisque L est G-linéarisé, l’espace vectoriel V := H 0 (X, L ) est un G-module rationnel, et l’application canonique F : X → P(V ∗ ) est équivariante ; on a un isomorphisme de fibrés G-linéarisés L ∼ = F ∗ ( OP(V ∗ ) (1)). La factorisation de Stein de F fournit alors une G-variété projective X 0 , un morphisme équivariant f : X → X 0 tel que f∗ ( OX ) = OX 0 0 et un fibré en droites ample et G-linéarisé L 0 sur X 0 tel que L ∼ = f ∗ ( L ). De plus, 0 ⊗n ∼ L L 0 0 µ (x, λ) = µ (f (x), λ), et on a des isomorphismes H (X, L ) = H (X 0 , L 0⊗n ) équivariants et compatibles aux évaluations en x et f (x). 3.3. Une caractérisation des fibrés G-effectifs On suppose désormais que X est lisse et projective ; on va obtenir des inéquations linéaires qui caractérisent les fibrés en droites G-effectifs, en suivant [32, Sec. 3]. Étant donné λ ∈ X∗ (G), on note X λ le lieu de ses points fixes ; c’est une sousvariété lisse et fermée de X, en général réductible, et stable par le centralisateur Gλ (le sous-groupe des points fixes de λ opérant par conjugaison dans G). Puisque ce sous-groupe est connexe, il stabilise chaque composante connexe Y de X λ . De plus, la fonction x 7→ µ L (x, λ) est localement constante sur X λ ; on note µ L (Y, λ) sa valeur sur Y . C’est aussi sa valeur sur l’ensemble Y + := {x ∈ X | lim λ(t)x ∈ Y }. t→0

ASTÉRISQUE 352

(1043)

RESTRICTION DE REPRÉSENTATIONS

13

D’après un résultat de Bialynicki-Birula ([8, Th. 4.3]), Y + est une sous-variété localement fermée, lisse, de X, et l’application « limite » π : Y + → Y,

x 7→ lim λ(t)x t→0

est une fibration localement triviale pour la topologie de Zariski, dont les fibres sont des espaces affines ; de plus, l’action de C∗ par λ dans chaque fibre est linéarisable. (On ne sait pas si π est un fibré vectoriel.) On peut maintenant énoncer l’observation clé suivante : Lemme 3.6. — On suppose que GY + est dense dans X et que L est G-effectif. Alors µ L (Y, λ) ≤ 0, et µ L (Y, λ) = 0 si et seulement si X ss ( L ) rencontre Y . Preuve. — Les hypothèses entraînent que X ss ( L ) rencontre Y + ; les assertions résultent alors de la proposition 3.5 (i) et (ii). Posons P = P (λ) := {g ∈ G | lim λ(t)gλ(t)−1 existe}. t→0

D’après [29, Prop. 2.6], P est un sous-groupe parabolique de G, et on a la décomposition de Levi P = Ru (P ) L où Ru (P ) = {g ∈ G | lim λ(t)gλ(t)−1 = 1} et L = Gλ . t→0

(Réciproquement, toute décomposition de Levi d’un sous-groupe parabolique s’obtient à partir d’un sous-groupe à un paramètre.) Observons que λ ∈ X∗ (T ) si et seulement si L contient T ; sous cette hypothèse, λ est dominant si et seulement si P contient B. Par ailleurs, µ L (gx, λ) = µ L (x, λ) pour tout g ∈ P ([29, Prop. 2.7]). On vérifie aussitôt que Y + est stable par P ; de plus, π est invariante par Ru (P ) et équivariante pour L. Puisque le morphisme quotient G → G/P est un fibré principal localement trivial pour la topologie de Zariski, on peut former le fibré associé G×P Y + . C’est une variété algébrique lisse, dans laquelle G opère par multiplication à gauche sur lui-même. Voici d’autres propriétés de cette construction : Lemme 3.7. — (i) La restriction à Y + induit des isomorphismes PicG (G ×P Y + ) ∼ = PicP (Y + ) et pour tout L ∈ PicG (G ×P Y + ), H 0 (G ×P Y + , L )G ∼ = H 0 (Y + , L )P . (ii) La restriction à Y induit un isomorphisme PicP (Y + ) ∼ = PicL (Y ). (iii) Si L ∈ PicP (Y + ) et µ L (Y, λ) 6= 0, alors H 0 (Y, L )λ = 0. (iv) Si L ∈ PicP (Y + ) et µ L (Y, λ) = 0, alors la restriction à Y induit un isomorphisme H 0 (Y + , L )P ∼ = H 0 (Y, L )L .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

14

M. BRION

De plus, on a (Y + )σ = π −1 (Yτ ) pour tout σ ∈ H 0 (Y + , L )P où on note τ := σ|Y . Preuve. — (i) Puisque le morphisme quotient q : G × Y + → G ×P Y + est un fibré principal, l’application q ∗ : PicG (G ×P Y + ) → PicG×P (G × Y + ) est un isomorphisme dont l’inverse est l’image directe invariante, L 7→ q∗ ( L )P . De même, la projection p : G × Y + → Y + induit un isomorphisme p∗ : PicG×P (G × Y + ) ∼ = PicP (Y + ). On en déduit la première assertion. La deuxième résulte des isomorphismes H 0 (G ×P Y + , L ) ∼ = H 0 (G × Y + , q ∗ ( L ))G×P ∼ = H 0 (G × Y + , p∗ ( L |Y + ))G×P . (ii) Puisque π : Y + → Y est un fibré affine, l’application π ∗ : Pic(Y ) → Pic(Y + ) est surjective ; c’est donc un isomorphisme, car π ∗ ( L )|Y = L pour tout L ∈ Pic(Y + ). Pour tout L ∈ PicP (Y + ), on en déduit que L ⊗ π ∗ ( L |Y )−1 est le fibré en droites trivial ; comme ce fibré est aussi P -linéarisé, l’action de P y est donnée par un caractère χ. En restreignant ce fibré à Y , on voit que χ|L est trivial, donc aussi χ puisque P = Ru (P ) L. (iii) est immédiat. (iv) D’après (ii), on a L = π ∗ ( M ) où M := L |Y . D’où H 0 (Y + , L )P ∼ = H 0 (Y, π∗ ( L ))P ∼ = H 0 (Y, M ⊗ π∗ ( OY + ))P . En considérant les poids de l’action de λ dans π∗ ( OY + ), on obtient que l’application naturelle H 0 (Y, M )L → H 0 (Y, M ⊗ π∗ ( OY + ))P est un isomorphisme. En particulier, on a τ = p∗ (σ), d’où les assertions. Le morphisme G × Y + → X, (g, x) 7→ gx se factorise par un morphisme η : G ×P Y + → X équivariant pour les actions naturelles de G. Définition 3.8. — Le couple (Y, λ) est dit dominant (resp. couvrant) si le morphisme η est dominant (resp. birationnel). On dit que (Y, λ) est bien couvrant si η est birationnel et si son lieu exceptionnel ne contient pas Y . L’intérêt de cette dernière notion provient du résultat fondamental suivant : Théorème 3.9. — Soit L un fibré en droites ample et G-linéarisé sur une G-variété projective lisse X. Alors L est G-effectif si et seulement si µ L (Y, λ) ≤ 0 pour tout couple bien couvrant (Y, λ) où λ ∈ X∗ (T ) est dominant.

ASTÉRISQUE 352

(1043)

RESTRICTION DE REPRÉSENTATIONS

15

Preuve. — Lorsque X ss ( L ) 6= ∅, on a en fait µ L (Y, λ) ≤ 0 pour tout couple dominant (Y, λ), d’après le lemme 3.6. Supposons maintenant que X ss ( L ) = ∅. D’après [20, Sec. 13], X est alors réunion disjointe de sous-variétés localement fermées, stables par G et de la forme GΩ+ où λ ∈ X∗ (G) et Ω est un ouvert de X λ , irréductible et stable par L ; de plus, µ L (Ω, λ) > 0 et le morphisme naturel G ×P Ω+ → GΩ+ est un isomorphisme. En particulier, le couple (Y := Ω, λ) est bien couvrant. D’autre part, il existe g ∈ G tel que le conjugué gλg −1 soit à valeurs dans T et dominant ; alors le couple (gY, gλg −1 ) est bien couvrant, et µ L (gY, gλg −1 ) = µ L (Y, λ) > 0. Terminons par une caractérisation « différentielle » des couples bien couvrants : −1 Lemme 3.10. — Soit D := ωG×P Y + ⊗ η ∗ ωX le fibré canonique relatif de η, muni de sa G-linéarisation naturelle.

(i) Si η est génériquement fini, alors µ D (Y, λ) ≥ 0. (ii) Pour que (Y, λ) soit bien couvrant, il faut et il suffit que η soit birationnelle et que µ D (Y, λ) = 0. Preuve. — (i) Le « déterminant jacobien » de η (la puissance extérieure maximale de sa différentielle) s’identifie à une section δ ∈ H 0 (G ×P Y + , D), invariante par G ; de plus, δ 6= 0 si et seulement si η est génériquement fini. La restriction de δ à Y + est alors non nulle, d’où H 0 (Y + , D)λ 6= 0. En considérant les poids de l’action de λ, on en déduit la première assertion. (ii) Supposons (Y, λ) bien couvrant ; alors δ ne s’annule pas en un certain y ∈ Y . Il en résulte que H 0 (Y, D)λ 6= 0, d’où µ D (Y, λ) = 0 d’après le lemme 3.7 (iii). Réciproquement, si η est birationnelle et µ D (Y, λ) = 0, alors il existe x ∈ Y + tel que x ∈ Xδ . Soit y = limt→0 λ(t)x. On montre comme dans la preuve de la proposition 3.5 que y ∈ Xδ ; autrement dit, η est non ramifiée en y. On conclut grâce au théorème principal de Zariski.

4. LE CÔNE DE LA RESTRICTION 4.1. Géométrie des variétés des drapeaux On va expliciter les objets introduits en 3.3, lorsque X est la variété des drapeaux “ B “ dans laquelle G opère diagonalement ; on suivra [32, Sec. 7]. G/B × G/ Le groupe PicG (X) est décrit par le résultat suivant où chaque fibré en droites L (ν, νb) est muni de sa G-linéarisation obtenue par la restriction à la diagonale de sa “ G × G-linéarisation naturelle :

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

16

M. BRION

Lemme 4.1. — L’application b → PicG (X), Λ×Λ

(ν, νb) 7→ L (ν, νb)

est un homomorphisme de conoyau fini et de noyau “} ∼ Λ “ bW {(−b ν |T , νb) | νb ∈ Λ = bW . De plus, L (ν, νb) est effectif (resp. ample) si et seulement si ν et νb sont dominants (resp. dominants réguliers) ; tout fibré en droites effectif (resp. ample) sur X est engendré par ses sections globales (resp. très ample). Preuve (esquisse). — Pour toute G-variété lisse et complète X, l’application naturelle PicG (X) → Pic(X) a un conoyau fini, et son noyau est isomorphe au groupe des b = caractères X ∗ (G) ; on en déduit la première assertion en observant que Λ × Λ b(X) et que Λ “ = X ∗ (G). bW “ Les autres assertions se déduisent du théorème de PicG×G Borel-Weil. Soient λ ∈ X∗ (T ), P = P (λ) et L = L(λ). On note WP le groupe de Weyl de (P, T ), ou encore de (L, T ) ; c’est aussi le groupe d’isotropie de λ pour l’action de W dans X∗ (T ). Lemme 4.2. — Les composantes connexes de (G/B)λ ne sont autres que les sousvariétés LwB/B. Elles sont toutes isomorphes à la variété des drapeaux de L, et paramétrées par WP \W . De plus, on a (LwB/B)+ = P wB/B. Preuve. — Soit Y une composante de (G/B)λ . Rappelons que Y + est stable par le sous-groupe parabolique P de G. D’après la décomposition de Bruhat, Y + est donc réunion d’orbites P wB/B pour certains w ∈ W . Mais si x ∈ P wB/B, alors limt→0 λ(t)x ∈ LwB/B (car limt→0 λ(t)gλ(t)−1 ∈ L pour tout g ∈ P ). De plus, l’orbite LwB/B est formée de points fixes de λ, et elle est isomorphe à L/(wBw−1 )λ , donc à la variété des drapeaux de L puisque (wBw−1 )λ est un sous-groupe de Borel de L = Gλ . En particulier, LwB/B est une sous-variété irréductible et fermée de (G/B)λ . Ceci entraîne les assertions sur les composantes Y de (G/B)λ et les variétés associées Y + . Pour l’assertion sur le paramétrage, on observe que (G/B)λ est stable par T , et que les points fixes de ce tore dans LwB/B ne sont autres que les vwB/B où v ∈ WP . “= P “(λ), L b = L(λ) b Identifions λ à un sous-groupe à un paramètre de Tb, et posons P ; “ b “ alors le sous-groupe parabolique de G× G associé à (λ, λ) ∈ X∗ (T × T ) est P × P , avec b comme sous-groupe de Levi. D’après le lemme 4.2 appliqué à X, les composantes L× L irréductibles de X λ sont les bw “ B “ Y = Yw,wb := Lw−1 B/B × L b−1 B/

ASTÉRISQUE 352

(1043)

RESTRICTION DE REPRÉSENTATIONS

17

c /W cP (ce choix du paramétrage s’avérera commode). De plus, où (w, w) b ∈ W/WP × W on a “w “ B. “ Y + := P w−1 B/B × P b−1 B/ w,w b On va maintenant caractériser les couples (Yw,wb, λ) qui sont dominants ou couvrants, en termes du « calcul de Schubert » dans la variété de drapeaux G/P . Puisque “, l’application naturelle P =G∩P “ P “ i : G/P → G/ est une immersion fermée. Notons H ∗ (G/P ) l’anneau de cohomologie de G/P à coefficients entiers, et “ P “) → H ∗ (G/P ) i∗ : H ∗ (G/ l’homomorphisme défini par i. Rappelons que G/P a une décomposition cellulaire formée des orbites P Cw := BwP/P

(w ∈ W/WP )

(les cellules de Bruhat). Leurs adhérences P XwP := Cw

sont les variétés de Schubert. Les classes de cohomologie de ces variétés, P σw := [XwP ]

(w ∈ W/WP ),

forment donc une base du groupe abélien H ∗ (G/P ) ; de plus, σeP est la classe du point. En particulier, la cohomologie de G/P est nulle en degrés impairs, si bien que le produit ∪ est commutatif. “ P “). On définit de même la base (σ Pb) de H ∗ (G/ w b wb∈W “ /W “ Pb c /W c . Le couple (Y , λ) est domiProposition 4.3. — Soit (w, w) b ∈ W/WP × W b w,w b P b ∗ P P P nant (resp. couvrant) si et seulement si σw ∪ i (σ ) 6= 0 (resp = σe ) dans H ∗ (G/P ). w b Preuve. — Rappelons que (Yw,wb, λ) est dominant (resp. couvrant) si et seulement si la fibre en x du morphisme η : G ×P Y + → X est non vide (resp. un point) pour w,w b tout x dans un ouvert non vide de X. Mais cette fibre s’identifie à Fx := {gP ∈ G/P | g −1 x ∈ Yw,wb} par l’application naturelle G ×P Y +

w,w b

→ G/P . De plus, comme η est équivariante

“/P “) pour un gb ∈ G. “ On a pour G, on peut supposer que x est de la forme (P/P, gbP alors pour tout g ∈ G : “ B “∈ P “w “ B “ gP ∈ Fx ⇔ g −1 B/B ∈ P w−1 B/B et g −1 gbB/ b−1 B/

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

18

M. BRION

“w “. Ainsi, ce qui équivaut, après quelques manipulations, à g ∈ BwP ∩ gbB bP b P P Fx = C w ∩ i−1 (b g Cw b ). D’après un théorème de transversalité dû à Kleiman, l’intersection des adhérences, P “ ; de plus, Xw ∩ i−1 (b g X Pb), est transverse pour tout gb dans un ouvert non vide de G w b Fx est dense dans cette intersection. On en déduit que la classe de cohomologie de Fx P est σw ∪ i∗ (σ Pb) ; les assertions en résultent aussitôt. w b 4.2. Couples bien couvrants et sous-groupes à un paramètre admissibles On va obtenir une caractérisation cohomologique des couples bien couvrants, et en déduire des inéquations linéaires en nombre fini qui définissent le cône de la restriction. On commence par deux résultats techniques qui permettront d’appliquer le critère du lemme 3.10. Fixons λ ∈ X∗ (T ) dominant, si bien que P = P (λ) contient B, et que L = L(λ) contient T . Rappelons que chaque classe wWP , où w ∈ W , contient un unique représentant de longueur minimale, caractérisé par w(R+ ∩ RL ) ⊂ R+ . Notons W P c Pb. l’ensemble de ces représentants minimaux et définissons de même W P Lemme 4.4. — Soit w ∈ W P . Notons γw la somme des poids de T dans l’espace normal à BwP/P dans G/P au point wP/P . Alors P γw = −ρ − ww0,P ρ

où w0,P désigne l’élément de plus grande longueur de WP . Preuve (esquisse). — Cet espace normal est isomorphe au quotient g/(b + wp) et ses poids ne sont autres que les α ∈ R− telles que w−1 α ∈ R− \ RL . c Pb et D le fibré canonique relatif du Lemme 4.5. — Soient (w, w) b ∈ WP × W morphisme η : G ×P Yw,wb → X. Alors T opère dans la fibre de D au point “ B) “ par le poids w−1 γ P + (w (w−1 B/B, w b−1 B/ b−1 γwb)Pb|T − γeP . w Preuve (esquisse). — On a ∗ D∼ = η ∗ (Λmax TX ) ⊗ Λmax TG× PY+

où Λmax désigne la plus grande puissance extérieure non nulle. D’où max ∗ Dx ∼ TG/P,P/P ⊗ Λmax TY∗ + ,x = Λmax TG/B,w−1 B/B ⊗ Λmax TG b/B, b wb−1 B/ b Bb ⊗ Λ

“ B). “ En utilisant le lemme 4.2, on obtient où x := (w−1 B/B, w b−1 B/ max ∗ Dx ∼ TG/P,P/P = Λmax NG/B,P w−1 B/B,w−1 B/B ⊗ Λmax NG b/B, b Pbwb−1 B/ b B, b wb−1 B/ b Bb ⊗ Λ

ASTÉRISQUE 352

(1043)

RESTRICTION DE REPRÉSENTATIONS

19

où NG/B,P w−1 B/B,w−1 B/B désigne le fibré normal à P w−1 B/B dans G/B au point w−1 B/B, et de même pour NG b/B, b Pbwb−1 B/ b B, b wb−1 B/ b Bb. On conclut grâce au lemme 4.4. Proposition 4.6. — Soient λ un sous-groupe à un paramètre dominant de T , et c Pb. Alors le couple (Y := Y , λ) est bien couvrant si et seulement (w, w) b ∈ WP × W w,w b s’il satisfait aux deux conditions suivantes : P (i) σw ∪ i∗ (σ Pb) = σeP dans H ∗ (G/P ). w b (ii) hρ, λ − wλi = hb ρ, λ + wλi. b Preuve. — D’après la proposition 4.3, la condition (i) équivaut à ce que η soit birationnelle. Par ailleurs, d’après le lemme 4.5, on a b b P P P P P P µ D (Y, λ) = hλ, w−1 γw + (w b−1 γw b γw b )|T − γe i = hwλ, γw i + hwλ, b i − hλ, γe i. En utilisant le lemme 4.4, on en déduit que µ D (Y, λ) = hλ − wλ, ρi − hλ + wλ, b ρbi. L’assertion résulte alors du lemme 3.10. On introduit à présent une classe de sous-groupes à un paramètre qui permettra de décrire les faces de codimension 1 du cône de la restriction, lorsque celui-ci est d’intérieur non vide. Parmi ces faces, il suffit alors de déterminer celles qui ne proviennent “ ; autrement dit, celles qui rencontrent l’intérieur pas d’un mur de la chambre C × C de cette chambre. Définition 4.7. — Un sous-groupe à un paramètre non trivial de T est dit admissible si l’hyperplan de ΛR qu’il définit est engendré par des poids de la représentation de T dans b g/g. Les sous-groupes à un paramètre admissibles et indivisibles sont donc en nombre fini. Lemme 4.8. — Soit (Y = Yw,wb, λ) un couple bien couvrant tel que l’hyperplan “ suivant une face F de codimension 1 qui ne (µ• (Y, λ) = 0) rencontre le cône C(G, G) “ Alors λ est admissible. provient pas d’un mur de C × C. Preuve. — Soit (ν, νb) ∈ F où ν et νb sont des poids dominants réguliers. Le fibré en droites G-linéarisé L = L (ν, νb) est ample et G-effectif, et µ L (Y, λ) = 0 ; par suite, Y rencontre X ss ( L ) d’après le lemme 3.6. Soit donc y ∈ Y ∩ X ss ( L ) ; alors le groupe d’isotropie Gy opère dans la fibre L y par un caractère, qui est d’ordre fini (par l’argument de la preuve de la proposition 3.5 (ii)). Ainsi, la composante neutre G0y opère trivialement dans L y .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

20

M. BRION

Le groupe des caractères X ∗ (Gy ) s’identifie à PicG (Gy) ∼ = PicG (G/Gy ). Montrons que la restriction res : PicG (X) → PicG (Gy) est surjective. En effet, la projection “ B “ → G/B p : X = G/B × G/ envoie y sur un sous-groupe de Borel B(y) qui contient Gy , et la composée de res et de l’homomorphisme p∗ : PicG (G/B) → PicG (X) s’identifie (par les isomorphismes PicG (G/B) ∼ = PicG (G/B(y)) ∼ = X ∗ (B(y))) à la restriction X ∗ (B(y)) → X ∗ (Gy ), laquelle est bien surjective. Montrons à présent que le groupe Gy est diagonalisable ; en particulier, G0y est un tore. En effet, l’adhérence de l’orbite Gy dans X ss ( L ) contient une unique orbite fermée Gz, et Gy est contenu dans un conjugué de Gz d’après le théorème du slice de Luna ([29, App. to Ch. 1, D]). Mais Gz est réductif (car la variété Gz est affine), et résoluble (car contenu dans un conjugué de B) ; il est donc diagonalisable, d’où l’assertion. Montrons enfin que G0y = Im(λ). En effet, la composée des restrictions, res0 : PicG (X) → X ∗ (Gy ) → X ∗ (G0y ), est identiquement nulle sur F , et d’autre part, le conoyau de res0 est fini. Comme F est de codimension 1, il en résulte que X ∗ (G0y ) est de rang au plus 1 ; par ailleurs, G0y contient Im(λ), d’où l’égalité. Le groupe L = Gλ opère dans Y à travers son quotient L/ Im(λ) ; d’après l’assertion précédente, le groupe d’isotropie d’un point général de Y dans ce quotient est fini. b B “λ comme L-variété, cela revient à dire que le groupe d’isoPuisque Y ∼ = L/B λ × L/ λ b B “λ est fini. D’après la décomposition tropie dans B / Im(λ) d’un point général de L/ b B “λ par B “λ /Tb ∼ “λ . Puisque de Bruhat, on peut remplacer dans cette assertion L/ =U λ λ B = U T , il en résulte que le groupe d’isotropie dans T / Im(λ) d’un point général “λ /U λ est fini. Par suite, Im(λ) est la composante neutre du noyau de l’action de de U “λ /U λ . En raisonnant comme à la fin de la preuve de la proposition 2.3, on T dans U “λ /U λ par b peut remplacer U gλ /gλ ∼ g/g)λ . Cela signifie que Im(λ) est la composante = (b neutre de l’intersection des noyaux de certains poids de T dans b g/g, ce qui équivaut à l’admissibilité. On peut à présent énoncer le résultat principal de cet exposé : Théorème 4.9. — On suppose que g ne contient aucun idéal non nul de b g. Alors le “ est l’ensemble des (ν, νb) ∈ C × C “ tels que cône C(G, G) hν, wλi + hb ν ∗ , wλi b ≤0

ASTÉRISQUE 352

(1043)

RESTRICTION DE REPRÉSENTATIONS

21

pour tout sous-groupe à un paramètre λ de T , dominant et admissible, et pour tout P c Pb tel que σw (w, w) b ∈ WP × W ∪ i∗ (σ Pb) = σeP dans H ∗ (G/P ), et que hρ, λ − wλi = w b hb ρ, λ + wλi. b “ est convexe, rationnel et polyédral (d’après le théorème Preuve. — Le cône C(G, G) b R (corollaire 2.6). Par suite, il suffit d’établir 2.1) et d’intérieur non vide dans ΛR × Λ l’énoncé pour les couples (ν, νb) de poids dominants réguliers. Mais cela résulte du lemme 3.1, du théorème 3.9, de la proposition 4.6 et du lemme 4.8. 4.3. Le cône de Littlewood-Richardson Rappelons qu’il s’agit du cône engendré par les triplets de poids dominants (λ, µ, ν) tels que (V (λ)⊗V (µ)⊗V (ν))G 6= 0 ; notons-le L R (G). On a pour tout (λ, µ, ν) ∈ C 3 : (λ, µ, ν) ∈ L R (G) ⇔ (λ, µ, ν ∗ ) ∈ C(G, G × G) ⇔ 0 ∈ Kλ + Kµ + Kν où la seconde équivalence résulte du théorème 1.3. Théorème 4.10. — Supposons que G soit semi-simple ; notons P1 , . . . , Pr les sousgroupes paraboliques maximaux de G qui contiennent B, et $1 , . . . , $r les poids fondamentaux qui leur correspondent. Pour i = 1, . . . , r, désignons par Li le sous-groupe de Levi de Pi qui contient T , par Wi ⊂ W le groupe de Weyl de (Li , T ), et par ρi la demi-somme des racines positives de (Li , T ). Identifions W/Wi à l’ensemble W i de ses représentants minimaux dans W , et posons pour tout w ∈ W i : Pi χw := ρ + w−1 ρ − 2ρi .

Alors un triplet (λ, µ, ν) de points de C appartient à L R (G) si et seulement si (λ, u$i ) + (µ, v$i ) + (ν, w$i ) ≤ 0 Pi = σePi pour i = 1, . . . , r et pour tout triplet (u, v, w) de W i tel que σuPi ∪ σvPi ∪ σw Pi Pi Pi ∗ Pi dans H (G/Pi ), et que (χu + χv + χw − χe , $i ) = 0.

“ = G × G. Les poids de Preuve (esquisse). — On applique le théorème 4.9 avec G b G dans g/g ne sont autres que les racines ; il en résulte que les sous-groupes à un paramètre dominants et admissibles de T ne sont autres que les multiples strictement positifs des poids fondamentaux (en identifiant X∗ (T )R à ΛR par la forme de Killing). Ce résultat, dû à Belkale et Kumar ([4, Th. 28]), raffine et généralise de nombreux travaux antérieurs, dont ceux de Klyachko [21] pour G = SLn et de Kapovich, Leeb et Millson ([17]) pour G arbitraire. En fait, [17, Th. 5.5] décrit L R (G) par les inéquations linéaires provenant des couples couvrants au sens de la définition 3.8 ; le cas où G = SLn n’est autre que la conjecture de Horn. Par ailleurs, le cône de la restriction “ est déterminé par Berenstein et Sjamaar en termes des inéquations linéaires C(G, G) qui proviennent des couples dominants ([7, Th. 3.1.1]).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

22

M. BRION

L’énoncé suivant est dû à Ressayre ([32, Th. 10]) : Théorème 4.11. — Les inéquations linéaires du théorème 4.10 sont deux à deux distinctes, et chacune définit une face de codimension 1 de L R (G). Preuve. — La première assertion résulte du fait que Wi est le groupe d’isotropie de $i dans W , si bien que (par exemple) les u$i , u ∈ W i , sont deux à deux distincts. Pour la seconde assertion, puisque le cône L R (G) est de dimension r, il suffit de construire des points de ce cône qui engendrent l’hyperplan d’équation (λ, u$i ) + (µ, v$i ) + (ν, w$i ) = 0, où i et (u, v, w) vérifient les hypothèses. (Cet hyperplan n’est visiblement pas un mur de la chambre C 3 .) L’équation s’écrit µ• (Y, θ) = 0 où θ ∈ X∗ (T ) est un multiple strictement positif de $i (ainsi, L(θ) = Li et P (θ) = Pi ), et où Y := Li u−1 B/B × Li v −1 B/B × Li w−1 B/B ⊂ G/B × G/B × G/B = X. De plus, Y ∼ = (Li /B ∩ Li )3 . Puisque G est semi-simple, l’application naturelle Λ3 → PicG (X) induit un isomorphisme Λ3R ∼ = PicG (X)R (lemme 4.1). Cet isomorphisme identifie L R (G) au cône PicG (X)+ R engendré par les classes des fibrés G-effectifs. Si L est un tel fibré et si µ L (Y, θ) = 0, alors la restriction res( L ) := L |Y est un fibré Li -effectif d’après le lemme 3.6. Autrement dit, avec des notations évidentes, L R (G) ∩ (µ• (Y, θ) = 0) Li + est contenu dans res−1 R (Pic (Y )R ). Mais ce dernier cône n’est autre que L R (Li ) (en effet, toujours d’après le lemme 4.1, resR s’identifie à l’application naturelle Λ3R → PicLi (Y )R ; l’assertion résulte alors de la définition de L R (Li )). Donc L R(G) ∩ (µ• (Y, θ) = 0) ⊂ L R(Li ). Par hypothèse, le morphisme η : G ×P Y + → X est un isomorphisme au-dessus d’un ouvert Ω de X, stable par G et qui rencontre Y . Par ailleurs, les applications de restriction PicG (G ×Pi Y + ) → PicPi (Y + ) → PicLi (Y ) sont des isomorphismes d’après le lemme 3.7. On peut donc identifier res à η ∗ : PicG (X) → PicG (G×Pi Y + ). Toujours d’après le lemme 3.7, il en résulte que L R (Li ) ⊂ (µ• (Y, θ) = 0). Par ailleurs, le cône L R (Li ) est de dimension 3r − 1 d’après l’exemple 1.2 (suite). On peut donc choisir L 1 , . . . , L 3r−1 ∈ PicG (X) linéairement indépendants, tels que µ L j (Y, θ) = 0 et que M j := res( L j ) soit Li -effectif pour j = 1, . . . , 3r − 1. Quitte à remplacer chaque L j par une puissance strictement positive, on peut supposer qu’il existe une section non nulle τj ∈ H 0 (Y, M j )Li . D’après le lemme 3.7, τj s’étend en une unique section σj ∈ H 0 (G ×Pi Y + , η ∗ ( L j ))G . On peut voir σj comme une section rationnelle invariante de L j , régulière sur Ω. Soient E1 , . . . , Em les composantes irréductibles de codimension 1 de X \ Ω. Pour k = 1, . . . , m, notons sk la section canonique du diviseur Ek , et ak ∈ N le maximum des ordres des pôles de σ1 , . . . , σ3r−1 le long de Ek . Alors chaque Ek est stable par G, donc OX (Ek ) est G-linéarisé et sk est

ASTÉRISQUE 352

(1043)

RESTRICTION DE REPRÉSENTATIONS

23

P invariante. Par suite, L 0 := OX ( m k=1 ak Ek ) est un fibré en droites G-linéarisé sur Q ak X, muni d’une section invariante σ0 := m k=1 sk qui ne s’annule pas identiquement sur Y (car Ω rencontre Y ). Ainsi, L 0 définit un point de L R (G), et µ L 0 (Y, λ) = 0 d’après le lemme 3.7. De même, L j ⊗ L 0 est un fibré en droites G-linéarisé sur X, avec une section invariante σj ⊗ σ0 qui ne s’annule pas identiquement sur Y : on a aussi L j ⊗ L 0 ∈ L R(G) ∩ (µ• (Y, λ) = 0). Comme les L j sont linéairement indépendants, il en résulte que le cône L R (G) ∩ (µ• (Y, λ) = 0) est de dimension 3r − 1. On montre de façon analogue que les inéquations du théorème 4.9 sont minimales b ([32, Th. 10]) ; l’ingrédient nouveau est le fait que le cône C(L(λ), L(λ)) est de codib R pour tout λ admissible, ce qui résulte de [28, Cor. 1]. mension 1 dans ΛR × Λ

5. COMPLÉMENTS ET QUESTIONS OUVERTES 5.1. Le produit de Belkale et Kumar Il s’agit d’une « dégénérescence » du produit ∪ sur la cohomologie des variétés de drapeaux, qui permet de mieux comprendre la structure du cône de la restriction. Avant de définir ce produit (en suivant [4]), introduisons quelques notations. Soit P un sous-groupe parabolique de G contenant B. Comme en 4.1, on note WP le groupe de Weyl de (P, T ), et on désigne par W P l’ensemble des représentants de P longueur minimale de W/WP . Pour tout w ∈ W P , on note pour simplifier Cw := Cw la cellule de Bruhat correspondante dans G/P ; on définit de même la variété de Schubert Xw et sa classe de cohomologie σw . Puisque dim(Xw ) = `(w), le degré de σw est 2(dim(G/P ) − `(w)). On a l’égalité dans H ∗ (G/P ) : X σu ∪ σv = cw u,v σw w∈W P

cw u,v

où les « constantes de structure » sont des entiers uniquement déterminés. Pour des raisons de degré, on a `(u)+`(v) = `(w)+dim(G/P ) lorsque cw u,v 6= 0. Par ailleurs, la base duale de (σw )w∈W P pour la dualité de Poincaré est ∨ (σw := σw0 ww0,P )w∈W P

où on rappelle que w0 (resp. w0,P ) désigne l’élément de plus grande longueur de W (resp. WP ) ; l’application w 7→ w0 ww0,P est une involution de W P . On a donc ∨ σu ∪ σv ∪ σw = cw u,v σe .

Comme pour le produit tensoriel (Exemple 1.1), on introduit une variante symétrique des cw u,v en posant σu ∪ σv ∪ σw = cu,v,w σe

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

24

M. BRION

lorsque `(u) + `(v) + `(w) = 2 dim(G/P ) ; dans le cas contraire, on pose cu,v,w = 0. Supposons donc que `(u) + `(v) + `(w) = dim(G/P ). D’après le théorème de transversalité de Kleiman, l’intersection des translatés gu Xu ∩ gv Xv ∩ gw Xw est transverse lorsque gu , gv , gw ∈ G sont généraux, et cette intersection consiste en cu,v,w points contenus dans gu Cu ∩ gv Cv ∩ gw Cw . En particulier, cu,v,w ≥ 0, et cu,v,w > 0 si et seulement si les translatés généraux de Cu , Cv et Cw se rencontrent. On va énoncer une version « infinitésimale » de ce critère ([4, Prop. 2]). La variété de Schubert translatée w−1 Xw est stable par T et contient le point de base P/P de l’espace homogène G/P comme point lisse et fixé par T . Notons Tw l’espace tangent en P/P à w−1 Cw , si bien que Tw est un sous-T -module du P -module TP/P (G/P ). Proposition 5.1. — Pour tout triplet (u, v, w) de W P , les conditions suivantes sont équivalentes : (i) cu,v,w > 0. (ii) `(u) + `(v) + `(w) = dim(G/P ) et de plus, pu Tu ∩ pv Tv ∩ pw Tw = {0} dans TP/P (G/P ) lorsque pu , pv , pw ∈ P sont généraux. Définition 5.2. — Soit L le sous-groupe de Levi de P qui contient T . On dit que (u, v, w) est L-mobile s’il existe pu , pv , pw dans L qui vérifient la condition précédente (ii) de transversalité. Cette notion est en fait étroitement liée à celle de couple bien couvrant, comme le montre le résultat suivant (conséquence de [4, Cor. 8]) : Proposition 5.3. — Soient λ ∈ X∗ (T ) dominant, P = P (λ) et L = L(λ) ; soient (u, v, w) un triplet de W P , et Y = Lu−1 B/B × Lv −1 B/B × Lw−1 B/B la composante irréductible de (G/B × G/B × G/B)λ qui lui correspond. On suppose que le couple (Y, λ) est couvrant. Alors ce couple est bien couvrant si et seulement si (u, v, w) est L-mobile. Le critère suivant ([4, Th. 15]) peut se déduire de la proposition 4.6 : −1 Proposition 5.4. — Notons χP ρ − 2ρL pour tout w ∈ W P . Alors w := ρ + w P le triplet (u, v, w) de W est L-mobile si et seulement s’il satisfait aux conditions P P P suivantes : cu,v,w 6= 0 et hχP u + χv + χw − χe , λi = 0 pour tout λ ∈ X∗ (T ) tel que P = P (λ).

On définit un produit ∪0 sur H ∗ (G/P ) par X σu ∪0 σv = cw u,v σw w

ASTÉRISQUE 352

(1043)

RESTRICTION DE REPRÉSENTATIONS

25

où la somme porte sur les w ∈ W P tels que (u, v, w0 ww0,P ) soit L-mobile. Ainsi, ( cu,v,w σe si (u, v, w) est L-mobile, σu ∪0 σv ∪0 σw = 0 sinon. Les deux conditions sur le triplet (u, v, w) de W i énoncées à la fin du théorème 4.10 sont équivalentes à l’unique condition σu ∪0 σv ∪0 σw = σe dans H ∗ (G/Pi ). Tout comme ∪, le produit de Belkale-Kumar ∪0 est commutatif et admet pour élément unité σe∨ = σw0 w0,P ; il vérifie également la dualité de Poincaré. En fait, ∪0 est aussi associatif, comme le montre le résultat suivant (conséquence de [4, Prop. 17]) : Proposition 5.5. — Soit λ ∈ X∗ (T ) dominant tel que P = P (λ). Alors les sousgroupes M F n H ∗ (G/P ) := Z σw (n ∈ N) w∈W P , hχP w ,λi≥n

forment une filtration décroissante de l’algèbre (H ∗ (G/P ), ∪), et l’algèbre graduée associée est isomorphe à (H ∗ (G/P ), ∪0 ). Le produit ∪0 coïncide avec ∪ lorsque le sous-groupe parabolique P est cominuscule, c’est-à-dire lorsque P est maximal et Ru (P ) est abélien. (En effet, Ru (P ) opère alors trivialement dans son algèbre de Lie n, et donc aussi dans TP/P (G/P ) ∼ = g/p ∼ = n∗ ; par suite, un triplet (u, v, w) est L-mobile si et seulement si cu,v,w 6= 0.) Ceci s’applique en particulier à la grassmannienne Grr,n := GLn /Pr

(r = 1, . . . , n − 1)

qui paramètre les sous-espaces de dimension r de Cn . L’ensemble W Pr est alors formé des partitions λ(I) associées aux sous-ensembles I de {1, . . . , n} ayant r éléments, comme dans l’exemple 1.1. De plus, la constante de structure cK I,J est égale au coeffiλ(K)

cient de Littlewood-Richardson cλ(I),λ(J) . Le théorème 4.10 redonne donc la description du cône L R n = L R (GLn ) présentée à la fin de cet exemple. Par contre, le produit ∪0 est très différent de ∪ lorsque P = B (si bien que L = T ). En effet, la proposition 5.1 entraîne que le triplet (u, v, w) de W est T -mobile si et seulement si on a R+ = (R+ ∩ u(R− )) t (R+ ∩ v(R− )) t (R+ ∩ w(R− )); sous cette condition, u et v déterminent uniquement le sous-ensemble R+ ∩ w(R− ) de R+ , donc aussi w. Ainsi, σu ∪0 σv est nul, ou multiple de σw pour un unique w ∈ W . On conjecture qu’on a alors cw u,v = 1. Cette conjecture a été établie par Richmond lorsque G = GLn ([37, Cor. 4]). Pour ce même groupe et un sous-groupe parabolique P arbitraire, Knutson et Purbhoo ont obtenu une expression des constantes de structure

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

26

M. BRION

de ∪0 , comme produits de coefficients de Littlewood-Richardson ([22, Th. 3]) ; leur résultat redonne la conjecture ci-dessus lorsque P = B. Il résulte de ces observations que le produit de Belkale-Kumar n’est pas fonctoriel, au sens où l’application π ∗ : H ∗ (G/P ) → H ∗ (G/B) induite par la projection naturelle π : G/B → G/P est incompatible aux produits ∪0 . Cependant, Ressayre et Richmond “ P “(λ) ([36]) ont obtenu un résultat de fonctorialité pour l’inclusion i : G/P (λ) → G/ où λ ∈ X∗ (G) ; ils en ont déduit une formulation plus compacte du théorème 4.9. 5.2. Faces et multiplicités “ supposé d’intérieur non vide dans On considère le cône de la restriction C(G, G), “ la chambre C × C. Le théorème 4.9 détermine en fait les faces de codimension 1 de ce cône qui sont régulières, c’est-à-dire qui rencontrent l’intérieur de la chambre. On va présenter deux résultats de Ressayre qui décrivent les faces régulières de codimension arbitraire ([33, Th. 5]), ainsi que le comportement de la fonction multiplicité (ν, νb) 7→ m(ν, νb) en restriction à ces faces ([35, Th. 1]). Ces résultats s’énoncent plus commodément en termes du cône modifié “ := {(ν, νb) ∈ C × C “ | (ν, νb∗ ) ∈ C(G, G)}. “ C ∗ (G, G) Observons que ce cône est engendré par les couples (ν, νb) de poids dominants tels que le fibré en droites G-linéarisé L (ν, νb) soit G-effectif. Définition 5.6. — Un sous-tore S de T est dit admissible si S est la composante neutre de l’intersection des noyaux de poids de T dans b g/g. S c c c c S ; posons Soient W le centralisateur de S dans W , et w b ∈ W /W “S w “ B “ Ye,wb := GS B/B × G bB/ (c’est une composante connexe de X S , isomorphe à la variété des drapeaux de “S ). GS × G On dit que le couple (S, w) b est admissible si S l’est, et s’il existe λ ∈ X∗ (S) tel que Ye,wb soit une composante connexe de X λ et que le couple (Ye,wb, λ) soit bien couvrant. On a une caractérisation cohomologique des couples admissibles ([33, Lem. 6]), dont l’énoncé et la preuve sont analogues à ceux de la proposition 4.6. À tout couple admissible (S, w), b on associe l’ensemble “ | (ν + wb F (S, w) b := {(ν, νb) ∈ C ∗ (G, G) bν )|S = 0}. Proposition 5.7. — L’application (S, w) b 7→ F (S, w) b est une bijection entre les “ De plus, la dimension de S couples admissibles et les faces régulières de C ∗ (G, G). b0 ), il faut et il suffit que est la codimension de F (S, w). b Pour que F (S, w) b ⊂ F (S 0 , w 0 0 “S 0 S0 “ S ⊂ S et que w bG =w bG .

ASTÉRISQUE 352

(1043)

RESTRICTION DE REPRÉSENTATIONS

27

Par exemple, les faces régulières de codimension 1 proviennent de sous-tores de la forme Im(w−1 λ) où w ∈ W et λ est dominant et admissible ; on retrouve ainsi le théorème 4.9. Pour les multiplicités, on introduit de même la fonction modifiée b (b G m∗ b(ν, νb) := m(ν, νb∗ ) = dim(VG (ν) ⊗ ResG G VG b ν )) . G,G On peut maintenant énoncer : Proposition 5.8. — Soient (S, w) b un couple admissible, et (ν, νb) un couple de poids dominants tels que (ν + wb bν )|S = 0. Alors bν ). m∗ b(ν, νb) = m∗ S bS (ν, wb G,G G ,G Ce résultat se déduit aussitôt du théorème de Borel-Weil et de l’énoncé géométrique suivant ([35, Th. 2]), qui a un intérêt propre : Proposition 5.9. — Soient L un fibré en droites G-linéarisé et G-effectif sur “ B, “ et (Y, λ) un couple bien couvrant tel que µ L (Y, λ) = 0. Alors la X = G/B × G/ restriction res : H 0 (X, L )G → H 0 (Y, L )L est un isomorphisme. Preuve. — Notons Y + l’adhérence de Y + dans X ; c’est une sous-variété stable par P , et le morphisme η : G ×P Y + → X s’étend en un morphisme propre et birationnel η : G ×P Y + → X. On en déduit un isomorphisme H 0 (X, L )G ∼ = H 0 (G ×P Y + , η ∗ ( L ))G . Par ailleurs, on montre comme dans la preuve du lemme 3.7 que la restriction H 0 (G ×P Y + , η ∗ ( L ))G → H 0 (Y + , L )P est un isomorphisme ; toujours d’après ce lemme, la restriction H 0 (Y + , L )P → H 0 (Y, L )L est aussi un isomorphisme. Il suffit donc de montrer que la restriction H 0 (Y + , L )P → H 0 (Y + , L )P est un isomorphisme. D’après le lemme 4.2, Y + est une variété de Schubert ; elle est donc normale. On est ainsi ramené à montrer que tout σ ∈ H 0 (Y + , L )P est défini le long de tout diviseur irréductible D de Y + qui ne rencontre pas Y + . Pour cela, on va utiliser la structure locale d’une variété de Schubert le long d’un diviseur de Schubert. “ est Il existe un unique point y ∈ Y + fixé par T × Tb et dont l’orbite (B × B)y b + T ×T “ ouverte dans Y , et de même un unique z ∈ D tel que (B × B)z soit ouvert

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

28

M. BRION

dans D. De plus, on a une unique courbe irréductible de Y + , stable par T × Tb et contenant y et z ; cette courbe, qu’on notera Σ, est isomorphe à la droite projective. Enfin, z admet un unique voisinage Ω dans Y + , affine et stable par T × Tb ; on a un isomorphisme équivariant ∼ Ω+ × (Σ \ {y}) Ω= où Ω+ est un espace affine dans lequel T × Tb opère linéairement avec des poids tous positifs (relativement à λ), et Σ \ {y} est la droite affine dans laquelle T × Tb opère linéairement avec un poids χy,z tel que hχy,z , λi < 0. De plus, cet isomorphisme se restreint en un isomorphisme D ∩ Ω ∼ = Ω+ × {z}. La restriction L |Ω est donc le fibré T -linéarisé trivial associé au poids χz de T dans la fibre L z . Notons de même χy le poids de T dans L y ; alors hχy − χz , λi = deg( L |Σ ) hχyz , λi. Puisque hχy , λi = −µ L (Y, λ) = 0, on obtient deg( L |Σ ) = −

hχz , λi . hχy,z , λi

Mais deg( L |Σ ) ≥ 0 car L est G-effectif et donc engendré par ses sections globales. Ainsi, on a hχz , λi ≤ 0. Soit w une coordonnée sur Σ \ {y}, qu’on voit comme une coordonnée sur l’espace affine Ω. Alors la restriction σ|Ω ∈ H 0 (Ω, L ) est invariante par T et régulière hors du diviseur D ∩ Ω = (w = 0) ; elle s’identifie donc à un vecteur propre de T dans l’algèbre C[Ω+ ][w, w−1 ], de poids −χz . En considérant le poids relativement à λ, il en résulte que σ ∈ C[Ω+ ][w], c’est-à-dire que σ est définie le long de D. La proposition 5.8 ramène la détermination des multiplicités sur une face à des groupes réductifs plus petits ; elle généralise un résultat de Roth sur les coefficients de Littlewood-Richardson ([38, Th. 3.1.1]) . On en trouvera d’autres applications, tant classiques que récentes, dans [35, Sec. 4]. Une question ouverte et très naturelle est de caractériser les faces (non nécessairement régulières) du cône de la restriction, sur lesquelles la multiplicité vaut identiquement 1. Dans cet ordre d’idées, on a le résultat suivant sur les coefficients de Littlewood-Richardson pour GLn : ν si cνλ,µ = 1, alors cN N λ,N µ = 1 pour tout N ≥ 1.

Cette conjecture de Fulton a été démontrée par Knutson, Tao et Woodward de façon combinatoire ([24]). Des preuves géométriques ont été obtenues par Belkale ([3]) et Ressayre ([34]). Une version de la conjecture de Fulton pour un groupe G arbitraire est due à Belkale, Kumar et Ressayre ([6]) ; leur résultat, dont l’énoncé est assez technique,

ASTÉRISQUE 352

(1043)

RESTRICTION DE REPRÉSENTATIONS

29

associe à chaque constante de structure égale à 1 pour le produit de Belkale et Kumar, une demi-droite d’un cône de Littlewood-Richardson sur laquelle la multiplicité vaut identiquement 1. 5.3. Cônes G-amples, saturation Le cône de la restriction considéré dans cet exposé est en fait étroitement lié au « cône G-ample » de la théorie géométrique des invariants. Rappelons la définition de ce cône, introduit par Dolgachev et Hu ([12]). Soit X une variété algébrique complexe, projective et normale, munie d’une action du groupe réductif connexe G. Notons NSG (X) le quotient du groupe PicG (X) par la relation de « G-équivalence algébrique » définie de façon évidente. On a une suite exacte 0 → X ∗ (G) → NSG (X) → NS(X) où NS(X) désigne le groupe de Néron-Severi ; de plus, l’image de NSG (X) est d’indice fini dans NS(X). En particulier, le groupe abélien NSG (X) est de type fini. Pour un fibré en droites G-linéarisé, on montre que la propriété d’être ample et G-effectif est invariante par G-équivalence algébrique. De plus, les classes dans NSG (X) des fibrés en droites amples et G-effectifs forment un sous-monoïde, noté NSG (X)+ . Le cône G-ample, noté C G (X), est le cône engendré par NSG (X)+ dans l’espace vectoriel réel NSG (X)R ; il est visiblement convexe et contenu dans l’image réciproque du cône ample, qu’on note AG (X). D’après [31, Th. 4], C G (X) est défini dans AG (X) par un nombre fini d’inéquations linéaires rationnelles. “ B, “ le cône AG (X) n’est autre que l’intérieur de la chambre Lorsque X = G/B × G/ G “ et C (X) est l’intersection de C(G, G) “ et de cet intérieur. En fait, une grande C × C, partie des résultats présentés dans cet exposé s’étendent au cône G-ample d’une G-variété X arbitraire ; on renvoie à [32, 33] pour ces développements. Dans une toute autre direction, une importante question ouverte est de déterminer les groupes semi-simples G tels que le monoïde de Littlewood-Richardson LR(G) soit saturé. Rappelons que c’est le cas pour SLn , la première preuve, de nature combinatoire, étant due à Knutson et Tao ([23]). Une autre démonstration a été obtenue par Derksen et Weyman, qui ont identifié LRn au monoïde formé des degrés des semi-invariants d’un certain carquois ([10]) ; dans un article ultérieur ([11]), ils ont développé des méthodes de représentations des carquois pour décrire les faces du cône L Rn . On trouvera aussi une preuve géométrique de la saturation de LRn dans l’article [2] de Belkale. Par ailleurs, Kapovich et Millson ont décrit explicitement le monoïde LR(G) lorsque G est de type B2 ou G2 ; dans les deux cas, ce monoïde n’est pas saturé. On conjecture que LR(G) est saturé si G est simple et simplement lacé (c’est-à-dire, si toutes ses racines ont la même longueur). Cette conjecture a été vérifiée par Kapovich, Kumar

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

30

M. BRION

et Millson en type D4 ([16]). Pour un groupe G arbitraire, on conjecture une version plus faible de la saturation : soient λ, µ, ν des poids dominants réguliers tels que λ + µ + ν ∈ ΛR . S’il existe un entier N ≥ 1 tel que (VN λ ⊗ VN µ ⊗ VN ν )G 6= 0, alors (Vλ ⊗ Vµ ⊗ Vν )G 6= 0. Une autre version affaiblie de la saturation a été obtenue par Kapovich et Millson ([18, Th. 1.1] ; voir aussi [1, Th. 1.1]) : il existe un entier k = kG ≥ 1 tel que, pour tous les poids dominants λ, µ, ν qui vérifient λ + µ + ν ∈ ΛR et (VN λ ⊗ VN µ ⊗ VN ν )G 6= 0 pour un certain N ≥ 1, on ait (Vkλ ⊗Vkµ ⊗Vkν )G 6= 0. De plus, lorsque G est simple, on peut prendre pour « facteur de saturation » k le carré du plus petit commun multiple des coefficients de la plus grande racine du système de racines dual R∨ , dans la base des coracines simples. En particulier, kG vaut 1 pour G = SLn , ce qui redonne la saturation dans ce cas. Pour un groupe G arbitraire, on conjecture que kG = 2 suffit. Ceci a été établi pour SO2n+1 et Sp2n par Belkale et Kumar ([5, Th. 6, Th.7]), puis pour SO2n par Sam ([39, Th. 1.1]) ; ce dernier obtient en fait un résultat uniforme pour tous les groupes classiques, par des méthodes de représentations de carquois munis de structures supplémentaires. Remerciements Ce texte doit beaucoup à des discussions et échanges avec Nicolas Ressayre. Je le remercie également, ainsi que Shrawan Kumar et Michèle Vergne, pour une lecture attentive de versions préliminaires.

RÉFÉRENCES [1] N. Bardy-Panse, C. Charignon, S. Gaussent & G. Rousseau – Applications des immeubles en théorie des représentations, prépublication arXiv:1007.3803. [2] P. Belkale – Geometric proofs of Horn and saturation conjectures, J. Algebraic Geom. 15 (2006), no 1, p. 133–173. [3]

, Geometric proof of a conjecture of Fulton, Adv. Math. 216 (2007), no 1, p. 346–357.

[4] P. Belkale & S. Kumar – Eigenvalue problem and a new product in cohomology of flag varieties, Invent. Math. 166 (2006), no 1, p. 185–228. [5]

, Eigencone, saturation and Horn problems for symplectic and odd orthogonal groups, J. Algebraic Geom. 19 (2010), no 2, p. 199–242.

ASTÉRISQUE 352

(1043)

RESTRICTION DE REPRÉSENTATIONS

31

[6] P. Belkale, S. Kumar & N. Ressayre – A generalization of Fulton’s conjecture for arbitrary groups, Math. Ann. 354 (2012), no 2, p. 401–425. [7] A. Berenstein & R. Sjamaar – Coadjoint orbits, moment polytopes, and the Hilbert-Mumford criterion, J. Amer. Math. Soc. 13 (2000), no 2, p. 433–466. [8] A. Białynicki-Birula – Some theorems on actions of algebraic groups, Ann. of Math. 98 (1973), p. 480–497. [9] N. Bourbaki – Éléments de mathématique, Hermann, 1975, Fasc. XXXVIII : Groupes et algèbres de Lie. Chapitre VII : Sous-algèbres de Cartan, éléments réguliers. Chapitre VIII : Algèbres de Lie semi-simples déployées, Actualités Scientifiques et Industrielles, No. 1364. [10] H. Derksen & J. Weyman – Semi-invariants of quivers and saturation for Littlewood-Richardson coefficients, J. Amer. Math. Soc. 13 (2000), no 3, p. 467– 479. [11]

, The combinatorics of quiver representations, Ann. Inst. Fourier (Grenoble) 61 (2011), no 3, p. 1061–1131.

[12] I. V. Dolgachev & Y. Hu – Variation of geometric invariant theory quotients, Publ. Math. I.H.É.S. (1998), no 87, p. 5–56. [13] V. Guillemin & S. Sternberg – Geometric quantization and multiplicities of group representations, Invent. Math. 67 (1982), no 3, p. 515–538. [14] G. J. Heckman – Projections of orbits and asymptotic behavior of multiplicities for compact connected Lie groups, Invent. Math. 67 (1982), no 2, p. 333–356. [15] A. Horn – Eigenvalues of sums of Hermitian matrices, Pacific J. Math. 12 (1962), p. 225–241. [16] M. Kapovich, S. Kumar & J. J. Millson – The eigencone and saturation for Spin(8), Pure Appl. Math. Q. 5 (2009), no 2, Special Issue : In honor of Friedrich Hirzebruch. Part 1, p. 755–780. [17] M. Kapovich, B. Leeb & J. J. Millson – The generalized triangle inequalities in symmetric spaces and buildings with applications to algebra, Mem. Amer. Math. Soc. 192 (2008), no 896. [18] M. Kapovich & J. J. Millson – A path model for geodesics in Euclidean buildings and its applications to representation theory, Groups Geom. Dyn. 2 (2008), no 3, p. 405–480. [19] F. Kirwan – Convexity properties of the moment mapping. III, Invent. Math. 77 (1984), no 3, p. 547–552. [20] F. C. Kirwan – Cohomology of quotients in symplectic and algebraic geometry, Mathematical Notes, vol. 31, Princeton Univ. Press, 1984.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

32

M. BRION

[21] A. A. Klyachko – Stable bundles, representation theory and Hermitian operators, Selecta Math. (N.S.) 4 (1998), no 3, p. 419–445. [22] A. Knutson & K. Purbhoo – Product and puzzle formulae for GLn BelkaleKumar coefficients, Electron. J. Combin. 18 (2011), no 1, Paper 76, 20 p. [23] A. Knutson & T. Tao – The honeycomb model of GLn (C) tensor products. I. Proof of the saturation conjecture, J. Amer. Math. Soc. 12 (1999), no 4, p. 1055– 1090. [24] A. Knutson, T. Tao & C. Woodward – The honeycomb model of GLn (C) tensor products. II. Puzzles determine facets of the Littlewood-Richardson cone, J. Amer. Math. Soc. 17 (2004), no 1, p. 19–48. [25] B. Kostant – On convexity, the Weyl group and the Iwasawa decomposition, Ann. Sci. École Norm. Sup. 6 (1973), p. 413–455. [26] P. Littelmann – Paths and root operators in representation theory, Ann. of Math. 142 (1995), no 3, p. 499–525. [27] I. G. Macdonald – Symmetric functions and Hall polynomials, second éd., Oxford Mathematical Monographs, The Clarendon Press Oxford Univ. Press, 1995. [28] P.-L. Montagard & N. Ressayre – Sur des faces du cône de LittlewoodRichardson généralisé, Bull. Soc. Math. France 135 (2007), no 3, p. 343–365. [29] D. Mumford, J. Fogarty & F. C. Kirwan – Geometric invariant theory, 3e éd., Ergebn. Math. Grenzg., vol. 34, Springer, 1994. [30] L. Ness – A stratification of the null cone via the moment map, Amer. J. Math. 106 (1984), no 6, p. 1281–1329. [31] N. Ressayre – The GIT-equivalence for G-line bundles, Geom. Dedicata 81 (2000), nos 1-3, p. 295–324. [32]

, Geometric invariant theory and the generalized eigenvalue problem, Invent. Math. 180 (2010), no 2, p. 389–441.

[33]

, Geometric invariant theory and generalized eigenvalue problem II, Ann. Inst. Fourier (Grenoble) 61 (2011), no 4, p. 1467–1491.

[34]

, A short geometric proof of a conjecture of Fulton, Enseign. Math. 57 (2011), nos 1-2, p. 103–115.

[35]

, Reductions for branching coefficients, prépublication arXiv:1102.0196.

[36] N. Ressayre & E. Richmond – Branching Schubert calculus and the BelkaleKumar product on cohomology, Proc. Amer. Math. Soc. 139 (2011), no 3, p. 835– 848. [37] E. Richmond – A partial Horn recursion in the cohomology of flag varieties, J. Algebraic Combin. 30 (2009), no 1, p. 1–17.

ASTÉRISQUE 352

(1043)

RESTRICTION DE REPRÉSENTATIONS

33

[38] M. Roth – Reduction rules for Littlewood-Richardson coefficients, Int. Math. Res. Not. 2011 (2011), no 18, p. 4105–4134. [39] S. V. Sam – Symmetric quivers, invariant theory, and saturation theorems for the classical groups, Adv. Math. 229 (2012), no 2, p. 1104–1135.

Michel BRION En congé de l’Institut Fourier B.P. 74 38402 Saint-Martin d’Hères Cedex E-mail : [email protected]

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

352

ASTÉRISQUE 2013

SÉMINAIRE BOURBAKI VOLUME 2011/2012 EXPOSÉS 1043-1058 (1044) Stabilité orbitale pour le système de Vlasov-Poisson gravitationnel Clément MOUHOT

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Séminaire BOURBAKI 64e année, 2011-2012, no 1044, p. 35 à 82

Novembre 2011

STABILITÉ ORBITALE POUR LE SYSTÈME DE VLASOV-POISSON GRAVITATIONNEL [d’après Lemou-Méhats-Raphaël, Guo, Lin, Rein et al.] par Clément MOUHOT

INTRODUCTION Cet exposé est consacré aux avancées mathématiques récentes sur un problème célèbre de l’astrophysique, la stabilité de modèles galactiques. La question se formule très simplement : si l’on considère un ensemble d’un très grand nombre d’étoiles en interaction gravitationnelle(1) dont la cohérence est assurée par leur attraction réciproque et que l’on considère en première approximation comme un système fermé, quelles sont les répartitions statistiques stables au cours du temps ? Autrement dit, quelles sont les configurations de galaxies observables dans notre univers ? On néglige ici les effets relativistes et on se place dans le cadre de la mécanique classique. Ce problème semble à première vue tout autant insoluble que le problème à N corps de Newton. Comment formuler des prédictions à long terme sur un système de 1011 corps(2) alors même que l’on ne sait pas résoudre de manière satisfaisante le problème à 3 corps ! C’est ici que la mécanique statistique entre en jeu. En suivant les idées de Maxwell et de Boltzmann, on peut tenter de décrire de manière statistique l’évolution de nos N corps lorsque N tend vers l’infini et que les corps sont suffisamment « peu corrélés », à travers une équation aux dérivées partielles non-linéaire sur la répartition d’un corps typique. Cette approche a d’abord été appliquée aux cas de gaz collisionnels pour donner la célèbre équation de Boltzmann. Cependant, les collisions entre étoiles dans une galaxie sont quasi-absentes et l’interaction se fait essentiellement à distance via le champ gravitationnel. Dans les années 1910 et 1930, Jeans puis Vlasov découvrent comment effectuer la limite N → +∞ dans ce cas « non-collisionnel » afin d’obtenir (1)

Le rôle joué par les planètes dans la dynamique est négligé au premier ordre car leurs masses sont bien plus petites que celles des étoiles. (2) C’est l’ordre de grandeur du nombre d’étoiles dans notre galaxie.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

36

C. MOUHOT

des équations aux dérivées partielles non-linéaires dites de « champ moyen ». La plus célèbre d’entre elles est l’équation de Vlasov-Poisson, dont nous allons étudier ici la version gravitationnelle (8)-(9). Cette équation de transport non-linéaire décrit avec une excellente précision l’évolution de systèmes stellaires sur de grandes échelles de temps.

Ainsi, lorsque le nombre de corps est grand et que les corrélations sont faibles, on peut espérer formuler des prédictions de stabilité à partir de l’étude de l’équation de Vlasov-Poisson. C’est le physicien russe Antonov [4, 3] qui, le premier, découvre comment résoudre le problème de la stabilité, mais uniquement dans un cadre linéarisé. Il démontre ainsi la stabilité linéarisée des modèles galactiques sphériques et monotones en l’énergie microscopique pour des petites perturbations. Cependant, l’équation de Vlasov-Poisson est réversible en temps, non dissipative, et ses solutions montrent des oscillations en temps grand ; rien ne garantit a priori que l’étude de stabilité linéarisée d’Antonov implique la stabilité non-linéaire recherchée. C’est ce problème mathématique que nous appellerons conjecture de stabilité nonlinéaire à la Antonov. Durant les cinquante dernières années, l’analyse mathématique des équations cinétiques de Boltzmann et Vlasov a connu un fort développement. Cette conjecture de stabilité non-linéaire a été récemment démontrée par Lemou, Méhats et Raphaël [54, 56, 57], suivant des travaux précurseurs de Dolbeault, Guo, Hadžić, Lin, Rein, Sánchez, Soler, Wan, Wolansky ainsi que Lemou, Méhats et Raphaël [81, 87, 82, 27, 28, 29, 30, 32, 33, 21, 77, 35, 34, 31, 49, 53, 51].

Dans cet exposé, nous proposerons tout d’abord dans la section 1 une introduction mathématique au problème, en expliquant l’origine du système de Vlasov-Poisson gravitationnelle à partir du problème à N corps. Nous rappellerons ensuite dans la section 2 les principales propriétés mathématiques de ce système d’équations. Puis nous aborderons dans la section 3 la résolution du problème linéarisé. Enfin nous traiterons dans la section 4 de la question de la stabilité non-linéaire. Nous retracerons l’histoire des différentes méthodes mathématiques développées pour attaquer ce problème, puis nous détaillerons le théorème central du travail [57] de Lemou, Méhats et Raphaël, en donnant un schéma détaillé de preuve. Nous conclurons finalement avec des commentaires et questions ouvertes.

L’auteur remercie Y. Guo, P.-E. Jabin, M. Lemou, F. Méhats, Z. Lin, P. Raphaël et J. Soler pour les échanges par courriel ou discussions durant la préparation de cet exposé, ainsi que S. Martin pour ses relectures et commentaires sur ce texte.

ASTÉRISQUE 352

(1044)

SYSTÈME DE VLASOV-POISSON GRAVITATIONNEL

37

1. PROBLÈME À N CORPS ET SYSTÈME DE VLASOV-POISSON 1.1. Le problème à N corps de Newton On écrit le problème à N corps, pour des interactions binaires et sans champ extérieur, et en normalisant toutes les masses à 1 :  ∂H  x0 (t) = vi (t) = (X(t), V (t)),    i ∂vi (1) 1 ≤ i ≤ N, X ∂H  0   ∇x ψ(xi − xj ) = − (X(t), V (t))  vi (t) = − ∂x i

i6=j

où ψ est le potentiel de l’interaction. Ces équations sont écrites sous forme hamiltonienne pour le hamiltonien (2)

H(X, V ) =

N X |vi |2 i=1

2

+

X

ψ(xi − xj )

i 0. On en déduit le contrôle suivant de l’énergie potentielle pour p > pc = 9/7 7p−9

p

1

3(p−1) 2 H pot (f ) ≤ Ckf kL6(p−1) 1 (R6 ) kf kLp (R6 ) H cin (f )

pour une certaine constante C > 0.

ASTÉRISQUE 352

(1044)

SYSTÈME DE VLASOV-POISSON GRAVITATIONNEL

43

Démonstration. — Pour p > 1 et R > 0, on décompose l’intégrale de la densité spatiale ρf en Z Z Z f dv + f dv = f dv R3

|v|>R

|v|≤R

ÇZ ≤ kf kLpv

å (p−1) p + R−2

dv

≤ kf kLpv

4πR3 3

f |v|2 dv

R3

|v|≤R

Å

Z

ã (p−1) p

+ R−2

Z

f |v|2 dv.

R3

En optimisant le paramètre R, on obtient Z ã (3p−3) ÅZ 2p (5p−3) (5p−3) 2 f dv ≤ Ckf (x, ·)kLp (R3 ) f |v| dv R3

R3

et on en déduit par inégalité de Cauchy-Schwarz Z kρf k



(5p−3)

R3



ÅZ

kf (x, ·)k

C

L (3p−1) (R3 )

2p (3p−1) p L (R3 )

2p (5p−3) p L (R6 )

Ckf k

! (3p−1) (5p−3) ã (3p−3) (3p−1) f |v|2 dv dx

R3

(3p−3)

H cin (f ) (5p−3) ,

ce qui conclut la preuve de la première inégalité. On veut maintenant contrôler le champ φf . En raisonnant heuristiquement, l’inégalité de Sobolev et la régularité elliptique de l’équation de Poisson impliqueraient k∇x φf kL2 (R3 ) ≤ Ck∇x φf kW 1,6/5 (R3 ) ≤ Ckρf kL6/5 (R3 ) . La fonction ∇x φf n’est pas dans l’espace W 1,6/5 (R3 ) ; cependant on a bien l’inégalité k∇x φf kL2 (R3 ) ≤ Ckρf kL6/5 (R3 ) en utilisant la formule ∇x φf = (x/(4π|x|3 )) ∗ ρf et l’inégalité de Hardy-Littlewood-Sobolev [58, Theorem 4.3]. De manière alternative, ˙ 1,6/5 (l’espace de Sobolev homogène) au il est possible de montrer que ∇x φf ∈ W moyen du contrôle sur le laplacien de φf et de la théorie de Calderón-Zygmund, puis d’utiliser l’inégalité de Gagliardo-Nirenberg-Sobolev pour conclure. En combinant ces deux précédentes inégalités, on obtient

H pot (f ) = k∇x φf k2L2 (R3 ) ≤ Ckρf k2L6/5 (R3 ) . Afin d’estimer ce membre de droite on effectue l’interpolation suivante : pour p > pc = 9/7, on a (5p − 3)/(3p − 1) > 6/5 et (7p−9)

kρf kL6/5 (R3 )



(5p−3)

(12p−12) kρf kL(12p−12) 1 (R3 ) kρf k (5p−3)

L (3p−1) (R3 )



kf k

(7p−9) (12p−12) L1 (R6 )

(5p−3)

kρf k (12p−12) (5p−3)

.

L (3p−1) (R6 )

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

44

C. MOUHOT

On combine alors toutes les inégalités précédentes pour obtenir (toujours lorsque p > pc ) 7p−9

p

1

3(p−1) 2 H pot (f ) ≤ Ckf kL6(p−1) 1 (R6 ) kf kLp (R6 ) H cin (f )

ce qui termine la démonstration de la seconde inégalité. Remarquons que l’énergie potentielle peut être ainsi contrôlée par interpolation entre les invariants du système et l’énergie cinétique, avec une puissance strictement inférieure à 1 de l’énergie cinétique (plus précisément 1/2 dans notre cas). Par analogie avec les équations aux dérivées partielles dispersives et en particulier l’équation de Schrödinger, dans le cas d’une telle équation où le hamiltonien est composé de deux termes de signe opposé qui peuvent diverger tout en s’équilibrant, on parle d’équation focalisante ; et lorsque l’on peut établir un tel contrôle de l’énergie potentielle, on parle d’équation sous-critique. Lorsqu’un tel contrôle est possible mais avec une puissance 1 de l’énergie potentielle, on parle d’équation critique. Lorsqu’un tel contrôle n’est possible qu’avec une puissance strictement plus grande que 1, on parle d’équations sur-critiques, pour lesquelles on s’attend en général à des phénomènes d’explosion en temps fini. Dans le cas du système de Vlasov-Poisson en dimension 3 qui est sous-critique, comme le suggère le résultat que l’on vient d’établir, la difficulté principale pour montrer des propriétés de stabilité est le contrôle de l’énergie cinétique. Nous renvoyons à [49, 50, 51, 52, 55] pour une étude systématique de la formation de singularités dans des cas critiques (dimension 4 ou dimension 3 relativiste), ainsi que pour des commentaires plus précis sur le parallèle avec les équations de Schrödinger. Ces modèles critiques n’ont toutefois pas d’interprétation claire au niveau physique. Nous nous concentrerons dans cet exposé sur les résultats qui concernent le système (8)-(9) en dimension 3. 2.4. La théorie de Cauchy La théorie de Cauchy est relativement développée pour cette équation non-linéaire. C’est même l’un des rares systèmes non-linéaires fondamentaux de la physique pour lequel on sait construire des solutions globales et uniques sans hypothèse perturbative en dimension 3. Il est facile de se convaincre des points suivants : – on souhaite montrer une régularité suffisante sur le champ de force moyen pour pouvoir définir des courbes caractéristiques pour les équations différentielles ordinaires correspondantes et établir des contrôles sur ces dernières ; – cette régularité sur le champ dépend du contrôle sur des moments en vitesse R f |v|k dx dv de la solution, donc en définitive du comportement de la distribution pour les grandes vitesses.

ASTÉRISQUE 352

(1044)

SYSTÈME DE VLASOV-POISSON GRAVITATIONNEL

45

Le contrôle de ces « particules à grandes vitesses » a finalement été obtenu de deux manières différentes il y a une vingtaine d’années. D’une part, Pfaffelmoser [72] a découvert comment propager en temps une borne sur la taille du support de la solution, ce qui implique le contrôle recherché et permet de construire des solutions globales C 1 à support compact. D’autre part et indépendamment, Lions et Perthame [61] ont découvert comment propager en temps des bornes directement sur les moments en vitesse de toute solution dans L∞ et de hamiltonien borné, ce qui leur permet de construire des solutions uniques et globales dans L1 ((1 + |v|k ) dx dv) ∩ L∞ pour k suffisamment élevé, modulo une hypothèse assez faible de régularité initiale sur la densité spatiale ρin . Nous renvoyons ensuite aux articles [78, 11, 41, 88, 76, 26, 62, 66, 70] pour les développements ultérieurs de ces théories. Par ailleurs, sous des hypothèses plus faibles sur les données initiales fin ≥ 0,

fin ∈ L1 ∩ L∞ (R6 ),

|v|2 fin ∈ L1 (R6 ),

des solutions faibles globales ont été construites par Arsen’ev [8] (voir également [43, 42]) ; cependant leur unicité reste ouverte. Ces solutions sont également des solutions renormalisées au sens de DiPerna-Lions [17, 18] et on peut leur associer des caractéristiques généralisées au sens de DiPerna-Lions [19]. Elles sont continues en temps à valeur dans L1 (R6 ) et vérifient l’inégalité suivante ∀ t ≥ 0,

H (ft ) ≤ H (fin )

(la conservation exacte du hamiltonien est ouverte). Les théorèmes de Lemou, Méhats et Raphaël que nous présenterons dans la dernière section ont pour objet ces solutions faibles. 2.5. L’étude des solutions stationnaires Nous cherchons maintenant les solutions stationnaires du système (8)-(9). Il en existe en fait une infinité, dont nous ne connaissons et ne savons caractériser de manière satisfaisante qu’une petite partie. Une telle solution f 0 doit vérifier    ∀ x, v ∈ R3 , v · ∇x f 0 − ∇x U (x) · ∇v f 0 = 0,   ∀ x ∈ R3 ,

∆x U = ρ f 0 .

On voit que la première équation incite à considérer une fonction f 0 ne dépendant que des invariants du mouvement du système différentiel x00 (t) = −∇x U , au moins si ce dernier est complètement intégrable. Cependant, on ne connaît rien a priori sur ce système différentiel, puisqu’il dépend de la solution f 0 recherchée elle-même.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

46

C. MOUHOT

2.5.1. Le théorème de Jeans. — On sait néanmoins résoudre ce problème dans le cas de solutions stationnaires dites à « symétrie sphérique ». Cela correspond à l’invariance de la solution stationnaire par les rotations du référentiel, soit ∀ (x, v) ∈ R6 ,

f 0 (Ax, Av) = f 0 (x, v)

pour toute matrice 3 × 3 orthogonale A. Cela implique donc que f 0 = f 0 (|x|, |v|, x · v). Les équations du mouvement    x0 (t) = v,   v 0 (t) = −∇ U = − x U 0 (|x|) x |x| possèdent alors toujours (c’est-à-dire indépendamment de f 0 ) un invariant supplémentaire, en plus de l’énergie : U 0 (|x|) d (x(t) ∧ v(t)) = v(t) ∧ v(t) − x(t) ∧ x(t) = 0. dt |x| Le système est alors complètement intégrable (l’espace des phases possède trois degrés de liberté), et l’on peut montrer que les équilibres s’écrivent sous la forme    f 0 (x, v) = f 0 (|x|, |v|, x · v) = F (E, L) ,      |v|2 (12) 0 (x, v) = E(x, v) := E + φf 0 (t, x), f  2       L(x, v) := |x ∧ v|2 . C’est le théorème de Jeans [44, 45] appliqué aux systèmes sphériques (voir la discussion [12, section 4.4]). Un cadre et une démonstration mathématiques rigoureux peuvent être consultés dans [9], fondés sur la résolution des équations différentielles non-linéaires radiales correspondantes. Lorsque F = F (E) ne dépend que de E, on parle de modèles sphériques isotropes, et lorsque F = F (E, L), on parle de modèles sphériques anisotropes. Ces termes s’expliquent par le fait que la matrice (tenseur) de dispersion en vitesse Z 1 vi vj F (E, L) dv, 1 ≤ i, j, ≤ 3 ρf R 3 est un multiple de la matrice identité lorsque F = F (E) alors que, par exemple, ses composantes diagonales sont différentes lorsque F = F (E, L) dépend de L (cf. à nouveau, ici et pour la suite de cette section, [12, section 4.4]). Dans le cadre de tels systèmes à symétrie sphérique, l’équation fondamentale qui gouverne les équilibres de systèmes stellaires est Z ã Å 2 1 2 0 0 |v| 2 (13) ∆x φ = ρ =⇒ r φ = + φ, |x ∧ v| dx dv. F r2 2 R6

ASTÉRISQUE 352

(1044)

SYSTÈME DE VLASOV-POISSON GRAVITATIONNEL

47

C’est une équation elliptique que l’on peut voir comme une équation non-linéaire sur le potentiel φ étant donné le profil de l’équilibre sphérique F , ou bien comme une équation non-linéaire sur F étant donné φ. 2.5.2. Les modèles polytropiques. — Supposons tout d’abord F = F (E) isotrope, et partons de la formule la plus simple pour obtenir un profil F à support compact, c’est-à-dire une fonction puissance tronquée : (14)

f (x, v) = F (E) = CF (E0 − E)n+ ,

n ∈ R,

où z+ := max{z, 0} désigne la partie positive d’un réel z ∈ R, et CF est une constante donnée. Un calcul élémentaire montre que, par résolution de l’équation (13), la densité spatiale associée est n+3/2

ρ = cn (E0 − φ)+

avec une constante cn finie si n > −1 et la formule simple lorsque n ≥ 0 : cn := CF

23/2 πn! . (n + 3/2)!

On voit ainsi que ces modèles ne peuvent jamais être répartis de manière homogène car une densité spatiale constante impliquerait n = −3/2. L’équation obtenue alors sur le potentiel est l’équation dite de Lane-Emden Å ã 1 d n+3/2 2 d . r φ = cn (E0 − φ)+ r2 dr dr On parle de modèles polytropiques car la distribution spatiale est alors la même que pour un gaz auto-gravitant vérifiant la loi de pression des gaz polytropes p = cste ργ avec γ = 1 + 1/(n + 3/2). Le cas n > 7/2 conduit à des solutions de masse infinie et à support non compact en ajustant le paramètre E0 . L’équation sur le potentiel n’admet pas de solution simple en terme de fonctions élémentaires en dehors du cas n = −1/2 (équation linéaire de Helmhotz). Le cas limite n = 7/2 est intéressant car on obtient une masse finie mais un support non compact ; c’est le modèle dit de Plummer. 2.5.3. Le modèle de King. — D’après les observations, l’énergie est très concentrée au centre des galaxies. Cela incite à considérer de grandes valeurs de n dans le modèle polytropique. Considérons ainsi tout d’abord formellement le cas limite « n = ∞ ». Bien sûr les équations que nous avons utilisées pour trouver la solution stationnaire ci-dessus ne font plus sens, mais si on suit le parallèle avec les gaz auto-gravitants, cela doit correspondre au cas d’un gaz vérifiant la loi de pression p = cste ργ avec γ = 1, c’est-à-dire un gaz isotherme. En suivant les considérations usuelles de mécanique statistique, on obtient des distributions de loi exponentielle. C’est le modèle dit de

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

48

C. MOUHOT

la sphère isotherme. Il est cependant de masse infinie et de support non compact. La littérature physique a donc introduit [47] la troncature suivante  (15) f = F (E) = eE0 −E − 1 + que l’on appelle modèle de King. Ce modèle reproduit les fortes valeurs d’énergie observées pour les petits rayons, tout en étant compatible avec les contraintes de masse et support. Ce modèle sera l’un des protagonistes principaux des travaux mathématiques récents, car c’est peut-être le modèle sphérique isotrope le plus important d’un point de vue physique, et l’étude de sa stabilité échappe aux techniques variationnelles fondées sur les fonctionnelles d’énergie-Casimir. Une des réussites marquantes du programme de recherche de Lemou, Méhats et Raphaël est d’obtenir dans [57] la stabilité de ces modèles pour des perturbations générales. Remarquons ici que l’on voit apparaître en filigrane un phénomème mystérieux, à savoir le fait que les équilibres sont analysés par des considérations de mécanique statistique collisionnelle, soit irréversible. Comprendre pourquoi cette démarche produit des résultats corrects, au moins partiellement, rejoint la question fondamentale de comprendre comment les galaxies se « thermalisent » sans collision. C’est l’objet des théories d’amortissement et de relaxation violente initiées par Lynden-Bell [63, 64]. 2.5.4. Autres modèles. — Si l’on se prescrit au départ la densité spatiale et que l’on cherche à calculer F , on obtient la formule dite de Eddington [24], dont les deux modèles célèbres qui en sont issus sont le modèle dit R1/4 et l’isochrone d’Hénon. Le cas anisotrope est moins clair, mais l’on peut citer le modèle dit d’Osipkov-Merritt qui généralise le modèle R1/4 , ainsi que le modèle dit de Michie qui généralise le modèle de King (nous renvoyons à [12, Chapitre 4]). 2.6. La conjecture de stabilité pour les modèles sphériques Nous devons d’abord discuter de la notion de stabilité utilisée. Au vu des invariants du système (fonctionnelles de Casimir et hamiltonien macroscopique), il est naturel de mesurer la stabilité de la manière suivante : pour tout ε > 0, il existe η > 0 tel que

(16) D(fin , f 0 ) := fin − f 0 L1 (R6 ) + H (fin ) − H (f 0 ) ≤ η =⇒

∀ t ≥ 0, D(ft , f 0 ) ≤ ε.

(Les fonctionnelles de Casimir sont correctement capturées par les espaces de Lebesgue en terme de distance, et le choix de L1 (R6 ) semble arbitraire, mais sera de toute façon complété plus loin par une hypothèse de borne L∞ (R6 ).) Cependant, il faut tenir compte du groupe de symétries du système d’évolution et voir si ces dernières sont « capturées » par la distance utilisée pour mesurer la stabilité. Il s’avère que le système de Vlasov-Poisson (8)-(9) admet un large groupe

ASTÉRISQUE 352

(1044)

SYSTÈME DE VLASOV-POISSON GRAVITATIONNEL

49

de symétries : si f (t, x, v) est solution, alors pour tous t0 ∈ R, x0 ∈ R3 , λ0 ∈ R∗+ , µ0 ∈ R∗+ Å ã µ0 t + t 0 x + x0 g(t, x, v) := 2 f , , µ0 v λ0 λ0 µ0 λ0 est encore solution, et on a également l’invariance par translation galiléenne (ce qui ne fait que traduire sur ce modèle statistique l’invariance galiléenne correspondante de la mécanique classique) : si f (t, x, v) est solution, alors pour tout v0 ∈ R3 g(t, x, v) := f (t, x + tv0 , v + v0 ) est encore solution. Il est clair que la « distance » utilisée D est également invariante par ces transformations lorsque λ0 = µ0 = 1. Nous devons donc reformuler la stabilité de la manière suivante : il existe une fonction de translation z = z(t) ∈ R3 telle que (17)

D(fin , f 0 ) ≤ η

=⇒

∀ t ≥ 0, D(ft , f 0 (· − z(t), ·)) ≤ ε.

C’est la notion de stabilité orbitale. Ajoutons que, dans le cas de perturbations à symétrie sphérique, le paramètre z(t) est nécessairement toujours nul. Pour les solutions stationnaires à symétrie sphérique, il est très largement discuté dans la littérature physique [12] que la stabilité est liée à la monotonie par rapport à l’énergie microscopique E = Ef 0 (x, v). Plus précisément, on peut formuler les conjectures suivantes : Conjecture 2.2. — Les galaxies f 0 = F (E, L) à symétrie sphérique anisotropes et décroissantes (∂E F < 0 sur le support de F ) sont orbitalement stables par perturbation à symétrie sphérique pour le système d’évolution (8)-(9). Conjecture 2.3. — Les galaxies f 0 = F (E) à symétrie sphérique isotropes et décroissantes (∂E F = F 0 < 0 sur le support de F ) sont orbitalement stables par perturbation générale pour le système d’évolution (8)-(9). Les conjectures correspondantes pour le problème linéarisé ont été démontrées dans les années 1960 et 1970 à la suite des travaux fondateurs d’Antonov [4, 3], mais leur résolution pour la dynamique non-linéaire correcte vient d’être obtenue par Lemou, Méhats et Raphaël respectivement dans les articles [56] et [57] (nous renvoyons également à [31] pour une réponse partielle importante sur la conjecture 2.2). Nous nous concentrerons sur la résolution de la conjecture 2.3 (article [57]), tandis que nous renvoyons à [56] pour la résolution de la conjecture 2.2, qui implique les mêmes idées essentielles. Et lorsque nécessaire, nous illustrerons les méthodes et résultats avec les deux modèles principaux : modèles polytropiques (14) et modèle de King (15). Ajoutons enfin qu’en l’absence de symétrie sphérique de la solution stationnaire, la question de la stabilité est ouverte, même pour le problème linéarisé.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

50

C. MOUHOT

3. LE PROBLÈME LINÉARISÉ 3.1. La dynamique linéarisée Il est possible d’adopter une vision géométrique de l’espace des solutions du système (8)-(9) en terme de structure de Poisson, avec les invariants définissant une feuille symplectique. Nous n’en aurons pas besoin dans cet exposé, et nous renvoyons aux références [83, 89, 67, 68] et [1, p. 302] pour des approfondissements sur cet aspect. Nous mentionnerons uniquement la notion de perturbation dynamiquement accessible qui a joué un rôle dans le développement de la théorie perturbative. Si l’on considère une solution stationnaire f 0 (x, v) on peut linéariser le système (8)-(9) autour de cette solution f = f 0 + ε h pour obtenir l’équation linéaire suivante    ∂t h + v · ∇x h − ∇x φf 0 · ∇v h = ∇x φh · ∇v f 0 , t ∈ R+ , x ∈ R3 , v ∈ R3 ,      h(t = 0, x, v) = h0 (x, v), (18)   Z   1    ρh (t, x) := h(t, x, v) dv et φh (t, x) := − ∗ ρh . 4π|x| 3 R Il est aisé de construire des solutions régulières uniques et résoudre le problème de Cauchy pour ce système d’équations aux dérivées partielles linéaires, par des méthodes de point fixe et en utilisant l’inégalité d’interpolation fondamentale de la proposition 2.1. On peut réécrire ce système d’évolution de manière plus compacte en     ∂t h + h, Ef 0 = ∇x φh · ∇v f 0 , (19)   h(t = 0, x, v) = h (x, v). 0 Il est important de remarquer que la fluctuation h n’est en général pas positive et que la structure hamiltonienne de l’équation (8) n’a pas survécu au processus de linéarisation. Le système linéarisé (18) en hérite toutefois la propriété suivante. Si l’on définit une perturbation initiale dynamiquement accessible comme étant créée à ¯ ext , on obtient formellement partir de f 0 par un hamiltonien extérieur donné H f = f 0 + ε h + O(ε2 )

et

¯ ext H = Ef 0 + ε H

avec

h|t=0 = 0.

Le premier ordre de linéarisation en ε de l’équation sur h donne  ¯ ext = O(ε) ∂t h + f 0 , H  ¯ ext en temps petit. Ce dernier terme joue le et on obtient finalement ht ∼ t f 0 , H rôle de la direction de dérivation dans le processus de linéarisation. On montre alors dans la proposition suivante que la forme ht = {gt , f 0 } est préservée au cours du temps pour l’équation linéarisée (18) sur h, soit que l’on peut restreindre l’équation

ASTÉRISQUE 352

(1044)

SYSTÈME DE VLASOV-POISSON GRAVITATIONNEL

51

linéarisée à l’« espace tangent » des conservations hamiltoniennes, i.e., de la feuille symplectique. Proposition 3.1. — Si g est une solution (régulière) de l’ équation génératrice suivante     ∂t g + g, Ef 0 = φ{g,f 0 } ,   g |t=0 = gin , alors h = {g, f 0 } est une solution régulière de (19). Remarquons dès lors, ce qui nous sera utile par la suite, qu’il est équivalent de chercher une solution sous la forme h = {g, f 0 } ou sous la forme h = {g, Ef 0 } : il suffit en effet de multiplier g dans la première forme par 1/F 0 (Ef 0 ) pour obtenir la deuxième. Démonstration. — On calcule l’équation d’évolution sur ht := {gt , f 0 } : ∂t h = {∂t g, f 0 } = −{{g, Ef 0 }, f 0 } + {φh , f 0 } = {{Ef 0 , f 0 }, g} + {{f 0 , g}, Ef 0 } + {φh , f 0 } où l’on a utilisé l’identité suivante sur le crochet de Poisson {{A, B}, C} + {{B, C}, A} + {{C, A, }, B} = 0. On utilise alors {Ef 0 , f 0 } = 0 (par définition d’une solution stationnaire), et {φh , f 0 } = ∇x φh · ∇v f 0 , ce qui permet de conclure à ∂t h + {h, Ef 0 } = ∇x φh · ∇v f 0 qui est bien l’équation recherchée, avec la donnée initiale hin = {gin , f 0 }. 3.2. Énergie libre du problème linéarisé Dans le cas de modèles sphériques, l’article [48] a pour la première fois proposé une énergie libre préservée au cours de l’évolution par le système de Vlasov-Poisson linéarisé dans le cas d’interactions de Coulomb, pour les plasmas. Cette fonctionnelle sera ensuite adaptée au cas gravitationnel du système (18) par Antonov [4, 3], et ce dernier l’utilisera pour formuler un critère de stabilité. Nous ne présentons ici que le cas isotrope f 0 = F (E) pour simplifier l’exposition et nous rappelons la notation E = Ef 0 (x, v). Proposition 3.2. — La quantité Z F (h) = − R3 ×R3

|h|2 dx dv − F 0 (E)

Z

|∇x φh |2 dx

R3

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

52

C. MOUHOT

est conservée par les solutions régulières du système (18) dont le support est inclus dans le support de F 0 . Le quotient |h|2 /F 0 (E) doit ici être compris comme étant égal à zéro lorsque les numérateurs et dénominateurs s’annulent. Démonstration. — On souhaite différencier en temps l’expression de F (h). On calcule d dt

Z R3 ×R3

|h|2 dx dv = −2 F 0 (E)

puis on remarque que

ß

Z {h, E} h ∇ x φh · ∇ v f 0 h dx dv + 2 dx dv 0 F 0 (E) R6 F (E) R6 Z Z {h, E} h v · ∇x φh h dx dv = −2 dx dv + 2 0 R6 F (E) R6

Z

1 ,E F 0 (E)

™ =−

F 00 (E) {E, E} = 0 F 0 (E)2

et ainsi par intégration par parties Z Z Z ™ ß {h2 , E} {h, E} h 1 2 dx dv = dx dv = − h , E dx dv = 0 2 0 0 F 0 (E) R6 F (E) R6 R6 F (E) d’où d dt

Z R3 ×R3

|h|2 dx dv = 2 F 0 (E)

Z v · ∇x φh h dx dv. R6

On calcule par ailleurs Z Z Z d ∂ ∂ 2 |∇x φh | dx = 2 ∇x φh · ∇x φh dx = −2 ∆x φh φh dx dt R3 ∂t ∂t 3 R3 Z R Z ÅZ ã ∂ ∂ = −2 ρh φh dx = −2 hdv φh dx dv R3 ∂t R3 R3 ∂t Z Z v · ∇x φh h dx dv. =2 v · ∇x hφh dx dv = −2 R6

R6

La somme de ces deux dernières équations fournit le résultat. 3.3. Interprétation variationnelle de l’énergie libre Quelle est l’origine de cette énergie libre et surtout quel est son lien avec le hamiltonien du problème non-linéaire ? Si l’on compare le hamiltonien en deux fonctions différentes f 0 et f on obtient par un calcul élémentaire la formule Z Z Å 2 ã 1 |v| 0 0 (20) H (f ) = H (f ) + + φf 0 (f − f ) dx dv − |∇x φf − ∇x φf 0 |2 dx. 2 2 R3 R6

ASTÉRISQUE 352

(1044)

53

SYSTÈME DE VLASOV-POISSON GRAVITATIONNEL

En effet Z Å

Z Å 2 ã ã φf 0 |v| |v|2 φf f dx dv = f 0 dx dv + + 2 2 2 2 R6 R6 Z Å 2 Z Å ã ã 1 |v| 1 0 0 0 dx dv + + φf 0 (f − f ) dx dv + φf f − φf 0 (f − f ) − φf 0 f 2 2 2 R6 R6 Z Å Z ã 1 1 E(f −f 0 ) dx dv− = H (f 0 )+ |∇x φf |2 − ∇x φf 0 · ∇x φf + |∇x φf 0 |2 dx dv 2 2 R3 R6

d’où le résultat. Il est clair cependant qu’aucune fonction f 0 ne peut constituer un point critique de H à cause de la partie linéaire en (f − f 0 ) dans la formule (20) ci-dessus, qui n’est jamais l’application nulle. Cela s’explique par les invariants du système. Pour y remédier, une idée introduite par Arnold [5, 6, 7] dans les années 1960 dans le cas de l’équation d’Euler incompressible bidimensionnelle, est de considérer une fonctionnelle dite d’énergie-Casimir qui combine le hamiltonien et une fonctionnelle de Casimir bien choisie. Cette idée resurgira plus loin lorsque nous aborderons la stabilité non-linéaire. On se donne alors une fonctionnelle d’énergie-Casimir générale définie par une fonction C : R+ → R+ avec C (0) = 0 : Z H C (f ) := H (f ) + C (f ) dx dv, R6

et l’on cherche à ajuster la fonction C afin que cette fonctionnelle admette bien f 0 comme point critique. Par un calcul élémentaire et en développant H C autour de f 0 on obtient Z Å 2 Z ã |v| 1 0 0 0 0 H C (f ) = H C (f ) + + φf 0 + C (f ) (f − f ) dx dv − |∇x φf − ∇x φf 0 |2 dx 2 2 R3 R6 Z 1 C 00 (f 0 )(f − f 0 )2 dx dv + . . . + 2 R6 1 =: H C (f 0 ) + D H C (f 0 )[f − f 0 ] + D2 H C (f 0 )[f − f 0 ] + . . . 2 On voit alors que le choix formel

C 0 (f 0 ) = −E = −

Å

|v|2 + φf 0 2

ã

permet d’annuler la partie linéaire et d’obtenir exactement D2 H C (f 0 )[f − f 0 ] = F (f − f 0 ). En effet puisque f 0 = F (E) ne dépend que de E on a

C 0 (F (E)) = −E

=⇒

C 00 (F (E))F 0 (E) = −1 soit C 00 (F (E)) = −

1 . F 0 (E)

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

54

C. MOUHOT

On peut donc interpréter cette énergie libre comme la hessienne de la fonctionnelle d’énergie-Casimir au point f 0 , pour une contrainte C correctement choisie en fonction de f 0 . 3.4. Première approche naïve de la stabilité linéaire par interpolation Donnons tout d’abord une approche « naïve » de la stabilité qui rappelle l’inégalité d’interpolation de la proposition 2.1 pour l’équation non-linéaire. On peut en effet interpréter à nouveau la fonctionnelle F comme une énergie que l’on décompose en deux termes positifs :

F (h) = F cin (h) − F pot (h) Z

F cin (h) := − R3 ×R3

|h|2 dx dv, F 0 (E)

avec Z

|∇x φh |2 dx

F pot (h) := R3

et l’on cherche à contrôler la partie F pot à partir de F cin dans une estimation souscritique. La proposition suivante est inspirée de [10]. Proposition 3.3 ([10]). — Si la solution stationnaire f 0 vérifie Z (21) F 0 (E) dx dv < +∞ R6

alors 1

1/3 2 F pot (h) ≤ Ckhk2/3 L1 (R6 ) kρh kL∞ (R3 ) F cin (h)

et l’on peut démontrer la stabilité dans un espace de solutions tel que ρh ∈ L∞ (R3 ). La preuve de l’inégalité fonctionnelle est immédiate, et le résultat de stabilité linéaire en découle une fois les solutions correctement construites. Malheureusement l’hypothèse (21) ne permet pas de traiter les modèles physiques les plus intéressants. Il va donc falloir se tourner vers une estimation globale de F sans décomposition ; autrement dit, une estimation de convexité sur la fonctionnelle d’énergie-Casimir H C . 3.5. L’inégalité de coercitivité d’Antonov Antonov [4, 3] propose alors de considérer la fonctionnelle F dans son ensemble, et de montrer qu’elle est positive, une fois restreinte aux perturbations dynamiquement accessibles h = {g, f 0 }. Pour être exact, l’argument (formel) original d’Antonov n’est pas fondé sur les perturbations dynamiquement accessibles, mais sur une décomposition de la perturbation en partie paire et partie impaire par rapport à la variable de vitesse. Nous renvoyons également aux travaux ultérieurs dans la littérature physique qui ont développé l’idée d’Antonov [23, 22, 80, 46, 71].

ASTÉRISQUE 352

(1044)

SYSTÈME DE VLASOV-POISSON GRAVITATIONNEL

55

L’argument historique d’Antonov consiste à considérer une solution h du problème linéarisé (19) puis à la décomposer en partie paire et partie impaire par rapport à la variable de vitesse v, soit h = h1 + h2 avec h1 (x, v) =

1 (h(t, x, v) + h(t, x, −v)) , 2

h2 (x, v) =

1 (h(t, x, v) − h(t, x, −v)) . 2

On obtient ainsi formellement les deux équations couplées suivantes    ∂t h1 + {h2 , E} = 0,   ∂ h + {h , E} = ∇ φ · ∇ f 0 . t 2 1 x h1 v Puis en remplaçant le terme h1 dans la deuxième équation, on déduit l’équation de pulsation suivante sur h2 2 ∂tt h2 = {{h2 , E}, E} − ∇x φ{h2 ,E} · ∇v f 0 .

(22)

Par analogie avec l’équation différentielle y 00 = λy, on voit que, si l’opérateur du membre de droite est négatif, on espère obtenir des solutions oscillantes bornées (ce qui justifie le terme de « pulsation »). On calcule alors l’énergie de ce système. Proposition 3.4. — On suppose F 0 < 0 sur son domaine, et h ∈ Cc∞ une solution de (22) à support inclus dans celui de F 0 . Alors h vérifie Z Z Å Z ã d |h|2 |{h, E}|2 2 − dx dv − dx dv − |∇x φ{h,f 0 } | dx = 0 0 0 dt R6 F (E) R6 F (E) R3 soit

Å Z ã d |h|2 0 − dx dv + F ({h, f }) = 0. 0 dt R6 F (E)

Démonstration. — En intégrant contre ∂t h/F 0 (E) l’équation de pulsation on obtient Z Z ∂t h d 1 |∂t h|2 2 ∂tt h 0 dx dv = dx dv F (E) dt 2 R6 F 0 (E) R6 pour le premier terme, puis Z {{h, E}, E} R6

∂t h dx dv F 0 (E) {∂t h, E} 1 d =− {h, E} 0 dx dv = − F (E) 2 dt R6 Z

|{h, E}|2 dx dv 0 R6 F (E)

Z

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

56

C. MOUHOT

pour le deuxième terme où l’on a utilisé une intégration par parties et le fait que {1/F 0 (E), E} = 0, et enfin pour le dernier terme Z Z ∂t h − ∇x φ{h,E} · ∇v f 0 0 dx dv = − {φ{h,E} , E}∂t h dx dv F (E) R6 R6 Z Z = φ{h,E} {∂t h, E} dx dv = φ{h,E} ∂t ρ{h,E} dx R6 R3 Z Z 1 d |∇x φ{h,E} |2 dx. ∇x φ{h,E} · ∇x ∂t φ{h,E} dx = − =− 2 dt R3 R3 On obtient le résultat souhaité en combinant les trois précédentes égalités. On voit donc que, dès lors que l’on sait montrer la positivité de l’énergie libre sur les perturbations admissibles {h2 , f 0 } issues d’une fonction h2 impaire, on peut en déduire l’impossibilité d’instabilités sur la composante impaire h2 puisque l’on a alors la somme de deux termes positifs qui est conservée au cours du temps. C’est le critère de stabilité d’Antonov [4]. Le reste de l’argument de [4] est moins clair en ce qui concerne le contrôle de la composante paire h1 , et semble conditionné à certaines hypothèses ad hoc pour éviter la possibilité d’instabilités avec une croissance polynomiale en temps. Dans l’article suivant [3], Antonov donne une preuve de cette propriété cruciale de positivité de F ({h2 , E}) avec h2 impaire, en résolvant le problème de minimisation associé. Nous allons maintenant présenter les analyses mathématiques récentes de ces questions. Tout d’abord, nous présentons un énoncé et une preuve élégante issue de [34] de la coercitivité découverte par Antonov, i.e., la positivité de l’énergie libre sur les fonctions de la forme {h2 , f 0 } avec h2 impaire. Du fait de l’importance de cette propriété d’un point de vue historique, ainsi que pour la genèse des résultats dont il est question ici, nous présentons une preuve détaillée. Une autre approche de cette propriété et de sa preuve, développée dans [56, 57], sera discutée dans la section 4. Proposition 3.5 ([34]). — On suppose F 0 < 0 sur le domaine de f 0 , et h ∈ Cc∞ à support inclus dans celui de F 0 , à symétrie sphérique et impaire par rapport à la variable de vitesse. Alors on a Ç å ß Z ™ 2 φ0f 0 (r) 2 h 0 0 2 (23) F ({h, f }) ≥ − F (E) |x · v| ,E + |h| dx dv ≥ 0 x·v r R6 où r = |x| et φ0f 0 (r) désigne la dérivée radiale de φf 0 = φf 0 (r). Démonstration. — Observons tout d’abord que, pour un modèle sphérique f 0 = F (E), les fonctions φf 0 et ρf 0 sont radialement symétriques, et on a ó0 1 î 2 0 ∆x φf 0 = ρf 0 =⇒ r φf 0 (r) = ρf 0 (r) 2 r

ASTÉRISQUE 352

(1044)

SYSTÈME DE VLASOV-POISSON GRAVITATIONNEL

57

d’où, en intégrant de 0 à r, on obtient ∀ r > 0,

φ0f 0 (r) =

1 r2

Z

r

r∗2 ρf 0 (r∗ ) dr∗ ≥ 0

0

et le potentiel créé par la solution stationnaire f 0 est croissant. On déduit donc immédiatement la positivité du membre de droite dans la proposition. Rappelons la formule de l’énergie libre Z Z |{h, f 0 }|2 F ({h, f 0 }) := − |∇x φ{h,f 0 } |2 dx. dx dv − 0 (E) F 3 3 3 R ×R R Nous allons tout d’abord contrôler par au-dessus l’opposé du second terme. On observe d’une part que la symétrie sphérique de h implique immédiatement celle de φ{h,f 0 } , et d’autre part que Z

0

Z

{h, f } dv = R3

R3

 ∇x h · ∇v f 0 − ∇v h · ∇x f 0 dv ÅZ ã ÅZ ã = ∇x · h∇v f 0 dv = ∇x · vF 0 (E)h dv . R3

R3

Par conséquence, en utilisant à nouveau ∆x φ = r−2 [r2 φ0 ]0 , on obtient Z r ÅZ ã 1 φ0{h,f 0 } (r) = 2 {h(x∗ , v), f 0 (x∗ , v)} dv r∗2 dr∗ r 0 3 Z Z Z Å ã ÅZ R ã 1 x·v 1 0 F 0 (E)h dv dω(x) = ∇ · vF (E)h dv dx = x 4πr2 |x|≤r 4πr2 |x|=r R3 |x| R3 où dω désigne la mesure uniforme sur la sphère, et dans la première ligne |x∗ | = r∗ . Puis, l’intégrande est à nouveau invariant par rotation sur la variable x et on en déduit Z Å ã x·v F 0 (E)h dv. ∀ |x| = r, φ0{h,f 0 } (r) = |x| R3 On aboutit au contrôle suivant sur le second terme de l’énergie libre par inégalité de Cauchy-Schwarz : åÅ Z Z Z Ç Z Å ã ã x·v 2 0 2 |∇x φ{h,f 0 } | dx ≤ − F (E) dv − F 0 (E)|h|2 dv dx. |x| R3 R3 R3 R3 Étudions plus précisément la première intégrale en v du membre de droite. En chaque point x, on décompose orthogonalement la variable v en ã Å ã Å x·v x x∧v x v= + =: v|| + v⊥ , v|| ∈ R, v⊥ ∈ R2 |x| |x| |x| |x|

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

58

C. MOUHOT

et Ç

å |v|| |2 |v⊥ |2 F (E) dv = − − + + φf 0 dv|| dv⊥ 2 2 R3 R2 R Ç 2 å Z Z v|| |v⊥ |2 v||2 F 0 = −2 + + φf 0 (r) dv|| dv⊥ 2 2 R2 R+ Ç 2 å Z Z Z v|| |v⊥ |2 F =2 f 0 (x, v) dx dv = ρf 0 (r). + + φf 0 (r) dv|| dv⊥ = 2 2 2 6 R R+ R Å

Z

x·v |x|

ã2

Z

0

Z

v||2 F 0

On a donc Z

Z |∇x φ{h,f 0 } | dx ≤ − F 0 (E)ρf 0 (r)|h|2 dx dv. 2

R3

R6

On calcule maintenant le carré du crochet de Poisson suivant ß ™ 2 ß ™ 2 h h h  0 0 0 |{h, f }| = (x · v), f = (x · v) ,f + (x · v), f (x · v) (x · v) (x · v) ß ™ 2 Å ã2 ß ™   h h h (x · v), f 0 2 + 2h = (x · v)2 , f 0 + , f 0 (x · v), f 0 (x · v) (x · v) (x · v) ´ ß ™ 2 ®Å ã2 h h 2 0 0 0 = (x · v) ,f + (x · v){(x · v), f }, f (x · v) (x · v) Å 2 ã  h − {(x · v), f 0 }, f 0 (x · v) 0

2

ce qui donne, lorsque l’on intègre contre 1/F 0 (E) : ß ™ 2 (x · v)2 h 0 , f dx dv 0 (x · v) R6 F (E) ®Å ´ Z ã2 1 h 0 0 + (x · v){(x · v), f }, f dx dv 0 (x · v) R6 F (E) Z Å 2 ã  1 h − {(x · v), f 0 }, f 0 dx dv 0 (x · v) R6 F (E) ß Z ™ 2 h 2 0 = (x · v) F (E) , E dx dv (x · v) R6 ´ Z ®Å ã2 h 0 + (x · v){(x · v), f }, E dx dv (x · v) R6 Z Å 2 ã  h 0 − F (E) {(x · v), E}, E dx dv. (x · v) R6

|{h, f 0 }|2 dx dv = 0 R6 F (E)

Z

ASTÉRISQUE 352

Z

(1044)

SYSTÈME DE VLASOV-POISSON GRAVITATIONNEL

59

Le deuxième terme du membre de droite s’annule par intégration par parties, et comme (x · v) 0 {(x · v), E}, E = −(x · v)φ00f 0 (r) − 3 φf 0 (r) r ä (x · v) (x · v) Ä 00 =− 2 φf 0 (r)r2 + 2φ0f 0 (r)r − φ0f 0 (r) r r ä0 (x · v) (x · v) Ä 2 0 (x · v) 0 =− 2 r φf 0 (r) − φ0f 0 (r) = −(x · v)ρf 0 (r) − φf 0 (r), r r r on obtient pour le troisième terme Ç å Z Z Å 2 ã φ0f 0  h 0 0 2 {(x · v), E}, E dx dv = F (E)h ρf 0 + − F (E) dx dv (x · v) r R6 R6 

et donc ß Z Z ™ 2 h |{h, f 0 }|2 2 0 0 dx dv = − (x · v) F (E) , f dx dv − 0 (E) F (x · v) 6 6 R R Ç å Z φ0f 0 0 2 − F (E)h ρf 0 + dx dv. r R6 On conclut la preuve en combinant cette égalité avec l’inégalité précédente sur R |∇x φ{h,f 0 } |2 dx. R3 3.6. Une inégalité de coercitivité précisée à la Weinstein pour les polytropes Pour conclure cette section, nous allons maintenant considérer le modèle polytropique (14) et présenter l’analyse linéarisée rigoureuse effectuée dans [53]. Nous renvoyons à la section suivante pour la caractérisation variationnelle des polytropes de [51] qui est utilisée pour montrer la positivité au sens large de la fonctionnelle d’énergie libre du problème linéarisé, et nous montrons comment les auteurs de [53] en déduisent une inégalité de coercitivité précisée. Nous présentons ce résultat et une ébauche de preuve car cette dernière contient l’une des idées de la méthode non-linéaire de [57] : l’inégalité de coercitivité sur l’opérateur de Schrödinger (28) ci-dessous, qui sera utilisée pour pouvoir traiter les perturbations non radiales dans le cas non-linéaire. Ce travail est inspiré de l’étude par Weinstein [84, 85] dans les années 1980 de la stabilité des solitons pour l’équation de Schrödinger. On considère une solution stationnaire polytropique (14) avec n = 1/(p − 1) et E0 = −1 : ã1/(p−1) Å |v|2 1/(p−1) − φf 0 (24) f 0 = F (E) = (−1 − E)+ = −1 − 2 +

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

60

C. MOUHOT

pour p > pc = 9/7 supérieur strictement à l’exposant critique que nous avons déjà rencontré dans l’inégalité d’interpolation de la proposition 2.1, ce qui redonne exactement la condition n < 7/2. On définit l’opérateur Å ã h Mh = − 0 + φh 1K F (E) restreint au support K de f 0 . Il est clair que h M h, hiL2 (R3 ×R3 ) = F (h) et que cet opérateur linéaire est symétrique dans L2 (K, dµ) avec la mesure de référence µ = 1/|F 0 (E)|. On peut donc reformuler la question de contrôler par en-dessous l’énergie libre en un contrôle de coercitivité sur l’opérateur M . Tout d’abord, nous admettons ici la positivité (au sens large) M ≥ 0 de cet opérateur pour des perturbations qui ne modifient pas le hamiltonien : Z Z Å 2 ã |v| h ∈ L2 (K, dµ) avec hE dx dv = h + φf 0 dx dv = 0. 2 R6 R6 Cette positivité découle de la caractérisation variationnelle de la proposition 4.1 par saturation d’inégalité de Sobolev de la section suivante. Une fois cette positivité acquise, en s’inspirant de [84], Lemou, Méhats et Raphaël quantifient la coercitivité de l’énergie libre de la manière suivante. Proposition 3.6. — Pour pc < p < +∞, la forme quadratique h 7→ h M h, hi est continue et auto-adjointe sur L2 (K, dµ), et il existe une constante δ ne dépendant que de p telle que "ÅZ Z ã X ã2 # 3 ÅZ 1 h2 − hE dx dv + xi h dx dv . (25) h M h, hi ≥ δ 0 δ R6 R6 K |F (E)| i=1 On retrouve le résultat précédent (avec cependant une constante non constructive) lorsque h = {g, E} et g impaire en v, mais l’analyse du défaut de coercitivité pour les perturbations qui ne sont pas sous cette forme est ici plus précise. Ébauche de preuve. — On va raisonner par l’absurde. On définit Z l’ensemble des fonctions h ∈ L2 (K, dµ) telles que Z Z Z Z hE dx dv = x1 h dx dv = x2 h dx dv = x3 h dx dv = 0. R6

R6

R6

R6

On sait par la caractérisation variationnelle de la proposition 4.1 que h M h, hi ≥ 0 pour h ∈ Z . On suppose alors que I :=

ASTÉRISQUE 352

inf

h∈ Z , khkL2 (K,dµ) =1

h M h, hi = 0.

(1044)

SYSTÈME DE VLASOV-POISSON GRAVITATIONNEL

61

Étape 1 – Construction d’un minimiseur. On considère une suite minimisante hn ∈ Z . Par compacité faible, quitte à extraire, la suite hn converge faiblement vers une fonction h∞ dans L2 (K, dµ). Par ellipticité de l’équation de Poisson, on a la convergence forte de ∇x φhn dans L2 (R3 ). De par la normalisation, on a h M hn , hn i = 1 − k∇x φhn k2L2 (R3 ) → 0 d’où k∇x φh∞ kL2 (R3 ) = 1 et la limite h∞ n’est pas nulle. Étape 2 – Le minimiseur est dans le noyau de M . Par la méthode des multiplicateurs de Lagrange, on déduit du problème de minimisation sous contraintes ci-dessus que ß ™ h∞ M h∞ ∈ Vect , x 1 , x 1 , x 1 , E1 . 1 K 2 K 3 K K |F 0 (E)| En considérant les intégrations de M h∞ contre successivement h∞ , ∂x1 f 0 , ∂x2 f 0 , ∂x3 f 0 et x · ∇v f 0 − 2v · ∇v f 0 , on annule chacun des coefficients dans la décomposition selon cette famille vectorielle, et on déduit finalement que M h∞ = 0. Étape 3 – Étude du noyau de M . On montre que  Ker M = Vect ∂x1 f 0 , ∂x2 f 0 , ∂x3 f 0 . L’inclusion de ces trois vecteurs dans le noyau de M provient simplement de la dérivation par rapport à x1 , x2 et x3 de l’équation définissant la solution stationnaire Å ã Å ã |v|2 1 0 0 (26) 0 = ∂xi (f 0 )p−1 + + φf 0 + 1 1K = ∂ f + φ 1K . x ∂xi f 2 F 0 (E) i Pour l’inclusion réciproque, on considère l’équation h = φh F 0 (E)

(27)

sur K, et l’on en déduit l’équation réduite suivante sur le potentiel par intégration en vitesse Z Z ∆x φ h = ρ h = h dx dv = F 0 (E)φh dx dv. R3

R6

Si l’on définit le potentiel effectif Z Vf 0 := −

F 0 (E) dv,

R3

on fait donc apparaître une équation de Schrödinger stationnaire  (28) A φh := ∆x + Vf 0 φh = 0. Le noyau de cet opérateur A est alors étudié de manière fine par décomposition selon les harmoniques sphériques, avec pour résultat  Ker( A ) = Vect ∂x1 φf 0 , ∂x2 φf 0 , ∂x3 φf 0 .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

62

C. MOUHOT

 On déduit donc que φh ∈ Vect ∂x1 φf 0 , ∂x2 φf 0 , ∂x3 φf 0 , puis en utilisant (27) et (26)  que h ∈ Vect ∂x1 f 0 , ∂x2 f 0 , ∂x3 f 0 . Étape 4 – Conclusion. Puisque h ∈ Z , en intégrant la relation linéaire  h ∈ Vect ∂x1 f 0 , ∂x2 f 0 , ∂x3 f 0 contre x1 , x2 et x3 , on obtient successivement que tous les coefficients de la combinaison linéaire sont nuls, soit h = 0, ce qui aboutit à une contradiction. Mentionnons qu’au moyen de cette inégalité de coercitivité, Lemou, Méhats et Raphaël démontrent ensuite dans [53] un théorème de stabilité linéarisée qui énonce que, pour toute donnée initiale dans un « espace d’énergie » (correspondant au problème de minimisation non-linéaire), le semi-groupe linéarisé croît au plus en O(t2 ). Ils donnent également une décomposition de l’espace L2 (K, dµ) qui localise plus précisément les modes de croissance algébrique.

4. LA STABILITÉ NON-LINÉAIRE Nous allons maintenant suivre le cheminement des différents travaux sur la stabilité non-linéaire. En dehors du dernier travail [57] que nous détaillerons, nous donnons seulement les étapes principales. 4.1. Premières approches variationnelles Le grand succès de ce programme conduit par différents groupes indépendants est la preuve de la stabilité de tous les modèles polytropiques discutés précédemment. Les ingrédients communs à ces différentes approches sont : (a) la caractérisation de la solution stationnaire f 0 étudiée comme un état fondamental (« ground state ») d’un problème de minimisation de la forme (29)

min V (f )=cstes

U (f )

pour une certaine fonctionnelle U et un ensemble de contraintes V , qui sont préservées par l’évolution non-linéaire ; (b) la preuve d’une propriété de séparation des états fondamentaux : la solution stationnaire f 0 est isolée parmi les minimiseurs du problème de minimisation précédent ; (c) la compacité des suites minimisantes, qui repose souvent sur une technique de concentration-compacité [60, 59], sachant que la compacité doit être obtenue dans un sens assez fort pour permettre d’obtenir à la limite une solution stationnaire du système ;

ASTÉRISQUE 352

(1044)

SYSTÈME DE VLASOV-POISSON GRAVITATIONNEL

63

(d) la preuve de la stabilité est alors fondée sur un raisonnement par l’absurde : on considère une suite minimisante qui ne reste pas proche de la solution stationnaire f 0 , puis en appliquant (c) on aboutit, à la limite, à un état stationnaire qui minimise le problème (29) mais qui est différent de f 0 , ce qui contredit (a)-(b). L’idée d’utiliser une fonctionnelle d’énergie-Casimir bien choisie et d’étudier ses points critiques et sa convexité a été introduite pour les équations d’Euler incompressibles en dimension 2 par Arnold [5, 6, 7], et elle a ensuite été appliquée avec succès aux équations de Vlasov-Poisson pour les plasmas dans [38, 73] (voir également les références incluses dans [38] pour les travaux antérieurs de physique sur la stabilité formelle pour les plasmas, ainsi que [27, 28] pour des travaux mathématiques dans le cas de plasmas magnétiques). En ce qui concerne le système de Vlasov-Poisson gravitationnel, le premier travail précurseur en ce sens est dû à Wolansky [87] : ce dernier caractérise l’équilibre comme le minimiseur d’une fonctionnelle d’énergie-Casimir Z min H C (f ) avec H C (f ) = H (f ) + C (f ) dx dv. kf kL1 =1 & f ≥0

R6

Cette approche a été développée de manière systématique par Guo et Rein [29, 32, 74] et a permis d’obtenir la stabilité des polytropes (14) pour 0 < n ≤ 3/2. Les cas 3/2 < n ≤ 7/2 ont ensuite été étudiés dans [30, 33, 75, 79, 35]. En particulier les articles [30, 33] modifient le problème variationnel de la façon suivante : Å ã n 7 1+1/n min H (f ) sous les contraintes f ≥ 0, kf kL1+1/n (R6 ) + − n kf kL1 (R6 ) = M. n+1 2 Parallèlement et de manière légèrement différente à ces travaux, Dolbeault, Sánchez et Soler [21] introduisent ensuite un problème de minimisation différent du type min H (f ) sous les contraintes f ≥ 0, kf kL1 (R6 ) = M, kf kL∞ (R6 ) ≤ 1. Ce problème de minimisation se réécrit de manière équivalente et naturelle par saturation d’inégalité fonctionnelle de type Poincaré reliant l’énergie potentielle, l’énergie cinétique, et les normes utilisées : min

H cin (f ) sous les contraintes f ≥ 0, kf kL1 (R6 ) = M, kf kL∞ (R6 ) ≤ 1. H pot (f )

Cette approche a permis de traiter le cas formel limite n = 0 dans (14) (en plus de cas de polytropes anisotropes que nous n’évoquons pas ici). Sánchez et Soler [77] ont ensuite généralisé cette approche à un espace de contrainte kf kL1 (R6 ) = M et kf kLp (R6 ) ≤ 1, et ont pu montrer la stabilité au sens de la distance L1 (R6 ) pour les polytropes (14) avec 0 ≤ n < 7/2. (4) Un des apports de ces travaux semble (4)

Nous renvoyons également au travail [14] qui étudie selon une stratégie proche les propriétés de stabilité orbitale pour l’équation de Nordström-Vlasov dans un cadre relativiste.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

64

C. MOUHOT

conceptuel : montrer que le problème variationnel sous-jacent est relié à des inégalités de type Sobolev optimales. Simultanément, Lemou, Méhats et Raphaël [49, 51] caractérisent les polytropes à partir d’une inégalité de type Sobolev optimale correspondant aux inégalités d’interpolation de l’équation non-linéaire. Le problème de minimisation en terme de fonctionnelle d’énergie et d’espace de contraintes est équivalent à celui considéré par Sánchez et Soler. Mais ils font ainsi le lien avec l’inégalité d’interpolation de la proposition 2.1, et ils effectuent aussi un retour conceptuel à la méthode originelle de Cazenave et Lions [15] pour l’étude de la stabilité des solitons par concentration-compacité pour l’équation de Schrödinger. Ils démontrent la proposition suivante, que nous avons déjà évoquée et utilisée dans l’étude linéarisée pour la preuve de la proposition 3.6. Proposition 4.1 ([49, 51]). — Soient p ∈ ]pc , +∞[ et f 0 un polytrope défini par (24). Alors le problème de minimisation

min

k|v|2 f kθL11 (R6 ) kf kθL2p (R6 ) kf kθL31 (R6 )

f ∈ E, f 6=0

k∇x φf k2L2 (R3 )

1 p (7p − 9) avec θ1 = , θ2 = , θ3 = 2 3(p − 1) 6(p − 1)

(le dernier coefficient est bien positif du fait que p > pc = 9/7) est atteint sur la famille à quatre paramètres  x − x 0 , µv , γ ∈ R∗+ , λ ∈ R∗+ , µ ∈ R∗+ , x0 ∈ R3 . γf 0 λ En procédant selon les grandes lignes de la stratégie décrite plus haut, les auteurs démontrent ensuite dans [51] la stabilité des polytropes (14) pour 0 < n < 7/2. Cette approche variationnelle a pu traiter de manière satisfaisante les modèles polytropiques. Elle semblait cependant impuissante à traiter des modèles plus généraux, et en particulier le modèle de King. La difficulté est que pour les types de problèmes de minimisation que l’on vient d’énumérer, la propriété de séparation des états fondamentaux (b) décrite plus haut n’est en général plus vérifiée, sans même parler de la propriété (c) de compacité des suites minimisantes. 4.2. Approche directe non-variationnelle par linéarisation Il existe essentiellement deux manières d’aborder la question de la stabilité d’un système d’évolution non-linéaire : d’une part l’approche variationnelle où l’on exprime la solution stationnaire comme solution d’un problème de minimisation qui est invariant le long de l’évolution, et d’autre part l’approche « directe » par linéarisation et contrôle du reste. Nous allons maintenant parler des travaux s’inscrivant dans cette dernière approche. Dans le cas de cette approche directe, il faut tout d’abord quantifier précisément les propriétés de stabilité du système linéarisé. L’inégalité de coercitivité d’Antonov

ASTÉRISQUE 352

(1044)

SYSTÈME DE VLASOV-POISSON GRAVITATIONNEL

65

(23) est un point de départ naturel pour cela. Cependant il faut ensuite surmonter deux difficultés importantes : – il faut contrôler les termes d’ordre supérieur ou égal à trois dans le développement de Taylor de la fonctionnelle d’énergie-Casimir au voisinage de la solution stationnaire f 0 considérée ; – et l’autre difficulté est que l’inégalité de coercitivité d’Antonov (23) n’est valide que pour les perturbations dynamiquement accessibles de la forme h = {g, f 0 }, et que l’on souhaiterait s’affranchir de cette restriction. La première tentative d’utiliser cette approche remonte à Wan [81] mais la preuve semble incomplète. La deuxième tentative du même auteur [82] est plus aboutie mais semble reposer sur une hypothèse non réaliste de positivité de la fonctionnelle F pour toute perturbation h qui exclut la plupart des modèles physiques. Le premier article traitant du modèle de King, et suivant cette approche directe, est dû à Guo et Rein [34]. Les ingrédients clés de ce travail sont : – la définition d’une classe de perturbation à symétrie sphérique n S f 0 = f ∈ L1 (R6 ), f = f (E, L) ≥ 0 tel que ∀ C ∈ C 2 (R2+ ) avec C (0, L) ≡ ∂1 C (0, L) ≡ 0, ∂12 C borné, alors Z Z o C (f, L) dx dv = C (f 0 , L) dx dv R6

R6

qui est : d’une part stable par le système d’évolution non-linéaire du fait que L R est conservé le long des trajectoires et donc les fonctionnelles R6 C (f, L) dx dv sont des invariants du système et, d’autre part, incluse dans les perturbations de la forme h = {g, f 0 } (ce dernier point est démontré en résolvant le système différentiel ordinaire associé) ; – la démonstration par contradiction d’une propriété de convexité stricte de la fonctionnelle d’énergie-Casimir H au voisinage de f 0 :

H (f ) − H (f 0 ) ≥ C0 k∇x φf − ∇x φf 0 k2L2 (R3 ) pour une constante C0 > 0 et avec d(f, f 0 ) := H (f ) − H (f 0 ) + k∇x φf − ∇x φf 0 k2L2 (R3 )

assez petit.

Il y a deux limitations importantes dans les résultats ainsi obtenus. D’une part les perturbations considérées sont restreintes à la classe S f 0 , qui est « trop petite », et en particulier incluses dans l’ensemble des fonctions équimesurables à f 0 . D’autre part, on aimerait bien sûr s’affranchir totalement de la contrainte de symétrie sphérique pour ces perturbations.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

66

C. MOUHOT

La première de ces limitations a ensuite été levée dans le travail [31] de Guo et Lin. Ils démontrent ainsi la stabilité du modèle de King par petite perturbation à symétrie sphérique. Les éléments principaux de leur travail sont les suivants. – Ils considèrent la fonctionnelle d’énergie-Casimir Z C (f ) dx dv avec C (f ) := (1 + f ) ln(1 + f ) − 1 − f H C (f ) = H (f ) + R6

et la distance associée d C (f, f 0 ) := H C (f ) − H C (f 0 ) + k∇x φf − ∇x φf 0 k2L2 (R3 ) . – Afin de montrer la coercitivité de cette fonctionnelle d’énergie-Casimir au voisinage de f 0 sans faire apparaître de termes d’ordre supérieur, ils font appel à une inégalité de dualité convexe élémentaire mais astucieusement utilisée, qui permet de contrôler par en dessous Z ÅZ ã 0 2 0 2 H C (f ) − H C (f ) ≥ cste |∇x φf −f 0 | dx + F (E)|φf −f 0 − P φf −f 0 | dx dv R3 R6 Z | P φf −f 0 |2 dx − · · · − R3

où les trois points désignent des termes contrôlables par les invariants du système, et l’opérateur P est le projecteur sur le noyau de D := v · ∇x − ∇x φf 0 · ∇v (c’est un opérateur de moyennisation sur chacun des tores invariants du flot complètement intégrable associé à cet opérateur de transport). R – Malheureusement le terme négatif − R3 | P φf −f 0 |2 dx dans l’équation ci-dessus semble difficilement contrôlable, aussi les auteurs ont-ils l’idée d’approcher l’opérateur P par une suite bien construite d’opérateurs P ` de rang fini, et de remR placer P par P ` dans l’argument ci-dessus. Le terme négatif − R3 | P ` φf −f 0 |2 dx est alors facilement contrôlable en utilisant un nombre fini de fonctionnelles de Casimir invariantes. – Enfin il reste à étudier la coercitivité du terme Z ã ÅZ F 0 (E)|φf −f 0 − P φf −f 0 |2 dx dv . |∇x φf −f 0 |2 dx + R3

R6

Cette dernière implique sans mal une estimation de coercitivité du même terme avec P ` à la place de P , pour ` assez grand. Cela revient à étudier la positivité de l’opérateur Z A φ = −∆x φ + F 0 (E)(φ − P φ) dv R3

agissant uniquement sur le potentiel φ. En remarquant simplement que Im(1 − P ) ⊥ Ker(D)

ASTÉRISQUE 352

et

Ker(D) = Im(D)⊥ ,

(1044)

SYSTÈME DE VLASOV-POISSON GRAVITATIONNEL

67

on déduit facilement que (φ − P φ) = {h, f 0 } avec h impaire, ce qui permet d’appliquer l’inégalité de coercitivité d’Antonov (23), et de conclure. Ce travail intéressant semble pouvoir se généraliser à des modèles sphériques décroissants plus généraux que le modèle de King. La seconde limitation de cette méthode, c’est-à-dire le fait de ne considérer que des perturbations à symétrie sphérique, semble par contre plus sévère. Un des apports principaux du travail [57], que nous allons maintenant discuter, est de s’être affranchi de cette limitation. 4.3. Nouvelle approche variationnelle par réarrangement Après ce détour par une approche non-variationnelle, nous allons maintenant revenir à une approche variationnelle, mais sous un angle nouveau. On voit qu’un défaut de l’approche variationnelle par énergie-Casimir est qu’elle semble impuissante à reformuler sous forme de problème de minimisation certains modèles stationnaires décroissants. Cependant, dans le même temps, l’approche directe par linéarisation semble limitée par l’inégalité de coercitivité d’Antonov elle-même et par les difficultés inhérentes aux contrôles des termes d’ordre supérieur dans le développement du hamiltonien. Le travail [55] constitue une première avancée en introduisant l’idée d’exploiter les propriétés d’équimesurabilité du flot : même si la propriété de séparation des états fondamentaux n’est pas vérifiée pour le problème de minimisation avec un nombre fini de contraintes, l’équimesurabilité de la solution à sa donnée initiale permet de prouver dans certains cas une propriété de séparation locale. Finalement dans les travaux [56, 57], Lemou, Méhats et Raphaël résolvent complètement ces contradictions. Ils prouvent le théorème suivant dans le cas de modèles sphériques isotropes. Théorème 4.2 ([57]). — Soit f 0 = F (E) ≥ 0 une solution stationnaire continue, non nulle, à support compact, du système (8)-(9), pour laquelle il existe E0 < 0 tel que F (E) = 0 pour E ≥ E0 , F est C 1 sur ] − ∞, E0 [ et F 0 < 0 sur ] − ∞, E0 [. Alors f 0 est orbitalement stable au sens suivant : pour tous M > 0 et ε > 0 il existe η > 0 tel que, pour toute donnée initiale fin ∈ E := {g ≥ 0, g ∈ L1 ∩ L∞ (R6 ), |v|2 g ∈ L1 (R6 )} telle que kfin − f 0 kL1 (R6 ) ≤ η,

H (fin ) ≤ H (f 0 ) + η, kfin kL∞ (R6 ) ≤ kf 0 kL∞ (R6 ) + M,

alors toute solution faible issue de cette donnée initiale vérifie Z  (1 + |v|2 ) f (t, x, v) − f 0 (x − z(t), v) dx dv ≤ ε. ∀ t ≥ 0, R6

Avant de détailler la preuve, donnons les idées essentielles :

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

68

C. MOUHOT

– en s’inspirant d’idées introduites dans la littérature physique [25, 65, 86, 2] les auteurs démontrent que le hamiltonien possède une propriété de monotonie par rapport aux réarrangements selon l’énergie microscopique ; – après ce réarrangement, on est alors ramené à un problème variationnel de minimisation sur le potentiel gravitationnel uniquement, pour lequel la solution stationnaire est bien un minimum isolé ; – enfin pour ce problème de minimisation réduit, ils démontrent une inégalité de coercitivité d’Antonov généralisée dans ce contexte, et font le lien entre la partie radiale de cette inégalité et une inégalité de type Poincaré ; – la fin de la preuve est basée sur un argument de compacité pour des suites minimisantes « généralisées » dont le réarrangement selon l’énergie microscopique est une suite minimisante pour le problème réduit sur le champ gravitationnel, et la compacité est extraite à partir de la coercitivité de l’étape précédente. Ce travail met donc à jour une nouvelle structure variationnelle « cachée sous les réarrangements selon l’énergie microscopique », pour laquelle l’approche variationnelle est bien plus simple et naturelle. Il révèle également le lien entre la coercitivité de ce problème de minimisation réduit et un problème d’inégalité fonctionnelle de type Poincaré. 4.3.1. Réarrangement selon l’énergie microscopique. — Rappelons tout d’abord la notion classique de réarrangement symétrique (voir par exemple [58, Chapitre 3]). Étant donné un ensemble A ⊂ R6 mesurable, on définit son réarrangement symétrique A∗ comme étant la boule ouverte centrée en zéro et de même volume que A (pour une norme donnée sur R6 ). Étant donnée une fonction f ≥ 0 intégrable sur R6 , on définit alors son réarrangement symétrique f ∗ comme étant la fonction positive sur R6 dont les ensembles de niveau supérieur sont obtenus par réarrangement symétrique des ensembles de niveau supérieur correspondants de f , ce qui donne la formule suivante par intégration par tranche Z +∞ 1∗{f ≥s} ds avec 1∗A = 1A∗ . f ∗ (x, v) = 0

La fonction f ∗ est alors radialement symétrique, décroissante, et équimesurable à f . Rappelons la propriété élémentaire suivante sur les réarrangements symétriques. Lemme 4.3. — Pour f ≥ 0 intégrable sur R6 on a Z Z ∗ f (x, v)|(x, v)|R6 dx dv ≤ f (x, v)|(x, v)|R6 dx dv R6

R6

où |(x, v)|R6 désigne la norme considérée sur R6 .

ASTÉRISQUE 352

(1044)

SYSTÈME DE VLASOV-POISSON GRAVITATIONNEL

69

Démonstration. — La preuve est très simple, nous la rappelons pour éclairer la suite. Pour deux ensembles mesurables A, B ⊂ R6 de volume fini avec |A| ≤ |B| (l’autre cas étant symétrique), on a Z Z 1A 1B dx dv = |A ∩ B| ≤ |A| = |A∗ | = |A∗ ∩ B ∗ | = 1∗A 1∗B dx dv. R6

R6

Or pour s ≥ 0 donné on a 1∗|(x,v)| 6 ≤s = 1|(x,v)|R6 ≤s , et on déduit en utilisant la R précédente inégalité et en intégrant par tranche Z Z f 1|(x,v)|R6 ≤s dx dv ≤ f ∗ 1|(x,v)|R6 ≤s dx dv. R6

Puisque

R R6

f dx dv = Z

R6

f ∗ dx dv on en déduit Z f 1|(x,v)|R6 >s dx dv. f ∗ 1|(x,v)|R6 >s dx dv ≤

R

R6

R6

R6

En intégrant finalement selon s ∈ [0, +∞[, on en déduit le résultat. On introduit maintenant de manière similaire le réarrangement selon l’énergie microscopique ã Å 2 |v| + φ(x) Eφ := 2 d’un potentiel donné φ sur R3 de la manière suivante. Étant donné un ensemble A ⊂ R6 mesurable on définit A∗φ son réarrangement selon l’énergie microscopique Eφ comme étant la « boule d’énergie » ouverte A∗φ = {(x, v) | Eφ (x, v) < EA } avec EA choisi tel que |A∗φ | = |A|. Il est facile de voir que E → |{(x, v) | Eφ (x, v) < E}| est une bijection de [min Eφ , 0[ sur R+ . Étant donnée une fonction f ≥ 0 intégrable à support compact sur R6 , on définit alors f ∗φ son réarrangement selon l’énergie microscopique Eφ comme étant la fonction positive sur R6 dont les ensembles de niveau supérieur sont obtenus par réarrangement selon l’énergie microscopique des ensembles de niveau supérieur correspondants de f : Z +∞ ∗φ f (x, v) = 1∗φ avec 1∗φ A = 1A∗φ . {f ≥s} ds 0

∗φ

La fonction f est alors une fonction de Eφ , à support compact, décroissante en l’énergie microscopique Eφ , et équimesurable à f . On a la propriété suivante qui rappelle le lemme élémentaire ci-dessus, et dont nous nous servirons par la suite :

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

70

C. MOUHOT

Lemme 4.4. — Pour f ≥ 0 intégrable à support compact sur R6 on a Z Z f (x, v)Eφ (x, v) dx dv. f ∗φ (x, v)Eφ (x, v) dx dv ≤ R6

R6

Démonstration. — En raisonnant comme précédemment on a Z Z ∗φ 1∗φ 1A 1B dx dv ≤ A 1B dx dv. R6

R6

1∗φ Eφ (x,v)≤s

= 1Eφ (x,v)≤s , en intégrant par tranche D’où, pour s ∈ [− min Eφ , 0[, puisque Z Z f ∗φ 1Eφ (x,v)≤s dx dv f 1Eφ (x,v)≤s dx dv ≤ R6

R6

et puisque

R R6

R

∗φ

f dx dv = R6 f dx dv on en déduit Z Z f ∗φ 1Eφ (x,v)>s dx dv ≤ f 1Eφ (x,v)>s dx dv. R6

R6

En intégrant finalement selon s ∈ [− min Eφ , 0[, on obtient Z Z f ∗φ (Eφ (x, v) − min Eφ ) dx dv ≤ f (Eφ (x, v) − min Eφ ) dx dv R6

R6

d’où le résultat. On va par la suite utiliser le réarrangement de f selon l’énergie microscopique créée par la fonction f elle-même, que nous noterons fˆ = f ∗φf avec, comme précédemment, φf = −(1/(4π|x|)) ∗ ρf . On voit que l’on obtient ainsi une opération de réarrangement f → fˆ très fortement non-linéaire. Remarquons immédiatement que la solution stationnaire sphérique est un point fixe de ce réarrangement non-linéaire : fˆ0 = (f 0 )∗φf 0 = f 0 . 4.3.2. Monotonie du hamiltonien et hamiltonien réduit. — On définit la fonctionnelle 1 J f ∗ (φ) := H (f ∗φ ) + k∇x φ − ∇x φf ∗φ k2L2 (R3 ) 2 et on montre la propriété de monotonie suivante. Proposition 4.5. — Si l’on considère f ∈ E et fˆ = f ∗φf , alors

H (f ) ≥ J f ∗ (φf ) ≥ H (fˆ) avec égalité si et seulement si f = fˆ. Ébauche de preuve. — La preuve repose sur le lemme précédent. Par un calcul que nous avons déjà fait Z Å 2 ã |v| 1 2 + φf (x) (f − g) dx dv H (f ) = H (g) + k∇x φf − ∇x φg kL2 (R3 ) + 2 2 R6

ASTÉRISQUE 352

(1044)

SYSTÈME DE VLASOV-POISSON GRAVITATIONNEL

71

pour deux fonctions f, g ∈ E, d’où avec g = fˆ : Z Å 2 ã |v| H (f ) = J f ∗ (φf ) + + φf (x) (f − fˆ) dx dv 2 R6 et l’on conclut grâce au lemme précédent appliqué à Z Å 2 ã |v| + φf (x) (f − fˆ) dx dv ≥ 0. 2 R6 Le cas d’égalité se traite en étudiant le cas d’égalité dans l’inégalité de monotonie du réarrangement selon l’énergie microscopique. Il s’avère que la différence J f ∗ − J f 0 est facilement contrôlable par des normes sans dérivée :

J f ∗ (φ) − J f 0 (φ) ≥ −kφf kL∞ (R3 ) kf ∗ − (f 0 )∗ kL1 (R6 ) , et l’on peut ainsi se contenter d’étudier la coercitivité de la fonctionnelle J f 0 . Nous noterons J (φ) := J f 0 (φ) et nous appellerons cette fonctionnelle hamiltonien réduit ; elle n’agit que sur le potentiel φ. 4.3.3. Inégalité de coercitivité d’Antonov généralisée pour le hamiltonien réduit. — On va maintenant étudier les propriétés de convexité de J au voisinage de φf 0 , et ainsi montrer que φf 0 est un minimum local de J . On définit un espace de potentiels admissibles ß ™ X := φ ∈ C 0 (R3 ) | φ ≤ 0, lim φ = 0, ∇x φ ∈ L2 (R3 ), inf3 (1 + |x|)|φ(x)| > 0 . ∞

x∈R

On peut alors montrer la proposition suivante. Proposition 4.6. — Il existe des constantes c0 , δ0 > 0 et une application continue φ → zφ de H˙ 1 (R3 ) (l’espace de Sobolev homogène) dans R3 telles que pour φ ∈ X tel que h i inf3 kφ − φf 0 (· − z)kL∞ (R3 ) + k∇x φ − ∇x φf 0 (· − z)kL2 (R3 ) < δ0 z∈R

alors

J (φ) − J (φf 0 ) ≥ c0 k∇x φ − ∇x φf 0 (· − zφ )kL2 (R3 ) . Ébauche de preuve. — On décompose la démarche en plusieurs étapes. Étape 1 : Développement de Taylor. La première phase calculatoire est d’écrire le développement de Taylor à l’ordre 2 de J avec un reste contrôlé explicitement :  1 J (φ) − J (φf 0 ) = D2 J (φf 0 )(φ − φf 0 , φ − φf 0 ) + o kφ − φf 0 kL∞ (R3 ) k∇x φ − ∇x φf 0 k2L2 (R3 ) 2 avec le terme d’ordre 1 qui s’annule et Z Z  2 2 2 D J (φf 0 )(h, h) := |∇x h| dx − |F 0 (E)| h(x) − ( P h)(x, v) dx dv R3

R6

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

72

C. MOUHOT

où l’on rappelle que, sans autre précision, E = Eφf 0 = (|v|2 /2 + φf 0 (x)), et la projection P est définie par 1/2 R  |v|2 0 0 h(y) dy 2 + φf (x) − φf (y) R3 + ( P h)(x, v) := R Ä 2 . ä1/2 |v| 0 0 + φ (x) − φ (y) dy f f 2 R3 +

C’est un opérateur de projection sur les fonctions de E uniquement. Dans le cas radial on retrouve ainsi l’opérateur de projection sur le noyau de l’opérateur v · ∇x − ∇x φf 0 · ∇v que nous avons déjà rencontré dans le travail [31]. Étape 2 : Inégalité d’Antonov généralisée. Si l’on définit Z L h = −∆x h − |F 0 (E)|(1 − P ) dv R3

on obtient h L h, hiL2 (R3 ) = D2 J (φf 0 )(h, h) et l’on ramène le problème à l’étude de l’opérateur L ; on a alors la proposition suivante. Proposition 4.7. — L’opérateur L est positif, c’est une perturbation compacte du laplacien sur H˙ 1 (R3 ), son noyau est donné par  Ker( L ) = Vect ∂x1 φf 0 , ∂x2 φf 0 , ∂x3 φf 0 et on a donc ∀ h ∈ H˙ 1 (R3 ),

h L h, hiL2 (R3 ) ≥

c0 k∇x hk2L2 (R3 )

ã2 3 ÅZ 1 X − h∆x (∂xi φf 0 ) dx c0 i=1 R3

pour une certaine constante c0 > 0. On décompose h en partie radiale et complémentaire orthogonal Ä ä⊥ 1 1 h = h0 + h1 , h0 ∈ H˙ rad (R3 ), h1 ∈ H˙ rad (R3 ) . La positivité selon la composante h1 est plus simple à traiter car Πh1 = 0 et son étude se ramène donc à celle de l’opérateur de Schrödinger A que nous avons déjà étudié plus haut dans la preuve de la proposition 3.6. Le noyau Ker( L ) de l’énoncé s’en déduit en particulier. Sur la composante radiale h0 on a l’inégalité 1 ∀ h ∈ H˙ rad (R3 ), h 6= 0,

h L h, hiL2 (R3 ) > 0.

Cette propriété peut se démontrer comme dans la preuve de Guo et Lin [31] que nous avons discutée précédemment à la sous-section 4.2, en montrant qu’elle se réduit à l’inégalité de coercitivité d’Antonov démontrée à la proposition 3.5.

ASTÉRISQUE 352

(1044)

SYSTÈME DE VLASOV-POISSON GRAVITATIONNEL

73

Lemou, Méhats et Raphaël proposent une autre preuve intéressante de cette propriété et de la proposition 3.5, en faisant le parallèle avec la démonstration d’une inégalité de type Poincaré. Ils adaptent la stratégie de preuve de Hörmander [40, 39], et utilisent une inégalité fonctionnelle de type Hardy. Donnons l’idée générale de cet argument. On introduit l’opérateur suivant sur les fonctions radiales, exprimé dans les variables E et r : T f (E, r) =

r2

p

1 1 ∂r f = 2 ∂r f, r |v| 2(E − φf 0 (r))

˜ pour un certain h. ˜ On calcule alors par et on vérifie que P h = 0 implique h = T h intégration par parties et inégalité de Cauchy-Schwarz (un argument d’approximation supplémentaire est nécessaire, que nous n’évoquons pas ici) å1/2 Ç Z Z ˜2 h 0 2 0 |F (E)|(h − P h) dx dv ≤ k∇x hkL2 (R3 ) 3 ρf 0 (r) 4 |F (E)| dx dv . 4r (E − φf 0 (r))2 R6 R6 On montre alors l’inégalité de type Hardy suivante Ç Z Å å Z ã ˜2 (φf 0 )0 (r) h 0 ˜ 2 dx dv, ρf 0 (r) + 3 |F 0 (E)||T h| |F (E)| dx dv ≤ r 4r4 (E − φf 0 (r))2 R6 R6 ce qui, combiné avec l’inégalité précédente, donne Z Z ˜2 (φf 0 )0 (r) h |F 0 (E)| dx dv k∇x hk2L2 (R3 ) − |F 0 (E)|(h − P h)2 dx dv ≥ 3 4 r 4r (E − φf 0 (r))2 R6 R6 et conclut la preuve de positivité. L’inégalité de Hardy se démontre en remarquant que ä T 2h Ä ˜2 ˜ 2=T h ˜ 2h ˜ ˜ ˜ 2 avec h ˜=h ˜ 1h ˜ 2, (T h) h 1 2 T h2 − ˜ h2 puis Å ã ˜2 φf 0 (r) T 2h 3 ˜ 2 = r3 (2(E − φf 0 (r)))3/2 . 0 − ρ (r) + pour h = 4 f ˜2 4r (E − φf 0 (r))2 r h Étape 3 : Traitement du noyau par modulation. On ajuste finalement la fonction de translation zφ au moyen d’un théorème des fonctions implicites pour annuler les défauts de coercitivité, i.e., les termes négatifs dans la proposition ci-dessus. 4.3.4. Compacité des suites minimisantes et résolution de la conjecture. — On peut montrer la compacité de certaines suites minimisantes généralisées fn au sens suivant. Proposition 4.8. — Si fn ∈ E vérifie h i sup inf3 kφf n − φf 0 (· − z)kL∞ (R3 ) + k∇x φf n − ∇x φf 0 (· − z)kL2 (R3 ) < δ0 n≥0 z∈R

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

74

C. MOUHOT

et lim kfn∗ − (f 0 )∗ kL1 (R6 ) = 0,

n→∞

alors

Z

n→∞

 (1 + |v|2 ) fn (x, v) − f 0 (x − zφ n , v) dx dv = 0. f

lim

n→∞

lim inf H (fn ) ≤ H (f 0 ),

R6

Ébauche de preuve. — La preuve est faite en deux étapes. Tout d’abord le contrôle de coercitivité précédent implique sans difficultés que lim k∇x φf n − ∇x φf 0 (· − zφf n )kL2 (R3 ) = 0.

n→∞

Ensuite on note f¯n (x, v) = fn (x + zφf n , v) et l’on revient au hamiltonien complet en utilisant l’identité Z 1 H (f¯n ) − H (f 0 ) + k∇x φf¯n − ∇x φf 0 kL2 (R3 ) = Eφf 0 (f¯n − f 0 ) dx dv. 2 R6 À partir des hypothèses et de la convergence déjà démontrée, on a    0 0   lim sup H (f¯n ) − H (f ) = lim sup H (fn ) − H (f ) ≤ 0, n→∞

 

n→∞

k∇x φf¯n − ∇x φf 0 kL2 (R3 ) = k∇x φf n − ∇x φf 0 (· − zφf n )kL2 (R3 ) → 0,

et on en déduit

Z lim sup n→∞ 0 ∗

R6

Eφf 0 (f¯n − f 0 ) dx dv ≤ 0.

L’hypothèse (fn )∗ → (f ) implique par ailleurs Z ∗φ 0 lim Eφf 0 (f 0 − f¯n f ) dx dv = 0 n→∞

R6

d’où l’on déduit

Z lim sup n→∞

R6

∗φ 0 Eφf 0 (f¯n − f¯n f ) dx dv ≤ 0.

R ∗φ 0 De par la monotonie du réarrangement R6 Eφf 0 (f¯n − f¯n f ) dx dv ≥ 0, on en déduit finalement Z ∗φ 0 Eφ 0 (f¯n − f¯n f ) dx dv = 0. lim n→∞

R6

f

Il suffit ensuite de montrer que la saturation de cette inégalité de réarrangement, combinée à l’hypothèse (fn )∗ → (f 0 )∗ , implique que lim kfn − f 0 kL1 (R6 ) = 0.

n→∞

En combinant cette convergence avec l’hypothèse de limite supérieure sur le hamiltonien ainsi que la convergence du potentiel, on obtient finalement la convergence de l’énergie cinétique Z Z |v|2 fn dx dv =

lim

n→∞

ASTÉRISQUE 352

R6

|v|2 f 0 dx dv

R6

(1044)

SYSTÈME DE VLASOV-POISSON GRAVITATIONNEL

75

ce qui conclut la preuve de la proposition 4.8. La fin de la preuve du théorème 4.2 se fait ensuite en combinant la proposition 4.8, l’inégalité d’interpolation de la proposition 2.1, ainsi que la contractivité du réarrangement symétrique kf ∗ − (f 0 )∗ kL1 (R6 ) ≤ kf − f 0 kL1 (R6 ) .

5. CONCLUSION ET PROBLÈMES OUVERTS Ce problème de stabilité des galaxies est un exemple intéressant de recherche mathématique nourrie par une question concrète posée par la physique théorique. Nous essayons pour terminer de soulever quelques questions ouvertes d’ordre mathématique, en suggérant des liens avec d’autres travaux. Tout d’abord, la première question naturelle du point de vue de la pertinence physique des résultats est de quantifier la taille du voisinage de stabilité orbitale. Cela paraît maintenant une tâche plus abordable avec la nouvelle théorie de Lemou, Méhats et Raphaël ; il s’agit essentiellement de rendre explicites, ou tout au moins constructives, les constantes de coercitivité dans les inégalités fonctionnelles utilisées. L’autre question naturelle est de sortir du cadre strictement monotone pour la solution stationnaire f 0 (E). Par exemple, nous pouvons déjà nous demander si, au niveau des solutions stationnaires, localement au voisinage d’une solution orbitalement stable, il est possible de démontrer un théorème de paramétrisation bijective des solutions stationnaires par les conservations du système, dans le même esprit que le travail récent de Choffrut et Sverák [16] sur l’équation d’Euler incompressible en dimension 2. Cependant, nous pourrions nous attendre plus généralement, au niveau dynamique, à la stabilité orbitale autour d’une solution stationnaire « presque » monotone, et donc proche des solutions orbitalement stables que nous avons étudiées. Une première tâche serait ici de clarifier au niveau mathématique les instabilités créées par des perturbations non radiales de modèles sphériques anisotropes. Les méthodes variationnelles semblent néanmoins trouver leur limite, et cela soulève la question de revenir à nouveau à une approche directe par linéarisation. Cela nous amène également à faire une autre remarque importante sur les travaux que nous avons présentés : ceux-ci n’utilisent pas la dynamique proprement dite de l’équation, mais uniquement ses invariants. Même si les résultats obtenus sont dynamiques, le cœur conceptuel de ces méthodes n’utilise pas la dynamique. C’est une force de ces approches, qui leur confère une grande robustesse pour traiter des modèles généraux et manipuler des solutions très faibles, mais c’est également une faiblesse dès lors que l’on sort d’un cadre parfaitement variationnel.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

76

C. MOUHOT

Par conséquent, il serait intéressant d’explorer les dialogues possibles avec les résultats de stabilité non-linéaire obtenus dans [69]. Ces derniers résultats utilisent des espaces fonctionnels très réguliers, c’est donc en ce sens l’extrême opposé des méthodes de stabilité orbitale que nous avons présentées. En particulier, cela implique qu’il faut « traquer » les oscillations du système dans les estimations de régularité, alors que les espaces de Lebesgue utilisés dans les théories de stabilité orbitale ne « voient » pas les oscillations de la variable de vitesse produites par le mélange de phase. Les hypothèses sur les données initiales sont donc bien plus fortes, mais cela permet également d’obtenir une information plus précise sur le comportement asymptotique du système, et de montrer la stabilité non-linéaire autour de solutions stationnaires linéairement stables, mais qui ne vérifient pas un problème variationnel. Les résultats de [69] s’appliquent à l’équation de Vlasov-Poisson gravitationnelle, mais uniquement dans le cas non physique d’un domaine périodique en espace. Le cas d’un système auto-gravitant qui « crée sa propre géométrie » et son propre confinement au cours du temps représente un défi probablement difficile mais aussi très intéressant pour cette approche par linéarisation : à l’inverse de [69] où « l’amortissement Landau » produit une convergence vers zéro du champ moyen asymptotiquement, on ne connaît plus ici à l’avance quelle doit être la limite du champ moyen lorsque t → +∞. Un défi conceptuel similaire se pose pour l’équation d’Euler incompressible en dimension 2 ainsi que pour l’équation de Vlasov-Poisson avec un confinement magnétique. Pour terminer, nous mentionnerons le problème intéressant, mais probablement pour le moment hors d’atteinte tant que les questions précédentes et la limite de champ moyen ne sont pas mieux comprises, de faire le lien entre les résultats de stabilité obtenus pour l’équation de Vlasov-Poisson gravitationnelle, et les résultats de stabilité asymptotique (on pense par exemple à la théorie KAM) pour le problème à N corps, dans la limite N → ∞.

RÉFÉRENCES [1] R. Abraham & J. E. Marsden – Foundations of mechanics, Benjamin/Cummings Publishing Co. Inc. Advanced Book Program, 1978. [2] J. J. Aly – On the lowest energy state of a collisionless self-gravitating system under phase space volume constraints, Monthly Notices Roy. Astronom. Soc. 241 (1989), no 1, p. 15–27. [3] A. V. Antonov – Solution of the problem of stability of a stellar system with the Emden density law and spherical velocity distribution, J. Leningrad Univ. Si. Mekh. Astro. 7 (1962), p. 135–146.

ASTÉRISQUE 352

(1044)

SYSTÈME DE VLASOV-POISSON GRAVITATIONNEL

77

[4] V. A. Antonov – Remarks on the problems of stability in stellar dynamics, Soviet Astronom. AJ 4 (1960), p. 859–867. [5] V. I. Arnol0 d – On conditions for non-linear stability of plane stationary curvilinear flows of an ideal fluid, Dokl. Akad. Nauk SSSR 162 (1965), p. 975–978. [6] V. I. Arnold – Variational principle for three dimensional steady-state flows of an ideal fluid, J. Appl. Math. Mech. 29 (1965), p. 1002–1008. , On an a priori estimate in the theory of hydrodynamic stability, Am. [7] Math. Soc. Transl. 19 (1969), p. 267–269. [8] A. A. Arsen0 ev – Existence in the large of a weak solution of Vlasov’s system of equations, Ž. Vyčisl. Mat. i Mat. Fiz. 15 (1975), p. 136–147. [9] J. Batt, W. Faltenbacher & E. Horst – Stationary spherically symmetric models in stellar dynamics, Arch. Rational Mech. Anal. 93 (1986), no 2, p. 159– 183. [10] J. Batt, P. J. Morrison & G. Rein – Linear stability of stationary solutions of the Vlasov-Poisson system in three dimensions, Arch. Rational Mech. Anal. 130 (1995), no 2, p. 163–182. [11] J. Batt & G. Rein – Global classical solutions of the periodic Vlasov-Poisson system in three dimensions, C. R. Acad. Sci. Paris Sér. I Math. 313 (1991), no 6, p. 411–416. [12] J. Binney & S. Tremaine – Galactic dynamics, Princeton Univ. Press, 1987. [13] W. Braun & K. Hepp – The Vlasov dynamics and its fluctuations in the 1/N limit of interacting classical particles, Comm. Math. Phys. 56 (1977), no 2, p. 101–113. [14] S. Calogero, Ó. Sánchez & J. Soler – Asymptotic behavior and orbital stability of galactic dynamics in relativistic scalar gravity, Arch. Ration. Mech. Anal. 194 (2009), no 3, p. 743–773. [15] T. Cazenave & P.-L. Lions – Orbital stability of standing waves for some nonlinear Schrödinger equations, Comm. Math. Phys. 85 (1982), no 4, p. 549– 561. [16] A. Choffrut & V. Šverák – Local structure of the set of steady-state solutions to the 2D incompressible Euler equations, Geom. Funct. Anal. 22 (2012), no 1, p. 136–201. [17] R. DiPerna & P.-L. Lions – Global weak solutions of kinetic equations, Rend. Sem. Mat. Univ. Politec. Torino 46 (1988), no 3, p. 259–288. [18] , Solutions globales d’équations du type Vlasov-Poisson, C. R. Acad. Sci. Paris Sér. I Math. 307 (1988), no 12, p. 655–658. [19] , Ordinary differential equations, transport theory and Sobolev spaces, Invent. Math. 98 (1989), no 3, p. 511–547.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

78

C. MOUHOT

[20] R. L. Dobrušin – Vlasov equations, Funktsional. Anal. i Prilozhen. 13 (1979), no 2, p. 48–58. [21] J. Dolbeault, Ó. Sánchez & J. Soler – Asymptotic behaviour for the Vlasov-Poisson system in the stellar-dynamics case, Arch. Ration. Mech. Anal. 171 (2004), no 3, p. 301–327. [22] J. P. Dorémus & M. R. Feix – Stability of a self gravitating density function of energy and angular momentum, Astron. & Astrophys. 29 (1973), p. 401–407. [23] J. P. Dorémus, M. R. Feix & G. Baumann – Stability of encounterless spherical stellar systems, Phys. Rev. Letter 26 (1971), p. 725–728. [24] A. Eddington – The distribution of stars in globular clusters, Mon. Not. R. Astr. Soc. 76 (1916). [25] C. S. Gardner – Bound on the energy available from a plasma, Phys. Fluids 6 (1963), p. 839–840. [26] I. Gasser, P.-E. Jabin & B. Perthame – Regularity and propagation of moments in some nonlinear Vlasov systems, Proc. Roy. Soc. Edinburgh Sect. A 130 (2000), no 6, p. 1259–1273. [27] Y. Guo – Stable magnetic equilibria in collisionless plasmas, Comm. Pure Appl. Math. 50 (1997), no 9, p. 891–933. [28]

, Stable magnetic equilibria in a symmetric collisionless plasma, Comm. Math. Phys. 200 (1999), no 1, p. 211–247.

[29]

, Variational method for stable polytropic galaxies, Arch. Ration. Mech. Anal. 150 (1999), no 3, p. 209–224.

[30]

, On the generalized Antonov stability criterion, in Nonlinear wave equations (Providence, RI, 1998), Contemp. Math., vol. 263, Amer. Math. Soc., 2000, p. 85–107.

[31] Y. Guo & Z. Lin – Unstable and stable galaxy models, Comm. Math. Phys. 279 (2008), no 3, p. 789–813. [32] Y. Guo & G. Rein – Stable steady states in stellar dynamics, Arch. Ration. Mech. Anal. 147 (1999), no 3, p. 225–243. [33]

, Isotropic steady states in galactic dynamics, Comm. Math. Phys. 219 (2001), no 3, p. 607–629.

[34]

, A non-variational approach to nonlinear stability in stellar dynamics applied to the King model, Comm. Math. Phys. 271 (2007), no 2, p. 489–509.

[35] M. Hadžić – A constraint variational problem arising in stellar dynamics, Quart. Appl. Math. 65 (2007), no 1, p. 145–153. [36] M. Hauray & P.-E. Jabin – N -particles approximation of the Vlasov equations with singular potential, Arch. Ration. Mech. Anal. 183 (2007), no 3, p. 489–524.

ASTÉRISQUE 352

(1044)

[37]

SYSTÈME DE VLASOV-POISSON GRAVITATIONNEL

79

, Particles approximations of Vlasov equations with singular forces : Part 2, prépublication arXiv:1107.3821.

[38] D. D. Holm, J. E. Marsden, T. Ratiu & A. Weinstein – Nonlinear stability of fluid and plasma equilibria, Phys. Rep. 123 (1985), nos 1-2, p. 116. [39] L. Hörmander – L2 estimates and existence theorems for the ∂¯ operator, Acta Math. 113 (1965), p. 89–152. [40]

, An introduction to complex analysis in several variables, third éd., NorthHolland Mathematical Library, vol. 7, North-Holland Publishing Co., 1990.

[41] E. Horst – On the asymptotic growth of the solutions of the Vlasov-Poisson system, Math. Methods Appl. Sci. 16 (1993), no 2, p. 75–86. [42] E. Horst & R. Hunze – Weak solutions of the initial value problem for the unmodified nonlinear Vlasov equation, Math. Methods Appl. Sci. 6 (1984), no 2, p. 262–279. [43] R. Illner & H. Neunzert – An existence theorem for the unmodified Vlasov equation, Math. Methods Appl. Sci. 1 (1979), no 4, p. 530–544. [44] J. H. Jeans – On the theory of star-streaming and the structure of the universe, Mon. Not. R. Astr. Soc. 76 (1915), p. 70–84. [45]

, Problems of cosmogony and stellar dynamics, Cambridge Univ. Press, 1919.

[46] H. E. Kandrup & J. F. Sygnet – A simple proof of dynamical stability for a class of spherical clusters, Astrophys. J. 298 (1985), no 1, part 1, p. 27–33. [47] I. R. King – The structure of star clusters. III. Some simple dynamical models, Astronomical Journal 71 (1966), p. 64. [48] M. D. Kruskal & C. R. Oberman – On the stability of plasma in static equilibrium, Phys. Fluids 1 (1958), p. 275–280. [49] M. Lemou, F. Méhats & P. Raphael – Orbital stability and singularity formation for Vlasov-Poisson systems, C. R. Math. Acad. Sci. Paris 341 (2005), no 4, p. 269–274. [50] M. Lemou, F. Méhats & P. Raphaël – Uniqueness of the critical mass blow up solution for the four dimensional gravitational Vlasov-Poisson system, Ann. Inst. H. Poincaré Anal. Non Linéaire 24 (2007), no 5, p. 825–833. [51] M. Lemou, F. Méhats & P. Raphael – The orbital stability of the ground states and the singularity formation for the gravitational Vlasov Poisson system, Arch. Ration. Mech. Anal. 189 (2008), no 3, p. 425–468. [52] M. Lemou, F. Méhats & P. Raphaël – Stable self-similar blow up dynamics for the three dimensional relativistic gravitational Vlasov-Poisson system, J. Amer. Math. Soc. 21 (2008), no 4, p. 1019–1063.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

80

[53] [54] [55] [56] [57] [58] [59]

[60]

[61] [62] [63] [64] [65] [66]

[67] [68] [69] [70]

C. MOUHOT

, Structure of the linearized gravitational Vlasov-Poisson system close to a polytropic ground state, SIAM J. Math. Anal. 39 (2008), no 6, p. 1711–1739. , A new variational approach to the stability of gravitational systems, C. R. Math. Acad. Sci. Paris 347 (2009), nos 15-16, p. 979–984. , Stable ground states for the relativistic gravitational Vlasov-Poisson system, Comm. Partial Differential Equations 34 (2009), nos 7-9, p. 703–721. , A new variational approach to the stability of gravitational systems, Comm. Math. Phys. 302 (2011), no 1, p. 161–224. , Orbital stability of spherical galactic models, Invent. Math. 187 (2012), no 1, p. 145–194. E. Lieb & M. Loss – Analysis, Amer. Math. Soc., 2001. P.-L. Lions – The concentration-compactness principle in the calculus of variations. The locally compact case. I, Ann. Inst. H. Poincaré Anal. Non Linéaire 1 (1984), no 2, p. 109–145. , The concentration-compactness principle in the calculus of variations. The locally compact case. II, Ann. Inst. H. Poincaré Anal. Non Linéaire 1 (1984), no 4, p. 223–283. P.-L. Lions & B. Perthame – Propagation of moments and regularity for the 3-dimensional Vlasov-Poisson system, Invent. Math. 105 (1991), no 2, p. 415–430. G. Loeper – Uniqueness of the solution to the Vlasov-Poisson system with bounded density, J. Math. Pures Appl. 86 (2006), no 1, p. 68–79. D. Lynden-Bell – The stability and vibrations of a gas of stars, Mon. Not. R. Astr. Soc. 124 (1962), p. 279–296. , Statistical mechanics of violent relaxation in stellar systems, Mon. Not. R. Astr. Soc. 136 (1967), p. 101–121. , The Hartree-Fock exchange operator and the stability of galaxies, Mon. Not. R. Astr. Soc. 144 (1969), p. 189–217. C. Marchioro, E. Miot & M. Pulvirenti – The Cauchy problem for the 3-D Vlasov-Poisson system with point charges, Arch. Ration. Mech. Anal. 201 (2011), no 1, p. 1–26. P. J. Morrison & D. Pfirsch – The free energy of Maxwell-Vlasov equilibria, Phys. Fluids B 2 (1990), no 6, part 1, p. 1105–1113. , Dielectric energy versus plasma energy, and Hamiltonian action-angle variables for the Vlasov equation, Phys. Fluids B 4 (1992), no 10, p. 3038–3057. C. Mouhot & C. Villani – On Landau damping, Acta Math. 207 (2011), no 1, p. 29–201. C. Pallard – Moment propagation for weak solutions to the Vlasov-Poisson system, Comm. Partial Differential Equations 37 (2012), no 7, p. 1273–1285.

ASTÉRISQUE 352

(1044)

SYSTÈME DE VLASOV-POISSON GRAVITATIONNEL

81

[71] J. Perez & J. J. Aly – Stability of spherical stellar systems. I : Analytical results, Mon. Not. R. Astr. Soc. 280 (1996), p. 689–699. [72] K. Pfaffelmoser – Global classical solutions of the Vlasov-Poisson system in three dimensions for general initial data, J. Differential Equations 95 (1992), no 2, p. 281–303. [73] G. Rein – Non-linear stability for the Vlasov-Poisson system—the energyCasimir method, Math. Methods Appl. Sci. 17 (1994), no 14, p. 1129–1140. [74]

, Stability of spherically symmetric steady states in galactic dynamics against general perturbations, Arch. Ration. Mech. Anal. 161 (2002), no 1, p. 27– 42.

[75] G. Rein & Y. Guo – Stable models of elliptical galaxies, Mon. Not. R. Astr. Soc. 344 (2003), p. 1396–1406. [76] R. Robert – Unicité de la solution faible à support compact de l’équation de Vlasov-Poisson, C. R. Acad. Sci. Paris Sér. I Math. 324 (1997), no 8, p. 873–877. [77] Ó. Sánchez & J. Soler – Orbital stability for polytropic galaxies, Ann. Inst. H. Poincaré Anal. Non Linéaire 23 (2006), no 6, p. 781–802. [78] J. Schaeffer – Global existence of smooth solutions to the Vlasov-Poisson system in three dimensions, Comm. Partial Differential Equations 16 (1991), nos 8-9, p. 1313–1335. [79]

, Steady states in galactic dynamics, Arch. Ration. Mech. Anal. 172 (2004), no 1, p. 1–19.

[80] J. F. Sygnet, G. Des Forets, M. Lachieze-Rey & R. Pellat – Stability of gravitational systems and gravothermal catastrophe in astrophysics, Astrophys. J. 276 (1984), p. 737–745. [81] Y. H. Wan – Nonlinear stability of stationary spherically symmetric models in stellar dynamics, Arch. Rational Mech. Anal. 112 (1990), no 1, p. 83–95. [82]

, On nonlinear stability of isotropic models in stellar dynamics, Arch. Ration. Mech. Anal. 147 (1999), no 3, p. 245–268.

[83] A. Weinstein – The local structure of Poisson manifolds, J. Differential Geom. 18 (1983), no 3, p. 523–557. [84] M. I. Weinstein – Modulational stability of ground states of nonlinear Schrödinger equations, SIAM J. Math. Anal. 16 (1985), no 3, p. 472–491. [85]

, Lyapunov stability of ground states of nonlinear dispersive evolution equations, Comm. Pure Appl. Math. 39 (1986), no 1, p. 51–67.

[86] H. Wiechen, H. J. Ziegler & K. Schindler – Relaxation of collisionless self gravitating matter : the lowest energy state, Mon. Not. R. Astr. Soc. 223 (1988), p. 623–646.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

82

C. MOUHOT

[87] G. Wolansky – On nonlinear stability of polytropic galaxies, Ann. Inst. H. Poincaré Anal. Non Linéaire 16 (1999), no 1, p. 15–48. [88] S. Wollman – Global-in-time solutions to the three-dimensional Vlasov-Poisson system, J. Math. Anal. Appl. 176 (1993), no 1, p. 76–91. [89] H. Ye, P. J. Morrison & J. D. Crawford – Poisson bracket for the Vlasov equation on a symplectic leaf, Phys. Lett. A 156 (1991), nos 1-2, p. 96–100.

Clément MOUHOT University of Cambridge Centre for Mathematical Sciences Wilberforce Road Cambridge CB3 0WA, UK E-mail : [email protected]

ASTÉRISQUE 352

352

ASTÉRISQUE 2013

SÉMINAIRE BOURBAKI VOLUME 2011/2012 EXPOSÉS 1043-1058 (1045) Difficulté d’approximation Pierre PANSU

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Séminaire BOURBAKI 64e année, 2011-2012, no 1045, p. 83 à 120

Novembre 2011

DIFFICULTÉ D’APPROXIMATION [d’après Khot, Kindler, Mossel, O’Donnell,...] par Pierre PANSU

INTRODUCTION Ce soir, je dois recevoir n invités. Je dois les répartir sur deux tables. Je les connais bien, je sais quelle solide inimitié certains éprouvent pour d’autres. Par exemple, je dois absolument éviter de placer L... et M... à la même table. Et de même pour N... et P... Mais il y a trop de couples ennemis. Je vais tout de même chercher un plan de table qui maximise le nombre de couples séparés. En termes combinatoires, je forme un graphe dont les sommets sont mes invités et les arêtes les liens d’inimitié. Il s’agit de trouver un coloriage des sommets en deux couleurs (noir et blanc) qui maximise le nombre d’arêtes bicolores. Par exemple, le graphe ci-dessous à gauche a 13 arêtes, le coloriage proposé à droite a 11 arêtes bicolores, on ne peut pas faire mieux. Je dis que la coupe maximale du graphe vaut 11.

Le problème MAX CUT consiste à écrire un algorithme qui prend en entrée un graphe à n sommets et un entier k et retourne un coloriage avec au moins k arêtes bicolores, s’il en existe, ou bien s’arrête s’il n’en existe pas. (∗) Ce travail a bénéficié d’une aide de l’Agence Nationale de la Recherche portant la référence ANR-10-BLAN 0116.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

84

P. PANSU

C’est le prototype des problèmes de recherche (il s’agit de trouver une solution à un ensemble de contraintes). On remarque que, étant donné un coloriage, vérifier s’il y a au moins k arêtes bicolores peut se faire rapidement, en temps polynomial (ici, au plus quadratique) en la taille du coloriage, i.e en le nombre de sommets. Cette propriété caractérise les problèmes de recherche de la classe N P . Cette classe est très vaste. Elle contient en particulier le problème de trouver une preuve d’un théorème (vérifier une preuve convenablement écrite peut se faire en temps polynomial en la longueur de la preuve). Néanmoins, MAX CUT est N P -complet au sens suivant. Tout problème de la classe N P se ramène à MAX CUT, par un prétraitement qui ne prend qu’un temps polynomial en la taille des données. Si un jour on trouve un algorithme qui résout MAX CUT en temps polynomial, il en sera de même pour tous les problèmes N P . Peu de gens y croient (c’est la célèbre conjecture P 6= N P ), si bien que la résolution de MAX CUT est considérée comme inaccessible au calcul. À défaut d’une solution exacte, on se contenterait volontiers d’une solution approchée. Étant donné α < 1, une α-approximation de MAX CUT est un algorithme polynomial qui retourne un coloriage réalisant α fois la coupe maximale. Cette notion s’étend à tout problème d’optimisation combinatoire, où les instances sont des fonctions à valeurs réelles sur des ensembles finis qu’il s’agit de maximiser (pour les problèmes de minimisation, on garde la même terminologie, avec α > 1). On s’autorise des tirages au hasard(1). Dans ce cas, on demande que la solution retournée par l’algorithme soit satisfaisante avec probabilité > 1/2. Définition 0.1. — Soit α < 1. On dit qu’un problème d’approximation combinatoire est α-approximable s’il possède une α-approximation. Par exemple, tirer la couleur de chaque sommet au hasard indépendamment donne une 1/2-approximation de MAX CUT. On peut faire mieux. En 1994, Michel Goemans et David Williamson [34] ont proposé une α-approximation de MAX CUT pour tout α < αGW = 0.8785672057848516 . . . On a de bonnes raisons de penser que cette borne est optimale, i.e. que le problème MAX CUT est N P -difficile à approcher au-delà de la constante αGW . Subhash Khot, Guy Kindler, Elchanan Mossel et Ryan O’Donnell [43] l’ont prouvé sous une hypothèse a priori plus forte que P 6= N P , connue sous le nom de Conjecture des Jeux Uniques (U GC). Dans cet exposé, on donnera un aperçu : (1)

C’est une commodité. Cela ne joue un rôle essentiel dans aucun des algorithmes présentés cidessous. Tous peuvent être transformés en algorithmes déterministes.

ASTÉRISQUE 352

(1045)

DIFFICULTÉ D’APPROXIMATION

85

– de l’étonnante efficacité des relaxations semi-définies, méthode de construction d’algorithmes inaugurée par M. Goemans et D. Williamson (d’aucuns la font remonter à [55]) ; – des questions mathématiques qui surgissent de l’analyse de ces relaxations semidéfinies ; – de l’émergence de résultats de difficulté d’approximation, depuis le théorème PCP. Le présent texte constitue une suite de l’exposé de Bernard Chazelle dans ce séminaire, [20], dont la lecture est chaudement recommandée. Je remercie les participants du groupe de lecture de complexité algorithmique (ENS, 2009-2010) et du trimestre « Géométrie métrique, groupes et algorithmes » (IHP, janvier-mars 2011) pour leur aide au fil des mois, et Assaf Naor pour sa vision d’ensemble du sujet.

1. UN ALGORITHME D’APPROXIMATION POUR MAX CUT 1.1. Relaxations semi-définies On se propose de donner une idée de la méthode de relaxation semi-définie. Il s’agit d’un procédé de construction d’algorithmes d’approximation. Il n’est pas systématique (il n’y a pas une relaxation semi-définie canonique pour chaque problème combinatoire). On peut seulement présenter la démarche sur des exemples. Nous avons choisi trois problèmes d’optimisation qui ont donné lieu à des développements mathématiques intéressants : MAX CUT, SPARSEST CUT et MAX ACYCLIC SUBGRAPH. On commence par MAX CUT. Ce problème a tout pour plaire : un intérêt historique, c’est le premier succès de la méthode ; un saut d’intégralité intéressant, une étude d’inapproximabilité spectaculaire. 1.2. L’algorithme de Goemans et Williamson pour MAX CUT Théorème 1.1 (M. Goemans et D. Williamson, [34]). — MAX CUT est α-approximable pour tout α < αGW = 0.878 . . .. 1.2.1. Arithmétisation. — On commence par formuler algébriquement le problème combinatoire. Soient G un graphe, V l’ensemble de ses sommets, E ⊂ V × V l’ensemble de ses arêtes. On choisit de représenter un coloriage de G par une fonction x : V → {−1, 1}. On choisit d’exprimer le nombre d’arêtes bicolores par la fonction X 1 OBJ(x) = (1 − xu xv ). 2 (u,v)∈E

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

86

P. PANSU

Calculer la coupe maximale de G, c’est maximiser la fonction OBJ sur le cube discret {−1, 1}V , i.e. sur l’ensemble des fonctions x : V → R qui satisfont aux contraintes ∀v ∈ V, x2v = 1. Notons OBJ(G) le maximum. 1.2.2. Relaxation. — On plonge le cube discret dans un espace plus vaste. On se donne un espace euclidien `2 et on considère les applications y : V → `2 . On remplace chaque produit xu xv par un produit scalaire yu · yv . Les contraintes deviennent ∀v ∈ V, yv · yv = 1. La fonction objectif devient SDP (y) =

X (u,v)∈E

1 (1 − yu · yv ). 2

Remarquer que la restriction de SDP aux applications y qui prennent leurs valeurs dans une droite coïncide avec OBJ. Il en est de même des contraintes, donc max SDP ≥ max OBJ. Admettons pour l’instant qu’il existe un algorithme qui, avec une précision arbitraire, détermine en temps polynomial l’application ymax : V → `2 qui maximise SDP sous les contraintes imposées. Notons SDP (G) le maximum. La fonction OBJ(G) |V |=n SDP (G)

n 7→ min

s’appelle le saut d’intégralité (integrality gap) de la relaxation choisie. 1.2.3. Procédure d’arrondi. — Pour compléter la méthode en un algorithme d’approximation, on construit maintenant un coloriage x à partir de la solution ymax du problème continu. Cela donnera simultanément une minoration du saut d’intégralité, et donc du facteur d’approximation réalisé par l’algorithme. On voit ymax comme un plongement du graphe G dans la sphère unité. On tire un hyperplan vectoriel H uniformément au hasard. Il sépare les sommets en deux parties, voilà le coloriage xH cherché. 1.2.4. Analyse. — Pour chaque arête (u, v), la probabilité que H sépare yu de yv vaut 1 π arccos(yu ·yv ). En effet, l’intersection de l’hyperplan avec le plan engendré par yu de yv est une droite vectorielle tirée uniformément au hasard dans ce plan, la probabilité qu’elle sépare yu de yv est proportionnelle à l’angle entre yu et yv . Par conséquent, l’espérance du nombre d’arêtes bicolores dans le coloriage aléatoire obtenu est X 1 EH (OBJ(xH )) = arccos(yu · yv ). π (u,v)∈E

ASTÉRISQUE 352

(1045)

87

DIFFICULTÉ D’APPROXIMATION

Il vient EH (OBJ(xH )) ≥ αGW × SDP (G) où αGW = 0.878 . . . est le minimum de la fonction t 7→

1 π

arccos(t) 1 2 (1−t)

sur [−1, 1]. Par

OBJ(G) SDP (G)

≥ αGW , donc le saut d’intégralité de la conséquent, pour tout graphe G, relaxation de Goemans-Williamson est ≥ αGW . Par symétrie, avec probabilité 1/2, OBJ(xH ) ≥ αGW SDP (G), donc le facteur d’approximation de l’algorithme obtenu serait au moins αGW si on savait calculer exactement SDP (G) en temps polynomial. On ne sait le faire qu’avec une précision donnée à l’avance. On a au moins obtenu une α-approximation pour tout α < αGW . 1.3. Saut d’intégralité La détermination exacte du saut d’intégralité de la relaxation de Goemans et Williamson est un joli problème de géométrie. La minoration par αGW a été aisée à obtenir. L’inégalité inverse n’est pas aussi simple. Théorème 1.2 (U. Feige, G. Schechtman, [31]). — Le saut d’intégralité de la relaxation de Goemans-Williamson est exactement αGW . OBJ(G) Autrement dit, il existe des graphes pour lesquels SDP (G) est arbitrairement proche de αGW . Ces graphes sont des approximations finies du graphe infini suivant. Les sommets sont tous les points de la sphère unité de l’espace de Hilbert séparable. Deux 1 arccos(t) sommets y1 et y2 sont reliés par une arête si et seulement si la fonction t 7→ π 1 (1−t) 2 atteint son minimum en y1 ·y2 . Il y a une mesure de probabilité naturelle sur l’ensemble des arêtes. U. Feige et G. Schechtman montrent que parmi tous les coloriages de ce graphe, ceux définis par des hyperplans maximisent la probabilité qu’une arête soit coupée. C’est une propriété isopérimétrique de la sphère, qui est prouvée par symétrisation par rapport à des hyperplans.

2. PROGRAMMATION SEMI-DÉFINIE Nous avons passé sous silence un ingrédient essentiel, l’existence d’algorithmes polynomiaux pour optimiser une quantité comme SDP . Remarquer que l’application inconnue y : V → `2 n’intervient qu’à travers les produits scalaires yu · yv . Autrement dit, SDP est en fait une fonction de la matrice de Gram A de coefficients Auv = yu · yv . Une condition nécessaire et suffisante sur une matrice A pour qu’elle soit la matrice de Gram d’un n-uplet de vecteurs est que – A est symétrique, de taille n ; – A est positive au sens large, i.e. pour tout vecteur Y , Y > AY ≥ 0.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

88

P. PANSU

Notons P le cône convexe des matrices n × n symétriques positives au sens large. CalP culer SDP (G), c’est maximiser la fonction affine (u,v)∈E 21 (1 − Auv ) sur le convexe obtenu en coupant P avec le plan affine défini par les équations Avv = 1, v ∈ V . Les algorithmes polynomiaux de la programmation linéaire (méthode de l’ellipsoïde, méthode du point intérieur) permettent de le faire. On a donné le nom de programmation semi-définie à cette extension de la programmation linéaire. En fait, on peut maximiser une fonction affine sur un convexe dès qu’on dispose d’un oracle indiquant si un point de l’espace appartient ou non au convexe, en un temps dépendant de façon adéquate de la complexité du convexe et de la précision souhaitée. Dans le cas du cône convexe P , l’oracle consiste à calculer la plus petite valeur propre avec une précision donnée. Pour tout convexe en dimension finie, il existe un oracle ayant les propriétés requises, [62], [61]. Donc, en théorie, maximiser une fonction affine sur un convexe est faisable en temps polynomial. En pratique, la programmation linéaire proprement dite (le convexe est un polyèdre) a été implémentée industriellement depuis des décennies, elle est capable de traiter des données de grande taille (n = 107 ). Il existe des implémentations « de laboratoire » de la programmation semi-définie (le convexe est l’intersection du cône P avec un polyèdre de l’espace des matrices symétriques), qui sont pour l’instant limitées à des tailles inférieures à n = 104 .

3. ALGORITHMES D’APPROXIMATION POUR SPARSEST CUT SPARSEST CUT a aussi un intérêt historique. C’est en étudiant ce problème et les questions de flots qui lui sont reliées que N. Linial, E. London et Yu. Rabinovich ont introduit la méthode des plongements dans les espaces de Banach en algorithmique. L’étude des sauts d’intégralité conduit à des problèmes de plongements qui ont été beaucoup étudiés, par exemple en lien avec la théorie des groupes. À la différence de MAX CUT, son seuil d’approximabilité tend (conjecturalement) vers l’infini avec la taille des instances. 3.1. Le problème SPARSEST CUT Définition 3.1. — On se donne un graphe G = (V, E) avec un poids mu,v pour chaque arête (u, v) ∈ E et une demande Du,v pour chaque couple (u, v) ∈ V × V de sommets. On considère les partitions des sommets en V = S ∪ S¯ et on s’intéresse à la quantité P ¯ ; (u,v)∈E} mu,v {(u,v)∈S×S P P OBJ(S) = . ¯ Du,v u∈S v∈S

ASTÉRISQUE 352

(1045)

DIFFICULTÉ D’APPROXIMATION

89

Le problème SPARSEST CUT consiste, étant donné un graphe fini G, à calculer une partition qui minimise OBJ. Cas particulier des poids et demandes uniformes (i.e. mu,v = Du,v = 1). Dans ce cas, OBJ(S) =

#∂S , #S #S¯

min OBJ s’appelle la constante de Cheeger de G. Elle exprime une propriété isopérimétrique du graphe. Elle est reliée au spectre du laplacien sur G, à la vitesse de mélange de la marche aléatoire sur G, à la notion d’expanseur. Donc le problème SPARSEST CUT uniforme consiste à calculer la constante de Cheeger d’un graphe fini. Le calcul exact de min OBJ est NP-complet. Mais une partition (presque) optimale est fréquemment utilisée dans des algorithmes (« diviser pour régner »). D’où l’intérêt pour des algorithmes d’approximation.

3.2. Approche de SPARSEST CUT par la programmation linéaire 3.2.1. Arithmétisation. — Soit S ⊂ V , soit 1S la fonction caractéristique de S. La fonction objectif s’écrit P (u,v)∈E m(uv)|1S (u) − 1S (v)| OBJ(S) = 2 P P . u v Du,v |1S (u) − 1S (v)| Soit d(u, v) = |1S (u) − 1S (v)|. C’est une semi-distance sur V , induite par une application vers l’espace métrique à 2 points {0, 1}. Le cône convexe engendré par ces semi-distances est exactement l’ensemble des semi-distances plongeables dans L1 , [9]. Notons L 1 l’ensemble des semi-distances plongeables dans L1 . Par conséquent, P (u,v)∈E mu,v d(u, v) min OBJ = 2 min1 P P d∈ L u v Du,v d(u, v) X XX mu,v d(u, v) | d ∈ L 1 , Du,v d(u, v) = 1}. = min{ (u,v)∈E

u

v

Il s’agit d’un problème de programmation linéaire, car pour chaque ensemble X à n points, l’ensemble des semi-distances sur X plongeables dans L1 est un cône polyédral convexe. Malheureusement, ce cône a un nombre exponentiellement grand de facettes, voir [26], ce qui fait que la programmation linéaire n’en donne pas une solution en temps polynomial. D’ailleurs, le problème de décider si un espace métrique fini est plongeable ou non dans L1 est NP-complet.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

90

P. PANSU

3.2.2. Relaxation. — Oublions la condition de plongeabilité dans L1 . Sur la fonction d, il ne reste que les contraintes de symétrie et d’inégalité triangulaire, qui sont en nombre quadratique. Le problème de programmation linéaire obtenu, noté LP, est résoluble en temps polynomial. 3.2.3. Procédure d’arrondi. — Elle est due à N. Linial, E. London, Y. Rabinovich, 1995, [54]). Elle s’appuie sur le théorème suivant. Théorème 3.2 (J. Bourgain, 1985, [15]). — Tout espace métrique à n points se plonge dans L2 (et donc dans L1 ) avec distorsion au plus O(log(n)). C’est optimal ([54]). [54] montre que le plongement de Bourgain est calculable en temps polynomial, et sa dimension est polynomiale. Il reste à convertir une métrique d ∈ L 1 , i.e. plongeable `¯ dans L1 , en une partition V = S S. Une métrique plongeable dans R = `11 s’écrit aisément comme combinaison linéaire positive de métriques à valeurs dans {0, 1}. Une métrique plongeable dans `N est la somme de N métriques plongeables dans `11 . On ` ¯1 en tire une partition S S qui réalise OBJ(d0 ). Corollaire 3.3. — On a min LP ≤ min OBJ ≤ C log(n) min LP, ce qui montre que LP fournit une approximation de min OBJ à un facteur multiplicatif log(n) près. Démonstration. — La métrique d0 plongeable dans L1 qui est O(log(n))-proche de la solution d de LP satisfait min LP ≤ OBJ(d0 ) ≤ C log(n) min OBJ = C log(n) min LP. 3.3. Approche de SPARSEST CUT via la programmation semi-définie 3.3.1. Arithmétisation. — On réécrit P

(u,v)∈E

OBJ(S) = 2 P P u

v

mu,v |1S (u) − 1S (v)|2

Du,v |1S (u) − 1S (v)|2

.

3.3.2. Relaxation. — On remplace les fonctions x : V → {0, 1} par des fonctions y : V → `2 , en gardant la contrainte ∀u, v, w ∈ V,

|y(u) − y(v)|2 ≤ |y(u) − y(w)|2 + |y(w) − y(v)|2 ,

satisfaite par les fonctions caractéristiques. Cela ramène à un problème de programmation semi-définie, noté SDP. Soit d(u, v) = |x(u) − x(v)|2 . C’est une semi-distance sur V , et d1/2 est induite par un plongement dans l’espace euclidien.

ASTÉRISQUE 352

(1045)

DIFFICULTÉ D’APPROXIMATION

91

Définition 3.4. — On dit qu’une semi-distance d est de type négatif si d1/2 est induite par un plongement dans un espace de Hilbert. On note N E G l’ensemble des semi-distances de type négatif. Par conséquent,

™ ß X XX mu,v d(u, v) ; d ∈ N E G , Du,v d(u, v) = 1 . min SDP = min u

(u,v)∈E

v

À nouveau, si toute métrique de type négatif se plonge dans L1 avec distorsion ≤ L, min SDP ≤ min OBJ ≤ L min OBJ. Ceci conduit à poser Définition 3.5 (M. Goemans [33], N. Linial [53]). — Soit GLn la borne inférieure des réels L tels que toute semi-distance de type négatif sur un ensemble à n points soit induite par une application à valeurs dans L1 , de distorsion ≤ L. On a montré que min OBJ est calculable en temps polynomial à un facteur multiplicatif GLn près. 3.3.3. Procédure d’arrondi. — Supposons connu un algorithme qui construit en temps polynomial un plongement d’un espace de type négatif dans L1 de distorsion ≤ L. Le procédé de N. Linial, E. London et Y. Rabinovich [54] permet d’en déduire une partition qui réalise le minimum de OBJ à L près. 3.4. Saut d’intégralité : majoration Il est facile de voir que le saut d’intégralité de la relaxation semi-définie étudiée est exactement GLn (voir [24]). Reste à évaluer GLn . Pour avoir une borne supérieure, il faut un raffinement du théorème de Bourgain. Théorème 3.6 (S. Arora, J. Lee, A. Naor, 2005, [6]). — Soit d ∈ N E G une semimétrique de type négatif sur un ensemble à n points. Alors (X, d) se plonge aussi dans p L2 avec distorsion O( log(n) log(log(n))). Un tel plongement est calculable en temps quadratique en n. Remarque 3.7. — C’est presque optimal, puisque l’ensemble des sommets du n-cube √ `1 ne se plonge pas dans `2 avec distorsion < n (P. Enflo, 1969, [30]). p Corollaire 3.8. — GLn = O( log(n) log(log(n))). En effet, L2 se plonge isométriquement dans L1 .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

92

P. PANSU

3.5. Saut d’intégralité : minoration Inversement, pour minorer GLn , il faut des exemples d’espaces métriques finis de type négatif qui se plongent mal dans L1 . Ce n’est pas simple. La distorsion des plongements dans L2 est assez bien comprise. Elle est liée au spectre du laplacien discret. En revanche, la distorsion des plongements dans L1 est plus mystérieuse. En 2005, S. Khot et N. Vishnoi ont construit des exemples pour lesquels ils montrent que la distorsion croît au moins comme une puissance de log log n, [46]. J. Lee et A. Naor ont eu l’idée d’utiliser les boules n du groupe o d’Heisenberg discret HeisZ . Il s’agit du 1x z 0 1 y groupe des matrices unipotentes à coefficients entiers. On choisit comme 0 0 1

boule unité B un système générateur fini symétrique quelconque (par exemple, les 8 matrices dont les coefficients sont compris entre −1 et 1). Cela produit une distance invariante à gauche dB dont la boule de rayon n B n (l’ensemble des produits de n éléments de B) contient en gros n4 éléments. J. Lee et A. Naor montrent qu’il existe sur HeisZ une distance d équivalente à dB , invariante à gauche, qui est de type négatif, [52]. Théorème 3.9 (J. Cheeger, B. Kleiner, A. Naor, [24]). — Tout plongement de B n dans L1 a une distorsion au moins égale à (log n)δ pour δ = 2−32 . On conjecture que la valeur optimale de δ est 1/2, ce qui prouverait que le saut √ d’intégralité GLn est de l’ordre de log n. La preuve du théorème 3.9 repose sur l’autosimilarité de l’espace métrique (HeisZ , dB ). HeisZ est un sous-groupe cocompact du groupe de Lie HeisR (de la même façon que Z3 dans R3 ). HeisR possède une distance invariante à gauche dCC (équivalente à dB ) qui est exactement auto-similaire : elle possède des homothéties ht , dCC (ht (x), ht (y)) = t dCC (x, y). Si GLn était borné, il en résulterait que l’espace métrique (HeisR , dCC ) admet un plongement bi-lipschitzien dans L1 (car une ultra-limite d’espaces L1 est encore un espace L1 , [39], [17]). Le problème combinatoire est alors converti en un problème d’analyse. Il y a une notion de différentiabilité associée aux homothéties ht , [64], et un théorème à la Rademacher : les fonctions lipschitziennes et, plus généralement, les applications lipschitziennes à valeurs dans un espace de Banach V possédant la propriété de Radon-Nikodym, possèdent presque partout une différentielle, qui est un homomorphisme de groupe de HeisR dans V . Un tel homomorphisme n’est jamais injectif, ce qui empêche d’être bi-lipschitzien. Cet argument est dû à S. Semmes, [72], lorsque V est de dimension finie, à J. Cheeger et B. Kleiner, [21], en général. Malheureusement, L1 n’a pas la propriété de Radon-Nikodym. J. Cheeger et B. Kleiner, [22],

ASTÉRISQUE 352

(1045)

DIFFICULTÉ D’APPROXIMATION

93

ont inventé une notion de différentiabilité spécialement adaptée à L1 . Elle repose sur le fait qu’une semi-distance induite par une application à valeurs dans L1 est l’intégrale d’une famille de semi-distances prenant les valeurs 0 et 1, i.e. correspondant à des sous-ensembles de l’espace de départ (fait qui remonte à la thèse de P. Assouad, [9]). Voici ce que le théorème de différentiabilité devient dans le cas de HeisR (voir une généralisation dans [2]). Théorème 3.10 (B. Franchi, R. Serapioni, F. Serra Cassano, [32]) Pour tout ensemble S ⊂ HeisR de périmètre fini, en presque tout point du bord de S (au sens du périmètre), les ht -dilatés de S convergent vers un demi-espace vertical. La distance associée à un demi-espace vertical provient du groupe R2 , quotient de HeisR par son centre. Le théorème 3.10 entraîne qu’en presque tout point, lorsqu’on la dilate, la distance induite par un plongement lipschitzien de HeisR dans L1 converge vers la distance induite par une application qui factorise par R2 , c’est impossible pour une application bi-lipschitzienne. On conclut qu’il n’existe pas de plongement bi-lipschitzien de HeisR dans L1 , et donc que GLn tend vers +∞. Pour obtenir une borne inférieure effective sur GLn , J. Cheeger, B. Kleiner et A. Naor utilisent une idée un peu différente. Ils prouvent que les ensembles qui figurent dans l’expression comme intégrale de distances de coupure d’une application lipschitzienne à valeurs dans L1 sont asymptotiquement monotones à petite échelle. Monotone signifie qu’ils coupent toute géodésique bi-infinie suivant une demi-droite. Ce résultat s’applique à une classe d’espaces sources assez large, et non seulement à HeisR , voir [23]. C’est cette propriété qui donne lieu à un énoncé quantitatif, et conduit au théorème 3.9. A. Naor a suggéré une autre approche du théorème 3.9, par le biais d’inégalités fonctionnelles. Cette approche donne l’exposant optimal pour les applications de HeisR dans Lp , p > 1, voir [10]. Comme on le voit, le calcul du saut d’intégralité de la relaxation semi-définie proposée par M. Goemans et N. Linial pour SPARSEST CUT a donné lieu à des développements géométriques poussés. Cette relaxation donne actuellement la meilleure solution connue du problème SPARSEST CUT général. Toutefois, dans le cas particulier où les poids sont tous égaux, S. Arora, E. Hazan et S. Kale, [5], ont donné en p 2004 un algorithme polynomial différent qui calcule min OBJ à un facteur O( log(n)) près. Donc rien ne prouve pour l’instant que la programmation semi-définie soit la meilleure approche possible pour SPARSEST CUT. D’ailleurs, les meilleures bornes inférieures de complexité connue actuellement sont les suivantes : – Sous l’hypothèse P 6= N P , il existe un  > 0 tel que SPARSEST CUT n’est pas 1 + -approximable, [3].

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

94

P. PANSU

– Sous l’hypothèse U GC (voir plus loin), pour toute constante C, SPARSEST CUT n’est pas C-approximable, [19].

4. MAX ACYCLIC SUBGRAPH ET L’INÉGALITÉ DE GROTHENDIECK On détaille un problème de gain par rapport au tirage au hasard : un tirage au hasard donne un facteur d’approximation qui est optimal (c’est assez fréquent), on s’intéresse alors au second terme dans un développement asymptotique du seuil. La solution décrite le relie aux inégalités de Grothendieck, qui constituent un chapitre important de l’analyse fonctionnelle. Ces mêmes inégalités soulèvent des questions algorithmiques. Pour l’une d’entre elles, le problème de Grothendieck `p , on a une solution spectaculaire : c’est une famille à un paramètre de problèmes dont le seuil d’approximabilité est non trivial, il est connu exactement. 4.1. Le problème MAX ACYCLIC SUBGRAPH On considère cette fois des graphes finis orientés. On dit qu’un graphe orienté est acyclique s’il ne contient aucun sous-graphe isomorphe à un cycle avec toutes les arêtes orientées dans le bon sens. Étant donné un graphe fini orienté G, on note M AS(G) le nombre maximal d’arêtes qui ensemble forment un sous-graphe acyclique. Ce problème est NP-complet. En voici une 1/2-approximation. Soit G un graphe fini orienté. Choisir une numérotation arbitraire des sommets, conserver toutes les arêtes dont les numéros des sommets sont croissants. Cela donne un premier sousgraphe acyclique, à e+ arêtes. Conserver ensuite toutes les arêtes dont les numéros des sommets sont décroissants. Le second graphe est aussi acyclique et a e− arêtes. La réunion des deux recouvre G, donc e+ + e− ≥ |E| ≥ M AS(G). Peut-on faire mieux ? On sait que – Sous l’hypothèse P 6= N P , MAX ACYCLIC SUBGRAPH n’est pas α-approxi65 mable pour α > 66 , [63]. – Sous l’hypothèse U GC (voir plus loin), MAX ACYCLIC SUBGRAPH n’est pas α-approximable pour α > 21 , [36]. On se pose une question plus fine. Pour un graphe à N arêtes, M AS(G) ≥ 12 N . On cherche un facteur d’approximation pour le gain gain(G) = M AS(G) − 21 N . Théorème 4.1 (M. Charikar, K. Makarychev, Yu. Makarychev, [18]) Le gain d’un graphe orienté est const. log n -approximable. Autrement dit, il existe c et un algorithme polynomial qui prend en entrée un graphe à n sommets et N arêtes et

ASTÉRISQUE 352

(1045)

95

DIFFICULTÉ D’APPROXIMATION

retourne un sous-graphe acyclique à N 0 arêtes tel que 1 c 1 N0 − N ≥ (M AS(G) − N ). 2 log n 2 On verra plus loin qu’on ne peut pas améliorer le facteur constant, sous l’hypothèse U GC.

C log n

en un facteur

4.2. L’algorithme de M. Charikar, K. Makarychev et Yu. Makarychev 4.2.1. Formulation en termes de permutations. — Soit G = (V, E) un graphe orienté. On pose, pour u, v ∈ V ,   si (u, v) est une arête orientée,  1 wu,v =

−1 si (v, u) est une arête orientée,   0 sinon.

Si σ : V → {1, · · · , n} est une numérotation des sommets, on pose X AS(σ) = wu,v . {(u,v)∈V ×V ; σ(u) W x0 .

Quitte à perdre un facteur 4, et au prix de remplacer W par une matrice plus grande mais toujours antisymétrique, on peut remplacer dans cette expression les vecteurs à valeurs dans {0, 1} par des vecteurs à valeurs dans {−1, 1}. On considère donc la fonction objectif OBJ(x, x0 ) = x> W x0 sur les couples de fonctions booléennes x, x0 : V → {−1, 1}. Par construction, max OBJ ≤ kW kcut . 4.2.4. Relaxation. — On remplace les fonctions booléennes x, x0 par des applications y, y 0 à valeurs dans la sphère unité d’un espace `2 et la fonction objectif par X wu,v yu · yv0 . SDP (y, y 0 ) = u, v∈V

La programmation semi-définie fournit en temps polynomial une valeur approchée à -près de max SDP , pour tout  > 0. 4.2.5. Analyse. — L’ingrédient principal est le théorème classique suivant. Théorème 4.2 (A. Grothendieck, [35]). — Il existe une constante universelle KG telle que, pour toute matrice réelle A, X X max0 au,v yu · yv0 ≤ KG max au,v xu x0v . 0 |yu |=|yv |=1

u, v∈V

xu , xv =±1

u, v∈V

Ceci montre que max OBJ ≤ max SDP ≤ KG max OBJ ≤ kW kcut . À partir de la solution (y, y 0 ) maximisant SDP , la procédure d’arrondi décrite cidessous fournit des fonctions booléennes (x, x0 ), et donc des sous-ensembles S, P T ⊂ V tels que S×T wu,v ≥ const.kW kcut , d’où une numérotation σ telle que AS(σ) ≥ const.kW kcut . Reste à voir que kW kcut ≥ const. log n max AS. Pour cela, on utilise à nouveau l’inégalité de Grothendieck et une estimation de sommes d’exponentielles. 4.2.6. Procédure d’arrondi. — On en trouve dans toutes les preuves de l’inégalité de Grothendieck. Celle qui donne la meilleure constante a longtemps été due à J.-L. Krivine, [49], mais son record a été battu récemment, [16].

ASTÉRISQUE 352

(1045)

DIFFICULTÉ D’APPROXIMATION

97

4.3. Inégalité de Grothendieck `p On s’intéresse à des variantes de la méthode du paragraphe précédent pour des matrices symétriques. Ces variantes n’ont pas d’applications combinatoires pour l’instant. En revanche, elles constituent une famille de problèmes dont le seuil d’approximabilité est connu exactement. L’inégalité de Grothendieck s’applique aussi bien aux matrices symétriques qu’aux matrices antisymétriques. Dans le cas symétrique, elle donne un procédé (par programmation semi-définie) pour calculer approximativement le maximum d’une forme quadratique sur la boule unité de `∞ . 4.3.1. Le problème de Grothendieck `p . — Il s’agit de maximiser une forme quadratique OBJ(t) = t> At dont les coefficients diagonaux sont nuls sur la boule unité de l’espace `np = Rn muni de la norme `p . C’est facile si p = 2 (max OBJ est la plus grande valeur propre de A). Pour p = 1, le problème est α-approximable pour tout α > 1, [1]. Pour p = ∞, le problème est log n-approximable, mais probablement non (log n)γ -approximable pour γ < 1/6, voir un énoncé précis dans [45]. Pour p ∈ [2, +∞[, le seuil optimal d’approximabilité est connu exactement. Théorème 4.3 (A. Naor, G. Schechtman, [60](2)). — Pour p > 2, soit γp la norme Lp d’une gaussienne standard. Alors le problème de Grothendieck `p est α-approximable pour tout α < γp2 . Théorème 4.4 (V. Guruswami, P. Raghavendra, R. Saket, Y. Wu, [37]) Sous l’hypothèse P 6= N P , le problème de Grothendieck `p n’est pas α-approximable pour α > γp2 . Le théorème 4.3 résulte d’une généralisation de l’inégalité de Grothendieck avec constante optimale γp2 . Pour toute matrice A, X X 2 max a y · y ≤ γ max aij xi xj . ij i j P P p p p {yi ∈`2 ;

i

|yi |2 ≤1}

i,j

{xi ∈R ;

i

|xi | ≤1}

i,j

L’algorithme consiste à minimiser le premier membre, ce qui est possible, car il s’agit d’une forme linéaire en les coefficients de la matrice de Gram Yij = yi ·yj , à maximiser P p/2 sur le convexe des matrices symétriques positives telles que i Yii ≤ 1.

(2)

Améliorant un résultat un peu plus faible de [48].

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

98

P. PANSU

5. DIFFICULTÉ D’APPROXIMATION Comment peut-on prouver qu’il n’existe pas d’algorithme qui calcule une solution d’une instance d’un problème O de la classe N P en temps polynomial en la taille de l’instance ? Actuellement, on ne sait pas faire. 5.1. Réductions Tous les résultats existants sont conditionnels à l’hypothèse P 6= N P , ou à d’autres hypothèses voisines. On part d’un problème C connu pour être N P -complet (cas de l’hypothèse P 6= N P ), et on effectue une réduction de C à O. Un problème de décision, c’est une partition des instances entre instances acceptées et instances rejetées. Par exemple, la version décision de MAX CUT fixe un réel s et divise les graphes en – graphes acceptés : ceux pour lesquels la fraction maximale d’arêtes bicolores dans un coloriage est ≥ s, et – graphes rejetés : ceux pour lesquels la fraction maximale d’arêtes bicolores dans un coloriage est < s. Une réduction de C à O consiste, pour chaque instance I de C , à construire (en temps polynomial en la taille de I) une instance I 0 de O, de sorte que – si I est acceptée, I 0 est acceptée ; – si I est rejetée, I 0 est rejetée. Clairement, s’il existe un algorithme polynomial pour O, il y en a un pour C , et donc pour tous les problèmes de la classe N P (par définition). Cela contredit P 6= N P . On manipulera une classe de problèmes (dits « de promesse ») un peu plus vaste. Pour ces problèmes, on admet des instances ni acceptées ni rejetées, et sur lesquels un algorithme a le droit de se tromper. Par exemple, étant donnés deux réels c ≥ s, le problème (c, s)-MAX CUT accepte les graphes pour lesquels la fraction maximale d’arêtes bicolores dans un coloriage est ≥ c, et rejette les graphes pour lesquels la fraction maximale d’arêtes bicolores dans un coloriage est < s. On peut parler de réduction (même définition) et donc de N P -complétude pour de tels problèmes. Le lien avec la difficulté d’approximation est simple. Par exemple, si (c, s)-MAX CUT est N P -complet, alors, sous l’hypothèse P 6= N P , MAX CUT n’est pas s/c-approximable. En effet, un algorithme de s/c-approximation construit pour tout graphe G un coloriage avec une fraction f d’arêtes bicolores au moins égale à s/c × coupe maximale(G). Si f < s, alors coupe maximale(G) < s/α ≤ c donc on rejette G. Sinon, on est certain que coupe maximale(G) ≥ f ≥ s, et on accepte G sans se tromper. L’algorithme résout donc le problème (c, s)-MAX CUT en temps polynomial, et P = N P , contradiction.

ASTÉRISQUE 352

(1045)

DIFFICULTÉ D’APPROXIMATION

99

5.2. Le théorème PCP C’est l’aboutissement d’une histoire qui commence avec la logique formelle : des règles pour rédiger les preuves (Frege) qui permettent de les vérifier en temps polynomial (Gödel). Cook et Levin constatent que la vérification est une succession d’opérations locales, c’est le mécanisme qui est à l’origine de l’existence de problèmes N P -complets. On peut même rédiger les preuves de façon qu’il suffise de vérifier la consistance de triplets de bits. Si on s’autorise des tirages au hasard et une marge d’erreur, la tâche de vérification peut être réduite : le théorème PCP (Probabilistically Checkable Proofs) affirme qu’il suffit de vérifier un nombre borné de triplets pour affirmer qu’une preuve est correcte avec une probabilité d’erreur infime. Le théorème PCP possède une formulation équivalente en termes de difficulté d’approximation. Considérons le problème E3SAT : les instances sont des systèmes de formules booléennes en n variables sous forme disjonctive ternaire, i.e. a ∨ b ∨ c où a, b ¯ 2 ∨ X4 ). On et c sont trois variables distinctes ou leurs négations (par exemple, X1 ∨ X cherche à maximiser la fraction d’équations qui possèdent une solution commune, i.e. la fraction de formules rendues vraies par un même choix des valeurs (Vrai ou Faux) des variables. Théorème 5.1 (S. Arora, S. Safra, [8] (complété par [7])). — Il existe s < 1 tel que le problème (1, s)-MAX E3SAT est N P -complet. Autrement dit, il est N P -difficile de décider, pour tout système de formules booléennes disjonctives ternaires, si on se trouve dans l’une ou l’autre des situations suivantes : – il existe une solution commune aux N équations ; – au plus sN équations peuvent être résolues simultanément. En d’autres termes, sous l’hypothèse P 6= N P , le problème MAX E3SAT n’est pas s-approximable. Nous renvoyons à [20] pour l’histoire et la signification de ce beau théorème. Dans les années 2000, de nouvelles preuves de ce théorème ont été trouvées, voir [27], mais elles restent assez difficiles. Elles ne donnent pas la valeur optimale de s. 5.3. Jeux et répétition parallèle L’obtention de bornes optimales d’approximabilité s’est faite en deux étapes. La première est la construction de familles de problèmes de seuils d’approximabilité arbitrairement petits. Nous donnons un exemple d’un tel problème, la recherche de stratégies pour les jeux répétés. On s’intéresse à des jeux coopératifs à deux joueurs. Des couples de questions (q, q 0 ) sont tirés suivant une distribution connue. Les joueurs doivent donner des réponses

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

100

P. PANSU

r = S(q) et r0 = S(q 0 ) sans savoir quelle question a été posée à l’autre. Un prédicat connu à l’avance indique quelles combinaisons de questions et réponses (r, r0 , q, q 0 ) sont gagnantes. Dans un jeu projectif, ce prédicat prend la forme suivante : pour chaque question q, chaque question q 0 et chaque réponse possible r du premier joueur, il y a une unique réponse r0 = πqq0 (r) du second qui les fait gagner tous les deux. Les joueurs cherchent une stratégie commune S qui maximise la probabilité de gain, Valeur du jeu = max P(q,q0 ) (S(q 0 ) = πqq0 (S(q))). S

Dans le jeu, il y a deux paramètres, le nombre n de questions et le nombre k de réponses possibles. Il s’agit donc d’une famille JEUX PROJECTIFS[k] de problèmes d’optimisation combinatoire indexée par k. Une instance de JEUX PROJECTIFS[k] est un jeu projectif à k réponses par question. Dans la littérature, ce problème est parfois appelé LABEL COVER[k]. Théorème 5.2. — On s’intéresse aux jeux projectifs. Soient n le nombre de questions et k le nombre de réponses par question. Pour tout  > 0, il existe k tel qu’il est N P -difficile de décider entre les deux cas de figure suivants (sachant qu’on est dans l’un des deux). 1. La valeur du jeu est 1. 2. La valeur du jeu est < . En particulier, le seuil d’approximabilité de JEUX PROJECTIFS [k] tend vers 0 quand k tend vers l’infini.

C’est une conséquence folklorique du théorème 5.1 et du théorème de répétition parallèle de Ran Raz (1995), [68, 69]. Ce théorème affirme que, lorsqu’un jeu est répété ` fois (chaque joueur se voit poser ` questions tirées indépendamment et donne ` réponses, en suivant une stratégie qui repose sur les ` questions), la valeur du jeu répété décroît exponentiellement avec `, de façon uniforme. Il existe depuis peu des preuves directes du théorème 5.2, voir [28, 58].

5.4. Vers des seuils d’approximabilité optimaux La seconde étape consiste à utiliser de judicieux tests de dictature. On va expliquer le principe de la méthode sur un exemple, le problème MAX E3LIN2. On suit les notes de cours [47].

ASTÉRISQUE 352

(1045)

DIFFICULTÉ D’APPROXIMATION

101

5.4.1. Le problème MAX E3LIN2. — Une instance de E3LIN2 est un système linéaire sur le corps à deux éléments dont chaque équation est ternaire, i.e. fait intervenir exactement 3 variables. En notation multiplicative (les variables sont à valeurs dans {−1, +1}), chaque équation s’écrit sous la forme aXi1 Xi2 Xi3 = 1, où a ∈ {−1, +1}. On cherche à maximiser la fraction d’équations qui possèdent une solution commune. Il est immédiat (par l’algèbre linéaire) de décider si un tel système possède une solution. Donc (1, 1)-MAX E3LIN2 est dans P . Tirer les valeurs des variables indépendamment et uniformément au hasard donne une solution à la moitié des équations, en moyenne. Cela fournit un algorithme de 1/2-approximation. Théorème 5.3 (J. Håstad, [38]). — Pour tous  > 0, δ > 0, (1 − , 12 + δ)-MAX E3LIN2 est N P -complet. En particulier, le seuil d’approximabilité de MAX E3LIN2 est 1/2. 5.4.2. Interprétation en termes de tests. — Dans la démonstration du théorème 5.3, les instances de E3LIN2 sont, plutôt que des systèmes linéaires ternaires, des distributions de probabilités I sur l’ensemble (fini) des équations linéaires ternaires en n variables (commodité technique). Tirons une équation au hasard selon la distribution I. On peut voir le choix d’un vecteur X ∈ {−1, +1}n comme une tentative de prouver que I doit être acceptée. – Si I est acceptée, il existe un vecteur X ∈ {−1, +1}n tel que, sous I, PI (X résout l’équation) ≥ c = 1 − . On appelle cette étape le test de complétude. Si l’instance I doit être acceptée, il en existe une preuve qui est convaincante avec probabilité ≥ c. – Si I est rejetée, alors pour tout X ∈ {−1, +1}n , sous I, PI (X résout l’équation) < s = 21 + δ. On appelle cette étape le test de sûreté. Si l’instance I doit être rejetée, aucune preuve n’est convaincante avec probabilité ≥ s. Le test porte sur 3 bits seulement de la preuve X. En ce sens, le théorème 5.3 est un raffinement ultime du théorème PCP : lire trois bits tirés au hasard d’une preuve convenablement codée suffit pour se convaincre de sa consistance, avec une probabilité d’erreur < 1/2. 5.4.3. Réduction. — La démonstration du théorème 5.3 repose sur une réduction depuis JEUX PROJECTIFS[k] pour un k quelconque. Il s’agit d’associer à un jeu I à n questions une distribution de probabilité I 0 sur l’ensemble des équations linéaires ternaires en n0 variables, de sorte que – Complétude. Si le jeu possède une stratégie de valeur proche de 1, il existe un vecteur X ∈ {−1, +1}n qui résout presque toute équation au sens de la distribution I 0 .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

102

P. PANSU

– Sûreté. S’il existe un vecteur X ∈ {−1, +1}n qui résout les équations avec probabilité (sous I 0 ) au moins s > 21 , alors le jeu possède une stratégie dont la valeur est bornée inférieurement. On choisit n0 = 2k n. On note Q l’ensemble (à n éléments) des questions, et R l’ensemble (à k éléments) des réponses. À chaque question q, on associe 2k variables Xq,t ∈ {−1, +1}, où l’indice t décrit {−1, +1}R . Q × Q est muni de la distribution de probabilité qui fait partie intégrante du jeu. On décrit une variable aléatoire à valeurs dans l’ensemble des équations ternaires en les inconnues Xq,t comme suit. On tire au hasard un couple de questions (q, q 0 ), on tire au hasard indépendamment trois vecteurs x, y, z ∈ {−1, +1}R suivant les lois de Bernoulli B( 12 )⊗k , B( 12 )⊗k et B(1 − )⊗k , on tire a ∈ {−1, +1} suivant B( 12 ) et on produit l’équation aXq0 ,x Xq,Πqq0 (y) Xq0 ,axyz = 1, où on a noté Πqq0 (y) le vecteur de composantes (Πqq0 (y))i = yπqq0 (i) . La loi de cette variable représente l’instance cherchée, de taille 2k n, de E3LIN2. 5.4.4. Interprétation en termes de codage. — Ce qui se déroule sous nos yeux, c’est le codage d’une preuve. Du côté jeux, la preuve que la valeur d’un jeu est ≥ c, c’est la stratégie S, c’est-à-dire la collection des réponses S(q) ∈ R, q ∈ Q. On code chaque élément r de R sous la forme d’une fonction booléenne sur {−1, +1}R , la fonction qui à x ∈ {−1, +1}R associe sa r-ième coordonnée xr (une telle fonction est appelée dictateur, car la r-ième coordonnée décide toute seule de la valeur de la fonction). Ce code est extrêmement coûteux (chaque réponse est représentée par un mot de k longueur 22 ), mais cela n’a aucune importance. La stratégie S est donc codée en une phrase constituée de n fonctions booléennes. À chaque phrase (i.e. une suite de fonctions booléennes fq : {−1, +1}R → {−1, +1}, q ∈ Q), on peut associer le vecteur X donné par Xq,t = fq (t). Réciproquement, un vecteur détermine uniquement une phrase, en général incompréhensible, car les fonctions qui la constituent ne sont pas toutes des dictateurs. L’art du décodage est de reconstituer une phrase compréhensible à partir d’une phrase ayant subi un brouillage modéré. L’agencement des équations est choisi de sorte que si X résout un peu plus de la moitié des équations, alors le procédé de décodage qu’on va décrire reconstitue une stratégie S qui a une probabilité bornée inférieurement (quoique faible) de gagner. 5.4.5. Test de dictature. — Dans un premier temps, on va identifier, parmi les fonctions booléennes {−1, +1}R → {−1, +1}, celles qui sont proches de dictateurs.

ASTÉRISQUE 352

(1045)

DIFFICULTÉ D’APPROXIMATION

103

On remarque que les dictateurs sont des fonctions linéaires, i.e. dans notre notation multiplicative, elles satisfont, pour tous x, y ∈ {−1, +1}R , f (x)f (y)f (xy) = 1. D’où le test de linéarité : tirer x, y uniformément au hasard et calculer f (x)f (y)f (xy). On montre aisément que, si Px,y (f (x)f (y)f (xy) = 1) ≥ 21 + δ, alors la distance de Hamming de f aux fonctions linéaires est ≤ 21 − δ. Noter que le test ne nécessite que la connaissance de trois bits dans le mot que constitue f . Parmi les fonctions linéaires, les dictateurs ont la particularité d’être impairs, i.e. f (−x) = −f (x). On modifie le test en conséquence : on tire en outre un a ∈ {−1, +1} et on calcule af (x)f (y)f (axy). Les dictateurs passent le test à coup sûr, et le test, outre les fonctions éloignées des fonctions linéaires, rejette en sus la fonction constante 1, par exemple. Parmi les fonctions linéaires, les dictateurs possèdent encore une particularité : ils sont sensibles au bruit. Si on change le signe de chaque bit de y indépendamment avec probabilité  (ce qui revient à multiplier y par un vecteur indépendant z tiré selon B(1 − )⊗k ), alors Py,z (f (y) 6= f (yz)) vaut 1 −  pour les dictateurs, et au plus (1 − )3 pour les autres fonctions linéaires impaires. Cela conduit au choix suivant. Proposition 5.4 (Test de dictature de Håstad). — Tirer au hasard indépendamment trois vecteurs x, y, z ∈ {−1, +1}R suivant les lois de Bernoulli B( 12 )⊗k , B( 12 )⊗k et B(1 − )⊗k , tirer indépendamment a ∈ {−1, +1} suivant B( 21 ). Calculer af (x)f (y)f (axyz). Accepter f si le résultat est 1, rejeter f sinon. Ce test a les propriétés suivantes. – Complétude. Si f est un dictateur, alors f est acceptée avec probabilité ≥ 1 − . – Sûreté. Si f est acceptée avec probabilité ≥ 1 −  − α, alors f est à distance de Hamming < α d’un dictateur. 5.4.6. Décodage aléatoire. — En réalité, l’objectif n’est pas tellement de détecter les fonctions f qui sont proches de dictateurs. Ce qu’on cherche, c’est à associer à f quelconque une coordonnée r = r(f ), d’une façon invariante par certains homorphismes de groupes (de sorte que r(f ◦ Πqq0 ) = πqq0 (r(f )) par exemple). Le décodage n’a pas besoin d’être très performant. Il suffit que l’égalité r(fq0 ) = r(fq ◦ Πqq0 ) se produise avec probabilité bornée inférieurement dès que P(f passe le test) ≥ 21 + δ. On construit une variable aléatoire à valeurs dans les décodages f 7→ r(f ) comme suit. On utilise la transformation de Fourier-Walsh (pour le groupe abélien {−1, +1}R ). On écrit X (1) f= fˆT χT , T ⊂R

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

104

P. PANSU

Q où les χT sont les caractères du groupe {−1, +1}R , χT (x) = i∈T xi . Si R f : {−1, +1} → {−1, +1} est booléenne, kf k2 = 1, donc l’identité de Parseval P ˆ2 ˆ2 donne T ⊂R fT = 1. On peut donc voir les carrés des coefficients de Fourier fT comme une distribution de probabilité sur les sous-ensembles de R. On tire T (f ) au hasard suivant cette distribution (en éliminant les ensembles trop grands ou de taille paire). On tire ensuite au hasard un élément r(f ) de T (f ). Proposition 5.5. — On modifie le test de la proposition 5.4 comme suit. Il porte désormais sur un couple (f, g) de fonctions booléennes sur {−1, +1}R . Avec les mêmes choix de variables aléatoires x, y, z, a, on accepte (f, g) si et seulement si af (x)g(y)f (axyz) = 1. Le test obtenu a les propriétés suivantes. Pour tout δ > 0, il existe δ 0 (δ, ) > 0 indépendant de k tel que – Complétude. Si f et g sont des dictateurs, alors (f, g) est accepté avec probabilité ≥ 1 − 2. – Sûreté. Si (f, g) est accepté avec probabilité ≥ 21 + δ, alors P(r(f ) = r(g)) ≥ δ 0 . 5.4.7. Preuve du théorème 5.3. — Complétude. On code une stratégie en une phrase constituée de dictateurs, qu’on convertit en un vecteur X. Par construction, X est solution d’une équation aléatoire si et seulement si le couple de fonctions (fq0 , fq ◦Πqq0 ) passe le test, c’est vrai avec probabilité ≥ 1 − 2. Sûreté. Un vecteur X, c’est une suite de fonctions booléennes fq . Considérons la stratégie S définie par S(q) = r(fq ). Si X est solution d’une équation aléatoire avec probabilité ≥ 21 + δ, alors, pour une proportion ≥ 2δ des couples (q, q 0 ), le couple (fq0 , fq ◦ Πqq0 ) passe le test avec probabilité ≥ 21 + 2δ . Avec probabilité ≥ δ 0 , 0 πqq0 (r(fq0 )) = r(fq ◦ Πqq0 ), donc la stratégie gagne avec probabilité ≥ δδ2 , le jeu a une 0 valeur ≥ δ 00 := δδ2 . On a donc bien construit une réduction de (1 − 2, δ 00 )-JEUX PROJECTIFS[k] à (1 − , 12 + δ)-MAX 3LIN2.

6. LE CAS DE MAX CUT MAX CUT peut être vu comme un problème MAX E2LIN2 restreint. La donnée d’un graphe G = (V, E) équivaut à celui du système d’équations suivant. Il y a une variable xu par sommet et une équation xu xv = −1 par arête (u, v). La construction d’une réduction analogue à celle décrite pour MAX E3LIN2 nécessiterait un test de dictature à 2 requêtes, ce que personne n’a réussi à faire marcher jusqu’à présent. En revanche, on est parvenu à trouver une réduction depuis un problème plus restreint que les jeux projectifs, les jeux uniques.

ASTÉRISQUE 352

(1045)

DIFFICULTÉ D’APPROXIMATION

105

6.1. Jeux uniques Définition 6.1. — Un jeu unique est un jeu qui est projectif dans les deux sens, i.e. les réponses gagnantes sont à la fois de la forme r0 = πqq0 (r) et r = πq0 q (r0 ). Autrement dit, les applications πqq0 sont supposées bijectives. Il est immédiat de décider si la valeur d’un jeu unique vaut 1 ou non. En effet, la stratégie de valeur 1 est uniquement déterminée par la réponse à une question (les autres réponses s’en déduisent de proche en proche). Par conséquent, (1, 1)-JEUX UNIQUES[k] est dans P . À part ce détail, les jeux uniques sont-ils réellement plus faciles que les jeux projectifs généraux ? Conjecture 6.2 (S. Khot, [40], Unique Games Conjecture) On s’intéresse aux jeux uniques. Soient n le nombre de questions et k le nombre de réponses par question. Pour tous  > 0, δ > 0, il existe k tel qu’il est N P -difficile de décider entre les deux cas de figure suivants (sachant qu’on est dans l’un des deux). 1. La valeur du jeu est ≥ 1 − . 2. La valeur du jeu est < δ. D’une certaine façon, U GC est équivalente à un problème isopérimétrique sur les graphes, qui porte sur les ensembles de sommets assez petits, voir [67]. Il existe des algorithmes d’approximation pour JEUX UNIQUES[k]. Par exemple, l’algorithme de E. Chlamtac, K. Makarychev et Yu. Makarychev donne, pour tout jeu unique de valeur 1 − , une stratégie dont la probabilité de gain vaut au moins √ 1 − O( log k log n), [25]. Il existe un algorithme sous-exponentiel qui donne une approximation en 1 − α , pour un α > 0, [4]. Cela peut donner l’impression que le problème des jeux uniques est moins difficile que les problèmes N P -complets. Les opinions sont partagées sur la conjecture des jeux uniques (U GC). En revanche, personne ne parie sur le fait que le problème des jeux uniques est dans P . Si bien qu’on peut s’en servir comme hypothèse de référence pour prouver des résultats de difficulté d’approximation, comme on le fait pour P 6= N P . Ce programme a eu un succès inattendu : pour de nombreux problèmes, le seuil exact d’approximabilité sous l’hypothèse U GC est connu. On pourra consulter avec profit les survols [41] et [42]. 6.2. Difficulté d’approximation de MAX CUT On rappelle qu’on dispose d’une α-approximation de MAX CUT pour tout α < αGW , la constante de Goemans et Williamson. Théorème 6.3 (S. Khot, G. Kindler, E. Mossel, R. O’Donnell [43]) Sous l’hypothèse U GC, MAX CUT ne possède pas d’α-approximation pour α > αGW . Autrement dit, le seuil d’approximabilité de MAX CUT (sous U GC) est αGW .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

106

P. PANSU

6.2.1. La réduction. — De nouveau, pour alléger l’exposé, on élargit la notion de graphe : un graphe pondéré est une distribution de probabilité sur les arêtes du graphe complet, i.e. l’ensemble des paires de points d’un ensemble V . La coupe maximale d’un graphe pondéré est le maximum sur les coloriages de la probabilité qu’une arête tirée au hasard soit bicolore. Pour tous 0 > 0, δ > 0 et k entier, on va construire  > 0, δ 0 > 0 indépendants de k et une réduction de (1 − , δ 0 )-JEUX UNIQUES[k] à (1 − 0 , αGW + δ)-MAX CUT. Sous la conjecture U GC, cela prouvera que MAX CUT ne possède pas de αGW +δ 1−0 -approximation. Étant donné un jeu unique J à n questions et k réponses, on considère l’ensemble V = Q × {−1, +1}R . Il s’agit de construire une distribution de probabilité sur l’ensemble des paires de points de V (baptisées arêtes) telle que – S’il existe une stratégie qui gagne avec probabilité ≥ 1 − , alors il existe un coloriage de V tel que les arêtes sont bicolores avec probabilité ≥ 1 − 0 . – S’il existe un coloriage de V tel que les arêtes sont coupées avec probabilité ≥ αGW + δ, alors il existe une stratégie qui gagne avec probabilité ≥ 1 − . Soit c ∈ [0, 1]. La distribution voulue est la loi de la variable aléatoire à valeurs dans l’ensemble des arêtes, définie comme suit. On tire au hasard deux couples de questions (q, q 0 ) et (q, q 00 ). On tire au hasard indépendamment deux vecteurs x0 et z ∈ {−1, +1}R 0 R suivant B( 21 )⊗k et B(1 − c)⊗k , on considère x00 = zΠ−1 qq 00 ◦ Πqq 0 (x ) ∈ {−1, 1} et on produit l’arête ((q 0 , x0 ), (q 00 , x00 )). On note G le graphe pondéré ainsi défini. 6.2.2. Complétude. — À une stratégie S correspond un coloriage de V : le sommet (q, x) ∈ {−1, 1}R est colorié par sa S(q)-ième coordonnée (coloriage dictatorial). 0 Si c est égal à 1 (i.e. tous les bits de Π−1 qq 00 ◦ Πqq 0 (x ) sont renversés), la probabilité que l’arête ((q 0 , x0 ), (q 00 , x00 )) soit coupée est égale à la probabilité que −1 0 S(q 00 ) = πqq00 ◦ πqq 0 (S(q )), i.e. à la valeur de la stratégie S. Lorsque c 6= 1, cette probabilité est au pire multipliée par c, d’où coupe maximale(G) ≥ c valeur(J). 6.2.3. Sûreté. — Inversement, soit s ∈ [0, 1]. Un coloriage du graphe pondéré G est une fonction booléenne sur Q × {−1, +1}R , elle induit une famille fq : {−1, 1}R → {−1, 1} de fonctions booléennes sur {−1, +1}R . Si la probabilité qu’une arête soit coupée est > s, alors en moyenne, la fonction fq a la propriété suivante. Sensc (fq ) := Px,z (fq (xz) 6= fq (x)) > s. Ce nombre s’appelle la sensibilité au c-bruit, [12]. La fin de la preuve repose sur l’observation que pour une fonction de grande sensibilité au bruit, au moins une des coordonnées a une grande influence. D’où une stratégie S : tirer S(q) au hasard parmi les coordonnées d’influence supérieure à un certain seuil. On vérifie enfin que la valeur de cette stratégie est bornée inférieurement. Le miracle, c’est que la dépendance en c

ASTÉRISQUE 352

(1045)

DIFFICULTÉ D’APPROXIMATION

107

de s est connue exactement (s > π1 arccos(1 − 2c)), c’est le Théorème MIS (Majority Is Stablest). On obtient comme borne inférieure d’approximabilité le maximum des rapports sc , qui coïncide avec la constante de Goemans et Williamson. 6.3. Le Théorème Majority is Stablest On peut penser à une fonction booléenne {−1, +1}n → {−1, +1} comme à un procédé pour agréger des votes, i.e. produire une décision à partir des votes de n électeurs. Par exemple, Définition 6.4. — Le i-ième dictateur est Dicti (x) = xi . La majorité est Maj(x) = P signe( xi ). Un procédé d’agrégation devrait avoir les propriétés suivantes. 1. Aucun électeur ne joue de rôle prépondérant. 2. Des erreurs dans le dépouillement des votes ont peu de chance de faire basculer le résultat. 6.3.1. Influence. — La première clause peut se traduire mathématiquement par la notion d’influence d’un électeur. Cette notion est née en probabilités (phénomènes de seuil) dans les années 80 (voir [71]), mais on la rencontre implicitement dès les années 70 (voir [57]). Elle a été introduite dans la théorie du choix social par M. Ben Or et N. Linial, [11]. Définition 6.5. — L’influence Infi (f ) du i-ième électeur sur f est la probabilité que, lorsque le i-ième électeur change d’avis, la valeur de f change. Infi (f ) = P(f (xei ) 6= f (x)), n

où ei ∈ {−1, +1} est le vecteur dont les coordonnées valent 1 sauf la i-ième. 6.3.2. Sensibilité au bruit. — On a déjà rencontré la sensibilité au bruit, au cours de l’étude de MAX CUT. Elle était apparue antérieurement en probabilités, [12]. Définition 6.6. — La sensibilité au c-bruit de f est la probabilité que, lorsque chaque vote est modifié indépendamment avec probabilité c, la valeur de f change. Sensc (f ) = Px,z (f (xz) 6= f (x)), où les coordonnées zi ∈ {−1, +1} sont i.i.d., indépendantes de x, et P(zi = −1) = c. Par exemple, pour le dictateur Dicti , Infi (Dicti ) = 1,

Infj (Dicti ) = 0 si j 6= i ;

Sensc (Dicti ) = c.

Pour la majorité, il résulte du Théorème Central Limite que 2 1 Infi (Maj) ∼ √ ; lim Sensc (Maj) = arccos(1 − 2c). n→∞ π πn

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

108

P. PANSU

6.3.3. Le Théorème MIS. — De tous les procédés d’agrégation, la majorité est celui qui satisfait le mieux aux deux critères d’influence et de sensibilité ci-dessus. C’est la substance du Théorème MIS (Majority is stablest) (qui complète des résultats antérieurs de [12]). Théorème 6.7 (E. Mossel, R. O’Donnell, K. Oleskiewicz, [59]) Soit c ∈ [0, 12 ]. De toutes les fonctions booléennes {−1, +1}n → {−1, +1}, de moyenne nulle, dont les influences sont petites, M aj est celle dont la sensibilité au c-bruit est asymptotiquement la plus faible, lorsque n tend vers l’infini. Si c ∈ [ 21 , 1], M aj a la sensibilité au c-bruit la plus forte (sans condition de moyenne nulle). En fait, l’énoncé est non asymptotique : pour tout  > 0, il existe τ () indépendant de n tel que, si toutes les influences Infi (f ) < τ , alors Sensc (f ) ≥ π1 arccos(1 − 2c) −  pour c ∈ [0, 12 ] (si moyenne nulle), Sensc (f ) ≤ π1 arccos(1 − 2c) −  pour c ∈ [ 12 , 1]. La preuve du théorème 6.7 repose sur 1. Principe d’invariance : on remplace le cube discret {−1, +1}n , muni de la mesure de probabilité uniforme, par l’espace gaussien, i.e. l’espace euclidien Rn muni de la mesure gaussienne γn , de densité (2π)−n/2 exp(−|x|2 /2). 2. Dans l’espace gaussien, un argument de symétrisation dû à Ehrhard et Borell montre que parmi les fonctions de moyenne nulle, à valeurs dans [−1, 1], les fonctions « signe de forme linéaire » maximisent Sensc , c < 21 . 3. Soit c > 12 . Si g(x) = 12 (f (x) − f (−x)), alors Sensc (f ) ≥ Sensc (g) = 1 − Sens1−c (g) ≥ 1 − π1 arccos(1 − c) −  = π1 arccos(c) − . On détaille maintenant les deux premières étapes. 6.3.4. Principe d’invariance. — Si f : {−1, +1}n → R, alors f s’étend à Rn de façon unique en un polynôme de degré partiel 1 (décomposition de Fourier-Walsh, formule (1)). Le principe d’invariance suivant généralise au cas des fonctions non linéaires le Théorème Central Limite. Il exprime quantitativement le fait que, pour certaines fonctions f , les lois de f sur {−1, +1}n et sur Rn gaussien sont voisines. Il remonte à V. Rotar en 1979, [70]. La version ci-dessous est celle de [59]. Proposition 6.8. — Soient x tiré uniformément dans {−1, +1}n et Y tiré indépendamment dans l’espace gaussien. Soit f : {−1, +1}n → R de degré ≤ d. On suppose que les influences satisfont Infi (f ) ≤ τ . Alors pour toute fonction Ψ : R → R de classe C 4 , |E(Ψ(f (x))) − E(Ψ(f (Y )))| ≤ τ 10d k Ψ kC 4 .

ASTÉRISQUE 352

(1045)

DIFFICULTÉ D’APPROXIMATION

109

La preuve consiste à remplacer une par une les variables xi par les Yi (c’est pourquoi les influences interviennent). La formule de Taylor permet d’exploiter le fait que les premiers moments des deux variables coïncident, E(xpi ) = E(Yip ) pour p ≤ 3. Enfin, on utilise l’inégalité d’hypercontractivité de Bonami, [13], pour estimer le reste. 6.3.5. La symétrisation d’Ehrhard. — C’est un procédé pour prouver des inégalités fonctionnelles sur l’espace gaussien (Rn , γn ). Définition 6.9 (A. Ehrhard, [29]). — Soit u ∈ L2 (Rn , γn ) une fonction positive. Sa symétrisée est la fonction décroissante u∗ définie sur R par γn ({u > t}) = γ1 ({u∗ > t}). Théorème 6.10 (C. Borell, [14]). — Soit u ∈ L2 (Rn , γn ) une fonction positive. Alors pour c < 21 , Sensc (u) ≥ Sensc (u∗ ). L’argument utilise le fait que la sensibilité au bruit s’exprime en fonction du semigroupe d’Ornstein-Uhlenbeck Ut , 1 − 2Sensc (u) = hUt u, ui pour e−t = 1 − 2c, pour lequel on a un principe du maximum. 6.4. Autres problèmes de satisfaction de contraintes Le Théorème MIS, avec ses bornes optimales explicites, semble indispensable à la preuve que nous venons d’esquisser de la difficulté d’approximation de MAX CUT. Il n’en est rien. Théorème 6.11 (P. Raghavendra, [66]). — Pour une classe de problèmes de satisfaction de contraintes assez vaste (elle contient MAX CUT, MAX E3SAT, MAX E3LIN2, ..., mais pas SPARSEST CUT), il existe un procédé systématique qui produit simultanément – un algorithme d’α-approximation par programmation semi-définie, pour α < αmax , où αmax n’est en général pas connu, mais est calculable ; – une preuve de difficulté d’approximation sous U GC pour α > αmax . Ce théorème ne donne d’information utile que pour les problèmes dont le seuil d’approximabilité est une constante. On explique quelques idées de la preuve dans l’exemple de MAX CUT. La plus frappante est d’associer à chaque instance sur laquelle l’algorithme d’approximation par programmation semi-définie n’est pas très performant une preuve de difficulté d’approximation.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

110

P. PANSU

6.4.1. Relaxation. — La relaxation semi-définie n’est pas sensiblement différente de celle de Goemans-Williamson. Elle produit des plongements y du graphe donné G dans la sphère unité S n−1 de l’espace euclidien `n2 qui maximisent la quantité SDP (y). Le maximum est noté SDP (G). Il est supérieur au maximum OBJ(G) de la fonction objectif. 6.4.2. Procédure d’arrondi. — L’étape suivante, c’est la procédure d’arrondi, destiOBJ(G) née à obtenir une minoration du saut d’intégralité minG SDP (G) . Elle est fondée sur l’intuition suivante. Soit G un graphe plongé dans la sphère unité. Soit G0 l’image ` de G par une rotation. Soit G00 = G G0 . Alors SDP (G00 ) = SDP (G) alors que OBJ(G00 ) ≤ OBJ(G). Donc la relaxation semi-définie est moins performante sur le graphe G00 que sur G. En itérant le procédé une infinité de fois, et en passant à la limite, on trouve un graphe HG entièrement symétrique : ses sommets sont tous les points de la sphère unité S n−1 , ses arêtes toutes les paires de points, pondérées par une mesure sur l’intervalle [0, 2]. Voici la procédure d’arrondi : soit x : S n−1 → {−1, +1} un coloriage optimal de HG ; restreindre x à l’image de G par une rotation tirée au hasard. Il se trouve que le coloriage optimal de HG est donné par un hyperplan (Théorème 1.2), mais cette information n’est pas indispensable pour la suite. 6.4.3. Saut d’intégralité. — Le saut d’intégralité est calculable algorithmiquement. En effet, pour toute résolution  > 0, il existe d tel que la projection orthogonale de G sur un espace de dimension d tiré au hasard respecte SDP et les contraintes à  près, avec forte probabilité (concentration). À  près, les graphes pondérés en dimension d tombent dans un nombre fini de paquets, qu’il suffit d’explorer systématiquement pour OBJ(G) trouver minG SDP (G) à  près. Toutefois, on n’a aucune garantie sur la complexité de cet algorithme. 6.4.4. Test de dictature. — Soit R un ensemble fini (destiné à être l’ensemble des réponses d’un jeu unique). Étant donné un graphe de référence G (vu comme une distribution de probabilité sur les paires de points d’un ensemble V ), on décrit un test de dictature de complétude c = SDP (G) −  et de sûreté s = OBJ(G) +  sur les fonctions booléennes sur {−1, +1}R . Soit y : V → `2 le plongement solution de la relaxation semi-définie. On choisit pour chaque sommet v ∈ V une variable aléatoire zv à valeurs dans {−1, +1}2 telle que pour toute arête (u, v), E(1 − zu · zv ) = 1 − yu · yv (la relaxation semi-définie est ajustée expressément pour fournir ces variables). Étant donnée f : {−1, +1}R → {−1, +1}, – tirer au hasard une arête (u, v) ; – faire R tirages indépendants de la variable zu , pour obtenir un vecteur Zu ∈ {−1, +1}R ; faire de même pour v et obtenir Zv ;

ASTÉRISQUE 352

(1045)

DIFFICULTÉ D’APPROXIMATION

111

– accepter f si f (Zu ) 6= f (Zv ), rejeter f sinon. 6.4.5. Analyse du test. — 6.4.5.1. Complétude. — Si f est le dictateur xr , 1 P(f (Zu ) 6= f (Zv )) = Pu,v,zu ,zv (zu 6= zv ) = Eu,v (1 − yu · yv ) = SDP (G). 2 6.4.5.2. Sûreté. — On suppose que les influences des variables sur f sont uniformément faibles. Une généralisation du principe d’invariance (Proposition 6.8) permet de remplacer les variables booléennes du test par des variables gaussiennes, puis par des variables uniformément distribuées sur la sphère. La fonction f est remplacée par son extension polynomiale (formule (1)). Elle n’est plus booléenne, mais on peut tout de même lui associer un coloriage du graphe symétrique HG (pour chaque point t de la sphère unité, on tire au hasard sa couleur suivant B(f (t))), et P(f (Zu ) 6= f (Zv )) est proche de la valeur de la fonction OBJ sur ce coloriage. On conclut que la sûreté est ≤ OBJ(HG ) + . 6.4.6. Réduction. — Elle est très semblable à celle décrite plus haut pour MAX CUT. 6.4.7. Généralisation. — Le théorème 6.11 s’applique à la classe de problèmes suivants. Chaque problème GCSP (a, R, C ) est spécifié par la donnée – d’un entier a, l’arité ; – d’un ensemble fini R ; – d’une famille C de fonctions de coût Ra → [−1, 1], invariante par les permutations de R. Une instance du problème GCSP (a, R, C ) est la donnée – d’un ensemble V de variables à valeurs dans R ; – d’une distribution de probabilité sur les sous-ensembles à k éléments de V ; – pour tout S ⊂ V de taille a, d’une fonction de coût CS : RS → [−1, 1] choisie dans la famille C . Il s’agit de trouver un choix de valeurs des variables, i.e. un élément y ∈ RV , qui maximise le coût moyen OBJ(y) = ES (CS (y|S )). Dans le cas particulier où R = {−1, +1} a 2 éléments, les coûts sont à valeurs dans {0, 1}, et la distribution est uniforme, on retrouve le problème de maximiser la fraction de contraintes satisfaites par des variables booléennes. Par exemple, MAX CUT correspond au cas où a = 2 et C est réduit à la fonction (x1 , x2 ) 7→ −x1 x2 , {−1, +1}2 → {−1, +1}. MAX E3LIN2 correspond au cas où a = 3 et C est réduit aux deux fonctions (x1 , x2 , x3 ) 7→ ±x1 x2 x3 , {−1, +1}3 → {−1, +1}. Pour MAX E3SAT, a = 3 et C contient les 8 fonctions {−1, +1}3 → {−1, +1}.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

112

P. PANSU

7. HIÉRARCHIES Après 15 ans d’existence, la méthode de relaxation semi-définie reste plus heuristique que systématique. Il y a pourtant eu de nombreuses tentatives d’en systématiser certaines étapes. Les hiérarchies de Sherali-Adams, Lovasz-Schrijver et Lasserre en font partie, [73, 56, 50]. On va décrire la méthode de Lasserre. Elle porte sur la seconde étape, le choix d’une relaxation, une fois le problème arithmétisé. L’arithmétisation d’un problème d’optimisation combinatoire produit un sous-ensemble K de Rn et une fonction objectif à maximiser sur K. Dans le cas (fréquent) où K est défini par des inéquations algébriques et f est un polynôme, la théorie de Lasserre construit automatiquement une suite de relaxations semi-définies dont les maxima convergent en décroissant vers le maximum de f sur K.

7.1. Le Positivstellensatz ∗

On note P l’espace des polynômes à coefficients réels sur Rn , P son dual. On s’intéresse au cône convexe Q K ⊂ P des polynômes qui prennent des valeurs strictement positives sur K. Supposons K défini par un système d’inéquations polynomiales {gj ≥ 0 ; j = 1, . . . , m}. On note g0 = 1 le polynôme constant. L’adhérence QK P contient l’ensemble R K des combinaisons linéaires m j=0 σj gj où chaque polynôme σj est une somme de carrés de polynômes. Le Positivstellensatz est une réciproque partielle. Théorème 7.1 (M. Putinar [65]). — On suppose qu’il existe q ∈ R K tel que l’ensemble {q ≥ 0} soit compact. Alors Q K ⊂ R K . Autrement dit, tout polynôme qui prend des valeurs strictement positives sur K est combinaison linéaire des polynômes gj à coefficients sommes de carrés.

7.2. Dualité Soit Q ∗1 K le convexe des formes linéaires sur P qui prennent des valeurs positives ou nulles sur Q K , et qui prennent la valeur 1 sur la fonction g0 = 1. Lorsque l’hypothèse ∗ du théorème 7.1 est satisfaite, pour µ ∈ P , 2 µ ∈ Q ∗1 K ⇔ hµ, g0 i = 1 et ∀q ∈ P , ∀j = 0, . . . , m, hµ, q gj i ≥ 0.

Autrement dit, vérifier qu’une forme linéaire µ appartient à Q ∗1 K se ramène à vérifier 2 que les m + 1 formes quadratiques Fµ,gj : q 7→ hµ, q gj i sur P sont positives semidéfinies.

ASTÉRISQUE 352

(1045)

113

DIFFICULTÉ D’APPROXIMATION

Si f est un polynôme et µ ∈ Q ∗1 K , alors hµ, f i ≤ maxK f , avec égalité lorsque µ est l’évaluation en un point où f atteint son maximum. Par conséquent, max f K

=

max hµ, f i ∗1 QK

( =

max{hµ, f i ;

™ .

hµ, g0 i = 1, ∀j = 0, . . . , m,

Fµ,gj est positive semi-définie.

Il s’agit d’un problème de programmation semi-définie, mais en dimension infinie. Le r-ème problème de la hiérarchie de Lasserre associée au choix (f, gj ) d’arithmétisation du problème combinatoire donné est l’approximation de dimension finie obtenue en projetant le problème sur l’espace P 2r des polynômes de degré ≤ 2r. Autrement dit, µ est remplacée par sa restriction µ2r à P 2r . La forme quadratique Fµ,gj est remplacée rj deg(gj ) par sa restriction Fµ,g c (qui ne dépend que de µ2r ). Le j à P rj , rj = r − b 2 deg(g ) ) problème projeté Πr est bien posé dès que r ≥ max{b deg(f c, b 2 j c, j = 1, . . . , m}. 2 On montre (voir [50], Theorem 5.6, page 119) que, lorsque r tend vers l’infini, max Πr tend vers maxK f . 7.3. Le cas de MAX CUT K ⊂ Rn est le cube discret, défini par les inéquations gi = x2i − 1 ≥ 0, P gn+i = 1 − x2i ≥ 0. L’hypothèse du théorème 7.1 est satisfaite par q = 2n i=n+1 gn+i = n − |x|2 . Soit f la fonction objectif f (x) =

n X

1 wij (1 − xi xj ). 2 i, j=1

La base canonique de P r est indexée par les vecteurs de Nn dont la somme des ∗ composantes est ≤ r. Pour r = 1, µ = µ2 ∈ P 2 . Notons A la matrice de la forme 1 quadratique Fµ,g sur P 1 , 0   µ00...0 µ10...0 µ010...0 · · · µ0...01    µ10...0 µ20...0 µ110...0 · · · µ10...01       A := µ010...0 µ110...0 µ020...0 · · · µ010...01  .  .  . . . .  ..  .. .. .. ..   µ0...01 µ10...01 µ010...01 · · · µ0...02 Alors n X 1 1 wij (A1,1 − Ai+1,j+1 ). hµ, f i = wij (µ0...0 − µ0...0i0...0j0...0 ) = 2 2 i, j=1 i, j=1 n X

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

114

P. PANSU

0 Les formes quadratiques Fµ,g habitent l’espace P 0 qui est de dimension 1, elles valent i 0 Fµ,g i 0 Fµ,g n+i

= hµ, gi i = µ0...020...0 − µ0...0 = Ai+1,i+1 − A1,1 , = hµ, gn+i i = A1,1 − Ai+1,i+1 . ∗

Lorsque µ varie dans P 2 , A décrit exactement toutes les matrices symétriques de 0 0 taille n + 1. La première contrainte est 1 = hµ, g0 i = µ00...0 = A1,1 . Si Fµ,g et Fµ,g i n+i sont positives au sens large, Ai+1,i+1 = A1,1 = 1, i.e. les coefficients diagonaux de A sont tous égaux à 1. Les µα où |α| = 1 n’interviennent que dans la première ligne et la première colonne de A, et ils n’apparaissent pas dans l’expression hµ, f i, ils ne jouent donc aucun rôle. Soit B la matrice obtenue en retirant sa première ligne et sa P première colonne à A. On est ramené à maximiser ni, j=1 wij 21 (Bij − 1) sur les matrices symétriques positives au sens large B de taille n dont les coefficients diagonaux valent 1. C’est exactement équivalent à la relaxation de Goemans-Williamson. Pour les problèmes d’optimisation sur le cube discret, il y a des procédures d’arrondi naturelles pour la relaxation Π1 de Lasserre, mais elles ne semblent pas coïncider avec celle de Goemans-Williamson dans le cas particulier de MAX CUT. Pour en savoir davantage sur les relaxations d’ordre supérieur de MAX CUT, voir [51].

8. CONCLUSION Le succès de la méthode des relaxations semi-définies pour construire des algorithmes d’approximation est frappant (voir notamment le tableau dans [42]). Il semble prometteur de progrès vers des applications pratiques (elles sont limitées actuellement par les implémentations de la programmation semi-définie). Sur le plan théorique, comment se fait-il que des problèmes combinatoires (typiquement, maximisation sur le cube discret d’une fonction non linéaire et non convexe) puissent se ramener à des problèmes convexes ? Les hiérarchies constituent une première réponse. Il est important d’approfondir la compréhension de ces hiérachies : comment se fait-il que, pour MAX CUT par exemple, la première itération de la hiérachie de Lasserre donne déjà la borne d’approximabilité (conjecturée comme) optimale ? La réponse contribuerait à cerner les limites de la puissance du calcul. En restant plus proche du courant principal des mathématiques, on peut plus modestement interpréter chaque relaxation semi-définie comme un petit modèle de calcul, à l’intérieur duquel le problème de difficulté d’approximation devient la détermination d’un saut d’intégralité. On a vu dans plusieurs exemples que les problèmes mathématiques qui surgissent alors sont riches et variés, ils font intervenir de la géométrie, de l’analyse, du calcul des probabilités. Ce genre de travaux a certainement une utilité

ASTÉRISQUE 352

(1045)

DIFFICULTÉ D’APPROXIMATION

115

du point de vue de la complexité. Les preuves des théorèmes 6.3 et 6.11 indiquent qu’une bonne compréhension d’un saut d’intégralité peut être la clé d’un résultat de difficulté d’approximation. La conjecture des jeux uniques occupe une place singulière dans les travaux que nous avons présentés. La difficulté d’approximation sous U GC est étroitement reliée à la méthode de relaxation semi-définie (cf. théorème 6.11). Est-ce une particularité d’U GC ? Peut-être non. Prouver la difficulté d’approximation sous U GC pourrait n’être qu’une étape vers la difficulté d’approximation sous P 6= N P (cf. théorème 4.4).

RÉFÉRENCES [1] N. Alon & A. Naor – Approximating the cut-norm via Grothendieck’s inequality, SIAM J. Comput. 35 (2006), no 4, p. 787–803. [2] L. Ambrosio, B. Kleiner & E. Le Donne – Rectifiability of sets of finite perimeter in Carnot groups : existence of a tangent hyperplane, J. Geom. Anal. 19 (2009), no 3, p. 509–540. [3] C. Ambühl, M. Mastrolilli & O. Svensson – Inapproximability results for sparsest cut, optimal linear arrangement, and precedence constrained scheduling, in 48th Annual IEEE Symposium on Foundations of Computer Science (FOCS), Providence, 2007, p. 329–337. [4] S. Arora, B. Barak & D. Steurer – Subexponential algorithms for unique games and related problems, in 51st Annual IEEE Symposium on Foundations of Computer Science (FOCS), Las Vegas, 2010, p. 563–572. √ [5] S. Arora, E. Hazan & S. Kale – O( log n) approximation to sparsest cut in ˜ 2 ) time, SIAM J. Comput. 39 (2010), no 5, p. 1748–1771. O(n [6] S. Arora, J. R. Lee & A. Naor – Euclidean distortion and the sparsest cut, J. Amer. Math. Soc. 21 (2008), no 1, p. 1–21. [7] S. Arora, C. Lund, R. Motwani, M. Sudan & M. Szegedy – Proof verification and the hardness of approximation problems, J. ACM 45 (1998), no 3, p. 501–555. [8] S. Arora & S. Safra – Probabilistic checking of proofs : a new characterization of NP, J. ACM 45 (1998), no 1, p. 70–122. [9] P. Assouad – Espaces métriques, plongements, facteurs, thèse de doctorat, Université Paris XI, Orsay, 1977, Publications Mathématiques d’Orsay, No. 223-7769. [10] T. Austin, A. Naor & R. Tessera – Sharp quantitative nonembeddability of the Heisenberg group into superreflexive Banach spaces, prépublication arXiv:1007.4238.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

116

P. PANSU

[11] M. Ben Or & N. Linial – Collective coin flipping, robust voting games and minima of Banzhaf values, in 26th Annual IEEE Symposium on Foundations of Computer Science (FOCS), Portland, 1985, p. 408–416. [12] I. Benjamini, G. Kalai & O. Schramm – Noise sensitivity of Boolean functions and applications to percolation, Publ. Math. I.H.É.S. (1999), no 90, p. 5–43. [13] A. Bonami – Étude des coefficients de Fourier des fonctions de Lp (G), Ann. Inst. Fourier (Grenoble) 20 (1970), no fasc. 2, p. 335–402. [14] C. Borell – Geometric bounds on the Ornstein-Uhlenbeck velocity process, Z. Wahrsch. Verw. Gebiete 70 (1985), no 1, p. 1–13. [15] J. Bourgain – On Lipschitz embedding of finite metric spaces in Hilbert space, Israel J. Math. 52 (1985), nos 1-2, p. 46–52. [16] M. Braverman, K. Makarychev, Y. Makarychev & A. Naor – The Grothendieck constant is strictly smaller than Krivine’s bound, in 52nd Annual IEEE Symposium on Foundations of Computer Science (FOCS), Palm Springs, 2011, p. 408–416. [17] J. Bretagnolle, D. Dacunha-Castelle & J.-L. Krivine – Lois stables et espaces Lp , Ann. Inst. H. Poincaré Sect. B (N.S.) 2 (1965/1966), p. 231–259. [18] M. Charikar, K. Makarychev & Y. Makarychev – On the advantage over random for maximum acyclic subgraph, in 48th Annual IEEE Symposium on Foundations of Computer Science (FOCS), Providence, 2007, p. 625–633. [19] S. Chawla, R. Krauthgamer, R. Kumar, Y. Rabani & D. Sivakumar – On the hardness of approximating multicut and sparsest-cut, Comput. Complexity 15 (2006), no 2, p. 94–114. [20] B. Chazelle – The PCP theorem [after Arora, Lund, Motwani, Safra, Sudan, Szegedy], Séminaire Bourbaki, vol. 2001/2002, exp. no 895, Astérisque 290 (2003), p. 19–36. [21] J. Cheeger & B. Kleiner – On the differentiability of Lipschitz maps from metric measure spaces to Banach spaces, in Inspired by S. S. Chern, Nankai Tracts Math., vol. 11, World Sci. Publ., Hackensack, NJ, 2006, p. 129–152. [22] , Differentiating maps into L1 , and the geometry of BV functions, Ann. of Math. 171 (2010), no 2, p. 1347–1385. , Metric differentiation, monotonicity and maps to L1 , Invent. Math. 182 [23] (2010), no 2, p. 335–370. [24] J. Cheeger, B. Kleiner & A. Naor – A (log n)Ω(1) integrality gap for the sparsest cut SDP, in 50th Annual IEEE Symposium on Foundations of Computer Science (FOCS), Atlanta, 2009, p. 555–564. [25] M. Chlamtac, K. Makarychev & Y. Makarychev – How to play unique games using embeddings, in 47th Annual IEEE Symposium on Foundations of Computer Science (FOCS), Berkeley, 2006, p. 687–696.

ASTÉRISQUE 352

(1045)

DIFFICULTÉ D’APPROXIMATION

117

[26] M. M. Deza & M. Laurent – Geometry of cuts and metrics, Algorithms and Combinatorics, vol. 15, Springer, 1997. [27] I. Dinur – Probabilisitically checkable proofs, in Proceedings of the International Congress of Mathematicians, ICM, Hyderabad, 2010. [28] I. Dinur & P. Harsha – Composition of low-error 2-query PCPs using decodable PCPs, in 50th Annual IEEE Symposium on Foundations of Computer Science (FOCS), Atlanta, 2009, p. 472–481. [29] A. Ehrhard – Symétrisation dans l’espace de Gauss, Math. Scand. 53 (1983), no 2, p. 281–301. [30] P. Enflo – On the nonexistence of uniform homeomorphisms between Lp -spaces, Ark. Mat. 8 (1969), p. 103–105. [31] U. Feige & G. Schechtman – On the optimality of the random hyperplane rounding technique for MAX CUT, Random Structures Algorithms 20 (2002), no 3, p. 403–440. [32] B. Franchi, R. Serapioni & F. Serra Cassano – On the structure of finite perimeter sets in step 2 Carnot groups, J. Geom. Anal. 13 (2003), no 3, p. 421– 466. [33] M. X. Goemans – Semidefinite programming in combinatorial optimization, Math. Programming 79 (1997), nos 1-3, Ser. B, p. 143–161. [34] M. X. Goemans & D. P. Williamson – Improved approximation algorithms for maximum cut and satisfiability problems using semidefinite programming, J. ACM 42 (1995), no 6, p. 1115–1145. [35] A. Grothendieck – Résumé de la théorie métrique des produits tensoriels topologiques, Bol. Soc. Mat. São Paulo 8 (1953), p. 1–79. [36] V. Guruswami, R. Manokaran & P. Raghavendra – Beating the random ordering is hard : Inapproximability of maximum acyclic subgraph, in 49th Annual IEEE Symposium on Foundations of Computer Science (FOCS), Philadelphia, 2008, p. 573–582. [37] V. Guruswami, P. Raghavendra, R. Saket & Y. Wu – Bypassing UGC from some optimal geometric inapproximability results, Electr. Colloq. Comput. Compl. 17 (2010), p. 177. [38] J. Håstad – Some optimal inapproximability results, J. ACM 48 (2001), no 4, p. 798–859. [39] S. Kakutani – Mean ergodic theorem in abstract (L)-spaces, Proc. Imp. Acad., Tokyo 15 (1939), p. 121–123. [40] S. Khot – On the power of unique 2-prover 1-round games, in Proceedings of the Thirty-Fourth Annual ACM Symposium on Theory of Computing, ACM, 2002, p. 767–775.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

118

[41]

[42] [43]

[44] [45]

[46]

[47]

[48] [49] [50] [51] [52]

[53]

[54] [55]

P. PANSU

, Inapproximability of NP-complete problems, discrete Fourier analysis, and geometry, in Proceedings of the International Congress of Mathematicians. Volume IV, Hindustan Book Agency, 2010, p. 2676–2697. , On the unique games conjecture, in 25th Annual IEEE Conference on Computational Complexity—CCC 2010, 2010, p. 99–121. S. Khot, G. Kindler, E. Mossel & R. O’Donnell – Optimal inapproximability results for MAX-CUT and other 2-variable CSPs ?, SIAM J. Comput. 37 (2007), no 1, p. 319–357. S. Khot & A. Naor – Grothendieck-type inequalities in combinatorial optimization, Comm. Pure Appl. Math. 65 (2012), no 7, p. 992–1035. S. Khot & M. Safra – A two prover one round game with strong soundness, in 52nd Annual IEEE Symposium on Foundations of Computer Science FOCS, Palm Springs, 2011, p. 648–657. S. Khot & N. Vishnoi – The unique games conjecture, integrality gap for cut problems and the embeddability of negative type metrics into l1 , in 46th Annual IEEE Symposium on Foundations of Computer Science (FOCS), Pittsburgh, 2005, p. 53–62. G. Kindler – Dictatorship testing and hardness of approximation, notes d’un cours donné à l’Institut Henri Poincaré, en février 2011, http://metric2011. wordpress.com/. G. Kindler, A. Naor & G. Schechtman – The UGC hardness threshold of the Lp Grothendieck problem, Math. Oper. Res. 35 (2010), no 2, p. 267–283. J.-L. Krivine – Constantes de Grothendieck et fonctions de type positif sur les sphères, Adv. in Math. 31 (1979), no 1, p. 16–30. J. B. Lasserre – Moments, positive polynomials and their applications, Imperial College Press Optimization Series, vol. 1, Imperial College Press, 2010. M. Laurent – Semidefinite relaxations for max-cut, in The sharpest cut, MPS/SIAM Ser. Optim., SIAM, 2004, p. 257–290. J. R. Lee & A. Naor – Lp metrics on the Heisenberg group and the GoemansLinial conjecture, in 47th Annual IEEE Symposium on Foundations of Computer Science (FOCS), Berkeley, 2006, p. 99–108. N. Linial – Finite metric-spaces—combinatorics, geometry and algorithms, in Proceedings of the International Congress of Mathematicians, Vol. III (Beijing, 2002), Higher Ed. Press, 2002, p. 573–586. N. Linial, E. London & Y. Rabinovich – The geometry of graphs and some of its algorithmic applications, Combinatorica 15 (1995), no 2, p. 215–245. L. Lovász – On the Shannon capacity of a graph, IEEE Trans. Inform. Theory 25 (1979), no 1, p. 1–7.

ASTÉRISQUE 352

(1045)

DIFFICULTÉ D’APPROXIMATION

119

[56] L. Lovász & A. Schrijver – Cones of matrices and set-functions and 0-1 optimization, SIAM J. Optim. 1 (1991), no 2, p. 166–190. [57] G. A. Margulis – Probabilistic characteristics of graphs with large connectivity, Problemy Peredači Informacii 10 (1974), no 2, p. 101–108. [58] D. Moshkovitz & R. Raz – Sub-constant error probabilistically checkable proof of almost-linear size, Comput. Complexity 19 (2010), no 3, p. 367–422. [59] E. Mossel, R. O’Donnell & K. Oleszkiewicz – Noise stability of functions with low influences : invariance and optimality, Ann. of Math. 171 (2010), no 1, p. 295–341. [60] A. Naor & G. Schechtman – An approximation scheme for quadratic form maximization on convex bodies, manuscrit, 2009. [61] A. Nemirovski – Advances in convex optimization : conic programming, in International Congress of Mathematicians. Vol. I, Eur. Math. Soc., Zürich, 2007, p. 413–444. [62] Y. Nesterov & A. Nemirovskii – Interior-point polynomial algorithms in convex programming, SIAM Studies in Applied Mathematics, vol. 13, Society for Industrial and Applied Mathematics (SIAM), 1994. [63] A. Newman – Approximating the maximum acyclic subgraph, thèse, MIT, 2000. [64] P. Pansu – Métriques de Carnot-Carathéodory et quasiisométries des espaces symétriques de rang un, Ann. of Math. 129 (1989), no 1, p. 1–60. [65] M. Putinar – Positive polynomials on compact semi-algebraic sets, Indiana Univ. Math. J. 42 (1993), no 3, p. 969–984. [66] P. Raghavendra – Optimal algorithms and inapproximability results for every CSP ? [extended abstract], in STOC’08, ACM, 2008, p. 245–254. [67] P. Raghavendra & D. Steurer – Graph expansion and the unique games conjecture, in STOC’10—Proceedings of the 2010 ACM International Symposium on Theory of Computing, ACM, 2010, p. 755–764. [68] R. Raz – A parallel repetition theorem, SIAM J. Comput. 27 (1998), no 3, p. 763–803. [69] , P 6= NP, propositional proof complexity, and resolution lower bounds for the weak pigeonhole principle, in Proceedings of the International Congress of Mathematicians, Vol. III (Beijing, 2002), Higher Ed. Press, 2002, p. 685–693. [70] V. I. Rotar0 – Limit theorems for polylinear forms, J. Multivariate Anal. 9 (1979), no 4, p. 511–530. [71] L. Russo – An approximate zero-one law, Z. Wahrsch. Verw. Gebiete 61 (1982), no 1, p. 129–139. [72] S. Semmes – On the nonexistence of bi-Lipschitz parameterizations and geometric problems about A∞ -weights, Rev. Mat. Iberoamericana 12 (1996), no 2, p. 337–410.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

120

P. PANSU

[73] H. D. Sherali & W. P. Adams – A hierarchy of relaxations between the continuous and convex hull representations for zero-one programming problems, SIAM J. Discrete Math. 3 (1990), no 3, p. 411–430.

Pierre PANSU CNRS et Université Paris-Sud UMR CNRS 8628 Département de Mathématiques Bâtiment 425 F–91405 ORSAY Cédex E-mail : [email protected]

ASTÉRISQUE 352

352

ASTÉRISQUE 2013

SÉMINAIRE BOURBAKI VOLUME 2011/2012 EXPOSÉS 1043-1058 (1046) Concentration compacité à la Kenig-Merle Pierre RAPHAËL

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Séminaire BOURBAKI 64e année, 2011-2012, no 1046, p. 121 à 146

Novembre 2011

CONCENTRATION COMPACITÉ À LA KENIG-MERLE par Pierre RAPHAËL

Dans leurs articles de référence [24], [25], Kenig et Merle ouvrent une brèche spectaculaire dans l’étude qualitative des équations aux dérivées partielles. Ce travail est l’aboutissement d’une lente maturation sur une problématique qui naît à la fin des années 1970 dans les travaux pionniers de Ginibre et Velo [19], [20] et est lui-même le commencement de développements considérables, puisque déjà une série importante de travaux reprend comme un classique la « feuille de route » à la Kenig-Merle. L’objet de cet exposé est de présenter les principaux résultats obtenus mais surtout de les replacer au sein d’une dynamique scientifique aux multiples facettes et dont l’inspiration provient de domaines très divers des mathématiques : le calcul des variations et les méthodes variationnelles, l’analyse harmonique et les systèmes dynamiques. La notion d’onde solitaire apparaît de façon centrale dans l’analyse. J’illustrerai la profonde unité entre ce travail de 2006 et la percée de Merle [41] de 1992 qui obtient la première classification dynamique de l’onde solitaire pour un problème critique, résultat pionnier et totalement isolé à l’époque, et qui contient en fait en substance l’ensemble des arguments. Il faudra à la suite de ce travail en premier abord très spécifique quatorze ans pour comprendre la profonde universalité de l’argument et développer une méthode de compacité robuste et des outils universels pour classifier la dynamique exceptionnelle de l’onde solitaire. Cette stratégie d’approche par théorème de rigidité à la Liouville, qui avait déjà donné des résultats spectaculaires en elliptique nonlinéaire à la fin des années 1970, s’est développée dans les travaux de Merle et ses collaborateurs autour de la description fine de dynamiques explosives pour des EDP d’abord paraboliques, Merle-Zaag [50], puis dispersives Martel-Merle [37], Merle-Raphaël [43]. L’adaptation de cette approche et la mise en place d’une stratégie robuste pour obtenir des critères optimaux d’existence globale ou dispersion pour des problèmes nonlinéaires requiert en sus l’apport de la machinerie des estimations de Strichartz issue de l’analyse harmonique [66], [19], et les lemmes de description de perte de compacité à la Lions

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

122

P. RAPHAËL

[34] via leur version moderne de décomposition en profils [1], [49], [27], l’ensemble aboutissant à la « feuille de route » à la Kenig-Merle mise en œuvre pour la première fois dans [24].

1. EXISTENCE GLOBALE ET EXPLOSION : UN PROBLÈME MODÈLE Notre compréhension des flots nonlinéaires en dimension infinie est extrêmement pauvre, et même la seule construction d’exemples de dynamiques génériques est souvent mal comprise. La question de l’existence globale des solutions ou au contraire la possibilité de dynamiques explosives est en général ouverte même pour des problèmes modèles, et c’est par exemple l’objet du Prix Clay du Millenium pour les équations de Navier Stokes qui sont l’exemple canonique de modèle surcritique. Nous présentons dans cette section un problème modèle : l’équation de Schrödinger nonlinéaire ( i∂t u + ∆u ± u|u|p−1 = 0 (t, x) ∈ R × Rd . (1) (N LS) ut=0 = u0 Nous montrons comment l’analyse aujourd’hui classique de Ginibre et Velo [19] permet l’identification des problèmes critiques/surcritiques, puis comment les méthodes variationnelles des années 1980 permettent de construire une solution exceptionnelle : l’onde solitaire. Nous présentons enfin la percée de Merle [41] qui couple les méthodes variationnelles à un argument dispersif dynamique pour obtenir la première classification dynamique de l’onde solitaire. 1.1. Existence locale et globale Ginibre et Velo résolvent le problème de Cauchy local en temps dans l’espace d’énergie H 1 (Rd ) et obtiennent l’exact analogue du Théorème de Cauchy Lipschitz pour les ODE : Théorème 1.1 (Ginibre, Velo [20]). — Soient l’exposant de Sobolev ( +∞ pour d = 1, 2 ∗ 2 = 2d pour d ≥ 3 d−2 et une nonlinéarité énergie sous-critique : 1 < p < 2∗ − 1;

ASTÉRISQUE 352

(1046)

FEUILLE DE ROUTE

123

alors pour tout u0 ∈ H 1 (Rd ), il existe un temps maximal 0 < T = T (u0 ) ≤ +∞ et une unique solution u ∈ C ([0, T ), H 1 (Rd )) de (1). En outre, on a le critère d’explosion (2)

T < +∞ =⇒ lim ku(t)kH 1 = +∞. t↑T

L’existence globale peut maintenant dans certains cas être obtenue comme une conséquence des lois de conservation attachées à la structure hamiltonienne de (1) : la conservation de la masse Z Z |u(t, x)|2 dx = |u0 (x)|2 dx, Rd

Rd

et la conservation de l’énergie totale du système Z Z 1 1 2 |∇u(t, x)| dx ∓ |u(t, x)|p+1 dx = E(u0 ). (3) E(u) = 2 Rd p + 1 Rd En vertu du critère d’explosion (2), il suffit pour obtenir l’existence globale de montrer une borne a priori sur la norme H 1 , ce qui en vertu de la conservation de l’énergie (3) est immédiat dans le cas défocalisant, signe « - » dans (1), où dispersions linéaire et nonlinéaire s’additionnent. Dans le cas focalisant plus délicat, signe « + » dans (1), la nonlinéarité tend à concentrer l’onde et agit contre la dispersion. En vertu de Sobolev, kukLp+1 . kukH˙ s . k∇uksL2 kuk1−s L2 , −s +

d d(p − 1) d = , i.e. s = , 2 p+1 2(p + 1)

les lois de conservation impliquent un contrôle H 1 uniforme pour 4 s(p + 1) < 2, i.e. p < 1 + . d On a donc le théorème d’existence globale : Corollaire 1.2 (Existence globale). — Sous les hypothèses du théorème 1.1, la solution est globale T = +∞ dans les cas : 1. défocalisant ; 2. focalisant L2 sous-critique : 1 < p < 1 + d4 . 1.2. Invariance d’échelle et théorie critique Cazenave et Weissler généralisent la théorie de Cauchy dans l’espace d’énergie H 1 et établissent dans [6] la théorie de Cauchy locale Sobolev critique. Le niveau Sobolev critique de (1) se calcule via l’invariance d’échelle du flot 2

u(t, x) 7→ uλ (t, x) = λ p−1 u(λ2 tλx), λ > 0 qui laisse invariante la norme Sobolev homogène kuλ (t, ·)kH˙ sc (Rd ) = ku(λ2 t, ·)kH˙ sc (Rd )

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

124

P. RAPHAËL

pour 2 d − . 2 p−1 Les estimations de Strichartz [66], qui sont une mesure robuste via des normes espacetemps de la dispersion du flot linéaire, permettent de résoudre de manière complètement élémentaire le problème de Cauchy local en temps. sc =

Théorème 1.3 (Problème de Cauchy local critique, [6]). — Soit 4 1 + ≤ p ≤ 2∗ , i.e. 0 ≤ sc ≤ 1 ; d alors pour toute donnée u0 ∈ H˙ s (Rd ), il existe 0 < T = T (u0 ) et une unique(1) solution u ∈ C 0 ([0, T ), H˙ s (Rd )) de (1). En outre, il existe ε0 > 0 tel que ku0 kH˙ s < ε0 =⇒ T = +∞. Une différence majeure avec le cas des données H 1 est que l’analogue du critère d’explosion (2) est maintenant nettement plus subtil(2), et notamment le temps de vie de la solution est fondamentalement une fonction du profil de la donnée initiale, et ne peut pas dépendre du seul contrôle de la norme Sobolev invariante d’échelle. En particulier, il existe deux problèmes critiques pour lesquels l’invariance d’échelle vit au niveau d’une loi de conservation : le problème L2 ou masse critique 4 sc = 0, i.e. p = 1 + , d et le problème énergie critique sc = 1, i.e. p = 2∗ − 1, d ≥ 3. Par exemple pour le problème masse critique, la conservation de la masse assure le contrôle uniforme de la norme critique ku(t, ·)kL2 , mais cela ne suffit pas à assurer a priori l’existence globale : la norme critique peut concentrer. Un corollaire remarquable de cette approche est que, pour les données petites, non seulement on démontre existence globale, mais on obtient gratuitement scattering, soit le fait que la solution du problème nonlinéaire se comporte asymptotiquement en temps long comme une solution du problème linéaire, et donc en particulier converge localement en espace vers la solution triviale nulle. On démontre de manière similaire que l’ensemble des données dont la solution disperse au sens Strichartz est un ouvert dans l’espace critique, et c’est donc une dynamique stable sans hypothèse de taille. Dans le cas du problème L2 critique défocalisant, on obtient donc existence globale pour des données H 1 , mais seulement locale pour des données peu régulières. (1)

Il faudrait être plus précis sur la notion d’unicité qui n’est stricto sensu connue que pour les solutions Strichartz. (2) Et fait intervenir la norme Strichartz espace temps associée au problème de Cauchy.

ASTÉRISQUE 352

(1046)

FEUILLE DE ROUTE

125

On pourrait à raison, en première approche, arguer que le problème est académique. C’est une erreur pour trois raisons. La première est que, pour l’étude qualitative des solutions même C ∞ , il est fréquent qu’un argument de type compacité aboutisse sur des solutions pour lesquelles le seul contrôle naturel vit au niveau de l’espace critique en raison de l’invariance d’échelle, et alors une théorie de Cauchy critique devient fondamentale, voir par exemple [45]. Deuxièmement, dans le cas énergie critique sc = 1, la seule théorie de Cauchy est critique, et donc les lois de conservation ne suffisent plus à assurer existence globale, même dans le cas défocalisant. C’est précisément l’objet des travaux de Bourgain [4], Tao et ses collaborateurs [8] et Kenig-Merle [24] que d’obtenir les résultats d’existence globale et scattering dans ce cadre sur lequel nous allons revenir. Enfin tertio, les résultats pionniers surcritiques de Kenig-Merle [26] en énergie surcritique sc > 1 montrent que la norme invariante d’échelle joue un rôle fondamental dans la description qualitative du flot, indépendamment de toute autre hypothèse de régularité sur la donnée. 1.3. Onde solitaire et existence globale Dans le cas focalisant, (1) admet des solutions exceptionnelles dites ondes solitaires. Ce sont des paquets d’ondes bien localisés en espace pour lesquels la dispersion du groupe linéaire et la concentration induite par la nonlinéarité focalisante se compensent exactement. Dans le cadre sous-critique sc < 1, l’onde solitaire est une solution périodique en temps (4)

u(t, x) = Q(x)eit , ∆Q − Q + Q|Q|p−1 = 0,

et stationnaire pour sc ≥ 1 : (5)

u(t, x) = Q(x), ∆Q + Q|Q|p−1 = 0.

De telles solutions donnent un premier exemple de dynamiques nonlinéaires puisqu’en particulier elles ne dispersent pas. Les techniques variationnelles des années 1980 permettent de classifier les états fondamentaux de (4), (5) et d’obtenir la description complète des solutions positives qui apparaissent naturellement comme des minimiseurs de l’énergie (3) en un sens à préciser, ou de manière équivalente comme des extremums dans des inégalités d’interpolation à la Gagliardo-Nirenberg. Le résultat typique d’estimation de Sobolev avec meilleure constante est le suivant : Théorème 1.4 (Sobolev optimal et état fondamental, [72], [18], [33]) Soit 1+

4 ≤ p ≤ 2∗ − 1, 0 ≤ sc ≤ 1 ; d

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

126

P. RAPHAËL

alors le problème de minimisation inf 1

u∈H

k∇ukσL2 kuk1−σ d(p − 1) L2 où σ = ∈ (0, 1] kukLp+1 2(p + 1)

est atteint sur la famille µ0 Q(λ0 x + x0 )eiγ0 , (µ0 , λ0 , x0 , γ0 ) ∈ R × R∗+ × R × R où l’état fondamental Q est l’unique solution à symétrie sphérique de ( ∆Q − Q + Qp = 0 pour sc < 1 (6) , Q > 0, Q ∈ Lp+1 . ∆Q + Qp = 0 pour sc = 1 La notion d’onde solitaire peut facilement être étendue au cas L2 sous-critique sc < 0 auquel cas les méthodes variationnelles permettent de démontrer sa stabilité, [5]. Au contraire, dans les cas que nous considérons, l’onde solitaire est intrinsèquement instable par scattering et explosion : n’importe quel voisinage de l’onde solitaire contient des données initiales pour lesquelles la solution correspondante de (1) explose ou au contraire disperse. Ce résultat est très simple à démontrer mais remarquable en soi et repose sur une algèbre très spécifique du problème. 1.4. Le problème L2 critique Nous allons maintenant illustrer sur un exemple la propriété fondamentale au cœur de l’intuition Kenig-Merle : l’onde solitaire est la plus petite solution nonlinéaire de (1) au sens de la norme critique. Considérons en effet le problème L2 critique sc = 0 ; alors la combinaison des théorèmes 1.1 et 1.4 donne aisément : Théorème 1.5 (Existence globale L2 critique, Weinstein [72]) Soit u0 ∈ H 1 avec (7)

ku0 kL2 < kQkL2 ;

alors la solution correspondante de (1) est globale en temps. En outre, si u0 ∈ Σ = H 1 ∩ {xu ∈ L2 }, alors il y a scattering. Preuve du théorème 1.5 : La caractérisation variationnelle de l’état fondamental donnée par le théorème 1.4 implique de manière équivalente la minoration du hamiltonien (3) : " Å ã4 # 1 kukL2 d 2 1 (8) ∀u ∈ H , E(u) ≥ k∇ukL2 1 − , 2 kQkL2

ASTÉRISQUE 352

(1046)

FEUILLE DE ROUTE

127

et d

(9)

(kukL2 ≤ kQkL2 et E(u) = 0) =⇒ u ≡ λ02 Q(λ0 x + x0 )eiγ0 .

La conservation de la masse et du hamiltonien couplée à la condition de masse souscritique (7) implique maintenant une borne uniforme ∀t ∈ [0, T ), ku(t)kH 1 . C(E(u0 ), ku0 kH 1 ) et donc T = +∞ en vertu de (2). La preuve du scattering est élémentaire si on utilise une symétrie additionnelle exceptionnelle du flot : l’invariance pseudo-conforme, [19]. En effet, si u(t, x) est solution de (1), alors Å ã |x|2 1 −1 x (10) v(t, x) = d u , ei 4t t |t| |t| 2 aussi. Comme u ∈ Σ, v ∈ H 1 et kv(t)kL2 < kQkL2 car la symétrie pseudo-conforme est une isométrie L2 . Donc v admet une limite forte dans H 1 quand t ↑ 0 et u disperse quand τ = − 1t → +∞ par inversion de la formule (10), cqfd. La remarque fondamentale est maintenant que le critère de Weinstein (th. 1.5) est optimal. En effet, au niveau critique ku0 kL2 = kQkL2 , l’onde solitaire u(t, x) = Q(x)eit fournit une solution non dispersive, et sa transformée pseudo-conforme Å ã |x|2 i x 1 ei 4t e− t (11) S(t, x) = d Q |t| |t| 2 engendre une solution explosive lim kS(t)kH 1 = +∞. t↑0

L’onde solitaire est donc le premier objet nonlinéaire puisque c’est le premier objet qui ne disperse pas, et c’est un résultat typique des années 1980. On voit aussi que l’explosion de la solution pseudo-conforme (11) correspond à la concentration de la norme critique : |S(t)|2 * kQk2L2 δx=0 quand t → 0. La question que pose Merle dans son article pionnier [41] est celle de la classification dynamique de l’onde solitaire qui est intimement liée à celle des attracteurs du système hamiltonien de dimension infinie (1). En effet, l’onde solitaire est à un déphasage temporel près une solution stationnaire. Si le problème était parabolique, on pourrait typiquement espérer démontrer via la dérivation d’une fonctionnelle de Lyapounov que les attracteurs du flot sont les objets stationnaires et donc, si de tels objets sont

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

128

P. RAPHAËL

classifiés, en déduire que c’est l’onde solitaire(3). La gageure est que cette stratégie de preuve classique s’effondre pour un problème dispersif, et la percée de Merle consiste pour classifier l’onde solitaire à remplacer la propriété correcte mais inutilisable « l’onde solitaire est une solution stationnaire à déphasage près du flot » par la propriété plus faible mais remarquable « l’onde solitaire engendre un flot compact dans l’espace critique aux symétries près », et ensuite de classifier de tels objets. La classification dynamique de l’onde solitaire procède alors en deux temps : 1. extraction d’un objet compact par concentration compacité ; 2. théorème de Liouville pour classifier les objets compacts dans l’espace critique. Illustrons la méthode pour classifier la dynamique de l’onde solitaire au niveau de masse critique : Théorème 1.6 (Classification dynamique de l’onde solitaire, Merle [41]) Soient u0 ∈ H 1 avec ku0 kL2 = kQkL2 , et u ∈ C ([0, T ), H 1 ) la solution correspondante de (1) ; alors : (i) si T < +∞, alors u(t) ≡ S(t) aux symétries du flot près. (ii) si T = +∞ et u0 ∈ Σ, alors la seule solution qui ne disperse pas est l’onde solitaire u(t, x) = Q(x)eit aux symétries du flot près. Preuve du théorème 1.6. Les propriétés (i) et (ii) sont duales l’une de l’autre par l’invariance pseudo-conforme (10), il suffit donc de montrer (i). Soit une solution u ∈ H 1 de masse critique explosant en T = 0, montrons que u(t) ≡ S(t) aux symétries du flot près. Étape 1. — Compacité du flot, [72]. Nous allons montrer que le flot u(t) est compact aux symétries près dans l’espace critique avec profil asymptotique donné par l’onde solitaire, soit qu’il existe (λ(t), x(t), γ(t)) ∈ R∗ × Rd × R tels que : (12)

d

λ(t) 2 u(t, λ(t)x + x(t))eiγ(t) → Q dans L2 quand t ↑ 0.

C’est une conséquence de la caractérisation variationnelle du soliton, des lois de conservation du flot et d’un argument de concentration compacité à la Lions [34]. Soit en effet la renormalisée d k∇QkL2 ; v(t, x) = λ(t) 2 u(t, λ(t)x), λ(t) = k∇u(t)kL2 (3)

Voir théorème 2.1 ci-après.

ASTÉRISQUE 352

(1046)

FEUILLE DE ROUTE

129

alors k∇v(t)kL2 = k∇QkL2 , par construction, et en vertu des lois de conservation et du critère d’explosion (2) : kv(t)kL2 = ku(t)kL2 = kQkL2 , E(v) = λ2 (t)E(u) = λ2 (t)E(u0 ) → 0 quand t ↑ 0. Soit tn ↑ 0 et vn = v(tn ) ; alors vn est une suite bornée dans H 1 . Le lemme de concentration compacité [34] décrit la perte de compacité de l’injection de Sobolev H 1 ,→ Lp , 2 < p < 2∗ , et nous donnons la version moderne dite de décomposition en profils [17], [22] : Lemme 1.7 (Décomposition en profils d’une suite bornée H 1 , [17], [22]) Soit vn une suite bornée de H 1 ; alors il existe des points xjn ∈ Rd et des profils j V ∈ H 1 (Rd ) tels que : (i) pour tout k 6= j, |xkn − xjn | → +∞ quand n → +∞ ; (ii) pour tout J ≥ 1, vn (x) = ΣJj=1 V j (x − xjn ) + wnJ (x) avec lim sup kwnJ kLp → 0 quand J → +∞ pour tout 2 < p < 2∗ . n→+∞

En outre, kvn k2L2 = ΣJj=1 kV j k2L2 + kwnJ k2L2 + on→+∞ (1), k∇vn k2L2 = Σlj=1 k∇V j k2L2 + k∇wnJ k2L2 + on→+∞ (1). En d’autres termes, on obtient une décomposition presque H 1 orthogonale de la suite avec une précision indexée par une erreur oJ→+∞ (1). Appliquons ce lemme à la suite vn qui vérifie par construction (13)

k∇vn kL2 = k∇QkL2 , kvn kL2 = kQkL2 , E(vn ) → 0.

Soit J  1. Supposons que la suite admette au moins deux profils non triviaux V j ; alors par (13) : kV 1 kL2 < kQkL2 , kV j kL2 ≤ kQkL2 et donc en vertu de (8) : E(V 1 ) > 0, E(V j ) ≥ 0 for j ≥ 2. Ceci implique en utilisant les propriétés du lemme lim inf E(vn ) ≥ E(V 1 ) > 0, n→+∞

ce qui est absurde. Donc il existe un unique profil non trivial, donc de masse kQkL2 , et alors vn (x − x1n ) → V 1 dans Lp+1 , puis : kV 1 kL2 = kQkL2 , E(V 1 ) ≤ 0.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

130

P. RAPHAËL

On en déduit par la caractérisation variationnelle (9) que la convergence est forte wn1 → 0 dans H 1 , et donc k∇V 1 kL2 = k∇QkL2 et V 1 = Q(x − x0 )eiγ0 , (x0 , γ0 ) ∈ Rd × R, ce qui conclut la preuve de (12). Étape 2. — Théorème de Liouville. Nous allons maintenant classifier les flots explosifs L2 compacts au sens de (12). Tout d’abord on peut montrer la compacité du point de concentration |x(t)| . 1, et en fait à translation près la convergence lim x(t) = 0. t↑0

Comprendre la dynamique du point de concentration est non trivial en général, nous renvoyons par exemple à [22], [60] pour une démonstration élémentaire. Couplée avec la compacité L2 , la localisation du point de concentration implique la concentration de toute la masse : |u(t)|2 * kQk2L2 δx=0 quand t ↑ 0.

(14)

La clé de la démonstration est un un gain de régularité et nous allons montrer que la solution est dans l’espace de viriel : u(t) ∈ Σ.

(15)

En effet, soit une fonction régulière ψ(x) = |x|2 pour |x| ≤ 1, ψ(x) = 1 pour |x| ≥ 2, x et pour R > 0, ψR (x) = R2 ψ( R ), et telle que 0 2 (ψR ) . ψR .

Un calcul direct sur (1) donne Z ÅZ ã 1 d 2 ∇ψR (x) · ∇u(t, x)u(t, x)dx . ψR (x)|u(t, x)| dx = Im (16) 2 dt Rd Rd En appliquant l’estimation optimale (8) à ueiaψR (x) , a ∈ R, on obtient facilement l’estimation, [2] : ∀v ∈ H 1 avec kvkL2 ≤ kQkL2 , ÅZ ã » ÅZ ã 21 2 Im ∇ψ (x) · ∇v(x)v(x)dx . E(v) ψ (x)|v(x)| dx , R R Rd

Rd

et donc avec (16) : Z ÅZ d 2 . C(u0 ) ψ (x)|u(t, x)| dx R dt d

ã 21 ψR (x)|u(t, x)| dx . 2

Rd

R

On intègre l’inéquation différentielle avec la condition de bord par (14) : Z ∀R > 0, lim ψR |u(t, x)|2 dx = 0 t↑0

ASTÉRISQUE 352

Rd

(1046)

et on obtient :

Z

FEUILLE DE ROUTE

131

ψR (x)|u(t, x)|2 dx . C(u0 )|t|.

∀R > 0, Rd

L’estimation étant uniforme en R > 0, on a donc montré Z Z (17) |x|2 |u(t, x)|2 < +∞, lim |x|2 |u(t, x)|2 dx = 0. t↑0

Rd

Rd

Étape 3. — Conclusion. Le gain de régularité (17) permet d’utiliser la loi de conservation additionnelle qui vit dans l’espace fonctionnel Σ et non seulement H 1 , et qui correspond à la conservation de l’énergie pseudo-conforme induite par la symétrie (10). En effet, soit Å ã |x|2 1 −1 x v(t, x) = d u ei 4t ; , t |t| |t| 2 alors un calcul algébrique explicite montre que le contrôle de la variance (17) implique E(v) = 0. Or kvkL2 = kukL2 = kQkL2 , et alors v ≡ Q aux symétries du flot près par (9), et donc u ≡ S, cqfd.

2. EXTRACTION DE PROFILS, EXPLOSION ET EXISTENCE GLOBALE Nous allons illustrer dans cette section le rôle de l’onde solitaire en relation avec des résultats d’existence globale ou de description de profils de concentration dans le cadre explosif. 2.1. Problèmes géométriques Les applications harmoniques entre Rd et une variété immergée M ⊂ Rp sont les points critiques de l’énergie de Dirichlet Z |∇u(x)|2 dx Rd d

pour les applications u : R → M . L’équation d’Euler-Lagrange associée est l’équation des applications harmoniques de Rd dans M : (18)

PT M (u(x)) (∆u) = 0

où PT M (u(x)) est la projection sur le plan tangent à M en u(x). Cette équation classique de la physique mathématique a été très étudiée et l’existence de solutions non triviales d’énergie finie dépend de la géométrie de la variété cible. Supposons pour simplifier d = 2 et p = 3 ; alors il existe des solutions non triviales d’énergie finie pour M = S2 , mais pas par exemple pour H2 , l’espace hyperbolique.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

132

P. RAPHAËL

On peut associer trois flots dynamiques naturels à (18) : le flot harmonique de la chaleur, le flot des wave maps et le flot des Schrödinger maps, qui font tous trois l’objet d’une littérature très importante. Par exemple le flot parabolique est ∂t u = PT M (u(x)) (∆u)

(19)

et dissipe par construction l’énergie de Dirichlet Z Z 1 d (20) |∇u(t, x)|2 dx = − |∂t u(t, x)|2 dx. 2 dt R2 d R Si l’existence locale de solutions est élémentaire, la question de l’existence globale est plus délicate car le problème est énergie critique puisque l’invariance d’échelle u(t, x) 7→ uλ (t, x) = u(λ2 t, λx) laisse invariante l’énergie de Dirichlet : k∇uλ (t, ·)kL2 = k∇u(λ2 t, ·)kL2 . Ainsi donc, comme pour le problème L2 critique, le contrôle de la norme invariante d’échelle ne suffit pas à assurer l’existence globale, et a priori une dynamique singulière est possible par concentration de l’énergie. Une démonstration remarquable d’existence globale est due à Struwe dans un papier pionnier de 1986, [67] : Théorème 2.1 (Profil d’explosion pour le flot harmonique de la chaleur, [67]) Soit u une solution d’énergie finie du flot harmonique de la chaleur (19) qui explose en temps fini T < +∞. Alors il existe tn → T , (λn , xn ) ∈ R∗+ × R2 tels que (21)

u(tn , λn x + xn ) → Q quand t → T

localement en espace, où Q est une application harmonique non triviale d’énergie finie. Ce résultat appelle trois commentaires fondamentaux. (i) Tout d’abord (21) est une première description du phénomène d’explosion qui se produit donc par concentration dans l’espace critique d’une bulle d’énergie modulée le long des symétries du flot avec profil donné par une solution stationnaire. Le point fondamental de la démonstration est la dissipation (20) et la coercivité de l’énergie de Dirichlet qui donnent une borne a priori Z TZ |∂t u(t, x)|2 dxdt < +∞ 0

R2

et impliquent par un principe de type Lassalle qu’un objet récurrent en temps est nécessairement stationnaire.

ASTÉRISQUE 352

(1046)

FEUILLE DE ROUTE

133

(ii) Un corollaire immédiat est donc que si la variété cible n’admet pas d’application harmonique non triviale d’énergie finie – comme H2 –, alors toutes les solutions sont globales en temps. C’est une démonstration d’existence globale par l’absurde. 2.2. Théorèmes de Liouville La description des bulles de concentration de type (21) est centrale pour comprendre la formation de singularités des dynamiques de dimension infinie. La démonstration de Struwe pour le flot harmonique de la chaleur est directe et basée sur les estimations a priori très fortes induites par la structure parabolique du problème. Merle et ses collaborateurs ont dans la lignée du théorème 1.6 développé une méthodologie générale pour exhiber les profils de concentration dans deux situations distinctes : pour la chaleur parabolique en lien avec la description fine de la singularité stable, [50] ; pour des problèmes dispersifs où les estimations paraboliques s’effondrent, [37], [43]. Dans tous ces travaux, le cœur de la démonstration est en deux temps : extraction d’un profil asymptotique par méthodes de compacité ; classification des dynamiques compactes obtenues et Théorème de Liouville. L’exemple typique de Théorème de Liouville dans un problème parabolique est la classification des « solutions rétrogrades » dont un résultat pionnier est donné dans [50] : Théorème 2.2 (Théorème de Liouville pour la chaleur nonlinéaire, [50]) Soient 1 < p < 2∗ − 1 et u une solution L∞ de ∂t u = ∆u + up dans (−∞, T ) × Rd . Supposons en outre (22)

1

0 ≤ u(t, x) . (T − t)− p−1 ;

alors 1

u ≡ 0 ou u(t, x) = κ(T − t)− p−1 , κ > 0. La condition (22) peut être comprise comme une condition de minimalité du flot qui n’est donc admissible que pour la solution autosimilaire exacte qui dans ce cas est à nouveau stationnaire après renormalisation du flot. L’extension de ce type de résultat au cadre dispersif fut une percée fondamentale de Martel et Merle [35] pour l’équation de (KdV) généralisée, puis pour l’équation de Schrödinger L2 critique au voisinage de l’onde solitaire [43]. Donnons par exemple le résultat pour (gKdV) démontré dans [35], et central dans la démonstration de

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

134

P. RAPHAËL

l’existence de solutions explosives, [42], et la description des attracteurs du flot en temps long [37]. Le modèle est ( (gKdV )

∂t u + ∂x (∂x2 u + u5 ) = 0,

(t, x) ∈ ×R × R

u|t=0 = u0

et il partage une structure très similaire avec (NLS) L2 critique focalisant : la masse et l’énergie sont conservées Z Z 1 1 2 ku(t)kL2 = ku0 kL2 , E(u) = (∂x u(t, x)) dx − u6 (t, x)dx = E(u0 ), 2 R 6 R l’invariance d’échelle vit au niveau L2 1

u(t, x) 7→ uλ (t, x) = λ 2 u(λ2 t, λx), kuλ (t)kL2 = ku(λ2 t)kL2 , et la solution admet des ondes progressives de type onde solitaire : u(t, x) = Q(x − t) où Q est l’unique solution positive H 1 de Q00 − Q + Q5 = 0. On a alors le théorème de classification : Théorème 2.3 (Théorème de Liouville pour (gKdV), [35]) Soit u ∈ C ([0, +∞), H 1 ) une solution de (gKdV) avec : (i) Petitesse initiale : ku(0) − QkH 1  1. (ii) Contrôle H 1 : 0 < c1 ≤ ku(t)kH 1 ≤ c2 < +∞. (iii) Compacité : il existe x(t) ∈ R telle que v(t) = u(t, x + x(t)) est L2 étroite, i.e. Z ∀ε > 0, ∃R > 0 tel que ∀t ≥ 0, v 2 (t, x) < ε. |x|≥R

Alors u(t, x) ≡ Q(x − t) aux symétries du flot près. En d’autres termes, l’unique solution non dispersive – (iii) –, non explosive ni évanescente – (ii) –, initialement au voisinage de l’onde solitaire – (i) – est l’onde solitaire elle-même. Le fait fondamental est que la preuve ne se ramène pas à un problème stationnaire, ce qu’on ne sait pas faire, mais procède de manière dynamique pour classifier les flots non dispersifs. Conceptuellement, ces résultats sont la directe continuation des théorèmes de classification en elliptique nonlinéaire de Gidas, Ni, Nirenberg, [18].

ASTÉRISQUE 352

(1046)

FEUILLE DE ROUTE

135

2.3. (NLS) énergie critique Montrons maintenant comme cet ensemble d’idées couplées avec la machinerie dispersive Strichartz se cristallise dans le papier de référence [24]. Le problème considéré est l’équation de Schrödinger nonlinéaire(4) énergie critique. ( i∂t u + ∆u ± u|u|4 = 0 (23) (N LS) , (t, x) ∈ [0, T ) × R3 . 1 3 ˙ u|t=0 = u0 ∈ H (R )

En vertu du théorème d’existence locale 1.3, il existe une unique solution u ∈ C ([0, T ), H˙ 1 ) et les petites données initiales engendrent un flot global avec scattering. Dans le cas défocalisant, Bourgain [4] est le premier à démontrer l’existence globale de toutes les solutions. De manière remarquable et au contraire de ce qui était connu notamment pour le problème analogue des ondes [21], [68], la preuve de Bourgain ne repose pas sur des estimations a priori valables pour toute solution, mais sur un argument inductif sur le niveau d’énergie minimale d’une solution possiblement non dispersive. La preuve est radiale et étendue au cadre général dans [8] au prix d’une extrême virtuosité technique et de l’importation d’une très lourde machinerie d’analyse harmonique. En particulier, traiter le cas focalisant à la suite de ces travaux semblait inaccessible en raison de l’existence de la solution stationnaire non dispersive 1 5 u(t, x) = Q(x) = Ä ä 1 , ∆Q + Q = 0. |x|2 2 1+ 3 C’est l’objet de [24] où est démontré le critère optimal d’existence globale et scattering : Théorème 2.4 (Existence globale et scattering énergie critique, [24]) Soient u0 ∈ H˙ 1 à symétrie sphérique avec E(u0 ) < E(Q), et u ∈ C ([0, T ), H˙ 1 ) la solution correspondante de (1) focalisante. Alors : (i) si k∇u0 kL2 < k∇QkL2 , alors la solution est globale T = +∞ et il y a scattering ; (ii) si k∇u0 kL2 > k∇QkL2 , alors la solution explose en temps T < +∞. Ce théorème est complété dans [15] par la classification des dynamiques critiques E(u) = E(Q) qui est l’exacte généralisation du théorème 1.6. Preuve du théorème 2.4. La gageure est de démontrer existence globale et scattering (i), le critère explosif étant connu [3] et conséquence d’une identité algébrique très spécifique. La preuve est en trois temps : mise en place d’un raisonnement inductif par (4)

Nous nous restreignons au cas de la dimension N = 3 pour simplifier.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

136

P. RAPHAËL

contradiction ; extraction d’un élément minimal par concentration compacité dans les normes Strichartz ; classification des objets compacts sous le soliton. Étape 1. — Induction. La machinerie Strichartz pour (23) assure que le scattering est équivalent au contrôle dispersif espace temps kukL10 10 < +∞, t Lx

(24)

et cette borne est donc vérifiée pour les petites données. Suivant [4], on peut donc considérer le niveau d’énergie EC > 0 qui est minimal au sens où, pour toute donnée initiale avec k∇u0 kL2 < k∇QkL2 et E(u0 ) < EC , la solution correspondante est globale sur R et vérifie scattering au sens de (24). Il nous faut donc montrer EC ≥ E(Q) et on raisonne par l’absurde en supposant EC < E(Q). On considère alors une suite de données initiales u0,n ∈ H˙ 1 avec Z Z (25) E(u0,n ) ↑ EC , |∇u0,n |2 < |∇Q|2 et telle que la solution correspondante un de (23) vit sur un intervalle In = (−T− (u0,n ), T+ (u0,n )) avec (26)

kun kS(In ) = kun kL10 < +∞, kun kS(In ) → +∞ quand n → +∞. L10 x I n

L’hypothèse EC < E(Q), la conservation de l’énergie et la caractérisation variationnelle du soliton du théorème 1.4 assurent un contrôle uniforme Z Z (27) ∀t ∈ In , |∇un (t)|2 ≤ (1 − δ) |∇Q|2 , δ > 0. Étape 2. — Concentration compacité. Nous allons extraire par compacité un objet minimal au niveau énergie critique E(u) = EC , ce qui pour un problème de minimisation standard correspond formellement à la compacité à symétrie près des suites minimisantes u0,n . L’obstruction à la compacité de l’estimation de Strichartz linéaire keit∆ φkL10 10 . k∇φkL2 t Lx est due aux actions

Å ã x 1 τx0 φ(x) = φ(x − x0 ), Sλ0 φ(x) = √ φ , Rt0 φ(t, x) = eit0 ∆ φ(x). λ λ0 0

ASTÉRISQUE 352

(1046)

FEUILLE DE ROUTE

137

Le lemme de décomposition en profil dont nous avons besoin est dû à Keraani [27] dans la continuation de [1], [49], et est la version Strichartz du lemme 1.7 : Lemme 2.5 (Décomposition en profils, [27]). — Étant donnée une suite (v0,n )n≥1 de données initiales bornée dans l’espace critique H˙ 1 , alors à sous-suite près, on peut trouver (λj,n , xj,n , tj,n ) avec (28)

λj,n λj 0 ,n |tj,n − tj 0 ,n | |xj,n − xj 0 ,n | + + + → +∞ quand n → +∞, j 6= j 0 , λj 0 ,n λj,n λ2j,n λj,n

et une suite de profils V0,j ∈ H˙ 1 telle que pour tous J, n, Ç å −tn,j x − xj,n 1 J , (29) v0,n (x) = Σj=1 1 Vj + wnJ (x), Vj (t, x) = eit∆ V0,j 2 λ λ 2 j,n j,n λ j,n

avec l’estimation d’erreur : lim sup keit∆ wnJ kS(R) → 0 quand J → +∞,

(30)

n→+∞

Ç (31)

E(v0,n ) =

ΣJj=1 E

å −tj,n Vj ( 2 ) + E(wnJ ) + o(1) quand n → +∞. λj,n

Étape 3. — Extraction de l’objet minimal. Nous pouvons maintenant extraire l’objet compact. Nous appliquons le lemme de décomposition en profils à la suite minimisante u0,n . L’observation fondamentale est que la décomposition en profils (29 )ne peut contenir qu’une bulle : V0,1 6= 0, V0,j = 0 pour j ≥ 2. Le raisonnement formel est identique à celui de l’étape 1 du théorème 1.6. S’il existait au moins deux profils non triviaux, alors par (31), (25), E(V0,j ) ≤ EC − δ pour un certain δ > 0, et donc par définition du niveau minimal EC , la solution correspondante de problème nonlinéaire (23) avec donnée V0,j satisfait des bornes Strichartz uniformes. Il reste maintenant à observer que la condition de découplage des profils (28) et l’estimation Strichartz uniforme du reste assurent que la solution de (23) avec donnée u0,n se comporte asymptotiquement comme la somme des solutions issues de chaque profil V0,j . Ceci nécessite une théorie perturbative robuste pour le flot nonlinéaire qui est typiquement à nouveau une conséquence de la machinerie Strichartz. On en déduit dans la limite n → +∞ un contrôle Strichartz uniforme qui contredit l’hypothèse d’explosion (26). Le même argument implique E(V0,1 ) = EC et la convergence forte ∇wn1 → 0 dans L2 . Il est alors facile de réextraire sur cette décomposition simplifiée une suite convergente de donnée initiale qui converge vers une donnée uC,0 ∈ H˙ 1 telle que la solution correspondante uC ∈ C (I, H˙ 1 ) de (23) vérifie : Z Z 2 E(uC ) = EC , |∇u0,C | < |∇Q|2 , kuC kS(I) = +∞.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

138

P. RAPHAËL

En outre, en réappliquant la décomposition en profil à la suite uC (tn ), on montre que cette décomposition à nouveau ne peut faire intervenir qu’un seul profil avec un reste fortement convergent vers 0 dans H˙ 1 : une solution minimale ne peut disperser car sinon on pourrait extraire une autre solution minimale avec strictement moins d’énergie, contradiction. On obtient ainsi que la solution minimale engendre un flot compact au sens suivant : il existe (λ(t), x(t)) ∈ R∗+ × R3 tels que (32) ¶ © 1 vC (t, x) = λ(t) 2 uC (t, λ(t)x + x(t)), t ∈ I est d’adhérence compacte dans H˙ 1 . En particulier, vC (t) est H˙ 1 étroit, soit : ∀ε > 0, ∃R(ε) > 0 tel que Z ï ò |vC |2 2 6 (33) ∀t ∈ I, |∇vC | + |vC | + (t, x)dx < ε. |x|2 |x|≥R(ε) Insistons sur le fait qu’une solution générique disperse et éjecte de la masse, et ne vérifie donc typiquement pas l’étroitesse (33). Étape 4.Ê Théorème de Liouville. Classifier les flots compacts en général est un problème ouvert, mais il nous suffit de montrer ici que l’onde solitaire est le plus petit objet compact. Le théorème de rigidité suivant achève la démonstration du théorème 2.4 : Théorème 2.6 (Liouville sous-critique, [24]). — Soit uC ∈ C ([0, T ), H˙ 1 ) solution compacte à symétrie sphérique de (23) au sens de (32) avec Z Z (34) E(uC ) < E(Q), |∇uC,0 |2 < |∇Q|2 ; alors uC ≡ 0. Preuve du théorème 2.6. La difficulté est comme pour la preuve du théorème 1.6 qu’on ne dispose pas d’estimation a priori sur la taille des paramètres (λ(t), x(t)) dans la décomposition (32). En utilisant l’hypothèse de minimalité, un argument initié dans [42] permet de ramener le problème à la négation de deux scénarios : (i) explosion type II : T < +∞ et λ(t) → 0 quand t → T ; (ii) existence globale hors évanescence : T = +∞ et 0 < λ(t) < λ1 < +∞. Montrons pourquoi explosion est impossible sous le soliton. L’argument pour évacuer existence globale est dans la même veine mais nécessite dans [24] l’hypothèse de radialité(5). D’une manière générale, il faut penser que l’étroitesse (33) permet de localiser les lois de conservation ou les monotonies nonlinéaires associées au flot, dont la structure est intimement liée à la caractérisation variationnelle du soliton, [3]. (5)

Ou plus précisément une borne a priori sur le point de concentration |x(t)| . 1.

ASTÉRISQUE 352

(1046)

139

FEUILLE DE ROUTE

Supposons donc λ(t) → 0 en temps fini t → T . Nous allons procéder de façon très analogue à la démonstration du théorème 1.6 en intégrant l’équation backwards depuis la singularité pour gagner de la régularité et ainsi utiliser la loi de conservation sous-critique(6), ici L2 . Soit une fonction de troncature φ(x) = 1 pour |x| ≤ 1, φ(x) = 0 pour |x| ≥ 2 et x φR (x) = φ( R ). On calcule avec (23) le flux de masse local : ÅZ Z ã 1 ÅZ ã ÅZ ã 21 1 d |uC |2 2 2 2 φ (x)|u (t, x)| dx = Im u dx ∇φ · ∇u . |∇u | R C R C C C 2 dt |x|2 Z . |∇uC |2 . 1 (35) où l’on a utilisé Hardy et comme précédemment la borne a priori H˙ 1 (27). Maintenant la compacité (33) couplée à l’hypothèse d’explosion implique : Z (36) ∀R > 0, lim φR |uC (t, x)|2 dx = 0. t→T

En effet, Z

|uC (t, x)|2 = λ2 (t)

Z

|x|≤R

|λ(t)y+x(t)|≤R

Z

2

|vC (t, y)|2 dy

|vC (t, y)|2 1λ(t)|y|≤εR dy

= λ (t) |λ(t)y+x(t)|≤R

Z

2

|vC (t, y)|2 1λ(t)|y|≥εR dy.

+ λ (t) |λ(t)y+x(t)|≤R

Pour le premier terme, par Hölder et Sobolev : Z 2 λ (t) |vC (t, y)|2 1λ(t)|y|≤εR dy

Å 2

(t)kvC (t)k2L6

.

λ

.

R 2 ε2 .

|λ(t)y+x(t)|≤R

εR λ(t)

ã2

Pour le second terme, par Hölder et la compacité (33) : Z λ2 (t) |vC (t, y)|2 1λ(t)|y|≥εR dy |λ(t)y+x(t)|≤R

.

Z

2

! 13 ÇZ

å 23

|vC (t, y)| dy

λ (t) εR |y|≥ λ(t)

Å

.

6

R λ2 (t) λ(t)

ã2

dy λ(t)y∈B(x(t),R)

Z

! 31 |vC (t, y)|6 dy

εR |y|≥ λ(t)

→ 0 quand t → T, (6)

Donc a priori inutilisable.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

140

P. RAPHAËL

et (36) s’ensuit. On intègre maintenant (35) backwards depuis la singularité avec (36) et donc : Z φR |uC (t, x)|2 dx . T − t.

La constante étant indépendante de R > 0, on en déduit Z Z |uC (t, x)|2 dx < +∞ et lim |uC (t, x)|2 dx = 0. t↑T

2

Mais la loi de conservation L implique maintenant uC ≡ 0, cqfd. 2.4. Extensions L’article [24] a immédiatement engendré un nombre impressionnant de travaux. Tout d’abord en relation avec la question de l’extension à toute dimension et l’élimination de l’hypothèse de radialité, [29]. Dans le cas des ondes nonlinéaires énergie critique, une démonstration école et complète est donnée dans [25]. L’extension de ces techniques au problème L2 critique fait l’objet de la série de travaux [71], [28], [30] avec notamment de très sérieuses difficultés pour obtenir la classification sous-critique des états compacts en petite dimension non radiale qui fait l’objet des travaux remarquables de Dodson [9], [10], [11], [12] ; nous renvoyons à l’exposé de F. Planchon [58] pour une exposition détaillée. En outre, ces travaux ont ouvert la voie à la découverte et la classification des dynamiques critiques, [15], [14], [16], et à la généralisation complètement insoupçonnée du théorème 1.6 qui loin d’être un cas isolé revêt donc un caractère universel. Les arguments d’extraction de profil et la classification des dynamiques critiques sont centraux dans les très élégants résultats de description du flot en énergie au-delà de l’onde solitaire obtenus par Nakanishi et Schlag [55], [56], et qui sont une première étape vers la classification du flot au voisinage de l’onde solitaire qui en est à ses débuts ; nous renvoyons par exemple à [48] pour une introduction à ces problèmes délicats. Les récentes percées sur les problèmes de wave map qui sont la généralisation ondes du problème parabolique (19), et complètent le programme initié dans [7], [69], sont dans la droite ligne de ces travaux, en particulier le travail Sterbenz-Tataru [65], [64] qui adapte les fonctionnelles de Lyapounov non radiales sur le flot renormalisé découvertes dans [51], [25] pour démontrer la version ondes du théorème 2.1, et le travail Krieger, Schlag [31], qui met en œuvre la « feuille de route » à la Kenig-Merle pour démontrer existence globale et scattering de la wave map énergie critique avec cible l’espace hyperbolique, voir aussi Tao [70]. Ces travaux ouvrent plusieurs directions de recherche importantes. Tout d’abord l’étude du flot près de l’onde solitaire, soit au-delà du seuil E(Q), qui était totalement ouverte il y a encore dix ans et fait l’objet d’une dynamique de recherche intense.

ASTÉRISQUE 352

(1046)

FEUILLE DE ROUTE

141

Dans les cadres critiques d’énergie et de masse, des progrès considérables ont été accomplis notamment pour la construction de dynamiques effectives, explosives ou globales, au voisinage de l’onde solitaire, par exemple [57], [36], [32], [63], [61], [52], [46], et la classification de l’onde solitaire comme profil universel d’explosion [37], [44], [13]. Le cas général de hautes énergies est pour l’instant largement ouvert mais ne semble plus totalement hors de portée au moins pour certains modèles simples, voir par exemple [53] pour un premier résultat de décomposition universel de la solution en train d’ondes solitaires. Enfin une frontière particulièrement excitante se dessine aux portes du monde surcritique p > 2∗ largement inexploré hors quelques résultats isolés – mais spectaculaires – dans le cas parabolique radial, [38], [39], [40], [54], et quelques résultats d’explosion dispersive surcritique explicite [59], [47], [62]. Dans le cas de l’équation des ondes énergie surcritique défocalisante, Kenig et Merle illustrent dans [26] le rôle fondamental de la norme invariante d’échelle et montrent que, si l’on suppose une borne a priori sur cette norme, alors la solution est globale et disperse, ce qui fait écho au résultat de régularité [23] pour Navier Stokes, et le résultat qualitatif explosif pour (NLS) [45]. L’existence d’une solution développant une dynamique dite faiblement turbulente avec croissance de la norme Sobolev critique est un des problèmes ouverts majeurs du domaine.

RÉFÉRENCES [1] H. Bahouri & P. Gérard – High frequency approximation of solutions to critical nonlinear wave equations, Amer. J. Math. 121 (1999), no 1, p. 131–175. [2] V. Banica – Remarks on the blow-up for the Schrödinger equation with critical mass on a plane domain, Ann. Sc. Norm. Super. Pisa Cl. Sci. 3 (2004), no 1, p. 139–170. [3] H. Berestycki & T. Cazenave – Instabilité des états stationnaires dans les équations de Schrödinger et de Klein-Gordon non linéaires, C. R. Acad. Sci. Paris Sér. I Math. 293 (1981), no 9, p. 489–492. [4] J. Bourgain – Global wellposedness of defocusing critical nonlinear Schrödinger equation in the radial case, J. Amer. Math. Soc. 12 (1999), no 1, p. 145–171. [5] T. Cazenave & P.-L. Lions – Orbital stability of standing waves for some nonlinear Schrödinger equations, Comm. Math. Phys. 85 (1982), no 4, p. 549– 561. [6] T. Cazenave & F. B. Weissler – The Cauchy problem for the critical nonlinear Schrödinger equation in H s , Nonlinear Anal. 14 (1990), no 10, p. 807–836.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

142

P. RAPHAËL

[7] D. Christodoulou & A. S. Tahvildar-Zadeh – On the regularity of spherically symmetric wave maps, Comm. Pure Appl. Math. 46 (1993), no 7, p. 1041– 1091. [8] J. Colliander, M. Keel, G. Staffilani, H. Takaoka & T. Tao – Global well-posedness and scattering for the energy-critical nonlinear Schrödinger equation in R3 , Ann. of Math. 167 (2008), no 3, p. 767–865. [9] B. Dodson – Global well-posedness and scattering for the defocusing, L2 -critical nonlinear Schrödinger equation when d ≥ 3, J. Amer. Math. Soc. 25 (2012), no 2, p. 429–463. [10] , Global well-posedness and scattering for the defocusing, L2 -critical nonlinear Schrödinger equation when d = 1, prépublication arXiv:1010.0040. [11] , Global well-posedness and scattering for the defocusing, L2 -critical nonlinear Schrödinger equation when d = 2, prépublication arXiv:1006.1375. , Global well-posedness and scattering for the mass critical nonlinear [12] Schrödinger equation with mass below the mass of the ground state, prépublication arXiv:1104.1114. [13] T. Duyckaerts, C. E. Kenig & F. Merle – Universality of the blow-up profile for small type II blow-up solutions of energy-critical wave equation : the non-radial case, prépublication arXiv:1003.0625. [14] T. Duyckaerts & F. Merle – Dynamics of threshold solutions for energycritical wave equation, Int. Math. Res. Pap. IMRP (2008), p. Art ID rpn002, 67. , Dynamic of threshold solutions for energy-critical NLS, Geom. Funct. [15] Anal. 18 (2009), no 6, p. 1787–1840. [16] T. Duyckaerts & S. Roudenko – Threshold solutions for the focusing 3D cubic Schrödinger equation, Rev. Mat. Iberoam. 26 (2010), no 1, p. 1–56. [17] P. Gérard – Description du défaut de compacité de l’injection de Sobolev, ESAIM Control Optim. Calc. Var. 3 (1998), p. 213–233. [18] B. Gidas, W. M. Ni & L. Nirenberg – Symmetry and related properties via the maximum principle, Comm. Math. Phys. 68 (1979), no 3, p. 209–243. [19] J. Ginibre & G. Velo – Existence of solutions and scattering theory for the nonlinear Schrödinger equation, in Proceedings of the International Conference on Operator Algebras, Ideals, and their Applications in Theoretical Physics (Leipzig, 1977), Teubner, 1978, p. 320–334. [20] , On a class of nonlinear Schrödinger equations. I. The Cauchy problem, general case, J. Funct. Anal. 32 (1979), no 1, p. 1–32. [21] M. G. Grillakis – Regularity and asymptotic behaviour of the wave equation with a critical nonlinearity, Ann. of Math. 132 (1990), no 3, p. 485–509.

ASTÉRISQUE 352

(1046)

FEUILLE DE ROUTE

143

[22] T. Hmidi & S. Keraani – Remarks on the blowup for the L2 -critical nonlinear Schrödinger equations, SIAM J. Math. Anal. 38 (2006), no 4, p. 1035–1047. [23] L. Iskauriaza, G. A. Serëgin & V. Shverak – L3,∞ -solutions of NavierStokes equations and backward uniqueness, Uspekhi Mat. Nauk 58 (2003), no 2(350), p. 3–44. [24] C. E. Kenig & F. Merle – Global well-posedness, scattering and blow-up for the energy-critical, focusing, non-linear Schrödinger equation in the radial case, Invent. Math. 166 (2006), no 3, p. 645–675. [25] , Global well-posedness, scattering and blow-up for the energy-critical focusing non-linear wave equation, Acta Math. 201 (2008), no 2, p. 147–212. [26] , Nondispersive radial solutions to energy supercritical non-linear wave equations, with applications, Amer. J. Math. 133 (2011), no 4, p. 1029–1065. [27] S. Keraani – On the defect of compactness for the Strichartz estimates of the Schrödinger equations, J. Differential Equations 175 (2001), no 2, p. 353–392. [28] R. Killip, T. Tao & M. Visan – The cubic nonlinear Schrödinger equation in two dimensions with radial data, J. Eur. Math. Soc. (JEMS) 11 (2009), no 6, p. 1203–1258. [29] R. Killip & M. Visan – The focusing energy-critical nonlinear Schrödinger equation in dimensions five and higher, Amer. J. Math. 132 (2010), no 2, p. 361– 424. [30] R. Killip, M. Visan & X. Zhang – The mass-critical nonlinear Schrödinger equation with radial data in dimensions three and higher, Anal. PDE 1 (2008), no 2, p. 229–266. [31] J. Krieger & W. Schlag – Concentration compactness for critical wave maps, EMS Monographs in Math., European Mathematical Society (EMS), Zürich, 2012. [32] J. Krieger, W. Schlag & D. Tataru – Renormalization and blow up for charge one equivariant critical wave maps, Invent. Math. 171 (2008), no 3, p. 543– 615. [33] M. K. Kwong – Uniqueness of positive solutions of ∆u − u + up = 0 in Rn , Arch. Rational Mech. Anal. 105 (1989), no 3, p. 243–266. [34] P.-L. Lions – The concentration-compactness principle in the calculus of variations. The locally compact case. I, Ann. Inst. H. Poincaré Anal. Non Linéaire 1 (1984), no 2, p. 109–145. [35] Y. Martel & F. Merle – A Liouville theorem for the critical generalized Korteweg-de Vries equation, J. Math. Pures Appl. 79 (2000), no 4, p. 339–425. [36] , Blow up in finite time and dynamics of blow up solutions for the L2 critical generalized KdV equation, J. Amer. Math. Soc. 15 (2002), no 3, p. 617– 664.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

144

[37]

P. RAPHAËL

, Stability of blow-up profile and lower bounds for blow-up rate for the critical generalized KdV equation, Ann. of Math. 155 (2002), no 1, p. 235–280.

[38] H. Matano & F. Merle – On nonexistence of type II blowup for a supercritical nonlinear heat equation, Comm. Pure Appl. Math. 57 (2004), no 11, p. 1494–1541. [39]

, Classification of type I and type II behaviors for a supercritical nonlinear heat equation, J. Funct. Anal. 256 (2009), no 4, p. 992–1064.

[40]

, Threshold and generic type I behaviors for a supercritical nonlinear heat equation, J. Funct. Anal. 261 (2011), no 3, p. 716–748.

[41] F. Merle – On uniqueness and continuation properties after blow-up time of self-similar solutions of nonlinear Schrödinger equation with critical exponent and critical mass, Comm. Pure Appl. Math. 45 (1992), no 2, p. 203–254. [42]

, Existence of blow-up solutions in the energy space for the critical generalized KdV equation, J. Amer. Math. Soc. 14 (2001), no 3, p. 555–578.

[43] F. Merle & P. Raphael – On universality of blow-up profile for L2 critical nonlinear Schrödinger equation, Invent. Math. 156 (2004), no 3, p. 565–672. [44]

, Profiles and quantization of the blow up mass for critical nonlinear Schrödinger equation, Comm. Math. Phys. 253 (2005), no 3, p. 675–704.

[45] F. Merle & P. Raphaël – Blow up of the critical norm for some radial L2 super critical nonlinear Schrödinger equations, Amer. J. Math. 130 (2008), no 4, p. 945–978. [46] F. Merle, P. Raphaël & I. Rodnianski – Blow up dynamics for smooth equivariant solutions to the energy critical Schrödinger map, C. R. Math. Acad. Sci. Paris 349 (2011), nos 5-6, p. 279–283. [47] F. Merle, P. Raphaël & J. Szeftel – Stable self-similar blow-up dynamics for slightly L2 super-critical NLS equations, Geom. Funct. Anal. 20 (2010), no 4, p. 1028–1071. [48] F. Merle, P. Raphaël & J. Szeftel – The instability of Bourgain Wang solutions for the mass critical NLS, à paraître dans Amer. J. Math. [49] F. Merle & L. Vega – Compactness at blow-up time for L2 solutions of the critical nonlinear Schrödinger equation in 2D, Int. Math. Res. Not. 1998 (1998), no 8, p. 399–425. [50] F. Merle & H. Zaag – Optimal estimates for blowup rate and behavior for nonlinear heat equations, Comm. Pure Appl. Math. 51 (1998), no 2, p. 139–196. [51]

, Determination of the blow-up rate for the semilinear wave equation, Amer. J. Math. 125 (2003), no 5, p. 1147–1164.

[52]

, Existence and universality of the blow-up profile for the semilinear wave equation in one space dimension, J. Funct. Anal. 253 (2007), no 1, p. 43–121.

ASTÉRISQUE 352

(1046)

[53]

FEUILLE DE ROUTE

145

, Existence and classification of characteristic points at blow-up for a semilinear wave equation in one space dimension, Amer. J. Math. 134 (2012), no 3, p. 581–648.

[54] N. Mizoguchi – Rate of type II blowup for a semilinear heat equation, Math. Ann. 339 (2007), no 4, p. 839–877. [55] K. Nakanishi & W. Schlag – Global dynamics above the ground state energy for the focusing nonlinear Klein-Gordon equation, J. Differential Equations 250 (2011), no 5, p. 2299–2333. [56]

, Global dynamics above the ground state energy for the cubic NLS equation in 3D, Calc. Var. Partial Differential Equations 44 (2012), nos 1-2, p. 1–45. [57] G. Perelman – On the blow up phenomenon for the critical nonlinear Schrödinger equation in 1D, in Nonlinear dynamics and renormalization group (Montreal, QC, 1999), CRM Proc. Lecture Notes, vol. 27, Amer. Math. Soc., 2001, p. 147– 164. [58] F. Planchon – Existence globale et scattering pour les solutions de masse finie de l’équation de Schrödinger cubique en dimension deux (d’après Benjamin Dodson, Rowan Killip, Terence Tao, Monica Vişan et Xiaoyi Zhang), Sém. Bourbaki (2010/11), exp. no 1042, Astérisque 348 (2012), p. 425–447. [59] P. Raphaël – Existence and stability of a solution blowing up on a sphere for an L2 -supercritical nonlinear Schrödinger equation, Duke Math. J. 134 (2006), no 2, p. 199–258. [60] , Stability and blow up for the non linear Schrödinger equation, in Clay summer school on nonlinear evolution equations, Zürich, 2008, http://www. claymath.org/programs/summerschool/2008/raphael.pdf. [61] P. Raphaël & I. Rodnianski – Stable blow up dynamics for critical corotational wave maps and the equivariant Yang Mills problems, à paraître dans Publ. Math. IHÉS. [62] P. Raphaël & J. Szeftel – Standing ring blow up solutions to the N dimensional quintic nonlinear Schrödinger equation, Comm. Math. Phys. 290 (2009), no 3, p. 973–996. [63] I. Rodnianski & J. Sterbenz – On the formation of singularities in the critical O(3) σ-model, Ann. of Math. 172 (2010), no 1, p. 187–242. [64] J. Sterbenz & D. Tataru – Energy dispersed large data wave maps in 2 + 1 dimensions, Comm. Math. Phys. 298 (2010), no 1, p. 139–230. [65]

, Regularity of wave-maps in dimension 2 + 1, Comm. Math. Phys. 298 (2010), no 1, p. 231–264.

[66] R. S. Strichartz – Restrictions of Fourier transforms to quadratic surfaces and decay of solutions of wave equations, Duke Math. J. 44 (1977), no 3, p. 705–714.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

146

P. RAPHAËL

[67] M. Struwe – On the evolution of harmonic mappings of Riemannian surfaces, Comment. Math. Helv. 60 (1985), no 4, p. 558–581. [68]

, Globally regular solutions to the u5 Klein-Gordon equation, Ann. Scuola Norm. Sup. Pisa Cl. Sci. 15 (1988), no 3, p. 495–513.

[69]

, Equivariant wave maps in two space dimensions, Comm. Pure Appl. Math. 56 (2003), no 7, p. 815–823.

[70] T. Tao – Global regularity of wave maps III-VII, prépublication arXiv:0908.0776. [71] T. Tao, M. Visan & X. Zhang – Global well-posedness and scattering for the defocusing mass-critical nonlinear Schrödinger equation for radial data in high dimensions, Duke Math. J. 140 (2007), no 1, p. 165–202. [72] M. I. Weinstein – Nonlinear Schrödinger equations and sharp interpolation estimates, Comm. Math. Phys. 87 (1982/83), no 4, p. 567–576.

Pierre RAPHAËL Institut de Mathématiques de Toulouse et Institut Universitaire de France Université Paul Sabatier 118 route de Narbonne 31062 Toulouse Cedex 9 E-mail : [email protected]

ASTÉRISQUE 352

352

ASTÉRISQUE 2013

SÉMINAIRE BOURBAKI VOLUME 2011/2012 EXPOSÉS 1043-1058 (1047) The Ribe Programme Keith BALL

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Séminaire BOURBAKI 64e année, 2011-2012, no 1047, p. 147 à 159

Janvier 2012

THE RIBE PROGRAMME by Keith BALL

INTRODUCTION In 1976 Ribe [23] proved that uniformly homeomorphic Banach spaces have uniformly linearly isomorphic finite-dimensional subspaces: that if there is a uniformly continuous homeomorphism between two Banach spaces, with uniformly continuous inverse, then every finite-dimensional subspace of one space is linearly isomorphic to a subspace of the other, with an implied constant of isomorphism independent of the dimension. This remarkable rigidity theorem guarantees that finite-dimensional properties are determined up to isomorphism by the metric structure of the space. Thus in principle, any property of a space that depends upon finite collections of points has an equivalent formulation which makes no reference to the linear structure of the space and involves only the distances between points. In view of this, Bourgain [6] proposed an ambitious programme which came to be known as “The Ribe Programme”: to find explicit metric descriptions of the most important invariants of normed linear spaces. He himself kick-started the programme by characterising superreflexivity. A Banach space X is called superreflexive if every space whose finite-dimensional spaces embed uniformly well into X, must automatically be reflexive. Bourgain showed this holds precisely if the space does not contain copies of arbitrarily large binary trees. Needless to say the general aim of the Ribe programme is not merely to find metric equivalents of linear properties but to transfer the subtle and well-developed theory of normed spaces to the non-linear setting, and in this broader sense the programme had been anticipated in a prescient paper of Johnson and Lindenstrauss, [13]. Within a decade or two the Ribe programme acquired an importance that would have been hard to predict at the outset, as the insights provided by the programme became powerful tools in the theory of algorithms and more recently in geometric

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

148

K. BALL

group theory. Data sets often come equipped with a metric structure but rarely a linear one. For a number of central algorithmic problems the most effective procedure is to embed the data-set into a familiar linear geometry, without distorting it too much, and then use the linear structure to analyse the embedded copy of the data. Plainly, data that fail to possess a metric property that holds in the linear geometry cannot be embedded: so it is essential to understand what these properties are and where they appear. The study of groups as metric spaces and in particular their embeddability into simpler geometric structures has become a subject of intense interest in the last 5-10 years because of its connection with several famous problems such as the Novikov conjecture. In this article I will describe what is currently by far the most successful family of achievements within the Ribe programme: the development of metric equivalents of type and cotype. In order to make the article reasonably self-contained I shall discuss the linear invariants as well as the non-linear ones and describe three classical principles (due in various combinations to Kwapień, Maurey and Pisier) that provided the inspiration for the non-linear development and serve as test cases to check that the non-linear invariants are useful. The non-linear theory proceeded in two (or even three) distinct phases that were quite widely separated in time. In the first phase Bourgain and others introduced metric type and initiated the theory of non-linear embedding. Formally the theory of embedding does not form part of the Ribe programme but it goes hand in hand with it. It is hard to imagine that the recent subtle development of the non-linear Dvoretzky Theorem by Mendel and Naor [19] would have emerged without something like the Ribe programme. Indeed, it still seems extraordinary that there is a subtle structure theory for objects as diverse as general metric spaces, mirroring the structure theory for normed spaces. In the second phase, or second half of the first phase, the present author introduced the Markov type and cotype properties for the specific purpose of studying Lipschitz extensions. The article had an effect opposite to the one that mathematicians always hope for: it seemed to halt the programme instead of encouraging further development. This was probably because we were unable to prove that the Markov type property held in any space other than Hilbert space. Ten years later this embarrassing open problem was adopted by Naor who solved it in collaboration with Peres, Schramm and Sheffield and who then produced a series of deep articles with Mendel that form the current phase of the development. They introduced a metric form of cotype, showed that for linear spaces it agreed with linear cotype and proved a non-linear analogue of the Maurey-Pisier Theorem. This is the most technically difficult part of the Ribe programme to date. The story begins with the linear invariants.

ASTÉRISQUE 352

(1047)

149

THE RIBE PROGRAMME

1. LINEAR (OR RADEMACHER) TYPE AND COTYPE The type and cotype invariants were introduced simultaneously by Maurey in the study of factorisation of linear maps and by Hoffmann-Jørgensen for the study of vector-valued central limit theorems. A detailed history of how these ideas grew out of earlier work of James and others can be found in the article of Maurey, [16]. A normed space X has type p if there is a constant T so that for every sequence of vectors x1 , . . . , xn in X Avek ± x1 ± x2 ± · · · ± xn kp ≤ T p

n X

kxi kp

1

where the average is taken over all choices of sign in the vector sum. It has cotype q with constant C if n X kxi kq ≤ C q Avek ± x1 ± x2 ± · · · ± xn kq 1

for every such sequence. In Hilbert space, both statements hold with equality if p = 2 or q = 2 and with constants T = 1 or C = 1. (The identity that results is the parallelogram identity.) Consideration merely of the real line shows that if the respective properties are to hold in any space then necessarily p ≤ 2 and q ≥ 2. Using the Khintchine inequality for the Lp norms of sign averages it is straightforward to show that if 1 ≤ p ≤ 2 the space Lp has type p and cotype 2, while if 2 ≤ q < ∞, Lq has type 2 and cotype q. Every space has type 1 and (with the obvious convention) cotype ∞. Thus there are spaces other than Hilbert space that possess either the optimal type (type 2) or optimal cotype (cotype 2). For this reason these properties have a special place in the theory. However, a gorgeous result of Kwapień [14] from the early days of the theory shows that only Hilbert space can possess both type 2 and cotype 2.

2. METRIC TYPE AND A NON-LINEAR `1 THEOREM The first metric analogue of type appeared in the work of Enflo [10] (actually before the linear version was introduced). He (in effect) asked: for which spaces X is it true that there is a constant T so that for every n and every embedding of the corners of the cube {−1, 1}n into X, the average squared length of the cube’s 2n diagonals is at most nT 2 times the average squared length of the cube’s n2n−1 edges? Such a space clearly has type 2 (with the same constant) since Enflo’s definition allows folded (non-linear) embeddings of the cube, but asks for the same inequality. Enflo observed that Hilbert space does have this property: that folding the cube shortens the diagonals (on average) more than the edges. But the question already illustrates

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

150

K. BALL

some of the difficulties that one encounters in the Ribe programme. It is still unknown whether Enflo’s property holds for linear spaces with type 2 and it is clear that we cannot hope to find a metric version of cotype just by allowing folded cubes, since we can fold the diagonals to nothing while keeping the edges of fixed length. Following Bourgain’s enunciation of the Ribe programme, Bourgain, Milman and Wolfson [8] wrote an article in which they chose a modification of Enflo’s property as their definition of metric type (for 1 < p ≤ 2) and showed that a space with linear type p has metric type r for all r < p. They also proved a metric analogue of Pisier’s `1 theorem (see [21]) which states that the finite-dimensional L1 -spaces are the only possible obstruction to type: Theorem 2.1 (Pisier). — If a normed space X fails to have type p for every p > 1 (the space has no non-trivial type) then there is a constant C so that for every n, X has a subspace Y which is C-isomorphic to the n-dimensional L1 -space, `n1 : in other words there is a linear isomorphism T : Y → `n1 with kT k kT −1 k ≤ C. The theorem of [8] guarantees that a metric space which has no non-trivial metric type contains uniformly Lipschitz-equivalent copies of the discrete cube {−1, 1}n equipped with the metric it inherits from `n1 ; the Hamming cube as it is usually known. Theorem 2.2 (Bourgain, Milman, Wolfson). — If a metric space X fails to have type p for every p > 1 (the space has no non-trivial metric type) then there is a constant C so that for every n, X has a subset which is C-lipschitz equivalent to the metric space {−1, 1}n with the Hamming metric it inherits from `n1 . As in Pisier’s paper, the crucial point is a submultiplicativity property for type constants in terms of the number of vectors. This means that if the space contains a cube of large dimension which looks a bit like a Hamming cube it must contain cubes of smaller dimension which look very like Hamming cubes. At about the same time, Bourgain [5] proved that every n-point metric space can be embedded into Hilbert space with the distances between points of the space being distorted by at most a constant multiple of log n. It had been known since the work of Fritz John [12] that two n-dimensional normed spaces are linearly isomorphic with √ an isomorphism constant at most n. Bourgain’s Theorem was clearly inspired by this fact about linear spaces together with a view which emerged at the time that the number of points of a metric space would play a role something like the exponential of the dimension of a normed space. This view was prompted by a fact related to sphere-packing that had by then become a standard tool in the linear theory: the unit ball of an n-dimensional normed space contains an ε-net with no more than (5/ε)n elements.

ASTÉRISQUE 352

(1047)

THE RIBE PROGRAMME

151

3. SMOOTHNESS, CONVEXITY AND MARTINGALE TYPE One of the oldest principles in functional analysis states that a space is reflexive if it is uniformly convex: for any two unit vectors u and v with ku − vk ≥ ε, the average (u + v)/2 is significantly inside the ball:

u + v

(1)

2 ≤ 1 − δ(ε) where δ(ε) > 0 depends upon ε but not on the particular u and v. Classical spaces like Lp spaces possess strong quantitative forms of this property and the corresponding dual property, uniform smoothness. A normed space is said to be p-smooth with constant K if for any two points x and y in the space, kx + ykp + kx − ykp ≤ kxkp + K p kykp 2 or q-convex with constant K if kx + ykq + kx − ykq 1 q kyk ≤ . Kq 2 If p or q is 2, these properties can be thought of as intrinsic (in the sense that they use the norm of the space) ways to measure the curvature of the unit ball: the first says that the curvature is not too tight, the second that the ball is not too flat. Euclidean spaces possess both properties with K = 1. For 2 < q < ∞ the space Lq is 2-smooth √ with constant K = q − 1 while for 1 < p < 2 the space Lp is 2-convex with constant 1 K = √p−1 . An overview of these properties in the Lp and non-commutative Lp spaces can be found in the article [3]. To see how these properties are related to type and cotype observe that if x1 , x2 , . . . , xn are points in a p-smooth space then (2)

kxkq +

Avek ± x1 ± x2 ± · · · ± xn−1 ± xn kp ≤ Avek ± x1 ± x2 ± · · · ± xn−1 kp + K p kxn kp and we can peel off the individual vectors one by one at the cost of a factor K p in front of each term kxi kp . So the space has type p with the same constant K. In a similar way, q-convexity implies cotype q. These quantitative forms of smoothness and convexity can be thought of as precise or “local” forms of type and cotype but they are quite a bit stronger. Moreover, for example, L1 has cotype 2 but is not uniformly convex. Since uniformly convex spaces are reflexive and uniform convexity depends only upon pairs of points, such spaces are automatically superreflexive. In [11] Enflo had shown that a space is superreflexive if and only if it can be equipped with an equivalent norm that is uniformly convex. A remarkable (in my view absolutely shocking) result of Pisier [22] showed that in this case there will necessarily be some finite q for which

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

152

K. BALL

the space has an equivalent q-convex norm: it is not possible that the optimal function δ in (1) is of the form e1/ε for all equivalent norms. Pisier’s argument goes via inequalities for martingales in the space in question. A sequence (Mk )nk=0 of integrable random vectors in a normed space is a martingale if for each k, the increment Mk − Mk−1 has expectation 0, conditional on the value of Mk−1 . The simplest examples can be built from independent choices of sign as follows. Suppose U1 , U2 , . . . , Un are IID random variables each taking the values 1 and −1 each with probability 1/2. Let x1 , x2 , . . . , xn be random vectors (on the same probability space) where for each k the value of xk depends only upon the earlier Ui namely: U1 , U2 , . . . , Uk−1 . Then the sums Mk =

k X

xi Ui

1

form a martingale. This sequence builds a binary tree in the space as shown in Figure 1. The leaves of the tree form a non-linear embedding of the cube which has some features in common with linear embeddings.

H0,0L

Figure 1: A martingale in the plane The easy part of Pisier’s argument depends upon the fact that in a p-smooth space the type inequality can be strengthened to hold for all martingales (and similarly for the cotype inequality in a q-convex space). Lemma 3.1. — If X is a p-smooth space with constant K and (Mk )m k=1 is a martingale in X then m X p p E kMm − M0 k ≤ f (K) E kMk − Mk−1 kp k=1

where the function f (K) depends only on K and not on the space (or the martingale). For a proof of this lemma see [1].

ASTÉRISQUE 352

(1047)

THE RIBE PROGRAMME

153

4. MARKOV TYPE AND COTYPE AND EXTENSIONS OF LIPSCHITZ MAPS Maurey’s extension theorem (which generalises Kwapień’s Theorem referred to earlier) [15], states the following. Theorem 4.1 (Maurey). — If A is a subspace of a normed space X with type 2, Y is a normed space with cotype 2 and S : A → Y is a bounded linear map, then there is ˜ a bounded linear map S˜ : X → Y which extends S: so S(a) = S(a) for each a ∈ A. (Moreover the least possible norm of such an S˜ can be estimated in terms of the norm of S and the type and cotype constants of the respective spaces.) In their article [13], Johnson and Lindenstrauss studied extensions of Lipschitz maps from metric spaces into Hilbert space and proved the celebrated dimensionreduction lemma stating that any n points in Euclidean space can be embedded in an Euclidean space of dimension only about log n, with very little distortion of the distances between points. This lemma has been used repeatedly in the theory of algorithms since data embedded in a space of low dimension are much easier to search than those in a space of higher dimension. In the same article, the authors asked whether an analogue of Maurey’s extension theorem holds for Lipschitz maps initially defined on arbitrary subsets of X (as opposed to subspaces), at least if X is Lq with 2 ≤ q < ∞ and Y is Lp with 1 ≤ p ≤ 2. The purist might object that if one is going to study Lipschitz maps one should be studying them on general metric spaces rather than on linear spaces, but one may interpret the question of Johnson and Lindenstrauss as asking: can you find appropriate metric versions of type and cotype 2, that imply an analogue of Maurey’s extension theorem, and that are possessed at least by the correct Lp spaces? At the time this was a rather bold question. The only real evidence for their suggestion was an old theorem of Kirszbraun which guarantees that a Lipschitz map from a subset of one Hilbert space H1 into another H2 , can be extended to the whole of H1 . The linear analogue of this statement is an immediate consequence of the existence of orthogonal projections in Hilbert space. The proof of Kirszbraun’s theorem is completely unrelated to the linear case and the extension is carried out one point at a time, so it is essential that there is no increase in the Lipschitz constant at each step. In contrast it is easy to see that no theorem can hold for other Lp spaces without such an increase in Lipschitz constant, so a one point extension is useless. In the context of the extension problem it was easy to see why metric cotype was more difficult to invent than metric type. If you want to extend a map into Y then you must have some hypothesis that prevents Y from being a collection of isolated points: you need that any collection of points in Y are at least joined by some sort of tree-like

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

154

K. BALL

structure onto which you can map the new points. So the cotype property we are after must involve some existential assertion on points, rather than merely an inequality on distances. One solution to the problem was introduced in the author’s paper [1] where the properties of Markov type and cotype were defined. A metric space X has Markov type p with constant K if every time-reversible stationary Markov chain (Mk )m k=1 in X, running in steady state, satisfies what amounts to the same inequality as in Lemma 3.1: E d(Mm , M0 )p ≤ K p mE d(M1 , M0 )p . Thus, a space has Markov type 2 if time-reversible Markov chains only wander about √ m times as far in m steps as they do in one step: if they experience the same sort of cancellation as appears in the central limit theorem. The Markov type p condition can be type p if there is a constant K so that every sequence (xi ) of points in X, and X (Am )ij d(xi , xj )p

rephrased as follows. A space X has Markov for every symmetric stochastic matrix (aij ), each natural number m, X ≤ K pm aij d(xi , xj )p .

(The matrix A is the transition matrix for the Markov chain.) To check this condition for Hilbert space (with p = 2 and K = 1) we need only check that for a sequence of real numbers (xi ) X X (Am )ij (xi − xj )2 ≤ m aij (xi − xj )2 . This is equivalent to the statement that the matrix (m − 1)I − mA + Am is positive semi-definite, where I is the identity matrix of the correct dimension. But the matrix A has all its eigenvalues in the interval [−1, 1] and the function λ 7→ (m − 1) − mλ + λm is non-negative on this interval. The Markov cotype condition is more complicated because of the existential assertion referred to above but in the linear setting it can be replaced by a simpler condition involving the Green’s matrices for the solution of difference equations based on stochastic matrices. As was mentioned earlier, at the time these properties were introduced it was not known whether the Markov type 2 property held in any normed space other than Hilbert space. This problem was solved some 10 years later in [20]: 2-smooth spaces have Markov type 2. Their result combined with those from [1] gives the following non-linear analogue of Maurey’s Extension Theorem. Theorem 4.2 (Ball, Naor, Peres, Schramm, Sheffield). — If 1 < p ≤ 2 ≤ q < ∞, A is a subset of Lq and S : A → Lp is a Lipschitz map, then there is a Lipschitz map ˜ S˜ : Lq → Lp which extends S: so S(a) = S(a) for each a ∈ A.

ASTÉRISQUE 352

(1047)

155

THE RIBE PROGRAMME

5. METRIC COTYPE AND THE NON-LINEAR MAUREY-PISIER THEOREM Although Markov cotype seems to be the correct non-linear analogue of cotype for the purpose of Lipschitz extensions it evidently does not fulfil the precise demand of the Ribe programme for a metric version of the linear condition. In their paper [17] Mendel and Naor finally found an appropriate metric analogue, some 40 years after Enflo came up with the analogue of type. Just as Pisier’s `1 Theorem and Maurey’s Extension Theorem provided a way to test the metric type and Markov type and cotype properties, the test problem for cotype is the Maurey-Pisier Theorem for `∞ : Theorem 5.1 (Maurey, Pisier). — If a normed space X fails to have cotype q for every q < ∞ (the space has no non-trivial cotype) then there is a constant C so that for every n, X has a subspace Y which is C-isomorphic to the n-dimensional L∞ -space, `n∞ : in other words there is a linear isomorphism T : Y → `n∞ with kT k kT −1 k ≤ C. In view of the fact that the Hamming cube is the only obstruction to metric type, one might at first guess that the discrete cube lying in `n∞ would be the analogous obstruction to non-trivial metric cotype. But a moment’s thought shows that this is absurd since any two distinct points of this set are distance 2 apart: so the set can be embedded in Hilbert space. Mendel and Naor not only found the metric version of cotype and showed that for linear spaces it is equivalent to linear cotype, they also found the right obstructions. The two parts of the problem should be thought of as being closely linked: the cotype condition depends on the distances between points in sets (more complicated than cubes) which mirror the structure of the obstructions. The sets in question are grids rather than cubes and the simplest way to describe the cotype property is by using inequalities for embeddings of the discrete torus Znm . A metric space X has cotype q with constant K if for every n there is an even integer m so that for every embedding f : Znm → X n X

q

E d (f (x + m/2 ej ), f (x)) ≤ K q mq E d (f (x + ε), f (x))

q

j=1

where the averages are taken over all x in the torus and (in the second case) over all choices ε ∈ {−1, 0, 1}n . The vectors ej are the standard basis vectors so the expression on the left is similar to edges of the cube (as in linear cotype) but with jumps increased by a factor of m/2. The expression on the right is built from the diagonals of the cubes that belong to the grid. The main theorem in [17] is the following: Theorem 5.2 (Mendel, Naor). — A normed space X has metric cotype q if and only if it has linear cotype q.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

156

K. BALL

Needless to say, the really difficult part of the theorem is to show that linear cotype implies metric cotype. The metric cotype property makes clearer than the linear version that the inequality relates two different discretisations of the gradient of a function. The key difference in using grids rather than simply cubes is that the expression that comes from diagonals is now impossible to collapse to zero without doing the same on the left of the inequality: large steps in the coordinate directions can be built from small diagonals. Mendel and Naor prove an analogue of the Maurey-Pisier Theorem for a variant of metric cotype, analogous to the variant used by Bourgain et al. in [8]. The obstruction that they build in the absence of metric cotype is not just a discrete cube in `∞ but a large grid.

6. THE NON-LINEAR DVORETZKY THEOREM The famous theorem of Dvoretzky [9] states that for each k, every normed space of large enough dimension contains a subspace that is nearly isometric to the Euclidean space of dimension k. In the article [7] Bourgain, Figiel and Milman proved an analogue of this for finite metric spaces: every n-point metric space contains a subset of at least about log n elements that can be almost perfectly embedded in Euclidean space. During the 1980’s a great deal was learned about what dimension of Euclidean subspace could be found in what spaces. One of the simplest facts is that the space `n∞ does not have subspaces isomorphic to Euclidean spaces of dimension larger than log n (see [2] for an elementary discussion of the problem). Based on this fact it was natural to believe that the result of [7] gave the correct dependence on n whatever distortion of the metric we allow on the subset. So it was something of a shock when Bartal, Linial, Mendel and Naor [4] discovered a remarkable threshold phenomenon which does not exist in the linear theory. Theorem 6.1 (Bartal, Linial, Mendel, Naor). — For every ε > 0 there is a constant C(ε) so that every n point metric space contains a subset of size at least n1−ε which can be embedded in Euclidean space with its metric distorted by a factor of no more than C(ε). Moreover, for every C > 2 there is a constant α(C) > 0 so that every npoint metric space contains subsets of size at least nα which are C-Lipschitz equivalent to subsets of Euclidean space. In this paper the authors show that the threshold C > 2 is sharp: if we insist that the distortion of the metric on the subset is less than 2, we can find Euclidean subsets only of logarithmic size, as in the earlier theorem of [7]. However, once we allow the metric to be distorted by a factor of more than 2 the size jumps to a power of n and

ASTÉRISQUE 352

(1047)

THE RIBE PROGRAMME

157

by increasing the distortion we can take this power as close to 1 as we wish. As one might expect, these very much larger subsets are of significance in applications to the theory of algorithms. Following the renewed interest in the non-linear Dvoretzky Theorem, Tao asked the wonderfully provocative question: “Why was the cardinality of a finite metric space chosen to be the analogue of the dimension of a normed space, instead of the Hausdorff dimension of the metric space?” In their remarkable recent article [19], Mendel and Naor solved the problem of Tao in the following very strong way: Theorem 6.2 (Mendel, Naor). — There is a constant C so that for each ε > 0, every compact metric space X contains a closed subset S whose Hausdorff dimension is at least 1 − ε times that of X and which embeds in Hilbert space with a distortion at most C/ε. The dependence of the distortion on the dimension is optimal. When Tao first posed the problem it was tempting to think that it could be tackled using methods similar to those used for the cardinality version. This now looks implausible. In an article in preparation [18], Mendel and Naor have found a very considerable generalisation of Theorem 6.2 which not only implies the cardinality version as well as the Hausdorff dimension version but also implies the famous majorising measure theorem of Talagrand, [24]. The statement is roughly the following: Theorem 6.3 (Mendel, Naor). — There is a constant C and for each ε > 0 a constant K = K(ε) so that for any metric space X and probability measure µ on X there is a subset S of X which embeds in Hilbert space with a distortion at most C/ε and a probability measure ν on S for which ν (B(x, r)) ≤ µ (B(x, Kr))

1−ε

for each metric ball B(x, r) in X.

REFERENCES [1] K. M. Ball – “Markov chains, Riesz transforms and Lipschitz maps”, Geom. Funct. Anal. 2 (1992), no. 2, p. 137–172. [2]

, An elementary introduction to modern convex geometry, in flavors of geometry, MSRI lecture notes, CUP, 1997.

[3] K. Ball, E. A. Carlen & E. H. Lieb – “Sharp uniform convexity and smoothness inequalities for trace norms”, Invent. Math. 115 (1994), no. 3, p. 463–482. [4] Y. Bartal, N. Linial, M. Mendel & A. Naor – “On metric Ramsey-type phenomena”, Ann. of Math. 162 (2005), no. 2, p. 643–709.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

158

K. BALL

[5] J. Bourgain – “On Lipschitz embedding of finite metric spaces in Hilbert space”, Israel J. Math. 52 (1985), nos. 1-2, p. 46–52. [6]

, “The metrical interpretation of superreflexivity in Banach spaces”, Israel J. Math. 56 (1986), no. 2, p. 222–230.

[7] J. Bourgain, T. Figiel & V. Milman – “On Hilbertian subsets of finite metric spaces”, Israel J. Math. 55 (1986), no. 2, p. 147–152. [8] J. Bourgain, V. Milman & H. Wolfson – “On type of metric spaces”, Trans. Amer. Math. Soc. 294 (1986), no. 1, p. 295–317. [9] A. Dvoretzky – “Some results on convex bodies and Banach spaces”, in Proc. Internat. Sympos. Linear Spaces (Jerusalem, 1960), Jerusalem Academic Press, 1961, p. 123–160. [10] P. Enflo – “On the nonexistence of uniform homeomorphisms between Lp -spaces”, Ark. Mat. 8 (1969), p. 103–105. [11]

, “Banach spaces which can be given an equivalent uniformly convex norm”, in Proceedings of the International Symposium on Partial Differential Equations and the Geometry of Normed Linear Spaces (Jerusalem, 1972), vol. 13, 1972, p. 281–288.

[12] F. John – “Extremum problems with inequalities as subsidiary conditions”, in Studies and Essays Presented to R. Courant on his 60th Birthday, January 8, 1948, Interscience Publishers, Inc., New York, N. Y., 1948, p. 187–204. [13] W. B. Johnson & J. Lindenstrauss – “Extensions of Lipschitz mappings into a Hilbert space”, in Conference in modern analysis and probability (New Haven, Conn., 1982), Contemp. Math., vol. 26, Amer. Math. Soc., 1984, p. 189–206. [14] S. Kwapień – “Isomorphic characterizations of inner product spaces by orthogonal series with vector valued coefficients”, Studia Math. 44 (1972), p. 583–595. [15] B. Maurey – “Théorèmes de factorisation pour les opérateurs linéaires à valeurs dans les espaces Lp ”, Astérisque 11 (1974). [16]

, “Type, cotype and K-convexity”, in Handbook of the geometry of Banach spaces, Vol. 2, North-Holland, 2003, p. 1299–1332.

[17] M. Mendel & A. Naor – “Metric cotype”, Ann. of Math. 168 (2008), no. 1, p. 247–298. [18]

, “Ultrametric skeletons”, to appear in Proc. Nat. Acad. Sci. USA.

[19]

, “Ultrametric subsets with large Hausdorff dimension”, to appear in Invent. Math.

[20] A. Naor, Y. Peres, O. Schramm & S. Sheffield – “Markov chains in smooth Banach spaces and Gromov-hyperbolic metric spaces”, Duke Math. J. 134 (2006), no. 1, p. 165–197.

ASTÉRISQUE 352

(1047)

THE RIBE PROGRAMME

159

[21] G. Pisier – “Sur les espaces de Banach qui ne contiennent pas uniformément de ln1 ”, C. R. Acad. Sci. Paris Sér. A-B 277 (1973), p. A991–A994. [22]

, “Martingales with values in uniformly convex spaces”, Israel J. Math. 20 (1975), nos. 3-4, p. 326–350.

[23] M. Ribe – “On uniformly homeomorphic normed spaces”, Ark. Mat. 14 (1976), no. 2, p. 237–244. [24] M. Talagrand – “Regularity of Gaussian processes”, Acta Math. 159 (1987), nos. 1-2, p. 99–149.

Keith BALL Mathematics Institute Zeeman Building University of Warwick Coventry CV4 7AL – U.K. E-mail : [email protected]

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

352

ASTÉRISQUE 2013

SÉMINAIRE BOURBAKI VOLUME 2011/2012 EXPOSÉS 1043-1058 (1048) Multizêtas, d’après Francis Brown Pierre DELIGNE

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Séminaire BOURBAKI 64e année, 2011-2012, no 1048, p. 161 à 185

Janvier 2012

MULTIZÊTAS, D’APRÈS FRANCIS BROWN par Pierre DELIGNE

0. INTRODUCTION Soient k ≥ 0 et s = (s1 , . . . , sk ) une suite de k entiers ≥ 1. Le nombre multizêta ζ(s) est la somme itérée (l’appellation est expliquée en 1.1) X 1 (0.1) ζ(s) := s1 n · · · nskk n >···>n >0 1 1

k

(somme sur les suites strictement décroissantes de k entiers > 0). Pour k = 0, cette définition donne ζ(s) = 1. Pour k > 1, la somme (0.1) converge si et seulement si s1 > 2. Nous ne considérerons que les ζ(s) convergents, i.e. tels que (0.1) converge. Le produit de deux nombres multizêtas est une combinaison linéaire à coefficients entiers de nombres multizêtas. Voir 3.6. Il revient donc au même de déterminer les relations polynomiales à coefficients rationnels entre les nombres multizêtas, ou de déterminer les relations Q-linéaires entre eux. Pour k = 1, les ζ(s) convergents sont les valeurs en les entiers n > 2 de la fonction ζ de Riemann. Euler a montré que pour n pair, ζ(n) est un multiple rationnel de π n ([3]). Calculant ζ(3) avec 10 chiffres significatifs, il a aussi vérifié que ζ(3) n’était pas le produit de π 3 par un nombre rationnel de petit dénominateur. À la suite d’une correspondance avec Goldbach, Euler a étudié dans [4], pour k = 2, la variante des sommes (0.1) dans laquelle on somme sur n1 > n2 : ζEuler (s1 , s2 ) = ζ(s1 , s2 ) + ζ(s1 + s2 ). Il prouve une série de relations Q-linéaires entre nombres multizêtas, parmi lesquelles ζ(2, 1) = ζ(3). Une de ses motivations était l’espoir d’obtenir des informations sur les valeurs de ζ en les entiers impairs > 3 (voir la fin de sa lettre à Goldbach du 5 janvier 1743). Le problème de déterminer toutes les relations Q-linéaires entre nombres multizêtas a deux aspects :

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

162

P. DELIGNE

(A) À quelles relations faut-il s’attendre ? Les prouver. (B) Prouver qu’il n’y en a pas d’autres. L’évidence disponible, tant numérique que théorique, suggère que toute relation Q-linéaire entre les ζ(s) est somme de relations isobares, i.e. entre ζ(s) de même poids P si . Si on se limite à ne considérer que les relations isobares, on ne sait rien sur le problème (B). Nous ne parlerons que de (A). F. Brown a défini une classe de relations Q-linéaires entre les ζ(s), les relations motiviques. Plus précisément, il définit une Q-algèbre graduée M , des éléments hoP mogènes ζ m (s) de M , de degré le poids si de s, et un homomorphisme real : m M → R tel que real(ζ (s)) = ζ(s). L’algèbre M est en tant qu’espace vectoriel engendrée par les ζ m (s). Les relations motiviques entre ζ(s) sont celles qui proviennent de relations entre les ζ m (s). Une variante de la conjecture des périodes de Grothendieck implique que toute relation Q-linéaire entre les ζ(s) est motivique. Cette prédiction a été vérifiée pour beaucoup des relations connues. Mise en garde : si certaines preuves de relations entre les ζ(s) sont faciles à relever en une preuve des mêmes relations entre les ζ m (s), c’est loin d’être toujours le cas. Théorème 0.2 (F. Brown [1]). – Les ζ m (s1 , . . . , sk ) pour lesquels chaque si vaut 2 ou 3 forment une base de M sur Q. Chaque ζ(s) peut donc être exprimé uniquement, de façon motivique, comme combinaison linéaire à coefficients rationnels de ζ(s1 , . . . , sk ) avec k > 0 et chaque si ∈ {2, 3}. Malheureusement, la preuve de Brown ne fournit pas un algorithme, du moins pas un algorithme utilisable, pour trouver quelle est cette combinaison linéaire. Du théorème 0.2, F. Brown déduit que la catégorie des motifs de Tate mixte sur Z est engendrée par le groupe fondamental de P1 − {0, 1, ∞}. Voir 7.18. Certaines de nos notations diffèrent de celles de [1]. La correspondance entre les notations est involutive : ζ(s1 , . . . , sk ) devient ζ(sk , . . . , s1 ), la composition des chemins αβ devient βα, un monôme en les et (resp. une suite de 0 et 1) est à remplacer par le même, lu de droite à gauche, et e1 est à remplacer par −e1 .

1. FORMULE INTÉGRALE

1.1. Soient ω1 , . . . , ωN des 1-formes sur l’intervalle [0, 1]. L’intégrale itérée R1 It 0 ω1 , . . . , ωN est l’intégrale, sur le simplexe (1.1.1)

ASTÉRISQUE 352

σN := {(t1 , . . . , tN ) | 1 > t1 > · · · > tN > 0},

(1048)

MULTIZÊTAS, D’APRÈS FRANCIS BROWN

163

contenu dans le cube [0, 1]N , de pr∗1 ω1 ∧ pr∗2 ω2 ∧ . . . ∧ pr∗N ωN . Soit S l’opération qui à Rt R1 une 1-forme ω attache la fonction S[ω](t) := 0 ω. L’intégrale itérée It 0 ω1 , . . . , ωN peut être construite comme suit : appliquer S à ωN , multiplier la fonction obtenue par ωN −1 , appliquer S, multiplier par ωN −2 , . . . , à la fin, évaluer en 1 : Z 1 (1.1.2) It ω1 , . . . , ωN = S[ω1 .S[ω2 . . . . S[ωN ] · · · ]](1). 0

C’est cette construction qui explique l’appellation « intégrale itérée ». Une somme P telle que (0.1) admet une description analogue, en terme de l’opérateur qui à n−1 P P une fonction f (n) (n > 1) attache la fonction [f ](n) := f (m) ; ceci explique m=1

l’appellation de « somme itérée » donnée à (0.1). Calculons ainsi l’intégrale itérée Z 1 dt dt dt dt dt dt dt dt dt (1.1.3) It t , . . . , t , 1−t , t , . . . , t , 1−t , . . . , t , . . . , t , 1−t . {z } | {z } | {z } 0 | (s1 −1)fois

(s2 −1)fois

(sk −1)fois

P tn tn dt. Appliquant S terme à terme, on obtient n . Multipliant n>1 n>0 P tn P tn par dt t et appliquant S, on obtient n2 . Itérant (sk − 1) fois, on obtient n sk . n>1 n>1 P dt = tm dt et appliquant S, on obtient Multipliant par 1−t

On a

dt 1−t

=

P

m>0

S



X m>0,n>1

X X tm+n  tm+n tm dt = = . ns k (m + n)nsk mnsk m>n>0 m,n>1

Continuant ainsi, on obtient finalement la Proposition 1.2. — L’intégrale itérée (1.1.3) vaut ζ(s1 , . . . , sk ). 1.3. Alors que la notion de somme infinie est étrangère à la géométrie algébrique, l’étude d’intégrales de quantités algébriques en est une des sources. C’est grâce à la proposition 1.2 que la géométrie algébrique, plus précisément la théorie des motifs de Tate mixte, est utile à l’étude des nombres multizêtas.

2. GROUPE FONDAMENTAL PRO-UNIPOTENT ET COHOMOLOGIE 2.1. Nous aurons besoin d’une variante Z 0 de la série centrale descendante Z d’un groupe Γ. Pour chaque i > 1, Γ/Z i est un groupe nilpotent. L’ensemble Ti de ses éléments de torsion est donc un sous-groupe. On définit Z 0i comme étant l’image inverse de Ti dans Γ. Ci-dessous, nous supposerons toujours Γ de génération finie.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

164

P. DELIGNE

Cette hypothèse implique que les Z 0i /Z 0i+1 sont des groupes abéliens libres de type fini. Supposons tout d’abord Γ nilpotent sans torsion, i.e. qu’il existe A tel que Z 0A = 0. Pour chaque i (1 6 i < A), choisissons une base de Z 0i /Z 0i+1 et relevons-la dans Z 0i . Soient γ1 , . . . , γM les éléments de Γ obtenus, rangés dans un ordre quelconque, et soit w(j) l’entier i tel que γj relève un élément d’une base de Z 0i /Z 0i+1 . On vérifie par induction sur A que l’application nM ZM → Γ : n 7−→ γ1n1 · · · γM

est bijective. Dans un tel « système de coordonnées », la loi de groupe de Γ est donnée par des polynômes à coefficients rationnels et à valeurs entières sur les entiers. Plus précisément, si la coordonnée d’indice j est vue comme étant de poids w(j), la j-ième coordonnée de m ◦ n est un polynôme de poids 6 w(j) en les mk et nl . Les mêmes polynômes définissent un groupe algébrique unipotent sur Q, l’enveloppe unipotente Γun de Γ. Le groupe Γun (Q) de ses points rationnels est QM , muni de la loi de groupe donnée par les mêmes formules que celle de Γ. Le groupe Γun (Q) est la complétion de Malcev Γ ⊗ Q de Γ. Soient Q[Γ] l’algèbre de groupe de Γ, et I son idéal d’augmentation. Quillen a donné une description élégante de l’algèbre affine O(Γun ) de Γun : c’est la limite inductive des duaux des Q[Γ]/I N . Plus précisément, l’inclusion de Γ dans Q[Γ] identifie le dual de Q[Γ] à l’espace des fonctions Γ → Q, et par cette identification le dual de Q[Γ]/I N +1 devient l’espace des polynômes en les nj de poids 6 N . Pour Γ de génération finie quelconque, ce qui précède s’applique aux Γ/Z 0i , et on définit Γun comme étant le schéma en groupe limite projective des (Γ/Z 0i )un . L’algèbre affine de Γun est encore la limite inductive des duaux des Q[Γ]/I N . 2.2. Soit E un espace topologique raisonnable, par exemple une variété algébrique complexe. On suppose E connexe. Un chemin γ de a à b : [0, 1] → E fournit γ N : [0, 1]N → E N et, par restriction au simplexe σN de (1.1.1), une chaˆıne singulière de E N qui est un cycle modulo la réunion des b = x1 , x1 = x2 , . . . , xN = a. La classe d’homologie de ce cycle ne dépend que de la classe d’homotopie de γ. Faisons a = b. Élaborant la construction précédente (cf. [2] §3), on obtient un isomorphisme de Q[π1 (E, a)]/I N +1 avec un groupe d’homologie relative de E N et, de son dual (Q[π1 (E, a)]/I N +1 )∨ avec un groupe de cohomologie relative de E N . De là, par passage à la limite inductive, une description cohomologique de l’algèbre affine de π1 (E, a)un . Ne supposons plus que a = b. Soit π1 (E; b, a) l’ensemble des classes d’homotopie de chemins de a à b. Le groupe π1 (E, a) agit à droite, par composition des chemins, sur π1 (E; b, a). Cette action fait de π1 (E; b, a) un espace principal homogène, nous préférons dire torseur, sous π1 (E, a). On note π1 (E; b, a)un le π1 (E, a)un torseur qui s’en

ASTÉRISQUE 352

(1048)

MULTIZÊTAS, D’APRÈS FRANCIS BROWN

165

déduit en poussant par π1 (E, a) → π1 (E, a)un . Soit Q[π1 (E; b, a)] l’espace des combinaisons linéaires formelles d’éléments de π1 (E; b, a). C’est un Q[π1 (E, a)]-module à droite, libre de rang un. On pose Q[π1 (E; b, a)]/I N := Q[π1 (E; b, a)]/Q[π1 (E; b, a)]I N . La construction qui précède fournit encore une description cohomologique des (Q[π1 (E; b, a)]/I N )∨ , et de l’algèbre affine de π1 (E; b, a)un qui en est la limite inductive. 2.3. Soit X une variété algébrique définie sur un sous-corps K de C. La cohomologie ∗ de Betti HB (X) de X est la cohomologie rationnelle de l’espace X(C) des points complexes de X, muni de sa topologie classique. Elle est munie de structures qui reflètent la structure algébrique de X. Notamment : une structure de Hodge mixte. ∗ On dispose aussi de la cohomologie de de Rham algébrique HdR (X). Si X est non ∗ singulière, HdR (X) est l’hypercohomologie du complexe de de Rham des faisceaux de formes différentielles algébriques. C’est un K-espace vectoriel, on dispose d’un isomorphisme de comparaison (2.3.1)

∼ i i compB,dR : HdR (X) ⊗K C −→ HB (X) ⊗Q C,

i et les filtrations W et F de la structure de Hodge mixte de HB (X) proviennent de i filtrations de HdR (X). Les coefficients de la matrice de l’isomorphisme (2.3.1), dans i i (X), portent le nom de périodes. une base de HdR (X) et une de HB Grâce à 2.2, tout ceci s’applique aux algèbres affines des schémas en groupe π1 (X, a)un ou de leurs espaces homogènes π1 (X; b, a)un . On écrira π1 (X, a)B pour π1 (X, a)un , π1 (X, a)dR pour sa variante de de Rham, et de même pour les π1 (X; b, a). On mettra B/dR en indice quand l’énoncé vaut aussi bien en Betti qu’en de Rham.

2.4. Exemple. Prenons K = Q et soit X le groupe multiplicatif Gm , de groupe de points complexes C∗ . Ici, le groupe fondamental, commutatif, est indépendant du 1 point-base et s’identifie au groupe d’homologie H1 . En de Rham, le dual HdR de H1dR ∗ est Q. dz z . En Betti, H1 (C , Z) est Z, engendré par un tour positif autour de 0. Si on ne veut pas parler de « tour positif », i.e. choisir qui est i et qui est −i, il vaut mieux dire que H1 = π1 = 2πiZ, avec ` ∈ 2πi Z correspondant au lacet exp(`t) (0 6 t 6 1), sur lequel l’intégrale de dz z vaut `. Les H1B (Gm ) = H1 (C∗ , Q) et H1dR (Gm ) sont les réalisations de Betti et de de Rham 1 du motif de Tate Q(1) (voir §5). On a Q(1)dR = Q (1 étant dual de dz z ∈ HdR (Gm )), et Q(1)B , inclus dans Q(1)dR ⊗ C par compdR,B , est 2πi Q ; Q(1) est purement de type de Hodge (−1, −1). Le groupe algébrique π1 (Gm , 1)dR est le groupe additif Ga , de groupe de points 1 rationnels Q(1)dR = Q, et d’algèbre affine Q[T ] (plus précisément : Sym∗ (HdR (Gm ))). Le groupe algébrique π1 (Gm , 1)B est le groupe additif de groupe de points rationnels

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

166

P. DELIGNE

1 2πiQ. Algèbre affine : Sym∗ (HB (Gm )). C’est l’algèbre des fonctions f sur 2πiZ, à valeurs rationnelles, et telles que si on identifie Z à 2πiZ par n 7→ 2πin, les conditions équivalentes suivantes soient vérifiées pour N assez grand : (a) f est un polynôme de degré < N ; (b) notant ∆ l’opérateur g 7→ (g(n + 1) − g(n)), on a ∆N f = 0 ; (c) la forme linéaire sur l’algèbre de groupe Q[Z] définie par f est nulle sur I N .

Par abus de langage, nous écrirons parfois Q(1)B/dR pour ces groupes algébriques.

3. LE CAS DE P1 − {0, 1, ∞} 3.1. Si X est le complément dans P1 d’un ensemble fini T de points rationnels, la variété X est définie sur Q et les structures de Hodge mixte de 2.2, 2.3 sont de HodgeTate : GrW n est nul pour n impair, et pour n = 2m est purement de type de Hodge (m, m). Pour chacun des groupes M considérés en 2.2, soit MdR sa variante de de Rham (2.3). Après renumérotation, les filtrations par le poids W et de Hodge F de MdR sont opposées. Elles définissent la graduation de MdR pour laquelle (3.1.1)

m W−2n (MdR ) = ⊕ MdR m>n

F

−p

m (MdR ) = ⊕ MdR . m6p

La convention (3.1.1) assure que Q(1)dR est de degré un. Il est parfois commode de graduer par l’opposé du degré, le codegré, et de poser (MdR )m := (MdR )−m . Cas particulier : l’algèbre affine de π1 (X; b, a)dR est graduée. Elle est à degrés 6 0 et réduite à Q en degré 0. Le morphisme d’augmentation O(π1 (X; b, a)dR ) → Q est un point b 1a de π1 (X; b, a)dR . En dR, on dispose ainsi d’un chemin canonique b 1a d’un point-base à un autre : pour un certain schéma en groupe pro-unipotent Π, chaque π1 (X; b, a)dR s’identifie à une copie b Πa de Π, et la composition des chemins est la loi de groupe. Le groupe Π admet la description suivante. Soit L l’algèbre de Lie sur Q engendrée P par des éléments et (t ∈ T ) soumis à la seule relation et = 0. On la munit de la graduation pour laquelle chaque et est homogène de degré 1. La série centrale descendante Z est la filtration par les « degré > i ». Soient L ∧ le complété de L pour cette filtration, et exp(L /Z i ) le groupe algébrique unipotent d’algèbre de Lie L /Z i . On a (3.1.2)

Π = exp(L ∧ ) := lim exp(L /Z i ).

Autre description : l’algèbre enveloppante A de L est l’algèbre associative engenP drée par des éléments et (t ∈ T ) soumis à la seule relation et = 0. Elle est graduée,

ASTÉRISQUE 352

(1048)

MULTIZÊTAS, D’APRÈS FRANCIS BROWN

167

chaque et étant homogène de degré un, et la puissance N -ième de l’idéal d’augmentation I est la partie de A de degré > N . Le complété A∧ = lim A/I N de A est muni d’un coproduit ∆ : A∧ → A∧ “ ⊗A∧ : et 7−→ et ⊗ 1 + 1 ⊗ et , L ∧ est l’algèbre de Lie des éléments primitifs, et pour toute Q-algèbre R, si on pose A∧ “ ⊗R := limN (A/I N ) ⊗Q R, le groupe Π(R) des R-points de Π est le groupe des éléments groupaux de (A∧ “ ⊗R)∗ : (3.1.3)

Π(R) = {g ∈ (A∧ “ ⊗R)∗ | ∆g = g ⊗ g}.

L’algèbre affine O(Π) de Π (munie de la topologie discrète) et l’algèbre enveloppante complétée A∧ (munie de sa topologie de limite projective) sont duales l’une de l’autre. Le dual topologique de A∧ s’identifie au dual gradué ⊕(An )∨ de A, et ceci donne la graduation (à degrés 6 0) de O(Π). On notera ω la 1-forme logarithmique sur X à valeurs dans L X dz . (3.1.4) ω := et z−t t6=∞

En chaque t ∈ T , elle a le résidu et . Supposons que ∞ ∈ T et posons T 0 := T − {∞}. On a A = Q h(et )t∈T 0 i et ∧ A = Q  (et )t∈T 0  (séries formelles associatives en les et ). Pour tout mot w = t1 · · · tk en l’alphabet T 0 , notons c(w) la forme linéaire sur A∧ « coefficient du monôme et1 · · · etk ». On note encore c(w) la restriction de c(w) à Π ⊂ A∧ ∗ , et pour P P une combinaison linéaire formelle de mots, on pose c ( λw w) = λw c(w). Les c(w) forment une base vectorielle de O(Π). Le produit dans O(Π) correspond au produit de mélange des mots : (3.1.5)

c(w0 )c(w00 ) = c(w0 x w00 )

où, pour w0 = t1 · · · tk et w00 = tk+1 · · · tk+` , w0 x w00 est la somme des tσ−1 (1) · · · tσ−1 (k+`) pour σ parcourant l’ensemble Sk,` des permutations de {1, . . . , k + `} croissantes sur {1, . . . , k} et sur {k + 1, . . . , k + `} (shuffle product). 3.2. Un chemin γ de a à b définit un point rationnel de π1 (X; b, a)B = π1 (X(C); b, a)un . Soit compdR,B (γ) l’image de ce point rationnel par l’isomorphisme de comparaison ∼ compdR,B : π1 (X; b, a)B (C) −→ π1 (X; b, a)dR (C) = Π(C).

Cette image est obtenue par « intégration » le long de γ, dans le groupe non commutatif Π, de la forme ω : c’est la valeur en 1 de la solution g : [0, 1] → Π(C), valant 1 en 0, de Å ã dγ −1 (3.2.1) dg(t).g(t) = ω dt. dt

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

168

P. DELIGNE

3.3. Le même formalisme s’applique quand on permet aux points-base a, b d’être des points-base tangentiels (vecteur tangent non nul en un « point rationnel à l’infini » t ∈ T de X). Soit Θt l’espace tangent à P1 en t, Θ∗t := Θt − {0}, et a ∈ Θ∗t un point-base tangentiel en t. Tout se passe comme si on disposait d’un morphisme de Θ∗t dans X : on dispose de morphismes π1 (Θ∗t , a)B/dR = Q(1)B/dR → π1 (X, a)B/dR

(3.3.1)

compatibles aux isomorphismes de comparaison. Côté Betti, ce morphisme est induit par les germes d’applications ϕ de (Θt , 0) dans (P1 , t) de différentielle l’identité. L’espace de ces germes est contractile, et chaque ϕ induit une application d’un petit disque épointé autour de 0 (homotope à Θ∗t ) dans X. En de Rham, et après passage aux algèbres de Lie, (3.3.1) est le morphisme de Q(1)dR = Q dans L ∧ qui envoie 1 sur et . La Q-forme π1 (X; b, a)B de Π(C) est caractérisée par la propriété que les images des chemins de a à b sont des points rationnels. Mise en garde : π1 (X; b, a)dR est indépendant de a et b, et π1 (X; b, a)B est localement constant en a et b, mais l’isomorphisme de comparaison entre leurs complexifiés n’est pas localement constant. Que π1 (X; b, a)dR soit indépendant de a et b provient de ce qu’on dispose du chemin dR canonique b 1a entre deux points-base quelconques. L’image de ce chemin par compB,dR n’est pas localement constante. 3.4. Le cas qui nous intéresse est celui où X = P1 −{0, 1, ∞} et où comme points-base on prend les points-base tangentiels 1 en 0 et −1 en 1. Ils seront notés 0 et 1. On a ici ω = e0

dz dz + e1 z z−1

et pour toute Q-algèbre R, Π(R) = {éléments groupaux de R  e0 , e1 ∗ } (3.1.3). En Betti, on dispose du « droit chemin » dch de 0 à 1. On notera encore dch son image par compdR,B dans Π(C). Cette image est la limite suivante pour ε, η → 0 par valeurs >0: (3.4.1)

compdR,B (dch) = lim exp(− log η.e1 )compdR,B ([ε, 1 − η]) exp(log ε.e0 ).

Le troisième (resp. premier) facteur doit être vu comme calculant, dans l’espace tangent épointé en 0 (resp. en 1), compdR,B ([1, ε]) (resp. compdR,B ([−η, −1]), la forme du ω étant remplacée par du u e0 (resp. u e1 ). On peut en général exprimer la solution de (3.2.1) comme une somme d’intégrales itérées. Appliquant 1.2, on obtient que pour ζ(s1 , . . . , sk ) convergent, on a : Proposition 3.5. — Le coefficient de e0s1 −1 e1 · · · es0k −1 e1 dans dch ∈ Π(C) ⊂ C  e0 , e1 ∗ est (−1)k ζ(s1 , . . . , sk ).

ASTÉRISQUE 352

(1048)

MULTIZÊTAS, D’APRÈS FRANCIS BROWN

169

Cette proposition ne détermine les coefficients de monômes c(w) de dch que pour w un mot en l’alphabet {0, 1} qui ne commence pas par 1 et ne finit pas par 0. Les coefficients c(0) de e0 et c(1) de e1 dans dch sont nuls. Ceci, joint au fait que dch est groupal, détermine les coefficients manquants. Plus précisément, la nullité de c(0) et c(1) signifie que dch appartient au groupe dérivé Π0 de Π, d’algèbre de Lie graduée la partie de degré > 2 de celle de Π. Sur Π0 , on a, notant {p} une puissance dans le monoïde des mots, (3.5.1)

c(0{p} ) = c(1{p} ) = 0 pour p > 0

et, appliquant (3.1.5) à w10{p−1} et 0 (resp. 1 et 1{p−1} 0w), on vérifie par récurrence sur p > 0 que (3.5.2)

c(w10{p} ) = (−1)p c((w x 0{p} )1) (resp. c(1{p} 0w) = (−1)p c(0(1{p} x w))

(sur Π0 ).

3.6. L’identité (3.1.5), évaluée en dch, exprime le produit de deux nombres multizêtas comme combinaison linéaire à coefficients entiers de nombres multizêtas.

4. LES MULTIZÊTAS MOTIVIQUES

4.1. Continuons à poser X := P1 − {0, 1, ∞} et à prendre pour points-base les pointsbase tangentiels 0 ou 1 (voir 3.4). Nous donnerons en 5.6 un sens précis à l’expression « structure motivique sur les algèbres affines des π1 (X; b, a)B/dR ». Nous dirons aussi « structure motivique sur les π1 (X; b, a)B/dR ». Heuristiquement, il s’agit de structures provenant de la géométrie, ayant donc un sens tant pour Betti que pour de Rham, et respectées par les isomorphismes de comparaison. Exemples : le produit donnant la structure d’algèbre, les coproduits provenant de la composition des chemins, la filtration par le poids, l’isomorphisme π1 (X; b, a)B/dR → π1 (X; σ(b), σ(a))B/dR induit par l’involution σ : x 7→ 1 − x de P1 . De même, les morphismes (3.3.1) sont une structure motivique sur Q(1)B/dR et π1 (X, a)B/dR . Par contre, ni la filtration de Hodge de l’algèbre affine de π1 (X; b, a)dR , ni donc sa graduation, ni l’indépendance de π1 (X; b, a)dR de a et b ne sont motiviques. On n’en dispose que pour dR. Les structures en question seront des structures d’algèbre multilinéaire. Soit HB (resp. HdR ) le schéma en groupe sur Q des automorphismes de π1 (X; 1, 0)B (resp. π1 (X; 1, 0)dR ) respectant toutes ses structures motiviques. La filtration par le poids W de l’algèbre affine est une filtration par des sous-espaces de dimension finie, et HB (resp. HdR ) est une limite projective de sous-groupes algébriques des GL(Wi ).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

170

P. DELIGNE

4.2. Soit PdR,B le schéma des isomorphismes de π1 (X; 1, 0)B avec π1 (X; 1, 0)dR respectant toutes les structures motiviques. Le groupe HB agit à droite sur PdR,B . L’isomorphisme de comparaison compdR,B est un point complexe de PdR,B . Le schéma PdR,B est donc non vide. C’est un HB -torseur (terminologie de 2.2). Si ZB est un sous-schéma de π1 (X; 1, 0)B stable sous HB , la torsion par le HB -torseur PdR,B transforme π1 (X; 1, 0)B en π1 (X; 1, 0)dR = 1 Π0 (notations de 3.1), et ZB en un sous-schéma ZdR de 1 Π0 . Sur C, ZdR (C) est l’image de ZB (C) par compdR,B . J’aime penser à la HB -orbite de dch comme étant l’espace des points ch de π1 (X; 1, 0)B ayant toutes les propriétés de dch exprimables en termes motiviques. Par exemple : le morphisme π1 (X; 1, 0)B → π1 (X; 0, 1)B induit par l’involution x 7→ 1 − x de P1 doit transformer ch en son inverse. Soit MB ⊂ π1 (X; 1, 0)B l’adhérence de la HB -orbite de dch. Le tordu de MB par PdR,B est un sous-schéma fermé MdR de 1 Π0 . Notons encore dch l’image de dch par compdR,B . C’est un point complexe de MdR , et MdR (C) ⊂ 1 Π0 (C) est l’adhérence de sa HdR (C)-orbite. Définition 4.3. — Soit s = (s1 , . . . , sk ). Si k 6= 0, on suppose que s1 > 2. Soient w le mot 0{s1 −1} 1 · · · 0{sk −1} 1 en l’alphabet {0, 1} et c(w) ∈ O(Π) la fonction « coefficient du monôme es01 −1 e1 · · · e0sk −1 e1 » (3.1). On note ζ m (s) la restriction à MdR de (−1)k c(w). Les ζ m (s) sont les multizêtas motiviques (F. Brown [1] 2.3). L’algèbre notée M dans l’introduction est O(MdR ). Avant [1], seule la restriction des ζ m (s) à l’orbite de 1 était considérée. Ceci donnait lieu à des contorsions pénibles. D’après 3.5, la valeur de ζ m (s) en le point complexe dch de MdR est ζ(s). Toute identité polynomiale à coefficients rationnels en les ζ m (s) fournit donc par évaluation en dch une relation polynomiale entre les ζ(s). Le yoga des périodes de Grothendieck prédit que toute relation polynomiale entre les ζ(s) provient de la géométrie. Plus précisément, qu’elle est obtenue comme ci-dessus. Pour tout mot w en 0 et 1, notons de même cm (w) la restriction de c(w) à MdR . S’appuyant sur la remarque qui suit 3.5, on peut montrer que les cm (w) sont des combinaisons linéaires à coefficients entiers des ζ m (s). Par construction, HdR agit sur MdR . Son algèbre de Lie agit donc par dérivations sur l’algèbre affine de MdR , quotient de celle de Π. Ces dérivations, qui n’ont de sens qu’une fois qu’on est remonté des ζ(s) aux ζ m (s), joueront un rôle-clé dans les arguments de F. Brown.

ASTÉRISQUE 352

(1048)

MULTIZÊTAS, D’APRÈS FRANCIS BROWN

171

5. MOTIFS DE TATE MIXTE

5.1. Nous sommes ici dans l’un des cas où la philosophie des motifs est non seulement un guide précieux, mais permet des démonstrations. Sur tout corps K, Voevodsky a défini une catégorie triangulée motivique VK , munie d’un produit tensoriel, et contenant des objets de Tate Z(n) (n ∈ Z). Si K est un corps de nombres, on peut après tensorisation avec Q construire une sous-catégorie M T (K) de VK ⊗Q, la catégorie des motifs de Tate mixte sur K et cette catégorie est tannakienne. Ceci repose sur notre connaissance des groupes de K-théorie d’un corps de nombres, due à la détermination par voie transcendante des H i (BGL(n, K), C) pour n  i. Tout ceci est pour moi une boˆıte noire. Elle est difficile à ouvrir et c’est pourquoi les identités promises par 0.2. ne sont pas explicites. 5.2. Passons en revue quelques propriétés de la catégorie M T (K). C’est une catégorie tannakienne sur Q. Elle contient un objet de rang un Q(1), le motif de Tate. Ce motif étant de rang un, Q(n) := Q(1)⊗n est défini pour n ∈ Z. Les objets de M T (K) sont munis d’une filtration finie croissante fonctorielle et compatible au produit tensoriel, la filtration par le poids W . Elle est indexée pas les entiers pairs. Le foncteur M 7→ GrW (M ) est exact, et GrW −2n (M ) est somme de copies de Q(n). Supposons pour simplifier que K = Q. On dispose alors de foncteurs fibres de Betti et de de Rham ωB , ωdR : M T (K) → Q-espaces vectoriels et d’un isomorphisme de comparaison compdR,B : ωB ⊗ C → ωdR ⊗ C. Noter que, parce que K = Q, le foncteur fibre ωdR co¨ıncide avec le foncteur fibre ω de [2]. Pour le motif Q(1), ωB (Q(1)), ωdR (Q(1)) et compdR,B sont comme en 2.4. Le foncteur ωdR est muni d’une filtration de Hodge F , opposée, à une renumérotation près, à la filtration par le poids de ωdR (M ) par les ωdR (W2n M ). Ceci en fait un foncteur gradué, comme en 3.1. 5.3. Si T est une catégorie tannakienne, nous appellerons T -algèbre un Ind-objet A de T , muni d’un produit A ⊗ A → A. On définit la catégorie des T -schémas affines comme étant l’opposée de celle des T -algèbres commutatives à unité, et un T -schéma en groupe affine comme un groupe dans cette catégorie. Pour T une catégorie de motifs, on remplace le préfixe T par l’adjectif motivique. 5.4. Les π1 (X; b, a)B , π1 (X; b, a)dR de 3.1, 3.3 et l’isomorphisme de comparaison entre leurs complexifiés sont motiviques : images d’un schéma en groupe motivique

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

172

P. DELIGNE

π1 (X; b, a)mot ([2] §4). Les morphismes « composition des chemins » et (3.3.1) sont eux aussi motiviques. Si X = P1 − {0, 1, ∞} et que a, b sont choisis parmi les points-base tangentiels 0, 1 de 3.4, les points 0, 1, ∞ restent distincts après réduction modulo p, et les vecteurs tangents choisis en 0 et 1 restent non nuls. On peut en déduire que les algèbres affines O(π1 (X; b, a)mot ) sont des Ind-objets d’une sous-catégorie tannakienne M T (Z) de M T (Q), celle des motifs de Tate mixte à bonne réduction sur Spec(Z) ([2] 1.7, 1.4, 1.8). Dans M T (Z), ( de dimension un sur Q pour n impair > 3, Ext1 (Q(0), Q(n)) est (5.4.1) 0 sinon; (5.4.2)

Ext2 (Q(0), Q(n)) = 0 .

5.5. Soient T une catégorie tannakienne sur un corps K, et ω un foncteur fibre sur une extension K 0 de K. La famille des ω(Y ), pour Y dans T , munie des ω(f ) : ⊗ ω(Yi ) → ⊗ ω(Zj ) pour f : ⊗Yi → ⊗Zj un morphisme de T , est une famille de K 0 -espaces vectoriels, munie d’une structure d’algèbre multilinéaire. Le sous-schéma en groupe de Π GL(ω(Y )) (produit sur Ob(T )) qui respecte cette structure est le schéma en groupe Aut(ω) des automorphismes du foncteur fibre ω. On le note π(T , ω) et on l’appelle groupe fondamental de T en ω. On verra sur des exemples qu’il est de « même nature » que les ω(Y ), par exemple que son algèbre affine est graduée si le foncteur ω est gradué. L’explication de ce fait est qu’il existe un T -schéma en groupe π(T ), agissant fonctoriellement sur chaque objet de T , tel que pour tout foncteur fibre ω, π(T , ω) soit ω(π(T )). Supposons que K 0 = K. Dans ce cas, ω induit une équivalence de T avec la catégorie des représentations linéaires de dimension finie de π(T , ω). Si T est une catégorie de motifs, les groupes fondamentaux s’appellent aussi groupes de Galois motiviques. 5.6. Soit h(Yi )i la sous-catégorie tannakienne de T engendrée (par sous-quotients, sommes, duaux et produits tensoriels) par une famille (Yi ) d’objets de T . Une T -structure sur la famille des ω(Yi ) est l’image par ω d’un morphisme de h(Yi )i. Plus précisément c’est la donnée de l’image par ω de sous-quotients de sommes de produits tensoriels de Yi et Yi∨ , et de morphismes entre de tels sous-quotients. Si T est une catégorie de motifs, on dira plutôt structure motivique. Le sous-groupe de Π GL(ω(Yi )) qui respecte toutes les T -structures est donc le groupe fondamental de h(Yi )i en ω. Tout sous-groupe algébrique d’un groupe GL(V ) est le sous-groupe respectant quelques sous-espaces et éléments dans des espaces de tenseurs sur V . L’équivalence 5.5 assure donc que ce groupe fondamental de h(Yi )i en ω est le quotient

ASTÉRISQUE 352

(1048)

MULTIZÊTAS, D’APRÈS FRANCIS BROWN

173

de π(T , ω) qui agit fidèlement sur la famille des ω(Yi ). Même terminologie si on part d’une famille de ind-objets de T : on la remplace par la famille des sous-objets dans T . Prenons T := M T (Z). Avec la notation B/dR de 2.3, posons (5.6.1)

GB/dR := π(M T (Z), ωB/dR ).

Le schéma en groupe HB/dR des automorphismes de π1 (X; 1, 0)B/dR « respectant toutes les structures motiviques » considéré en 4.1 est le quotient de GB/dR agissant fidèlement sur π1 (X; 1, 0)B/dR = ωB/dR (π1 (X; 1, 0)mot ). D’après l’équivalence 5.5, un sous-schéma fermé de π1 (X; 1, 0)B stable sous HB est la réalisation de Betti d’un sousschéma fermé de π1 (X; 1, 0)mot . Exemple : il existe un unique sous-schéma motivique Mmot de π1 (X; 1, 0)mot de réalisation de Betti l’adhérence d’orbite MB ; le sousschéma MdR (4.2) de π1 (X; 1, 0)dR est sa réalisation de de Rham. 5.7. L’action de GB/dR sur Q(1)B/dR définit un morphisme t de GB/dR dans le groupe multiplicatif Gm . Pour tout M dans M T (Z), GB/dR respecte la filtration par le poids de ωB/dR M , et, puisque GrW −2n (M ) est somme de copies de Q(n), l’action de g dans (M ) est la multiplication par t(g)n . Le noyau UB/dR de t agit donc GB/dR sur GrW −2n W trivialement sur les Gr−2n (M ) : c’est un schéma en groupe pro-unipotent. n Soit τ (λ) la multiplication par λn sur ωdR (M ). Les τ (λ) définissent une section τ : Gm → GdR de t, qui fait de GdR un produit semi-direct Gm nUdR . L’action de Gm sur UdR (par automorphismes intérieurs dans GdR ) sera encore notée τ . Elle permet de définir l’algèbre de Lie graduée Liegr (UdR ). La nullité (5.4.2) implique que cette algèbre de Lie graduée est libre, et (5.4.1) qu’elle est librement engendrée par un générateur en chaque degré impair > 3. Le foncteur ωdR induit une équivalence de catégories de M T (Z) avec la catégorie des espaces vectoriels gradués de dimension finie, munis d’une action, compatible aux graduations et donc nilpotente, de Liegr (UdR ).

5.8. Soit P le schéma des isomorphismes de foncteurs fibres de ωdR avec ωB . L’isomorphisme de comparaison compB,dR est un point complexe de P . Le schéma P est donc non vide, et est un GdR -torseur. Le groupe GdR étant extension de Gm par UdR , un argument de cohomologie galoisienne montre que tout GdR -torseur a un point rationnel : il existe un isomorphisme de foncteurs fibres p : ωdR → ωB . Écrivons (5.8.1)

p = compB,dR · a

avec a ∈ GdR (C). Il résulte de (5.8.1) que pour tout M dans M T (Z), si on identifie ωdR (M ) ⊗ C à ωB (M ) ⊗ C par compB,dR , ωB (M ) ⊂ ωB (M ) ⊗ C = ωdR (M ) ⊗ C vérifie (5.8.2)

ωB (M ) = a(ωdR (M )).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

174

P. DELIGNE

Puisque ωB (Q(1)) = 2πiQ, on a t(a) ∈ 2πiQ∗ , et a = uτ (λ) avec u ∈ UdR (C) et λ ∈ 2πiQ∗ . Une compatibilité à la conjugaison complexe permet de montrer qu’on peut choisir ([2] 2.12) (5.8.3)

a ∈ UdR (R).τ (2πi).

›(2, 3) DE FONCTIONS SUR π1 (X; 1, 0)dR 6. L’ESPACE H Dorénavant, X := P1 − {0, 1, ∞}, et les notations de 3.4 sont en vigueur. Par abus de langage, notons Q e0 , e1 (resp. Q e0 , e1∗ ) le schéma en groupe sur Q tel que, pour toute Q-algèbre R, l’ensemble de ses R-points soit Re0 , e1  (resp. R  e0 , e1 ∗ ). Rappelons que π1 (X; b, a)dR est une copie b Πa du sous-schéma en groupe Π des éléments groupaux (3.1.3) de Q  e0 , e1 ∗ . On la regardera comme contenue dans une copie Qe0 , e1 b,a de Q e0 , e1 . Un point x de Qe0 , e1 , sera parfois noté b xa quand regardé comme appartenant à cette copie. 6.1. En tant que Q-espace vectoriel, l’algèbre affine O(Π) de Π a pour base les « coefficients de monômes » c(w) de 3.1. Elle est graduée. Si le mot w en l’alphabet {0, 1} est de longueur d, l’élément c(w) de O(Π) est de degré −d, de codegré d. Quand nous noterons B 0 , affecté de décorations, un ensemble de mots, B, affecté des mêmes décorations, sera l’ensemble correspondant de c(w). Définition 6.2. — (i) B 0 (2, 3) est l’ensemble des mots concaténation de mots 01 et 001 ; ›(2, 3) est le sous-espace vectoriel de O(Π) de base B(2, 3). (ii) H Les restrictions à MdR des c(w) dans B(2, 3) sont ceux des (−1)k ζ m (s1 , . . . , sk ) où chaque si vaut 2 ou 3. Pour tout espace vectoriel gradué Z, à composantes homogènes de dimension finie, la série de Poincaré de Z est X (6.2.1) P (Z, t) = dim(Zd )td . ›(2, 3) est gradué par le codegré, on a Si H ›(2, 3), t) = (1 − t2 − t3 )−1 . P (H P On le vérifie en développant (1 − t2 − t3 )−1 = (t2 + t3 )n .

(6.2.2)

6.3. Les mots w ∈ B 0 (2, 3) sont caractérisés par a. ils ne commencent pas par 1 et ne finissent pas par 0 ; b. ils ne contiennent pas deux 1 consécutifs ; c. ils ne contiennent pas trois 0 consécutifs.

ASTÉRISQUE 352

(1048)

MULTIZÊTAS, D’APRÈS FRANCIS BROWN

175

Que la fonction f ∈ O(Π) soit combinaison linéaire de c(w) où w vérifie a, b, ou c équivaut respectivement à ce que a0 . pour γ dans Π, f (exp(ue1 )γ exp(te0 )) est indépendant de t et u ; b0 . pour γ, δ dans Π, f (γ exp(te1 )δ) est de degré 6 1 en t ; c0 . pour γ, δ dans Π, f (γ exp(te0 )δ) est de degré 6 2 en t. Pour le vérifier, noter que les combinaisons linéaires d’éléments de Π(Q) sont denses dans Qe0 , e1 , et que si f est interprété comme une forme linéaire continue sur Q  e0 , e1 , la condition a0 (resp. b0 , resp. c0 ) équivaut à la même condition, où on permet à γ, δ, d’être arbitraires dans Q e0 , e1 . Les conditions a0 , b0 , c0 sont motiviques, car exprimables en terme de composition des chemins, et de (3.3.1). Il faut ici interpréter γ (resp. γ, δ) comme étant dans 1 Π0 (resp. 1 Π1 et 1 Π0 , resp. 1 Π0 et 0 Π0 ). Pour se convaincre du caractère motivique de a0 , b0 , c0 , on peut observer que ces conditions admettent une formulation « Betti ». On l’obtient en regardant f comme une fonction sur π1 (X; 1, 0), et en remplaçant exp(te0 ) (resp. exp(te1 )) par σ0t (resp. σ1t ) avec t ∈ Z et σ0 (resp. σ1 ) un tour positif autour de 0 dans l’espace tangent épointé à P1 en 0 (resp. 1) (cf. 3.3). On laisse au lecteur la vérification du lemme suivant : P LEMME 6.4. — Soit f = λw c(w) dans O(Π). Pour que, quels que soient γ0 , . . . , γr dans Π, (6.4.1)

f (γ0 exp(te0 )γ1 exp(te0 ) · · · exp(te0 )γr )

soit de degré 6 d en t, il faut et suffit que pour tout w tel que λw 6= 0, la longueur totale d’au plus r suites disjointes de 0 consécutifs dans w soit 6 d. 0 6.5. Soit B`0 (2, 3) (resp. B6` (2, 3)) l’ensemble des mots w dans B 0 (2, 3) ayant exactement (resp. au plus) ` facteurs 001. Avec la convention de 6.1, soit N` le sous-espace ›(2, 3) de base B6` (2, 3). Il résulte de 6.4 que pour que f dans H ›(2, 3) soit dans de H N` , il faut et il suffit que pour r = ` + 1, et tout choix des γi , (6.4.1) soit de degré 6 2` + 1 en t. Cette propriété est motivique. L’action de GdR sur O(1 Π0 ) respecte ›(2, 3) et sa filtration croissante N . donc H

›(2, 3) est triviale. Proposition 6.6. — L’action de UdR sur GrN H Preuve – L’algèbre de Lie graduée de UdR est engendrée par des éléments νd de degrés impairs d > 3, et si on gradue O(1 Π0 ) par le degré (6.1), l’action est compatible aux graduations. Il suffit de montrer que chaque νd agit trivialement. Soit w un mot de longueur n concaténation de mots 01 et de ` mots 001. On a n ≡ `(2). L’image de c(w) par νd est une combinaison linéaire de c(w0 ) avec w0 de longueur n−d et concaténation

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

176

P. DELIGNE

de mots 01 et de `0 6 ` mots 001. On a n − d ≡ `0 (2) et, d étant impair, ` et `0 n’ont pas la même parité. Que `0 < ` prouve 6.6. 6.7. Il résulte de 6.6 que l’action de Liegr UdR sur N` /N`−2 se factorise par l’abélianisé ab Liegr UdR . L’action de νd sur N` /N`−2 ne dépend donc pas, à un facteur près, du choix des générateurs νd . Elle est donnée par une application (6.7.1)

N › › GrN (νd ) : GrN ` (H (2, 3)) → Gr`−1 (H (2, 3)).

› L’espace vectoriel GrN ` (H (2, 3)) admet pour base l’image de Bl (2, 3) (6.5). Il est gradué par le codegré. Soit B`0 (2, 3)n la partie de B`0 (2, 3) formée des mots de lonN › › gueur n. Notons GrN ` (H (2, 3))n le facteur direct de codegré n de Gr` (H (2, 3)). Il a pour base l’image de B` (2, 3)n . Il n’est non nul que pour n ≡ `(2) et n − 3` > 0. Les morphismes (6.7.1) induisent X N › › (6.7.2) GrN (νd ) : GrN ` (H (2, 3))n → ⊕ Gr`−1 (H (2, 3))n−d , d

où il suffit de sommer sur d impair vérifiant 3 6 d 6 3 + n − 3`. Le membre de gauche de (6.7.2) a une base indexée par B`0 (2, 3)n . Celui de droite a une base indexée par la 0 réunion des B`−1 (2, 3)n−d . Si l > 1, on obtient une bijection entre ces ensembles de mots en associant au mot w ∈ B`0 (2, 3)n le mot w ¯ qui s’en déduit en ôtant de w son (001)(01) · · · (01) final. F. Brown calcule les morphismes (6.7.2) et prouve le Théorème 6.8. — Pour ` > 1, les morphismes (6.7.2) sont des isomorphismes. La stratégie qu’il utilise pour prouver 6.8 sera expliquée au §8. Corollaire 6.9. — Le morphisme de restriction à MdR : (6.9.1)

restr :

›(2, 3) → O(MdR ) H

est injectif. Appliquant (6.2.2), on déduit de 6.9 le Corollaire 6.10. — La série de Poincaré de O(MdR ) vérifie (6.10.1)

P (O(MdR ), t) > (1 − t2 − t3 )−1

(inégalité terme à terme),

avec égalité si et seulement si (6.9.1) est bijectif. Admettons 6.8, et prouvons 6.9. Lemme 6.11. — Le morphisme (6.9.1) est injectif sur N0 . Preuve — Le morphisme induit par (6.9.1) de N0 dans O(MdR ) est compatible aux graduations par le codegré. Il suffit donc de vérifier son injectivité séparément en chaque codegré. Les c((01)n ) forment une base de N0 , et c((01)n ) est de codegré

ASTÉRISQUE 352

(1048)

MULTIZÊTAS, D’APRÈS FRANCIS BROWN

177

2n. Ces codegrés étant distincts, il suffit de vérifier que pour chaque n la restriction de c((01)n ) à MdR est non nulle. La valeur de c((01)n ) en dch ∈ MdR (C) est (−1)n ζ(2{n} ), où ζ(2{n} ) = ζ(2, . . . , 2) avec n « 2 ». On conclut en observant que tout nombre multizêta est > 0, donc non nul. Remarque 6.12. — Développant les identités dues à Euler X Q (1 − z 2 /n2 ) = sin(πz)/πz = (−1)n (πz)2n /(2n + 1)!, n>0

on voit que ζ(2{n} ) = π 2n /(2n + 1)!. Que ζ(2{n} ) soit un multiple rationnel de π 2n résultait déjà de ce que le sous-espace motivique N0 de O(1 Π0 ) est fixe sous UdR , donc la réalisation dR d’une somme de motifs de Tate. Ceci force ζ(2{n} ) à être une période de Q(−2n). ›(2, 3)) de H ›(2, 3) dans O(MdR ) 6.13. Preuve de 6.8 ⇒ 6.9. Filtrons l’image restr(H par les images des N` . Il suffit de montrer l’injectivité de (6.13.1)

›(2, 3) → restr(H ›(2, 3)) H

après passage aux gradués. Prouvons par récurrence sur ` > 0 l’injectivité sur › GrN ` (H (2, 3)). Le lemme 6.11 prouve cette injectivité pour ` = 0. Si ` > 0, considérons le morphisme X N › › GrN (νd ) : GrN ` H (2, 3) → ⊕ Gr`−1 H (2, 3), › où le but est une somme de copies de ⊕ GrN `−1 H (2, 3) indexées par les entiers impairs d > 3. Le théorème 6.8 assure que ce morphisme est bijectif. Le morphisme (6.9.1) commute aux dérivations νd . Le diagramme › GrN ` H (2, 3) P  ν oy d

GrN (6.13.1)

−−−`−−−−−→

› GrN ` restr(H (2, 3)) P  ν d y

GrN `−1 (6.13.1)

› › ⊕ GrN −−−−−−−−→ ⊕ GrN `−1 H (2, 3) − `−1 restr(H (2, 3)) est donc commutatif. L’hypothèse de récurrence assure que GrN `−1 (6.13.1) est injectif. N La première flèche verticale étant injective, Gr` (6.13.1) l’est aussi.

7. STRUCTURE DE L’ADHÉRENCE D’ORBITE MdR 7.1. Considérons le groupo¨ıde des b Πa pour a, b ∈ {0, 1}, muni de e0 ∈ Lie 0 Π0 et de e1 ∈ Lie 1 Π1 . Soit VdR le schéma en groupe des automorphismes de cette structure.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

178

P. DELIGNE

L’action de UdR sur le groupo¨ıde des b Πa se factorise par un morphisme (7.1.1)

I : UdR → VdR .

On note IUdR l’image de UdR dans VdR . Le groupe des automorphismes qui ne respectent e0 ∈ Lie 0 Π0 et e1 ∈ Lie 1 Π1 qu’à un facteur près, le même pour e0 et e1 , est un produit semi-direct Gm n VdR . On note ◦ sa loi de groupe, et τ l’inclusion de Gm . L’action de Gm sur les b Πa , est celle du sous-groupe Gm de GdR . Elle correspond aux graduations. D’après [2] 5.9, (7.1.2)

v 7−→ v(1 10 ) : VdR → 1 Π0

est un isomorphisme de schémas. Cet isomorphisme identifie VdR à Π, muni d’une nouvelle loi de groupe, notée ◦. L’action τ de Gm qui définit la graduation de O(1 Π0 ) fixe 1 10 . Il en résulte que (7.1.2) est compatible aux graduations. Puisqu’il envoie élément neutre sur élément neutre, il définit un isomorphisme d’espaces vectoriels gradués (7.1.3)

∼ Liegr VdR −→ Liegr Π.

L’algèbre de Lie graduée Liegr VdR est ainsi identifée à Liegr Π, muni d’un nouveau crochet, le crochet de Ihara {, }. 7.2. Notons x 7→ γb,a hxi l’action sur b Πa de γ dans (Π, ◦). Elle se calcule comme suit. L’action sur a Πa respecte la structure de groupe. Pour a = 0, elle est induite par l’automorphisme (7.2.1)

γ00 : e0 7−→ e0 , e1 7−→ γ −1 e1 γ

de l’algèbre enveloppante complétée Q  e0 , e1  de Lie Π. Pour le vérifier, noter que e0 ∈ Lie 0 Π0 et e1 ∈ Lie 1 Π1 sont fixes par définition de VdR . Écrivant 0 (e1 )0 = (1 10 )−1 1 (e1 )1 (1 10 ), on obtient comme promis 0 (e1 )0

7−→ γ −1 1 (e1 )1 γ.

L’automorphisme γ10 de 1 Π0 est induit par l’automorphisme γ00 -semi-linéaire (7.2.2)

γ10 : x 7−→ γ γ00 hxi

du Qe0 , e1 -module à droite Qe0 , e1 . Le vérifier comme ci-dessus, partant de 1 x0 = 1 10 0 x0 . Puisque γ ◦ x envoie 1 10 sur γ10 h1 x0 i, c’est aussi (7.2.3)

γ10 : x 7−→ γ ◦ x,

(7.2.4)

x ◦ y = x x00 hyi .

et donc

7.3. Regardons, par compdR,B , π1 (X; b, a)B comme une Q-structure sur le complexifié de π1 (X; b, a)dR = b Πa , la Q-structure de Betti, notée ( b Πa )B . Pour cette nouvelle

ASTÉRISQUE 352

(1048)

MULTIZÊTAS, D’APRÈS FRANCIS BROWN

179

Q-structure, 2πie0 dans Lie 0 Π0C et 2πie1 dans Lie 1 Π1C sont rationnels : leurs exponentielles sont les σ0 et σ1 de 6.3. On en déduit le Lemme 7.4. — Soit ch un point rationnel de (1 Π0 )B . Regardons son image par compdR,B , encore notée ch, comme un point complexe de ( Π, ◦). Alors, le point complexe ch ◦ τ (2πi) de Gm n VdR = Gm n (Π, ◦) transforme la Q-structure de b Πa en sa Q-structure de Betti. 7.5. Soit a = u τ (2πi) ∈ UdR (R)τ (2πi) ⊂ GdR (C) comme en (5.8.3). Si ch est comme en 7.4, tant ch τ (2πi) que I(u)τ (2πi) transforment la Q-structure des b Πa en leur Q-structure de Betti. Si γ ∈ VdR (C) = Π(C) est défini par (7.5.1)

ch ◦ τ (2πi) = I(u) ◦ τ (2πi) ◦ γ,

γ respecte la Q-structure, donc est dans VdR (Q) = Π(Q). Notant encore τ l’action de Gm sur Π, on peut récrire (7.5.1) sous la forme ch = I(u) ◦ τ (2πi)(γ). Appliquons ceci au droit chemin dch : Lemme 7.6. — Pour u comme ci-dessus, il existe γ dans Π(Q) tel que (7.6.1)

dch = I(u) ◦ τ (2πi)(γ).

Tout tel γ vérifie (7.6.2)

τ (−1)(γ) = γ.

Preuve — (7.6.2) résulte de ce que u et dch, et donc aussi τ (2πi)(γ), sont réels. 7.7. Appliquons (7.2.3) à (7.6.1). On obtient que l’orbite de dch sous UdR (C) est IUdR (C) ◦ τ (2πi)(γ)



ΠdR (C).

Pour obtenir l’orbite sous GdR = Gm n UdR , il suffit de remplacer τ (2πi)(γ) par son orbite τ (C∗ )(γ) sous Gm : (7.7.1)

GdR (C)(dch) = IUdR (C) ◦ τ (C∗ )(γ).

En effet, IUdR est déjà stable sous Gm . Ainsi qu’on le savait déjà, l’orbite (7.7.1) est, au sens dR, définie sur Q. C’est l’ensemble des points complexes de (7.7.2)

IUdR ◦ τ (Gm )(γ)



Π.

Dans (7.7.2), le produit est celui de (Π, ◦) = VdR , et le résultat est regardé comme un sous-schéma de 1 Π0 .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

180

P. DELIGNE

P Dans Qe0 , e1, on a γ = cw w. D’après (7.6.2), la somme ne porte que sur des P monômes w de degré pair. Si ρ(λ) := λdeg(w)/2 cw w, ρ(λ) est défini pour λ ∈ Ga et vérifie (7.7.3)

ρ(λ2 ) = τ (λ)(γ).

Proposition 7.8. — Le morphisme de schémas (7.8.1)

IUdR × Ga → Π : (u, λ) 7−→ u ◦ ρ(λ)

induit un isomorphisme de IUdR × Ga avec MdR

⊂ 1 Π0

défini en 4.2.

Preuve — Si u est dans IUdR ⊂ VdR = Π ⊂ Q  e0 , e1 ∗ , on peut l’écrire P u = 1 + aw w, où la somme ne porte que sur les monômes de degré > 3. C’est une conséquence de ce que Liegr UdR est nul en degré < 3. Le coefficient de e0 e1 dans u ◦ ρ(λ) co¨ıncide donc avec celui de ρ(λ). Le coefficient de e0 e1 dans dch est 2 2 − π6 = (2πi) 24 . D’après (7.7.3), celui de γ est donc 1/24, et celui de ρ(λ) est λ/24. Partant de x = u ◦ ρ(λ), on retrouve λ comme étant 24 c(01)(x), que x soit de la forme u ◦ ρ(λ) équivaut à ce que u défini par x = u ◦ ρ(24 c(01)(x)) soit dans IUdR . C’est une condition fermée, et (7.8.1) est un isomorphisme avec un sous-schéma fermé de Π, dans lequel l’orbite de dch est dense. Ceci prouve 7.8. ∼ 7.9. Nous noterons D l’image de Ga par ρ. On a donc ρ : Ga −→ D, et 7.8 dit que la loi de groupe ◦ induit un isomorphisme

(7.9.1)

∼ ◦ : IUdR × D −→ MdR .

Cet isomorphisme est compatible aux graduations des algèbres affines, si O(D) = Q[λ] est gradué en donnant à λ le degré −2 (codegré 2). 7.10. D’après 6.6 appliqué à N0 , les (−1)n c((01)n ), et donc leurs restrictions ζ m (2{n} ) à MdR , sont UdR -invariantes. Transportée de MdR à IUdR × D par (7.9.1), l’action de u ∈ UdR est (a, λ) 7→ (I(u)a, λ). Vues comme fonctions sur IUdR × D, les ζ m (2{n} ) sont donc les images inverses de fonctions sur D. À un facteur près, il n’y a qu’une telle fonction en chaque degré pair. Pour déterminer laquelle est ζ m (2{n} ), il suffit de tester 2 sur dch. Posons πm := 6ζ m (2), une définition suggérée par l’identité ζ(2) = π 2 /6, et 2n 2 n πm := (πm ) . D’après 6.12, on a : Lemme 7.11. — (i) Pour chaque entier n > 0, on a 2n ζ m (2{n} ) = πm /(2n + 1)! . 2 (ii) IUdR est le sous-schéma de MdR défini par πm = 0.

Proposition 7.12. — Pour chaque entier n > 1,

ASTÉRISQUE 352

(1048)

MULTIZÊTAS, D’APRÈS FRANCIS BROWN

181

2n (i) ζ m (2n) est un multiple rationnel de πm (quel multiple, on le voit en évaluant sur dch) ;

(ii) en tant que fonction sur IUdR × D, ζ m (2n + 1) est l’image inverse d’une fonction sur IUdR , et celle-ci est un homomorphisme non nul de IUdR dans Ga ; (iii) sur les groupes rendus abéliens, les ζ m (2n + 1) pour n > 1 induisent un isomorphisme ab ∼ ab ∼ −→ (produit de Ga ). −→ IUdR UdR

Preuve (esquisse) — La filtration de profondeur de Lie Π est la filtration par les sous-algèbres « degré en e1 > i ». On note Di Π les sous-groupes correspondants. Si un sous-groupe Q de Π, vu comme sous-groupe de 0 Π0 , est stable sous VdR , il résulte de (7.2.4) que c’est aussi un sous-groupe de (Π, ◦). Ceci s’applique aux Di Π. Le sous-groupe D1 Π est défini par l’équation c(0) = 0. Il contient le groupe dérivé Π , qui est défini par c(0) = c(1) = 0, donc contient tant IUdR que dch. Le quotient D1 Π/D2 Π est aussi le quotient D1 Π/D2 Π pour la loi de groupe ◦. Il est abélien, et les c(0{n−1} 1) définissent un isomorphisme de D1 Π/D2 Π avec un produit de copies de Ga . 0

Parce que IUdR ⊂ (Π, ◦) a une algèbre de Lie engendrée en degré impair, si n est pair, c(0{n−1} 1) est nul sur IUdR , ζ m (n), transporté par (7.9.1) en une fonction sur IUdR × D, est l’image inverse d’une fonction sur D, et (i) se prouve par les arguments de 7.10. Par (7.6.2), les c(0{n−1} 1) sont nuls sur D pour n impair. Que ζ(n) 6= 0 assure que, pour n impair > 3, ils ne sont pas nuls sur IUdR . Ceci prouve (ii). L’assertion (iii) résulte de (ii) et de ce que l’algèbre de Lie graduée de UdR a un générateur en chaque degré impair > 3. Corollaire 7.13. — Quels que soient les entiers a, b > 0, il existe des nombres rationnels αa,b,r (1 6 r 6 a + b + 1), uniques, tels que (7.13.1)

ζ m (2{b} 3 2{a} ) =

a+b+1 X

αa,b,r ζ m (2r + 1)ζ m (2{a+b+1−r} ).

r=1

Preuve — Regardons, par (7.9.1), ζ m (2{b} 3 2{a} ) comme une fonction sur IUdR × D. Développons-la selon les puissances d’une coordonnée sur D : ζ m (2{b} 3 2{a} ) = P 2(a+b+1−r) u2r+1 πm , avec u2r+1 de codegré 2r + 1 sur IUdR . D’après 6.6 et 7.9, un translaté à gauche de u2r+1 ne diffère de u2r+1 que par l’addition d’une constante. C’est donc un homomorphisme de IUdR dans le groupe additif. Étant de poids 2r + 1, c’est d’après 7.12 un multiple rationnel de ζ m (2r + 1) et 7.13 résulte de 7.11.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

182

P. DELIGNE

2r Deus ex Machina 7.14 (D. Zagier [6]). — Posons Ara,b = 2a+2  2r r Ba,b = (1 − 2−2r ) 2b+1 . Alors X r (7.14.1) ζ(2{b} 3 2{a} ) = 2 (−1)r (Arab − Bab )ζ(2r + 1)ζ(2{a+b+1−r} ).



et

r Ce théorème suggère que les αa,b,r de (7.13.1) sont les 2(−1)r (Ara,b − Ba,b ). Comment le prouver en partant de 7.14 sera expliqué au §8.

7.15. L’algèbre affine O(UdR ) de UdR est en dualité, au sens gradué, avec l’algèbre enveloppante de Liegr (UdR ). Cette algèbre enveloppante est une algèbre associative libre en des générateurs de degrés les entiers impairs > 3. La série de Poincaré de O(UdR ), gradué par le codegré, est donc a  −1 X X X P (O(UdR ), t) = t2n+1 = 1 − t2n+1 a>0 n>1 3

n>1 2

−1

= (1 − (t /(1 − t )))

= (1 − t2 )/(1 − t2 − t3 ).

Si l’algèbre affine du groupe additif Ga , de coordonnée λ, est graduée en donnant à λ le codegré 2, on a P (O(Ga ), t) = (1 − t2 )−1 et P (O(UdR × Ga ), t) = (1 − t2 − t3 )−1 . L’algèbre affine O(IUdR ) est une sous-algèbre graduée de O(UdR ). Par 7.9, on a donc Proposition 7.16. — La série de Poincaré de O(MdR ), gradué par le codegré, vérifie (7.16.1)

P (O(MdR ), t) 6 (1 − t2 − t3 )−1

(inégalité terme à terme),

avec égalité si et seulement si le morphisme I : UdR → IUdR est un isomorphisme, i.e. si UdR agit fidèlement sur π1 (X; 1, 0)dR . Comparant avec 6.10, on obtient le Théorème 7.17. — (i) UdR agit fidèlement sur 1 Π0 . ›(2, 3) → O(MdR ) est un isomorphisme. (ii) Le morphisme de Q-espaces vectoriels H L’algèbre affine de π1 (X; 1, 0)mot contient en sous-quotient un Q(−1). Il résulte donc de (i) que l’action de GdR sur l’algèbre affine de π1 (X; 1, 0)dR est fidèle. La théorie des catégories tannakiennes donne qu’en conséquence de (i), on a le Corollaire 7.18. — L’algèbre affine O(π1 (X; 1, 0)mot ), qui est un Ind-objet de M T (Z), engendre la catégorie tannakienne M T (Z).

ASTÉRISQUE 352

(1048)

MULTIZÊTAS, D’APRÈS FRANCIS BROWN

183

Plus précisément, tout motif de Tate mixte à bonne réduction sur Spec(Z) se déduit de sous-objets dans M T (Z) de O(π1 (X; 1, 0)mot ) par les opérations de produits tensoriels, sommes directes, duaux et sous-quotients. L’assertion (ii) de 7.17 équivaut à dire que les ζ m (s) avec si ∈ {2, 3} forment une base de O(MdR ).

8. ESQUISSES DE PREUVES 8.1. Le schéma en groupe VdR = (Π, ◦) agit sur 1 Π0 (7.1), et donc sur son algèbre affine O(1 Π0 ). Cette action est l’action de (Π, ◦) sur O(Π) par translations à gauche (7.2.3) : x transforme f en y 7→ f (x−1 ◦y). Ces actions sont données par (7.2.1) (7.2.2). Dérivant ces formules, on obtient l’action de Lie(VdR ) = (Lie Π, { , }) sur O(1 Π0 ), et dualement la coaction de la coalgèbre de Lie. Celle-ci est m/m2 , pour m l’idéal des fonctions nulles à l’élément neutre 1, et la coaction est la projection sur m/m2 ⊗ O(Π) de f 7→ f (x−1 ◦ y) − f (y) dans m ⊗ O(Π) ⊂ O(Π × Π). Goncharov a donné une formule commode pour cette coaction (voir [5] théorème 1.2). Pour w un mot de l’alphabet {0, 1}, considérons les sous-mots c I d de 1w0, avec I non vide : on considère toutes les décompositions w = w0 Iw00 de w, avec I non vide, et c, d sont les lettres mitoyennes à I dans 1w0. Pour chaque décomposition, posons w r I := w0 w00 . Formule pour la coaction : X (8.1.1) c(w) 7−→ − pcd (I) ⊗ c(w r I), où pcd (I) est la projection dans m/m2 de l’élément suivant de m ⊂ O(Π) :  0 si c = d    c(I) si c = 1, d = 0 (8.1.2) pcd (I) = projection de    l’antipode c(I)∗ de c(I) si c = 0, d = 1 , où si I = a1 · · · ak , l’antipode est (−1)k c(ak · · · a1 ). 8.2. L’action de UdR sur O(1 Π0 ) se factorise par celle de IUdR ⊂ (Π, ◦), et pour obtenir la coaction de la coalgèbre de Lie, il reste à composer (8.1.1) avec coLie(Π, ◦) → coLie(IUdR ) → coLie(UdR ). Les c(I) et c(I)∗ de (8.1.2) n’importent plus que par leur restriction à MdR , prise 2 mod πm et le carré de l’idéal maximal en 1. Nous choisirons les générateurs ν2r+1 de l’algèbre de Lie Liegr (UdR ) de sorte que, notant encore ν2r+1 l’image de ν2r+1 dans l’espace tangent de IUdR ⊂ Π en 1, on ait hν2r+1 , dζ m (2r + 1)i = 1

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

184

P. DELIGNE

ab (possible par 7.12(ii)). Ceci détermine l’image de ν2r+1 dans Liegr (UdR ). Si r = a+b+1 m et que αa,b est le coefficient de ζ (2r + 1) dans (7.13.1), on a alors ¨ ∂ ν2r+1 , dζ m (2{b} 3 2{a} ) = αa,b .

Proposition 8.3. — La formule (7.14.1) reste vraie avec ζ remplacé par ζ m . Preuve — On procède par récurrence sur a + b. Si a + b = 0, l’identité (7.14.1)m à prouver se réduit à ζ m (3) = ζ m (3). Supposons (7.14.1)m vraie pour a + b < N . Ceci assure que, pour a + b < N et r = a + b + 1, on a, avec les notations de 7.14, (8.3.1)

r ζ m (2{b} 3 2{a} ) = 2(−1)r (Arab − Bab )ζ m (2r + 1) sur IUdR .

Pour a + b = N , si les αa,b,r sont définis comme en 7.13, on a, pour l’action de ν2r+1 (8.3.2)

ν2r+1 ζ m (2{b} 3 2{a} ) = −αa,b,r ζ m (2{a+b+1−r} ) :

appliquer 7.12. Pour r 6 N , calculons le membre de gauche par (8.1.1) (8.1.2). Il faut sommer sur les sous-mots I de w = (01)b (001)(01)a , de longueur 2r +1, et entourés de 0, 1 ou 1, 0 dans 1w0. Les c(w r I), restreints à MdR , sont ±ζ m (2{a+b+1−r} ). Les c(I) 0 0 ou c(I)∗ qui apparaissent dans (8.1.2), restreints à MdR , sont des ±ζ m (2{b } 3 2{a } ) auxquels (8.3.1) s’applique par l’hypothèse de récurrence, ou un c((01)m 0) qui, sur 0 0 Π0 , s’exprime par (3.5.2) comme somme de ζ(2{b } 3 2{a } ) auxquels (8.3.1) s’applique. Ceci permet le calcul des αa,b,r pour r 6 N , et on trouve qu’ils ont la valeur espérée. Ceci ne laisse inconnu dans (7.13.1) que le coefficient αa,b,a+b+1 . On le détermine en évaluant en dch et en appliquant (7.14.1). 8.4. Armé de (8.3.1), on peut maintenant calculer par (8.1.1) (8.1.2) les morphismes (6.7.1). Pour prouver 6.8, l’idée est que, dans la matrice obtenue pour (6.7.2), les r termes dominants, au sens 2-adique, proviennent du 2−2r qui figure dans Bab (7.14). Si, au but et à la source de (6.7.2), on range les vecteurs de base dans des ordres convenables qui se correspondent par la bijection définie en 6.7, et qu’au but on multiplie les vecteurs de base par des puissances de 2 convenables, la matrice de (6.7.2) est une matrice carrée à coefficients entiers, dont la réduction modulo 2 est triangulaire avec des 1 sur la diagonale. Ceci assure qu’elle est inversible. Remerciements Je remercie F. Brown, P. Cartier et H. Esnault de remarques et de corrections qui m’ont permis d’améliorer ce texte.

ASTÉRISQUE 352

(1048)

MULTIZÊTAS, D’APRÈS FRANCIS BROWN

185

RÉFÉRENCES [1] F. Brown – Mixed Tate motives over Z, Ann. of Math. 175 (2012), no 2, p. 949– 976. [2] P. Deligne & A. B. Goncharov – Groupes fondamentaux motiviques de Tate mixte, Ann. Sci. École Norm. Sup. 38 (2005), no 1, p. 1–56. [3] L. Euler – De summis serierum reciprocarum, Comm. Acad. Sci. Petropol. 7 (1734/5), p. 123–134, Opera Ommia Ser. I, vol. 14, p. 73–86 (voir aussi dans le même volume des Opera Omnia le mémoire 61, p. 138–155, pour une preuve irréprochable, et le mémoire 130, p. 407–462, pour une approximation de ζ(3) (p. 440)). [4]

, Meditationes circa singulare serierum genus, Novi Comm. Acad. Sci. Petropol. 20 (1775), p. 140–186, Opera Omnia Ser. I, vol. 15, Teubner, Berlin (1927), p. 217–267.

[5] A. B. Goncharov – Galois symmetries of fundamental groupoids and noncommutative geometry, Duke Math. J. 128 (2005), no 2, p. 209–284. [6] D. Zagier – Evaluation of the multiple zeta values ζ(2, . . . , 2, 3, 2, . . . , 2), Ann. of Math. 175 (2012), no 2, p. 977–1000.

Pierre DELIGNE School of Mathematics Institute for Advanced Study Einstein Drive Princeton, N.J. 08540 - U.S.A. E-mail : [email protected]

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

352

ASTÉRISQUE 2013

SÉMINAIRE BOURBAKI VOLUME 2011/2012 EXPOSÉS 1043-1058 (1049) Average rank of elliptic curves Bjorn POONEN

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Séminaire BOURBAKI 64e année, 2011-2012, no 1049, p. 187 à 204

Janvier 2012

AVERAGE RANK OF ELLIPTIC CURVES [after Manjul Bhargava and Arul Shankar] by Bjorn POONEN

1. INTRODUCTION 1.1. Elliptic curves An elliptic curve E over Q is the projective closure of a curve y 2 = x3 + Ax + B for some fixed A, B ∈ Q satisfying 4A3 + 27B 2 6= 0 (the inequality is the condition for the curve to be smooth). Such curves are interesting because 1. they are the simplest algebraic varieties whose rational points are not completely understood, and 2. they are the simplest examples of projective algebraic groups of positive dimension. The abelian group E(Q) of rational points on E is finitely generated [37]. Hence E(Q) ' Zr ⊕ T for some nonnegative integer r (the rank ) and some finite abelian group T (the torsion subgroup). The torsion subgroup is well understood, thanks to B. Mazur [33], but the rank remains a mystery. Already in 1901, H. Poincaré [39, p. 173] asked what is the range of possibilities for the minimum number of generators of E(Q), but it is not known even whether r is bounded. There are algorithms that compute r successfully in practice, given integers A and B of moderate size, but to know that the algorithms terminate in general, it seems that one needs a conjecture: either the finiteness of the Shafarevich–Tate group X (or of its p-primary part for some prime p), or the Birch and Swinnerton-Dyer conjecture that r equals the analytic rank ran := ords=1 L(E, s) [8]. The main results of Bhargava and Shankar (Section 1.4) concern the average value of r as E ranges over all elliptic curves over Q.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

188

B. POONEN

1.2. Selmer groups There is essentially only one known proof that E(Q) is finitely generated. The hardest step involves proving the finiteness of E(Q)/nE(Q) for some n ≥ 2. This is done by embedding E(Q)/nE(Q) into the n-Selmer group Seln (E), which we now define. For each prime p, let Qp be the field of p-adic numbers; also define Q∞ := R. Let Q be an algebraic closure of Q. We write H1 (Q, E), for example, to denote the profinite group cohomology H1 (Gal(Q/Q), E(Q)). Fix n ≥ 2. For any abelian group or group scheme G, let G[n] be the kernel of multiplication-by-n on G. Taking cohomology of n

0 −→ E[n] −→ E −→ E → 0 over Q and Qp leads to the exact rows in the commutative diagram (1) 0

/ E(Q) nE(Q)

/ H1 (Q, E[n])

/ H1 (Q, E)[n]

/0

β

0

 Y E(Qp ) / nE(Qp ) p≤∞

α

/

Y

 H1 (Qp , E[n]) /

p≤∞

Y

 H1 (Qp , E)[n]

/ 0.

p≤∞

The group H1 (Q, E[n]) turns out to be infinite, and it is difficult to determine which of its elements are in the image of E(Q)/nE(Q). But because arithmetic over Qp is easier than arithmetic over Q, one can determine which elements are locally in the image. With this in mind, define Seln (E) := {x ∈ H1 (Q, E[n]) : β(x) ∈ image(α)}. Diagram (1) shows that the subgroup Seln (E) ⊆ H1 (Q, E[n]) is an upper bound for the image of E(Q)/nE(Q). In fact, if we define also the Shafarevich–Tate group Ñ é Y X = X(E) := ker H1 (Q, E) → H1 (Qp , E) , p≤∞

then diagram (1) yields an exact sequence (2)

0 −→

E(Q) −→ Seln (E) −→ X[n] −→ 0. nE(Q)

Moreover, it turns out that Seln (E) is finite and computable.

ASTÉRISQUE 352

(1049)

AVERAGE RANK OF ELLIPTIC CURVES

189

1.3. Averaging over all elliptic curves The average of an infinite sequence of real numbers a1 , a2 , . . . is defined as limn→∞ (a1 + · · · + an )/n, if the limit exists. This may depend on the ordering of the terms. Hence, to define the average rank of elliptic curves, we should first decide how to order them. Tables such as [6, 14, 15, 44] order elliptic curves by their conductor N . But it is not known even how many elliptic curves have conductor < X asymptotically as X → ∞, so we cannot hope to prove anything nontrivial about averages for this ordering. Ordering by minimal discriminant runs into the same difficulty. Therefore we order by height, which we now define. Elliptic curves y 2 = x3 +Ax+B and y 2 = x3 + A0 x + B 0 over Q are isomorphic if and only if there exists q ∈ Q× such that (A0 , B 0 ) = (q 4 A, q 6 B). Therefore each isomorphism class contains a unique representative EAB with (A, B) ∈ Z2 minimal in the sense that there is no prime p with p4 |A and p6 |B. Let E be the set of all such EAB . Define the (naïve) height H(EAB ) = H(A, B) := max{|4A3 |, 27B 2 }. (Other authors replace 4 and 27 by other positive constants; it is only the exponents that matter in the proofs.) For X ∈ R, define E 1 > l. For characteristic initial data as described above, suppose (20)

r02 8π

Z

δ

e du ≥ 0

constants,

k , 8π

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

262

M. DAFERMOS

where the integral is taken along the segment of each generator of Co corresponding to the range [0, δ] of u for some δ > 0. e

C

o

C0

o

Then, if δ is suitably small, the maximal development of the data contains a trapped sphere S of area (21)

Area(S) ≥ 4πl2 .

This function e actually only depends on the conformal class of g/, which is in fact free data. We will discuss how to actually prescribe data in Sections 4 and 5. See in particular Section 5.3 for a discussion of the smallness condition on δ.

Remark 2.2. — The Einstein equations are clearly scale invariant under homotheties. Given a > 0, we may thus replace r0 → ar0 , δ → aδ, k → ak, l → al in the above statement. The formulation of the theorem has essentially set the scale to 1, and this corresponds to the order of the area radius of the trapped surface to be formed.

Remark 2.3. — As already announced in the introduction, we will extract in Section 13 a limiting statement from Theorem 2.1, where r0 → ∞ and C0 is thus pushed − to past null infinity I . It should already be clear, however, that the function r02 e will correspond in the limit r0 → ∞ to the analogue of |Ξ|2 , as defined in (11), but now according to past null infinity, i.e. with χ in place of χ. Thus assumption (20) will correspond to a very natural condition on the flux of incoming radiation per unit solid angle. Cf. the role of this quantity in Section 1.5.2.

ASTÉRISQUE 352

(1051)

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

263

3. THE GAUGE AND THE SEMI-GLOBAL EXISTENCE THEOREM The bulk of the work in obtaining Theorem 2.1 is proving a semi-global existence theorem. This will refer to a gauge defined by a double null foliation. The existence of the gauge will be part of the theorem, but as usual, it will be convenient to discuss its properties assuming it has already been shown to exist. 3.1. The double null foliation and canonical coordinates 3.1.1. The optical functions u, u. — Recall the definition u|Co = s − r0 from Section 2.1. We shall extend u to the future of Co so that its level sets are the future boundary of the part of the initial cone enclosed by the sets of constant u in Co . We denote these level sets by C u . We introduce a function u conjugate to u, the level sets of which are future null geodesic cones with vertices on Γ0 , and such that u|Γ0 measures arc length from o along Γ0 minus r0 . We denote the level sets of u by Cu . We refer to u, u as our optical functions. Finally, define the hypersurfaces Ht by u + u = t. In general, the foliation we are describing will only exist up to a C δ , for some small δ and up to a hypersurface Hc as above, for 0 > c > u0 . Let us denote such a region by Mc . Let us make one final assumption on such an Mc : There are no cut or conjugate points along Cu , C u in Mc \ Γ0 . Restricted to Mc \ Γ0 , we have then that Cu , C u are smooth null hypersurfaces, Ht defined above is a spacelike hypersurface, and Su,u = C u ∩Cu , are spacelike 2-surfaces diffeomorphic to S 2 . In what follows, all constructions will refer to some such Mc . 3.1.2. The three null frames. — We define first the null geodesic vector fields µ

L0 = −2(g −1 )µν ∂ν u,

µ

L0 = −2(g −1 )µν ∂ν u.

From these we define Ω by the relation: −g(L0 , L0 ) = 2Ω−2 . Ω is the inverse density of the double null foliation. We define two additional pairs, the normalized pair ˆ = ΩL0 , L

ˆ = ΩL0 L

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

264

M. DAFERMOS

ˆ = 2 and finally the equivariant pair : ˆ L) satisfying −g(L, L = Ω2 L0 ,

L = Ω2 L0

satisfying Lu = 0, L u = 0, Lu = Lu = 1. 3.1.3. Canonical coordinates. — Let Φτ define the flow generated by L. Recall the definition Su,u = C u ∩ Cu . Note that Φτ : Su,u → Su+τ,u is a diffeomorphism. We can define similarly the flow Φτ generated by L. Similarly Φτ : Su,u → Su,u+τ is a diffeomorphism. Thus, given local coordinates (ϑ1 , ϑ2 ) in a patch U on the sphere S0,u0 , we can extend these to Φu (Φu ( U )) ⊂ Su,u+u0 by pullback. Thus, given two patches U 1 , U 2 covering S0,u0 with coordinates ϑA , (ϑ0 )A respectively, the region Mc \ Γ0 is covered by two coordinate patches with coordinates (u, u, ϑ1 , ϑ2 ) and (u, u, (ϑ0 )1 , (ϑ0 )2 ), and (u, u) range in a region Dc depicted below:

u = δ

u+u =c

=

0

u

=

(D0′ )c

u

u

0

Dc′

Dc = (D0′ )c ∪ Dc′

We may call these coordinate systems canonical coordinates. Let us note that in such coordinates the metric takes the form g = −2Ω2 (du ⊗ du + du ⊗ du) + g/AB (dϑA − bA du) ⊗ (dϑB − bB du) where bA is governed by the torsion ζ (defined in Appendix 17.2.2) by the relation ∂bA A = 4Ω2 ζ ] ∂u expressed in canonical coordinates. For the problem of prescribing initial data, it will be convenient to choose a particularly nice coordinate system on the sphere, namely stereographic coordinates. We refer to Section 2.1 of [9] for the details.

ASTÉRISQUE 352

(1051)

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

265

3.2. The existence theorem We may now state the semi-global existence theorem which is the heart of the work: Theorem 3.1 (Existence theorem). — Consider data as described in Section 2.1. If δ is suitably small, then the maximal vacuum development of the data contains a region M−1 on which the gauge described in Section 3.1 can be constructed, bounded in the future by the spacelike hypersurface H−1 and the incoming null hypersurface C δ , such that the cones Cu and Cu do not contain cut or conjugate points.

Γ0 e H−1

Sδ,−1−δ



C

o

C0

o

Remark 3.2. — Under the assumptions of the trapped surface formation Theorem 2.1, the surface Sδ,−1−δ will in fact be trapped, as will, by continuity, all surfaces Su,u with u, u sufficiently close to δ, −1 − δ, respectively. As previously announced, we shall discuss the smallness assumption on δ in Section 5.3. Let us emphasize that indeed, the smallness assumption can be satisfied simultaneously in both Theorems 2.1 and 3.1.

4. FREE DATA Before examining more closely the issue of smallness of δ and its significance, we must address the question: How does one actually parametrize the data? We have already remarked that free data for the vacuum Einstein equations (1) in this context is precisely the conformal geometry of the initial cone. It will be essential,

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

266

M. DAFERMOS

however, to have an explicit convenient parametrization of the space of free data. This will be provided by the geometric object ψ to be described immediately below. 4.1. The geometric object ψ We proceed with how to explicitly isolate the conformal geometry of the null cone with respect to our gauge. 4.1.1. The conformal factor φ. — On Cu0 let us write g/|Su,u0 = (φ|Su,u0 )2 gˆ/S u,u

0

where dµΦ∗u g/ˆ|Su,u = dµg/|S0 ,u0 . 0

It follows that we may write dµg/|Su,u = (φ|Su,u0 )2 dµg/ˆ|Su,u 0

0

for a scalar function φ. In terms of canonical coordinates, we have g/|S0,u0 = |u0 |2˚ g/ where ˚ g/ represents the metric of the standard sphere. We may then write » » det g/(u, u0 , ϑ) = (φ(u, ϑ))2 |u0 |2 det ˚ g/(ϑ) whence 2 gˆ /AB (u, u0 , ϑ) = |u0 |

»

det ˚ g/(ϑ) mAB (u, ϑ)

where det m = 1. 4.1.2. m and ψ. — The object m is in fact a 2-covariant symmetric positive definite tensor density of weight −1. We can see its transformation rule explicitly: Consider two charts ϑ and ϑ0 covering S 2 . Writing ϑ0 = f (ϑ) we may express ∂f A (ϑ) = TBA (ϑ). ∂ϑB We see then that m(ϑ) = | det T (ϑ)|−1 T˜(ϑ)m0 (ϑ0 )T (ϑ). If we restrict attention to stereographic charts on S 2 (as discussed in Section 3.1.3), then the matrix O = | detTT |1/2 is orthogonal, symmetric of determinant −1. We can write the matrix ! Z +X Y m= Y Z −X where Z 2 − X 2 − Y 2 = 1, i.e., this corresponds to the upper hyperboloid H1+ .

ASTÉRISQUE 352

(1051)

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

267

If we consider now the exponential map: exp : Sˆ → H1+ ,

(22)

where Sˆ denotes the space of symmetric trace-free matrices, this defines an analytic diffeomorphism. We can thus express m = exp ψ where ψ ∈ Sˆ ! a b ψ= , b −a and ψ transforms as 0 0 ˜ ψ(ϑ) = O(ϑ)ψ (ϑ )O(ϑ).

(23)

We shall see in the following section that indeed ψ determines the whole set of initial data, once the Einstein equations are imposed. To be completely concrete, one should consider a pair (ψ, ψ 0 ) each defining a map [0, δ] × D2ρ for a ρ > 1, where the latter denotes the stereographic disc of radius strictly greater than 2, where ψ and ψ 0 in the overlapping region transform as above. It will often be useful, however, to suppress this and consider ψ as a single geometric object(8) ψ(u, ϑ) : [0, δ] × S 2 → Sˆ with ϑ ∈ S 2 . 4.2. Determining the rest of the data Given an arbitrary choice of ψ, one can then determine the remaining data by imposing the Einstein equations. See Appendix 17.4—17.6. 4.2.1. Determining e. — From (90), noting that Ω = 1 on Cu0 , we have ∂trχ = −|χ|2g/ . ∂u We obtain trχ =

(24)

χ ˆAB =

(25) We thus have e= (8)

2 ∂φ , φ ∂u

1 2 ∂ gˆ/AB φ . 2 ∂u

∂ gˆ/ ∂ gˆ/ 1 2 1 −1 −1 |χ| ˆ g/ = (gˆ/ )AC (gˆ/ )BD AB CD . 2 8 ∂u ∂u

As such it is a funny object, namely, the logarithm of a tensor density of weight −1.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

268

M. DAFERMOS

Note the function e is conformally invariant, i.e. it is independent of φ. Given, say stereographic coordinates, we may express it in terms of m and thus (inverting (22)) in terms of ψ. 4.2.2. Determining φ. — We have the linear equation ∂2φ + eφ = 0. ∂2u The initial conditions are φ|u=0 = 1,

∂φ 1 1 |u=0 = trχ|S0,u0 = . ∂u 2 |u0 |

Thus, φ is determined in terms of e and thus of ψ. Note that φ is a concave function. Let us call data regular if φ > 0. This means precisely that Cu0 has no conjugate points. When we refer to “arbitrary data” in what follows, we shall always implicitly assume this condition. 4.2.3. The rest. — Continuing, one can obtain the initial values of all connection coefficients (see Section 17.2) and all curvature components (see Section 17.3) on Cu0 , in terms of ψ. For instance trχ is now defined by (24), χ ˆ is defined by (25) (in view of the fact that g/ˆAB is defined by m which is defined by ψ), etc.

5. THE SHORT PULSE ANSATZ AND HIERARCHY We have shown that free data is indeed completely parametrized by the geometric object ψ. In trying to understand the key to Theorems 2.1 and 3.1, it is useful to think of such ψ (restricted in u to [0, δ]) as arising in a particular way. This will shed light both on the mechanism behind the result and on the quantities that determine the smallness of δ. This way of defining ψ is what we shall call the short pulse ansatz. 5.1. The short pulse ansatz Let ψ0 be a “seed” map ψ0 : [0, 1] × S 2 → Sˆ which extends smoothly to s < 0. Now given u0 < −1, 0 < δ < 1, define for ϑ ∈ S 2 , (26)

ψ(u, ϑ) =

δ 1/2 u ψ0 ( , ϑ). |u0 | δ

Note that this assumption is indeed compatible with the transformation rule (23). ˆ This ψ defines now a mapping [0, δ] × S 2 → S.

ASTÉRISQUE 352

(1051)

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

269

5.2. Parametrization of initial data One way of viewing the above ansatz is that for each fixed δ, it simply gives a specific way of parameterizing general data (restricting them in u to [0, δ]). That is to say, given initial data on Cu0 determined by ψ as in Section 4, and ˆ we may define ψ0 by (26). given δ, restricting ψ to [0, δ] × S 2 → S, The statements of the theorems will be more transparent if one thinks about fixing ψ0 and defines ψ (and thus data on Cu0 ) from ψ0 after δ has been chosen; we shall freely move between both points of view. 5.3. The smallness assumption on δ We are now ready to return to the issue of smallness of δ in the statement of Theorems 3.1 and 2.1. Small with respect to what? And are the assumptions simultaneously satisfiable? Let us first take the point of view that we have given fixed data on Cu0 which determines ψ as in Section 4. Let us note that ψ must extend smoothly to 0. Then, given δ, we may define ψ0 as in Section 5.2 immediately above. Let us now define Mk (27)

Mk = kψ0 kC k ([0,1]×S 2 ) .

The smallness condition on δ in both Theorems 2.1 and 3.1 can now be expressed as follows. There is a continuous, positive non-increasing function F (M8 ) such that (28)

δ < F (M8 ).

In this approach where the data are first fixed, it follows that ψ0 (and thus M8 ) depends on δ. But in this approach, one sees that M8 → 0 as δ → 0. Thus, for fixed data, the smallness assumption (28) will indeed hold for sufficiently small δ. Alternatively, one can begin by fixing ψ0 . Then M8 is fixed, and clearly for δ sufficiently small, (28) holds. It follows that considering the rescaled data defined by ψ as in (26), then the statement of Theorem 3.1 holds. The status of assumption (20) of Theorem 2.1 is somewhat different. For one sees Rδ that the quantity 0 edu is critical with respect to the rescaling defined by (26). Thus, (20) is essentially an assumption about the seed function ψ0 . This assumption can be made more explicit by replacing (20) with the assumption 2 2 Z Z 1 1 ∂ψ0 1 1 ∂ψ00 ≥ k, ≥k (29) (s, ϑ) (s, ϑ) 8 0 ∂s 8 0 ∂s (for all ϑ in two respective stereographic charts, as discussed in Section 4.1); this is directly computable from ψ0 and it implies that (20) holds for all data rescaled by (26), with k replaced by 1 + 21 (k − 1). (See the statement of Theorem 7.1 of [9].)

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

270

M. DAFERMOS

Let us note finally that the necessity of satisfying the transformation rule (23) is not an obstacle for satisfying both inequalities of (29). Thus, in summary, starting with a seed function ψ0 satisfying (29), then for δ satisfying (28), with M8 = M8 (ψ0 ), then rescaled data determined by (26) will lead to developments satisfying the conclusions of both Theorems 3.1 and 2.1.

5.4. The initial data hierarchy We fix now ψ0 and will consider the corresponding initial data set on Cu0 , restricted to u ≤ δ, which as we saw in Section 4.2 above, can be completely determined by defining ψ by (26). As before, we define Mk by (27) with respect to this fixed ψ0 . One thing we have slipped under the rug is the question of whether, starting from ψ0 and defining ψ by (26), one indeed obtains “regular” data, in the sense of Section 4.2.2. We note, however, that one easily sees that initial data are indeed regular if δ|u0 |−2 is sufficiently small depending on M1 . 5.4.1. Invariant norms. — Note first some basic control of the geometry: the eigenvalues of |u0 |−2 g/ relative to ˚ g/ are bounded above and below by fixed positive constants provided that δ is suitably small depending on M1 . It follows that we can compare coordinate | · | norms, defined with respect to canonical coordinates in say two stereographic charts, with invariant norms: If ξ is a type Tpq S-tensor field (see Appendix 17.1 for this notion!), then −1 Cp,q |u0 |q−p |ξ| ≤ |ξ|g/ ≤ Cp,q |u0 |q−p |ξ|.

Let us define invariant norms Ckδ by: Ä ä m / Dn ξ|g/ . kξkCk = max sup δ n |u0 |m |∇ δ

m+n≤k Cu 0

Now we say ξ = Ml (δ r |u0 |s ) if for all k, kξkCk ≤ δ r |u0 |s Fk (Mk+l ) δ

for some Fk a nonnegative nondecreasing continuous function.

ASTÉRISQUE 352

(1051)

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

271

5.4.2. The initial connection coefficient hierarchy. — Just as one determined the data, one can now give bounds for the connection coefficients on the initial cone Cu0 , as these are defined in Appendix 17.2. In the above notation, these bounds are as follows: χ ˆ = M1 (δ −1/2 |u0 |−1 ) trχ −

2 = M1 (|u0 |−2 ) |u0 | ζ = M2 (δ 1/2 |u0 |−2 )

trχ +

u 2 = M3 (δ|u0 |−3 ) −2 |u0 | |u0 |2 χ ˆ = M3 (δ 1/2 |u0 |−2 ) ω = M3 (δ|u0 |−3 ).

5.4.3. The curvature components. — Recall that the curvature components in a null frame are denoted by the geometric objects α, β, ρ, σ, β, α, defined in Appendix 17.3. Similarly to the above, we obtain the following initial data hierarchy for curvature: α = M2 (δ −3/2 |u0 |−1 ) β = M2 (δ −1/2 |u0 |−2 ) ρ, σ = M3 (|u0 |−3 ) β = M4 (δ|u0 |−4 ) α = M5 (δ 3/2 |u0 |−5 ).

(30)

5.4.4. The nonlinearity of the hierarchy. — We note that the above curvature hierarchy is nonlinear, in the sense that, had one used a linearized analysis, one would have obtained δ −3/2 ,

δ −1/2 ,

δ 1/2 ,

δ,

δ 3/2 .

Let us note that to estimate correctly the latter two components β, α one must use the Bianchi identities (92) and (91) respectively. We see, for instance, that in the identity (91), the last two terms, though lower order from the point of view of differentiation, are dominant from the point of view of behavior in δ. This is a characteristic difficulty of the problem at hand. Remark 5.1. — Let us note that the above non-linear δ-dependence of the curvature hierarchy is not unrelated to the non-linearity of the equations at infinity responsible for the memory effect discussed in Section 1.5.2. On the other hand, taking the limit as u0 → ∞ (see Section 13), we see that the u0 -dependence of the hierarchy reflects precisely the peeling hierarchy of [32]. This is still consistent, however, with the

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

272

M. DAFERMOS

analysis of Section 1.5.3 concerning the validity of peeling. For as noted there, the − analogue of B∗ , defined with respect to past null infinity I , is constant in u (as the roles of u and u are now reversed). Thus, it is the triviality of the data in the region u ≤ 0 that here imposes the analogue of B∗ = 0, and thus peeling to indeed hold at past null infinity. Remark 5.2. — Denoting by Mi the norms on the right hand side, it is also instructive to reflect upon the i-dependence of the hierarchy. One sees that although ψ is at the order of the metric and ζ, χ, ω are at the order of first derivatives of the metric, the latter appear in Section 5.4.2 with i = 3. This is related to the loss of derivatives inherent to the characteristic initial value problem (cf. the remarks in Section 1.1.7). We shall not track this aspect of the hierarchy further in what follows. 5.5. Preservation of the hierarchy The key to both the semi-global existence Theorem 3.1 and the trapped surface formation Theorem 2.1 is precisely the δ-hierarchy motivated by the above behavior of the norms in Sections 5.4.2 and 5.4.3 above. This hierarchy will be encoded in the very energy estimates for curvature (and higher order so-called Weyl fields) that control the solution at top order. See Section 9.7. From there, it will filter down to all lower order estimates. In particular, the connection coefficients will be bounded pointwise: |Ω| ≤ O(1) Ωtrχ + 2 ≤ O(δ|u|−2 ) |u| Ωtrχ − 2 ≤ O(|u|−2 ) |u| |χ| ˆ ≤ O(δ −1/2 |u|−1 ) |ˆ χ| ≤ O(δ 1/2 |u|−2 ) |η| ≤ O(δ −1/2 |u|−2 ) |ω| ≤ O(δ|u|−3 ) and curvature(9) will similarly be bounded pointwise: (31)

|α| ≤ O(δ −3/2 |u|−1 )

(32)

|β| ≤ O(δ 1/2 |u|−2 )

(9)

In examining the u dependence of (36), the reader may notice that a weaker bound is propagated than that suggested by the data (cf. (30)). This is because, although peeling can be shown to hold for smooth data of the type considered, the estimates at the level given do not propagate peeling. This is related to the actual failure of peeling for general initial data as discussed in Section 1.5.3.

ASTÉRISQUE 352

(1051)

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

(33)

|ρ| ≤ O(|u|3 )

(34)

|σ| ≤ O(|u|3 )

(35)

|β| ≤ O(δ|u|−4 )

(36)

|α| ≤ O(δ 3/2 |u|−9/2 ).

273

Let us defer any further discussion of how these bounds are actually attained, and first turn briefly in the next section to showing that, given the semi-global existence Theorem 3.1 with respect to our gauge, and the propagation of the hierarchy in the form of the above bounds, we indeed obtain the result on formation of trapped surfaces, Theorem 2.1. In fact, adding / ≤ O(|u|−3 ) |∇η| we will have written explicitly above precisely all those inequalities that we shall need!

6. PROOF OF THEOREM 2.1 The proof of Theorem 2.1, given the semi-global existence Theorem 3.1 and the connection-coefficient estimates collected in Section 5.5, is in fact almost immediate, and we shall be able to essentially give the complete details in this short section. 6.1. Raychaudhuri on the cone C−1−δ We will integrate the Raychaudhuri equation (90), written in the form 1 Dtrχ0 = − (trχ)2 − |χ| ˆ2 2 on the cone C−1−δ . e H−1

Sδ,−1−δ

C



1−

δ



C

o

C0

o

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

274

M. DAFERMOS

Defining f = |u|2 |χ| ˆ 2, we have Dtrχ0 ≤ −(1 + δ)−2 f. We note that 2 1+δ and thus, denoting by ϑ(u, ϑ0 ) the ϑ-dependence of the null generators of C−1−δ emanating from (0, −1 − δ, ϑ0 ) in canonical coordinates as they cross Cu , we obtain Z u 2 1 trχ0 (¯ u, −1 − δ, ϑ(u; ϑ0 )) ≤ − f (u0 , −1 − δ, ϑ(u0 ; ϑ0 ))du0 . 1+δ (1 + δ)2 0 trχ0 |S0,−1−δ =

It follows that if Z

δ

f (u, −1 − δ, ϑ(u; ϑ0 ))du > 2(1 + δ)

(37) 0

for all ϑ0 ∈ S 2 , then there is a u∗ ∈ (0, δ) such that for all u ∈ (u∗ , δ) we have trχ0 (u, −1 − δ, ϑ(u; ϑ0 )) < 0

(38)

for all ϑ0 ∈ S 2 , i.e. Su,−1−δ is a trapped sphere. 6.2. Estimating the change in f from the short pulse hierarchy We compute using the structure equation (88): Df = g

(39) where

ã ™ ß Å 2 2 |trχ| + 2(χ, ˆ θ) , g = |u| − Ωtrχ + |u| ß ™ 1 ˆ ˆ / ⊗η + η ⊗η − trχˆ θ=Ω ∇ χ − ω χ. ˆ 2 2

From the inequalities of Section 5.5, it follows that (40)

|g| ≤ O(δ −1/2 |u|−2 ).

Working in canonical coordinates, (39) has the form ∂u f = g, and integrating we obtain Z −1−δ f (u, −1 − δ, ϑ) = f (u, u0 , ϑ) + g(u, u, ϑ)du. u0

ASTÉRISQUE 352

(1051)

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

275

See −

1−

δ

e

C

Sδ,−1−δ

C

u

0



C0

From (40), we have Z

−1−δ

|g(u, u, ϑ)|du ≥ −O(δ −1/2 )

− u0

and so conclude that f (u, −1 − δ, ϑ) ≥ f (u, u0 , ϑ) − O(δ −1/2 ). It follows that (37) is satisfied if Z δ (41) f (u, u0 , ϑ(u; ϑ0 )) > 2 + O(δ 1/2 ). 0

6.3. The initial condition Note that (42)

f (u, u0 , ϑ) = 2|u0 |2 e(u, u0 , ϑ)

for e defined in (19). In comparing (41) with (20) in view of (42), there is only one small subtlety remaining. The integration in (41) is not along the null generators of the cone Cu0 . This is of course a reflection of torsion. Nonetheless, using again the hierarchy (now concerning only the initial data as in Section 5.4) one can easily relate the two integrals modulo terms O(δ 1/2 ), thus showing that (20) implies (37) and thus (38). Let us note finally that the statement (21) concerning the area of the trapped sphere is again easily derived given the assumptions of the Theorem 2.1 and the estimates of the hierarchy given in Section 5.5.

7. THE PROOF OF THEOREM 3.1: A FIRST OVERVIEW We now turn in the next three sections to the proof of the existence theorem, Theorem 3.1, and the intimately related property of the propagation of the hierarchy of Section 5.5.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

276

M. DAFERMOS

As is typical for results concerning non-linear evolution equations, the proof is framed as a continuity argument, known in this context as a bootstrap. For the benefit of the reader not familiar with such arguments, we will eventually want to outline in some detail how this is actually set up. It is hard, however, to motivate the ingredients of the set-up before one has introduced the main estimates of the proof, because it is the nature of the estimates themselves which define in particular the so-called bootstrap assumptions at the heart of the continuity argument. We thus defer the outline of the actual continuity argument to Section 10. In Sections 8 and 9 below, we shall thus only consider the question of how to estimate a solution assumed to exist on a slab of spacetime of the form Mc , as in Section 3.1. In broad terms, there are two parts to the problem of obtaining bounds, and this is already familiar from the proof of the stability of Minkowski space (see Section 1.4): 1. Use the structure equations to control the connection coefficients given bounds on the curvature. 2. Apply energy estimates to control curvature given bounds on the connection coefficients. These two parts will reflect the breakdown between Sections 8 and 9, respectively.

8. CONTROLLING THE CONNECTION COEFFICIENTS FROM CURVATURE In the present section we will review the structure which allows us to control the connection coefficients given bounds on curvature. 8.1. “Naive” propagation estimates One may estimate “naively” the connection coefficients from curvature fluxes simply by integrating the propagation equations (78), (79), (80), (81), etc., along the null generators of the cones Cu , C u . This will indeed be used to derive L∞ estimates from L∞ estimates of the curvature (see Chapter 3 of [9]) and to derive L4 (S)(10) estimates for the first derivatives of the connection from L4 (S) bounds for the first derivatives of the curvature (see Chapter 4). For instance (43) (10)



|χ ˆ0 | ≤ C|u|−1 δ −1/2 R 0 (α)

By this notation, we mean L4 estimates with respect to the measure of the Su,u spheres.

ASTÉRISQUE 352

(1051)

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

277

where, in the notation of [9]: 3/2 R∞ |α|). 0 (α) = sup(|u|δ Mc

As is apparent, however, these estimates “lose” a derivative, as the connection coefficients are estimated at the same level as curvature, and not one degree better. The reason is clear: solutions of transport equations do not gain in differentiability against their right hand side. The presence therein of curvature thus necessitates the above loss. These naive estimates are not however useless. In particular, although they lose a derivative, the estimates are sharp with respect to their δ-dependence; having such an estimate is important for the propagation of the hierarchy as in Section 5.5. Cf. Section 8.2.4. 8.2. A hidden elliptic structure We will see in this section a hidden elliptic structure that will allow us to overcome the loss in regularity above. This has already appeared in the stability of Minkowski space, but as it is one of the most beautiful aspects of the structure of the Einstein equations, it is certainly worth repeating! In the present work, this structure will be used specifically in order to obtain L4 (S) estimates for second derivatives of χ, etc., from L4 (S) estimates for first derivatives of curvature (see Chapter 6), and cone L2 estimates for third derivatives of χ, etc., from cone L2 estimates for second derivatives of curvature. The latter are top order estimates. 8.2.1. Raychaudhuri and trχ. — Like almost everything in general relativity, the story begins with the Raychaudhuri equation (90)! In its more general form (i.e. without imposing Ric = 0): (44)

ˆ L), ˆ Dtrχ0 = −Ω2 |χ0 |2 − Ric(L,

this equation was first exploited by Penrose to prove his famous incompleteness theorem, Theorem 0.1. The significance of (44) in that context is that given the null curvature condition, then the right hand side of (44) is non-negative, and from this it follows that focal points form in finite time. From this in turn, geodesic incompleteness properties can be inferred by global topological methods. Equation (44) plays a similar role in the proof of Theorem 0.3. In the context of the analysis of the vacuum Einstein equations, the relation (44) takes on a new significance. The point is precisely that, in view of the vanishing ˆ L), ˆ no curvature term is present in (90). of Ric(L,

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

278

M. DAFERMOS

In principle, this allows one to hope to estimate trχ without losing differentiability. Rewriting (90) in the form: (45)

1 Dtrχ0 = − Ω2 (trχ0 )2 − Ω2 |χ ˆ0 |2 , 2

we see, however, that for this to work, one has to also estimate the trace-free part χ, ˆ the so-called shear, which appears on the right hand side of (45). (See Appendix 17.2.) Here comes the second part of the miracle, which has no analogue in the classical use of (44) in the context of the proof of the incompleteness theorem. Given control of trχ, then the quantity χ, ˆ in view of the Codazzi equation (84), satisfies what can be viewed as an elliptic equation on the spheres Su,u : (46)

/ χ div ˆ0 =

1 1 /trχ0 + Ω−1 (−β + trχ η − χ d ˆ] · η). 2 2

t fo ran r sp tr o χ rt

eq ua ti on

The last two terms in brackets are clearly of lower order in differentiability. We see that one expects χ ˆ0 to have one more degree of angular regularity than the curvature /trχ0 . Thus, (46) coupled with (45) form β and the form d

2d elliptic system for χ ˆ

allow one to obtain quantitative bounds for trχ, χ, ˆ given bounds on curvature, gaining one level of differentiability. ˆ. Note that a similar argument can of course be applied for trχ, χ 8.2.2. The mass aspect functions µ, µ. — One would like to extend the above method to estimate the remaining connection coefficients (η, η, ω, ω). In examining the equations (80), (81), etc., from Appendix 17.4, however, it is not at all obvious how this is to be done, as there does not appear to be an immediate analogue of the good quantity trχ satisfying an analogue of the transport equation (45), with no curvature terms present on the right hand side. One of the most beautiful discoveries associated with the original proof of the stability of Minkowski space [12], is that there is indeed such a quantity! The quantity is, however, at one level of differentiability higher than the connection coefficients! Specifically, one defines µ by (47)

ASTÉRISQUE 352

1 1 / = −ρ + (χ, / ˆ χ ˆ ) − divη. µ = K + trχtrχ − divη 4 2

(1051)

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

279

We may also define a version associated with the Cu 1 / µ = K + trχtrχ − divη. 4 We have that µ satisfies the transport equation Å ã 1 1 1 / ˆ 2 + trχ|η|2 + div(Ω(2 χ ˆ] · η − trχ η)), (48) Dµ = −Ωtrχµ − Ωtrχµ + Ω − trχ|χ| 2 4 2 with a similar expression for Dµ. This transport equation has the property that there are no curvature terms on the right hand side. To close, however, one still must somehow retrieve estimates for η, η and their derivatives on the spheres. For this, recall the structure equation (82) from Appendix 17.4. Rewriting also / (47) as an equation for divη, we see that for given µ, the quantity η can be viewed as satisfying the elliptic system (49)

1 / = −ρ + (χ, divη ˆ χ ˆ ) − µ, 2

1 / =σ− χ curlη ˆ∧χ ˆ. 2 Similar considerations hold for η given µ. We thus see that by simultaneously coupling both transport equations (48) and the equation for Dµ, to the elliptic system (49)–(50) and the analogue for η, we can in principle close the estimates. (50)

sp an tr

coupled

tr an sp

or t

µ

fo r

r fo

elliptic for η

µ

t or

coupled

elliptic for η coupled

The quantity µ has an important property. When integrated over the two-surface R Su,u , S µ retrieves the so-called Hawking mass:   Z Z Z 8π 1 · mHawk (Su,u ) = 1 + trχtrχ = µ= µ. Area(Su,u ) 16π Su,u Su,u Su,u With respect to the foliation considered in the proof of the stability of Minkowski space, the Hawking mass of St,u approaches the so-called Bondi mass associated to + the “cut” on I defined by the cone Cu . Moreover, lim (Area(Su,t )/4π)3/2 µ(u, t, ϑ)

t→∞

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

280

M. DAFERMOS

represents the energy per unit solid angle, the so-called news function N (u, ϑ). See [4], as well as Chapter 17 of [12]. Note that with Ξ defined by (11), we have ∂N 1 = − |Ξ|2 . ∂u 2 −

+

Thus, replacing now future null infinity I with past null infinity I and exchanging the underlined and non-underlined quantities, we see that the change in N over a δ-interval along the generators of past null infinity measures precisely the limiting flux which appears in the statement of Theorem 13.1. For this reason, µ and µ are known as mass aspect functions, even though, strictly speaking, this interpretation is only valid at infinity. 8.2.3. The quantity ω / . — For ω, ω, a suitable quantity is to be found one order further down in differentiability. We define / / − div(Ωβ) ω / = 4ω to obtain the transport equation 2

/ ω) + m Dω ω = −2Ω(χ, ˆ ∇ / + Ωtrχ/ where m is of suitable order. For details, see Chapter 6.5 of [9]. 8.2.4. Note on the δ-hierarchy. — Without going into details, let us just remark that, in the case of η, η, ω, the estimates obtained in the manner of the present section, though better from the point of view of differentiabilty, are worse with respect to δ that those obtained in Section 8.1 above. The estimates are indeed sharp, however, in the case of χ, χ, and ω, and this is fundamental for the argument to close. 8.3. Sobolev inequality and uniformization on S There is one missing link in order to apply elliptic theory on the Su,u spheres. For elliptic estimates to hold, one needs to first retrieve some basic underlying geometric information on the spheres. First and foremost, to do the necessary elliptic theory, one requires the Sobolev inequality. This in turn is derived from the isoperimetric inequality ÇZ å2 Z 2 ¯ /f |dµg/ (f − f ) dµg/ ≤ I(Su,u ) |d Su,u

Su,u

and I(Su,u ) is the isoperimetric constant. The latter can be estimated from the eigenvalues of the pullback Φ∗u gSu,u with respect to g|So,u . This in turn requires only a bound on δ|Ωtrχ|, δ|Ωχ|. ˆ

ASTÉRISQUE 352

(1051)

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

281

The δ factor is quite fortuitous; comparing with the bounds of Section 5.5, there is in fact a δ 1/2 to spare. The other element which is required is the uniformization theorem. For in order to estimate in Lp , one needs to transfer Calderón-Zygmund estimates from the standard sphere to Su,u . In the context of stability of Minkowski space, a version of uniformization was proven [12] depending only on L∞ bounds on curvature. In the present context, the L∞ bounds on curvature are not sufficiently good for these purposes, in view of their bad δ-dependence.(11) It turns out that uniformization theory can in fact be obtained using only L2 (S) bounds on the Gauss curvature K. Moreover, from the equation / div(Ωχ) / DK + ΩtrχK = div − 4(Ωtrχ), / we see immediately that an L2 (S) estimate on K can be obtained from L2 (S) flux type integrals of curvature. These flux integrals have the desired δ-dependence so as for the argument to close.

9. ENERGY ESTIMATES FOR CURVATURE It is well-known that for hyperbolic equations in more than 2 spacetime dimensions, estimates for the top order quantities must be in L2 on appropriate hypersurfaces, for all other norms would necessarily lose derivatives. In this section we will describe how to prove such estimates for curvature and its first and second derivatives. It is the latter that will in fact be the top order quantities in this approach. These estimates are of a geometric nature, and as we shall see will require precisely control on the connection coefficients in order to close. Thus, this and the previous section are in fact strongly coupled. 9.1. The energy method Let us first briefly recall the energy method for the most classical example, a scalar field ψ. We define the so-called energy-momentum tensor T[ψ] by 1 Tµν [ψ] = ∂µ ψ∂ν ψ − gµν ∇λ ψ∇λ ψ. 2 (11) An analogous difficulty was encountered in Bieri’s work [1], where, in view of the fact that only H 1 bounds of curvature were being assumed on the initial Cauchy hypersurface, one could in principle only hope for L4 (S) bounds on curvature. Thus, from pure regularity considerations, a version of uniformization was required assuming only L4 (S)-curvature bounds.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

282

M. DAFERMOS

If ψ satisfies the covariant wave equation g ψ = 0,

(51) then

∇µ Tµν [ψ] = 0. More generally, for g ψ = F, we have ∇µ Tµν [ψ] = F ∂ν ψ.

(52)

9.1.1. Multiplier vector fields. — Given a vector field V , we may now define a 1-form PµV [ψ] = Tµν [ψ]V ν as well as a scalar current

J V [ψ] = (V ) πµν Tµν [ψ] + F V ν ∂ν ψ, where

(V ) µν

π

denotes the so-called deformation tensor of V , defined by (V )

πµν = L V gµν .

The relation (52) gives the divergence identity V

∇µ PµV [ψ] = J [ψ]. Applying the divergence theorem, we obtain an identity Z Z V µ Pµ [ψ]n dσ∂R = J V [ψ]. ∂R

R

We note that the integrands of both boundary and bulk terms are of the same order of differentiability, quadratic in first derivatives. If V is timelike, and ∂ R consists of two homologous spacelike hypersurfaces Σ0 , Σ1 , then rewriting the above as: Z Z Z (53) PµV [ψ]nµ dσ∂R = J V [ψ] + PµV [ψ]nµ dσ∂R , R

Σ1

Σ0

the left hand side is now non-negative, by the general property (54)

T(V1 , V2 ) ≥ 0,

V1 , V2 causal, future-directed.

It is in fact a coercive quantity in all derivatives of ψ, where the coercivity constants are determined by the geometry of Σ1 and the choice of V . If we consider R defined by a suitable foliation Σt , t ∈ [0, 1], then Gronwall’s inequality allows one to use the above identity to estimate |ψ|H ˚1 (Σ1 ) ≤ C|ψ|H ˚1 (Σ0 ) ,

ASTÉRISQUE 352

(1051)

283

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

where C depends on the geometry of the foliation and the deformation tensor of the vector field V . This estimate is particularly simple when V is Killing and F = 0, for then J The relation (53) then represents Noether’s theorem.

V

= 0.

9.1.2. Commutation vector fields. — To obtain higher Lp bounds (including pointwise bounds), one must obtain energy estimates at a higher order of regularity. This is done by introducing so-called commutation vector fields. Note that if X is a vector field and g ψ = 0, then g (Xψ) = [g , X]ψ = F (∂ψ, ∂ 2 ψ). It is again the deformation tensor of X that enters in the coefficients of the expression F . Given now also a multiplier vector field V , we may apply identity (53) to Xψ to bound say Z PµV [Xψ] nµ Σ1

and more generally Z (55)

PµV [X1 · · · Xn ψ] nµ .

Σ1

To relate the quantity (55) to a higher order Sobolev norm of ψ, one needs to examine the coercivity properties of the expressions in various directions. The most immediate way to obtain coercivity in given directions is to include commutation vector fields Xi which span those directions.(12) These higher order energy estimates in turn lead to pointwise or higher Lp estimates for lower order quantities via Sobolev imbedding type theorems. 9.1.3. The vector field method. — The combined use of multiplier and commutation vector fields is behind both the local well-posedness and long time decay properties for linear and non-linear wave equations. When used to prove decay results, both the multiplier and the commutation vector fields have well-chosen weights. See Klainerman’s seminal [23] for how this approach captures the dispersive properties of (51) in a way sufficiently robust for applications to non-linear stability properties. This is the celebrated vector-field method.

(12)

One can also, however, sometimes use the equation (51) itself together with elliptic estimates to control directions which are not in the span of the commutation vector fields.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

284

M. DAFERMOS

9.2. The Bel Robinson tensor In the present work, one wishes to apply a version of the vector field method at the level of the Bianchi equations for the Riemann curvature tensor (cf. the discussion in Section 1.2). From the perspective of its algebraic structure, the Riemann curvature tensor is a special case of an object known as a Weyl field, a subclass of the set of covariant 4-tensors. The algebra and calculus of such fields are reviewed in Appendix 17.7. For a Weyl field W , we define the totally symmetric, trace free quadratic expression in W : Qαβγδ [W ] = (Wαµβν Wγ µδ ν + ∗ Wαµβν ∗ Wγ µδ ν )/2. This is the celebrated Bel Robinson tensor. If W satisfies the Bianchi equations (9), (10), then Q is divergence free ∇α Qαβγδ [W ] = 0. More generally, divQ [W ] = (W, J ), where J βγδ is a so-called Weyl current defined by (93). In analogy with (54), Q has the remarkable property (56)

Q(W )(V1 , V2 , V3 , V4 ) ≥ 0,

Vi causal, future-directed.

Thus Q can indeed be considered a close analogue to the T of Section 9.1. 9.3. Multiplier and commutation fields The approach of using an adaptation of the classical vector field method with the Bel Robinson tensor Q in the role of the energy momentum tensor T was first taken in the proof of stability of Minkowski space [12]. This will be the approach used here to obtain estimates. In analogy with the classical vector field method, one must first discuss the choice of multipliers and commutators. 9.3.1. Multiplier fields. — Let us first remark that, given a Weyl form W , to obtain a 1-form from Q[W ], in general we must contract with 3 vector field multipliers! P α [W ](V1 ,V2 ,V3 ) = −Qαβγδ [W ]V1β V2γ V3δ . How are these chosen in the present work? As multiplier fields, we shall always choose from L,

K

where K = u2 L. Note that these are both causal, and thus, in view of (56), they generate nonnegative definite boundary terms if the divergence theorem is applied in a region

ASTÉRISQUE 352

(1051)

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

285

bounded by spacelike or null hypersurfaces with the appropriate orientations. The weight u2 in K is essential to track the correct behavior with respect to u in the hierarchy. 9.3.2. Commutation fields. — As commutation fields we will take L,

S,

Oi

i = 1, 2, 3

where S = uL + uL, and Oi denote the so-called rotation fields. The latter are defined most directly in canonical coordinates simply as the standard rotations of the sphere S 2 . (See Chapter 8.3 of [9].) These will satisfy coercivity properties to be discussed below in Section 9.5. 9.4. Deformation tensors and connection coefficients As we shall see, just as in the classical vector field method, it is the deformation tensors of the multiplier and commutation vector fields which will appear in our energy identities. Thus, to estimate curvature, we will need in particular to estimate these deformation tensors. Since the vector fields are related to the null foliation, it should not be surprising that our deformation tensors can in turn be estimated by connection coefficients. Indeed, the deformation tensors of our multiplier and commutator vector fields are estimated in Chapters 8 and 9 of [9] from precisely the type of quantities estimated in Section 8. It is in this way that energy estimates are coupled to the estimates of Section 8. In particular, it is through this that the δ-hierarchy for connection coefficients (derived with the help of the curvature hierarchy) will re-couple with the estimates required to prove the propagation of the curvature hierarchy. We will discuss this in Section 9.10 in the context of the most difficult terms, the so-called borderline terms. 9.5. Aside: Sobolev inequalities and coercivity In analogy with our discussion of the classical vector field method, we know that for energy identities to give control on geometrically natural L2 quantities we need coercivity properties, e.g. properties of the form X / 2 + |ξ|2 ). | /L Oi ξ|2 + |ξ|2 ≥ C −1 (|u|2 |∇ξ| i

To moreover then get control on higher Lp , we need control on the relevant Sobolev constants, both on the spheres Su,u and the cones Cu , Cu . The issue of the Sobolev inequality on the spheres has in fact already been discussed in Section 8.3 and is addressed in Chapter 5 of [9]. The remaining issues are addressed in Chapters 10 and 11 of [9].

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

286

M. DAFERMOS

Recalling the discussion in Section 8.3, we emphasize that control on coercivity, Sobolev, etc., require at the very least some basic assumptions about the geometry of the spheres and cones. In the logic of the proof as described in Section 10, the basic bounds necessary for these must be included as bootstrap assumptions, and are finally recovered from the estimates proven. We have given already some flavour of the origin of this improvement in Section 8.3 above. We shall not comment further on this in the present section. 9.6. Table of Weyl fields used, and the notion of index Before proceeding, we collect here the complete list of Weyl fields to be used: Order

Weyl field W

0th order

R ˜L L R, ˜L O R, ˜L S R i ˜L L ˜L L R, ˜L O ˜L L R, ˜L O ˜L O R, ˜L O ˜L S R, ˜L S ˜L S R i i j i

1st order 2nd order

We will define the index ` of a Weyl field by the rule: `(W ) = ] of ˜L L operators in the above representation. The significance of the index will become clear in Section 9.7 below. 9.7. The (n)-stratification and the exponents of the short pulse hierarchy We now turn to what essentially is the heart of the whole method. We wish to capture at energy level the curvature hierarchy of Section 5.5. It turns out that the different δ-behavior of the various curvature components α, β, is distinguished precisely by the freedom of choosing different combinations of multiplier vector fields. (n)

This motivates the following: Given a Weyl field W , we define P [W ] for n = 0, 1, 2, 3 by (0)

P [W ] = P [W ](L, L, L), (1)

P [W ] = P [W ](K, L, L), (2)

P [W ] = P [W ](K, K, L), (3)

P [W ] = P [W ](K, K, K). The (n) above measures the number of K’s used as multipliers. Let us consider the case W = R. The point is now that for each n, different (n)

combinations of curvature components appear in the flux terms associated to P [R]. Thus, n provides a stratification of currents that will allow one to implement the

ASTÉRISQUE 352

(1051)

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

287

curvature hierarchy of Section 5.5. To be consistent with this hierarchy, it turns out that one must “assign” δ exponents to each n by the rule: (57)

q0 = 1,

q2 = −1/2,

q1 = 0,

q3 = −3/2.

We shall refer to the above qn as the exponents qn of the short pulse hierarchy. This assignment essentially captures the fact that, when applied to curvature (n)

W = R, we expect the boundary terms associated to P [R] in the energy identity to be like δ −2qn . Of course, we must apply currents not only with W = R but with higher order Weyl fields from the last two rows of our table in Section 9.6 above. But now, because ˜L L differentiates in the u direction, we expect quadratic quantities with index ` to be δ −2` worse than they would be otherwise. This motivates the definition: (n)

(58)

P =

X

(n)

δ 2` P (W ).

W

(In the case n = 3 we sum over all Weyl fields from our table in Section 9.6. In the cases n = 1, 2, we omit from the sum those containing an ˜L S in their representation.) With the inclusion of the index factor, all terms in the sum (58) have the same expected δ-behavior. In view of the above comments, we expect the boundary terms (n)

of P in the energy identity to be like δ −2qn .

9.8. The divergence identity In the previous section, we have successfully translated the δ-hierachy of curvature (n)

components in Section 5.5 into a δ-hierarchy for energy currents P , stratified by (n), and given by (57). (n)

We are now ready to apply the divergence theorem for each P , n = 0, . . . , 3.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

288

M. DAFERMOS

In the notation of (3.1), we will consider a domain as below

C

u

0

C

Cu

u

C0 Dc′

and integrate the divergence identity (n)

(n)

div P = τ

(59)

over the darker shaded region (where this is to be envisioned rotated around Γ0 ). Denoting by E the boundary term on Cu , F the boundary term on C u , and D the boundary term on Cu0 (“data”), we may write the resulting identity as: Z (60) E(u) + F (u) = τ dµg + D(u). In view of our hierarchy (57), let us define Ç (n)

E = sup δ

2qn

(n)

å

E (u) ,

u

Ç

(n)

F = sup δ

2qn

(n)

å

F (u) ,

u

the data terms: (n)

(n)

D = δ 2qn D (u0 ),

and finally (0) (1) (2) (3) (3)

(61)

P = max{ E , E , E , E , F }.

Our goal is thus to bound P using (60).

ASTÉRISQUE 352

(1051)

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

289

9.9. The excess index In view of (59) and the above definitions, we must estimate Z (n) (62) δ 2qn | τ |dµg ≤ O(δ 2e ) where e is the so-called excess index. If it were always the case that e > 0, then the estimates would immediately close for sufficiently small δ. For irrespectively of the non-linear dependence of the right hand side of (62) in P , we would have a smallness factor provided by δ 2e . On the other hand, if e < 0, then it would be hopeless to prove estimates, and the hierarchy would essentially be inconsistent. 9.10. The borderline terms The good news is that it turns out that e ≥ 0. The bad news, however, is that there are terms which appear on the right hand side of (59) for which one must take e = 0 in (62) These are the so-called borderline terms. To see these, let us examine the structure more carefully: For each choice of multiplier set and Weyl field W we have the identity (V2 ) divP [W ] = −(divQ)[W ](V1 , V2 , V3 ) − Qαβ παβ V1γ V3δ + · · · γδ [W ]

= τc + τm . For the first term above, recall divQ = (W, J ). For the fundamental Weyl field, namely curvature, J = 0. We see thus that the first term only arises because of commutation fields. The error term τc is thus introduced by the commutation fields, while the error term τm is introduced by the multiplier fields. The number of terms that arise is immense! We shall thus simply summarize the end result of very close case by case examination of all terms that arise (Chapters 13– 15 of [9]). Let us introduce the notation: (X)

π ˜ |Su,u = (X) i

and let (X)ˆi denote the trace free part. We stress again that, in view of Section 9.4, deformation tensors are estimated from connection coefficients and obtain their appropriate δ-behavior from there.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

290

M. DAFERMOS

9.10.1. Multiplier borderline terms. — For τm , borderline terms e = 0 occur only for n = 1 and n = 3. For n = 1, we have the borderline terms ((K) i, α(W ))ρ(W ),

(K i ∧ α(W ))σ(W )

where we now use the α notation, etc., to describe the decomposition of an arbitrary Weyl field. For n = 3, we have ((K) i, α(W ))ρ(W ),

(K i ∧ α(W ))σ(W ). (n)

9.10.2. Commutation borderline terms. — For τc , borderline terms occur only in the (1)

case n = 1 and 3, and moreover, they only occur in (X) J . In searching for borderline terms, one must be careful. The border line terms are not the principle terms. They are lower order (from the point of view of differentiability). Let us define ˆ Y) /J (X, Y ) = J (X, L, similarly /J . Let us decompose this as: /J = Θ − Λg/ + K/. In the case n = 1, we have Λρ(W ), Kσ(W ). In Λ, what gives rise to borderline terms is trχ((X)ˆi, α), whereas in K, it is the expression trχ(X)ˆi ∧ α. In the case n = 3, we have (Θ, α(W )), and the borderline terms in Θ are trχ(ρ(X)ˆi − σ ∗(X)ˆi). 9.11. The reductive structure And here we have arrived at what is the most amazing and unexpected aspect of the structure! The borderline terms as identified in Section 9.10 are cooperative with the stratification introduced in Section 9.7 in a remarkable way: Despite the fact that the system (n)

of inequalities satisfied by the E is still non-linear, it can be solved reductively so as to grow (modulo terms lower order in δ) sublinearly.

ASTÉRISQUE 352

(1051)

291

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

(0) (2)

We have already seen that for E , E there are no borderline terms, hence: (0)

(0)

E ≤ D + 1,

(63)

(2)

(2)

E ≤ D + 1.

(64) (1)

Since borderline terms for E (as identified in the previous section) are linear in α, this leads to an inequality of the form below: … … … (1)

(65)

(0)

(1)

E ≤ D +C

(1)

(0)

E+ E

E

(1)

(2)

E +1

(0) (2)

which while non-linear, is sublinear in E , given E , E . (n)

(As an exercise the reader may want to examine how terms α appear in the E , in view of the definitions of Section 9.7). Similarly, … … … (3)

(66)

(0)

(3)

F ≤ D +C

(1)

(2)

E+ E

E

(3)

F.

The system closes! We can also estimate now (3)

(67)

(3)

E ≤ D + ...,

which has in fact decoupled from the rest. We have bound the quantity P of (61)!

10. THE LOGIC OF THE PROOF With the discussion of the bounds on the connection and on curvature in the above two sections, we have given an overview of all the main ideas from the point of view of analysis behind the proof of Theorem 3.1. As discussed, however, already in Section 7, in the context of the logic of the proof of Theorem 3.1, the estimates of Sections 8 and 9 collectively represent only one (but by far the most important!) step of a continuity argument, where a region defined by a collection of bootstrap assumptions is successively enlarged. Specifically, the estimates of the above mentioned Sections 8 and 9 correspond to the step: “improving the bootstrap assumptions”. We turn in this section to discuss in more detail the structure of the actual continuity argument.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

292

M. DAFERMOS

For the experts, we note that the continuity argument requires particular care because the framework for “local existence” is different from that used to prove estimates. This is handled in [9] in complete detail and with considerable technical artistry; in fact, the set-up used serves as a model for the careful treatment of these issues. For the reader’s convenience, we have specific page references to the various steps of the argument.

10.1. The set A Let us recall the notation Mc of Section 3.1, for a general c ∈ (u0 , −1]. Let us also recall the notation P from (61). We begin with a definition

Definition 10.1. — Let data be fixed and let A be the set of real numbers c ∈ (u0 , −1], such that 1. We have smooth solution in canonical coordinates on Mc \ Γ0 and such that M0 \ Γ0 is Minkowski. Moreover for c > u0 + δ, the solution extends smoothly to the outer boundary u = δ. 2. A collection of boostrap assumptions(13) hold on Mc (necessary for Sobolev inequality, coercivity inequalities, and some additional ones necessary for comparison of energies). 3. (0) (1) (2) (3)

P ≤ G( D , D , D , D )

(68)

for a function G to be discovered(14) in the course of the proof.

(13)

These are the bootstrap assumptions, proper, and are collected in Chapter 12, p 413 of [9]. We shall refer more generally to these assumptions together with (68) as “bootstrap assumptions”. (14) See formulas (16.16), (16.18) and (16.25) of [9].

ASTÉRISQUE 352

(1051)

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

293

In Section 3.1, note that we depicted Mc only in the case c ≥ u0 + δ. If c < u0 + δ, Mc is the region obtained by rotating the region Dc depicted below:

u u

=

=

0

δ u u

=

Dc′ (D0′ )c

0

u+u =c

10.2. A 6= ∅ Let us note that by appealing to Rendall’s local well-posedness result, Theorem 1.2, one can solve the characteristic initial value problem for smooth initial data in a small neighborhood of S0,u0 . Using the implicit function theorem and compactness, then one can write the solution in the gauge of Section 3.1 in a region Mc for some c > u0 : u = δ

u = 0 u + u = u0 + ǫ

u

=

u

0

(D0′ )u0 +ǫ

Rendall

Moreover, the bootstrap assumptions corresponding to 2. in the definition of A as well as (68) can be seen to hold by continuity, for some c > u0 (depending on the data). We have shown thus Proposition 10.2. — A is non-empty.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

294

M. DAFERMOS

10.3. Semi-global existence Set c∗ = sup A . Theorem 3.1 in fact follows from the following: (n)

4

D1 , Theorem 10.3. — If δ is suitably small depending on D , n = 0, 1, 2, 3,; D∞ 0 , / 4 /D2 (trχ), /D3 (trχ),(15) then c∗ = −1 ∈ A . The proof is by continuity. One shows that if c ∈ A with c ≤ 1, then there exists an  such that c +  ∈ A . Let us first describe the argument if c > u0 + δ, which is somewhat simpler. 1. The first (and by far most important and difficult!) step is to improve the bootstrap assumptions corresponding to 2. and the assumption (68). All together, this concerns Chapters 3–Chapter 16.1 of the work! More precisely, the logical order of this big step is as follows: (a) One first notes that, essentially since the bootstrap assumptions are defined by ≤, c∗ ∈ A and the solution is defined in Mc∗ . Given the bootstrap assumptions corresponding to 2., one can control the the coercivity and Sobolev constants allowing the energy fluxes defining P to be comparable to geometric L2 bounds, etc. This is Chapters 10 and 11. (For instance, at ∞ this stage we can estimate R 0 appearing on the right hand side of (43) in terms of P .) (b) The estimates on the connection (Chapters 3–7, discussed here in Section 8) then apply in Mc∗ . The bounds on the connection then allow for control of the deformation tensor of the multiplier and commutation vector fields (Chapters 8–9). Moreover, as suggested for instance in the discussion of Section 8.3, the retrieved bounds are such that all the bootstrap assumptions of 2. can then be improved. (c) We now apply the divergence identity of Section 9.8 as in Section 9.8, and the reductive structure of the system of inequalities (63)–(67) allows us to improve inequality (68) for P , say by a factor of 1/2, for proper choice of the function G. This is Chapters 12–16.1. 2. Because one will apply existence theorems that are most cleanly stated in the smooth category, it is necessary to first show uniform estimates in Mc∗ for all higher norms. These estimates are now essentially linear. This is the entirety of Chapter 16.2. 3. One now can use this to show that the solution extends smoothly to u + u = c∗ and a smooth initial data set can be constructed for the reduced Einstein system. See Chapter 16.3, pp. 551–55. (15)

These are all initial data quantities and bounded by a positive continuous increasing function of M8 .

ASTÉRISQUE 352

(1051)

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

295

4. It is convenient to extend the data so that the interesting part of the data is contained in a compact set. The extension need not satisfy the constraints. See Chapter 16.3, pp. 555-56. 5. One then solves the reduced Einstein equations following Choquet-Bruhat (cf. Section 1.1.4). In the domain of dependence of the interesting part of the data, this is a genuine smooth solution of the Einstein equations as in Theorem 1.1. See Chapter 16.3, pp. 556–59. 6. Using the implicit function theorem, one can express a suitable part of this solution in the double null gauge of Section 3.1 and attach smoothly to Mc∗ . See Chapter 16.3, pp. 559–69. 7. Compactness shows that this attachment covers some Mc∗ + , with  > 0, and since the bootstrap assumptions were improved in step 1, by continuity they still hold, for  suitably small. See Chapter 16.3, pp. 570–71. The above steps are depicted below: 5. Choquet-Bruhat in harmonic coordinates 6. Attach subset of domain of dependence using implicit function theorem

4. Extend (constraint violating) so that data compact subset

7. Compactness implies ǫ > 0, and bootstrap assumptions still hold u

u + u = c∗ + ǫ

= δ

u + u = c∗

(Σ, g¯, K)

u =

0

u

=

Dc′ ∗

0

u

3. Extract smooth data with respect to harmonic coord. system

1. Improve bootstrap assumptions

2. Show uniform smooth bounds

Let us note that the earlier stages of the openness argument (corresponding to c∗ < u0 + δ) require an extra step, as the curve U + u = c∗ has not met the boundary u = δ. This extra step is provided by appealing to Rendall’s local existence Theorem 1.2 after step 6 in the above outline, just as in the proof of Proposition 10.2 above, and again appealing to the implicit function theorem and continuity for the construction

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

296

M. DAFERMOS

of the gauge. This is illustrated below:

u

0

δ

=

=

u

Choquet-Bruhat

u + u = c∗

Dc′ ∗

u

=

u

0

Rendall

See Chapter 16.3, pp. 569–70.

11. THE KLAINERMAN-RODNIANSKI RELAXED HIERARCHY Christodoulou’s short pulse method has been revisited in a more recent and very insightful approach to the problem by Klainerman-Rodnianski [27, 26]. Let us make some very brief comments about this approach. The essential idea is to slightly relax the “short pulse hierarchy” of Section 5.5, to a less precise hierarchy, in a way which, though at first appears quite unnatural from the perspective of the behavior of ψ under the ansatz of Section 5.1, is suggested by a certain scaling property of the Einstein equations that the authors introduce. At the level, say, of energy estimates for curvature as in Section 9, these scaling properties then provide a systematic approach to predicting the excess index e (see Section 9.9) of the non-linear terms which appear in the error terms τ (see (62)): For each arising term acquires a well-defined notion of signature which must be respected by the Einstein equations. This is a very important point, because, in practice, enumerating and analyzing all terms leading to the final conclusions summarized in Section 9.10 constitutes much of the work. A family of relaxations of the original hierarchy are in fact possible. In this context, the authors first consider a certain subcritical hierarchy (with respect to their scaling). This hierarchy can be shown to propagate following the scheme outlined in Sections 8 and 9 above, without having to enumerate carefully the structure of every nonlinear term arising in τ , as scaling and signature arguments ensure e > 0 and thus the absence of borderline terms.

ASTÉRISQUE 352

(1051)

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

297

The propagation of this hierarchy allows one to state a semi-global existence theorem in the style of Theorem 3.1, for fixed u0 , again allowing large amplitude initial data. This can be used, for instance, to prove a theorem on the formation of prescarred surfaces, that is to say surfaces S such that trχ < 0 only in some proper open subset U ⊂ S.(16) This subcritical scaling, however, is not compatible with the assumptions necessary for bona-fide trapped surface formation, which requires a large initial amplitude spread out over all directions of the sphere. This difficulty can be overcome in the Klainerman-Rodnianski approach by slightly modifying the above relaxed hierarchy yet again, now allowing for certain violations of scaling. These are termed anomalies. As in Section 9.10, these anomalies will indeed give rise to borderline terms in the energy estimates, and one will need again to identify a reductive structure as in Section 9.11. There are far fewer such terms, however, and these are easier to systematically analyze. An added simplification of the Klainerman-Rodnianski approach is that the whole argument is closed at one lower order of differentiability. In particular, one can cross off the entire lower line of the table of Section 9.6. This also leads to considerable simplifications, which of course translate to only requiring rougher control of the connection coefficients in Section 8. There is of course, a price to be paid for this: Since the hierarchy is weaker and less geometrically motivated, one obtains less control of solutions than is obtained in the original approach. Nonetheless, control is sufficient to obtain the most basic geometrical conclusions. These ideas have since been extended to the problem of trapped surface formation for the Einstein-Maxwell equations by P. Yu [43]. Yet another approach to Christodoulou’s short pulse method applied to the vacuum equations, using the wellknown first order symmetric hyperbolic reformulation due to H. Friedrich [18], is given in [37].

12. APPLICATIONS TO THE INCOMPLETENESS THEOREMS The motivation for the notion of a trapped surface is its intimate relation with the incompleteness theorem, Theorem 0.1. In particular, we would certainly like to apply the result of Theorem 2.1 to derive analogous incompleteness statements for our own initial value problem. So far, we have only considered initial data up to advanced time u = δ. As the initial data is incomplete, the development will also be, but trivially so. (16)

In connection to such surfaces, see also the comments in the last paragraph of p. 581 of Chapter 17 of [9].

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

298

M. DAFERMOS

To make a sensible statement about incompleteness, we must first complete our choice of initial data! Fortunately, there is in fact an explicit construction of complete initial data (see Chapter 17, p. 579 of [9]) on Co by extending ψ appropriately (note one must ensure that the data is regular—cf. Section 4.2.2). For such data, we note then an immediate corollary of Theorem 2.1 and Penrose’s incompleteness theorem(17): Corollary 12.1. — Let ( M , g), be the maximal development of complete initial data on Co , satisfying the assumption of Theorem 2.1. Then ( M , g) is future causally geodesically incomplete. Given a suitable choice of complete data which is moreover asymptotically flat in a suitable sense, one can show that the solution exists for at least a finite retarded + time (See [10, 24]). This allows one to define a notion of future null infinity I as in [12, 10, 24]: +

I

Sδ,−1−δ

C

o



C0 o

The proof of Theorem 0.3 still applies in this context, and thus we obtain Corollary 12.2. — Let ( M , g), be the maximal development of complete initial data + on Co , satisfying the assumption of Theorem 2.1. Then Sδ,−1−δ ∩ J − ( I ) = ∅. In particular, the spacetime M contains a black hole region B in the sense of definition (2).

(17)

This theorem also holds when the assumption of a Cauchy hypersurface is replaced by the assumption of having a complete null.

ASTÉRISQUE 352

(1051)

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

13. DATA AT PAST NULL INFINITY I

299



The estimates of the hierarchy are such that one can immediately take the limit of the statement of Theorems 2.1 and 3.1 as u0 → −∞. Specifically, for a sequence of ui0 → −∞, one considers a sequence of initial data on Cu0 defined by a fixed δ and fixed seed function ψ0 . Γ0 e

I



C0

i+

Applying the estimates of the hierarchy, noting that we have also estimates at all orders, it follows immediately by Arzela-Ascoli that there exists a subsequence which converges to a smooth solution of the Einstein equations. Moreover, in view of the uniformity of the estimates in u0 , this limiting solution − is such that one can attach a past boundary I , to be thought of as past null infin2 ity, and for which the limiting data |u| e(u, u, ϑ) converge to what is denoted in [9] by e∞ (u, ϑ) and which is just the past null infinity analogue of the square of the radiative amplitude Ξ(u, ϑ) defined in [12]. This has the interpretation of incoming − radiative power per unit solid angle and its integral along the null generators of I for fixed ϑ thus corresponds to incoming radiative energy per unit solid angle (cf. the quantity (15) in the context of the discussion of the memory effect). We thus obtain: Theorem 13.1. — Let 0 < l < 1 < k be constants. Let us be given smooth asymptotic initial data at past null infinity which is trivial for advanced times u ≤ 0. Suppose that the incoming energy per unit solid angle in each direction in the advanced time interval

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

300

M. DAFERMOS

[0, δ] is not less than k/8π. Then if δ is suitably small, the maximal development(18) of the data contains a closed trapped surface S which is diffeomorphic to S 2 and has area Area(S) ≥ 4πl2 .

See Chapter 17, pp. 580–81 of [9].

14. COMPLETENESS OF FUTURE NULL INFINITY AND APPROACH TO KERR

The given definition (2) of the notion of black hole, though intimately connected with Theorem 0.3, is in fact in reality too general. For instance, if we imagine Minkowski space minus the future of two distinct points, say both on the Euclidean subset R3 ⊂ R3+1 : R3+1 \ (J + (p) ∪ J + (q)), then this is a globally hyperbolic spacetime containing a black hole, according to definition (2). Of course, the above spacetime is not a maximal Cauchy development. On the other hand, one could easily imagine a maximal Cauchy development with two “first singularities”, resulting in a causal geometry broadly similar to the above. +

An additional distinguishing property of the future null infinity I attached to + Schwarzschild or Kerr, is that I is complete. This essentially means that the null + generators of I can be continued to both future and past to arbitrary values of affine parameter, or, alternatively, in the setup of Theorem 1.3, that it is naturally parametrized as (−∞, ∞) × S 2 . −

Now, if one takes the data to the limit on past null infinity I as in Section 13 above, then, using ideas from the stability of Minkowski space, one can easily show the + past completeness of future null infinity I (and the existence of an asymptotically flat Cauchy surface Σ).

(18)

We note that the uniqueness statement implicit in the characterization of the above as the maximal development of data prescribed at I + follows from work of Friedrich [18].

ASTÉRISQUE 352

(1051)

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY



+

I

Sδ,−1−δ

301

I−

C

o

Σ

o

i− +

Thus, in what follows, we need only consider the issue of future completeness of I . Physically, this is the statement that asymptotic observers in the radiation zone can observe ad infinitum. +

+

Now it is widely believed that if I is complete and J − ( I ) 6= ∅, then the + metric in J − ( I ) will eventually asymptote to the exterior of a collection of Kerr black holes, each rapidly moving away from the other. Here, however, we confront a fundamental difficulty. For, even if we were to start with Cauchy data arbitrarily close + to Schwarzschild or Kerr, it is unknown whether the resulting I is complete. Nonetheless we have the following conjecture Conjecture 14.1 (Nonlinear stability of the Kerr family). — Let |a| < M ,(19) let ( M , ga,M ) denote the globally hyperbolic region of a subextremal Kerr manifold with two ends, and let Σa,M denote a Cauchy hypersurface. Let (Σ, g¯, K) be vacuum initial data suitably close to Kerr data on Σa,M . Let ( M , g¯, K) denote its Cauchy + development. Then one can attach to M an appropriate asymptotic boundary I + + + + (with two connected components!) I A , I B , such that both I A , I B are complete and + + such that g asymptotes in J − ( I A ) and J − ( I B ) to nearby subextremal Kerr metrics gaA ,MA and gaB ,MB with aA , aB close to a, and MA , MB close to M . (19)

The Kerr family depends on two parameters, mass M and specific angular momentum a, and the black hole case is |a| ≤ M . The so called extremal case |a| = M is special and is best excluded from the conjecture. See [14, 13] for background.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

302

M. DAFERMOS

+

The above is more than just the statement of completeness of I ; it is the statement of asymptotic stability of the Kerr family. The point is, however, that, for supercritical quasilinear wave equations like the Einstein equations, these problems appear to be necessarily coupled. Thus, one does not expect to be able to prove the completeness property without understanding, quantitatively, the dispersion mechanism to a nearby Kerr. Even the linear scalar aspects of the dispersive properties of waves on Kerr black hole backgrounds—a necessary prerequisite if Conjecture 14.1 is ever to be addressed, have only recently been understood. See [14, 13] for a survey and many references. Returning now to the problem at hand, even though understanding the global + properties of J − ( I ) in the context of the initial data considered here is not strictly speaking a stability problem, it may be that a resolution of the above conjecture nonetheless opens the way to its solution as well, in conjunction of course with an extension of the short pulse hierarchy to the whole exterior region. One can thus also conjecture: −

+

H

Sδ,−1−δ

o

I



C o

i−

ASTÉRISQUE 352

+

Σ

I



H+

Conjecture 14.2. — For suitable completions of the initial data on Co (or I ) + as in Section 12 (or 13), then future null infinity I is complete and the geometry + in J − ( I ) asymptotes to a subextremal Kerr geometry gM,a .

(1051)

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

303

15. EPILOGUE: WEAK COSMIC CENSORSHIP An even more ambitious problem than showing the completeness of null infinity for the particular case of data as in Conjectures 14.1 or 14.2 is the following Conjecture 15.1 (Weak cosmic censorship). — For generic asymptotically flat vacuum initial data, the maximal development possesses a complete future null + infinity I . This is one of the great open problems of classical relativity! In view of Theorem 0.1, one should view the above conjecture as the remaining analogue of the problem of global existence in general relativity. In the original formulation of the above, due to Penrose, the caveat generic was not included. Christodoulou then showed [5] that for the analogue of the above problem for the self-gravitating scalar field under spherical symmetry, i.e. the study of spherically symmetric solutions to: (69) (70) (71)

1 Ricµν − Rgµν = 8πTµν 2 g ψ = 0 1 Tµν = ∂µ ψ∂ν ψ − gµν ∂ µ ψ∂ν ψ, 2 +

then there exist regular asymptotically flat initial data for which I is incomplete! (These examples satisfy also B = ∅.) We say that collapse has formed a naked singularity. Let us note that naked singularities have long been known to form when (69) is coupled to certain other type of matter models. For instance, again Christodoulou [3] in 1984, showed that the Oppenheimer-Snyder model of gravitational collapse of a homogeneous spherically symmetric ball of dust [33] is in some sense unstable to the formation of so-called shell-focusing naked singularities of infinite density.(20) It is widely thought that this behavior is an artifice of the unrealistic equation of state. The case of the scalar field, however, is different. Scalar field matter ψ satisfies a linear equation (70) when g is considered frozen, so does not form singularities + “on its own accord”, and radiates to I just as with gravitational waves. Thus, the occurrence of naked singularities for the scalar field model (69)–(71) strongly suggests that similar phenomenon could happen in principle in the vacuum (1). (20)

This is somewhat ironic because the notion of black hole was first really accepted on the basis of this model!

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

304

M. DAFERMOS

Indeed, the main motivation for considering (69)–(71) is precisely as a “poor man’s” vacuum equations (1) which can be studied in spherical symmetry.(21) Remarkably, Christodoulou was able to show [6]—again in the context of the scalar field model (69)–(71) under spherical symmetry—that the previously constructed naked singularities [5] are unstable to perturbation of initial data, in fact all naked singularities are unstable, and that the analogue of Conjecture 15.1, as now formulated with the caveat generic, thus holds. In fact, something stronger is shown, namely + that the set of data leading to an incomplete null infinity I have codimension at least 1 (in a suitable sense) in the space of all spherically symmetric data. The key to proving Conjecture 15.1 for the (69)–(71) under spherical symmetry was proving that for such generic data, all “first singularities” are preceded by trapped surface formation. This notion of “first singularity” can be formalized in the language of terminal indecomposable past sets. See [21]. This motivates conjecturing a similar property for the vacuum: Conjecture 15.2 (Trapped surface conjecture [7]). — For generic asymptotically flat initial data (Σ, g¯, k) the maximal development ( M , g) has the following property. If P is a terminal indecomposable past set with P ∩ Σ of compact closure, then any open domain Σ ⊃ D ⊃ P ∩ Σ has the property that the domain of dependence of D in M contains a closed trapped surface. The above conjecture would in fact imply (see [7]) a suitable formulation of Conjecture 15.1 for the Einstein vacuum equations (1). It is of course a long way from the very specific setup of Theorem 2.1 to a general understanding of how and when trapped surfaces form. Again, however, the spherically symmetric case suggests that statements quite similar to Theorem 2.1 may be unexpectedly useful for the general problem. One should of course be weary of naively extrapolating from symmetric cases, where the very nature of the analysis is fundamentally simpler. On the other hand, the idea that a statement like Theorem 2.1, a large-data result for the vacuum equations, could be proven in the absence of symmetry assumptions would have seemed completely unrealistic only 5 years ago. Thus, the framework of Theorem 2.1 together with its revolutionary proof, while special, at the very least allow us to hope that, indeed, the above conjectures may one day be part of the realm of mathematical analysis.

(21)

Note that Birkhoff’s theorem (cf. [21]) says that spherically symmetric vacuum solutions are necessarily Schwarzschild.

ASTÉRISQUE 352

(1051)

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

305

16. ACKNOWLEDGEMENTS This exposition would not have been possible in its current form without my having attended the series of lectures given by Demetrios Christodoulou at MSRI in September 2009, at a one-week “Hot topics workshop” dedicated in its entirety to [9]. Several sections of this exposition (e.g. Section 4.1, Sections 9.2–9.11) owe their general structure to his own presentation. The presentation in Section 11 is in turn inspired by the beautiful talk of Igor Rodnianski at the same event. I am grateful to both, not only for these lectures, but also for the many wonderful conversations we have had over the years. The point of view expressed in this exposition owes much to those discussions. The above lectures are in fact available online at http://www.msri.org/web/ msri/scientific/workshops/hot-topics-workshops/show/-/event/Wm515 and are recommended in the strongest of terms for all who wish to learn more about this work.

17. APPENDIX All concepts will refer to the double null foliation defined in Section 3.1. 17.1. The algebra calculus of S-tensor fields S-tensor fields are defined as follows: ξ is an S 1-form on M if ξ(L) = ξ(L) = 0. (Thus ξ is in fact specified by a smooth choice of 1 form on Su¯,u for each Su¯,u .) A vector field V is an S-vector field if it is tangent to Su¯,u ). The notion then generalizes to higher order tensors. Let us also define the following operation: Let θ be a 2-covariant S-tensor field. Let eA be a local frame field for Su,u . Define θ] by (θ] )AB = θAC (g/−1 )CB . This is a T11 S-tensor field. Note that g(X, θ] Y ) = θ(X, Y ) for any X, Y ∈ Tp Su,u . Now given two such objects θ, φ, define the 2-covariant S-tensor field θ × φ by θ × φ = g(θ] , φ] ),

i.e.

(θ × φ)AB = θAC φBC .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

306

M. DAFERMOS

For two S 1-forms ξ, ξ 0 , we denote by (ξ, ξ 0 ) the inner product of the 1-forms with respect to g/, ]

(ξ, ξ 0 ) = g/−1 (ξ, ξ 0 ) = g/(ξ ] , ξ 0 ),

|ξ| = (ξ, ξ)1/2

ˆ 0 the symmetric trace-free 2-covariant S tensor field defined while we denote by ξ ⊗ξ by ˆ 0 = ξ ⊗ ξ 0 + ξ 0 ⊗ ξ − (ξ, ξ 0 )g/. ξ ⊗ξ Similarly, for a symmetric 2-covariant tensor field θ and an S 1-form ξ, we define ˆ = θ ⊗ ξ + θ⊗ξ ˜ − θ] · ξ g/. θ⊗ξ This is symmetric and trace free in the last two indices. The ˜ denotes transposition. 17.1.1. D and D. — We define the operators D, D on S-tensor fields. If X is an S-vector field, L L X = [L, X] is also an S-vector-field. We define DX = L L X. On the other hand, if ξ is an S 1-form, then Dξ is the restriction of L L ξ to T Su¯,u . Similarly for D. For a Tpq S-tensor field θ, we denote by Dθ the expression defined by considering θ on each Cu as extended to T Cu by the condition that it vanishes if one of the entries is L, and restricting to T Su,u of the Lie derivative of this object with respect to L. Similarly we define D. ˆ and Dθ ˆ to equal the trace-free parts of Dθ, Dθ. ˆ Finally, we set Dθ / ∇, / and all that. — For S-vector fields, div, / curl / are self-explanatory, / curl 17.1.2. div, / operating on arbitrary S-forms. as is d / X Y = Π∇X Y , where Π is the projection to For S vector fields X, Y , we define ∇ the tangent space of the surfaces. / to be the S 1-form: For a two-covariant S tensor field θ, we define divθ A

] / B =∇ / A θB divθ .

17.2. The connection coefficients Recall from Section 3.1 the basic quantities at the level of the metric: g/, Ω. Recall also the three null frames of Section 3.1.2. Here we define the connection coefficients χ, χ, η, η, ω, ω.

ASTÉRISQUE 352

(1051)

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

307

17.2.1. The second fundamental forms χ, χ. — We define χ to be the intrinsic second fundamental form of Cu and χ the intrinsic second fundamental form of C u . Specifically, χ is a symmetric 2-tensor field on Cu defined by ˆ Y ). χ(X, Y ) = g(∇X L, ˆ where P X ∈ Tp Su,u . We Now, any vector X ∈ Tp Cu may be decomposed as P X + cL see easily that χ(X, Y ) = χ(P X, P Y ). This makes χ an S-tensor field. ˆ L ˆ are replaced by L0 , L. Note that these It is useful to define also χ0 , χ0 where L, are related by χ0 = Ω−1 χ, χ0 = Ω−1 χ. 17.2.2. The torsion ζ (and torsion forms η, η). — We define an S 1-form ζ by ζ(X) =

1 ˆ L), ˆ g(∇X L, 2

X ∈ Tp Su,u .

ˆ and L, ˆ we define ζ. We see immediately that ζ = −ζ. Reversing the role of L For a given Cu , it is more natural to look at the torsion of Su,u with respect to the geodesic parametrization. We can define η(X) =

1 g(∇X L0 , L), 2

η(X) =

1 g(∇X L0 , L). 2

We have / log Ω, η =ζ +d

/ log Ω. η = −ζ + d

/ log Ω. Thus, if one controls both η, η, one controls both ζ and d The geometric meaning of the torsion: [L, L] is the S tangential vector field: [L, L] = 4Ω2 ζ ] . This is precisely the obstruction to integrability of the distribution spanned by L, L, i.e. of the orthogonal complement of Tp Su,u . 17.2.3. The quantities ω, ω. — We define finally ω = D log Ω,

ω = D log Ω.

17.3. The curvature in a null frame The non-zero components of the curvature tensor of a Ricci flat metric are the following (72) (73)

ˆ Y, L) ˆ α(X, Y ) = R(X, L, β(X) =

1 ˆ L, ˆ L) ˆ R(X, L, 2

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

308

(74) (75)

M. DAFERMOS

1 ˆ ˆ ˆ ˆ R(L, L, L, L) 4 ˆ L, ˆ X, Y ) σ /(X, Y ) = R(L, ρ=

1 ˆ L) ˆ ˆ L, R(X, L, 2 ˆ Y, L) ˆ α(X, Y ) = R(X, L, β(X) =

(76) (77) where α and α are trace free.

17.4. The structure equations of a null foliation 17.4.1. The first variation equations. — We have Dg/ = 2Ωχ,

Dg/ = 2Ωχ.

17.4.2. The second variation equations. — We have (78)

Dχ0 = Ω2 χ0 × χ0 − α

(79)

Dχ0 = Ω2 χ0 × χ0 − α.

17.4.3. The torsion equations. — We have (80)

Dη = Ω(χ] · η − β)

(81)

Dη = Ω(χ] · η + β)

1 χ∧χ−σ 2 1 / = − χ ∧ χ + σ. (83) curlη 2 17.4.4. The Codazzi equations. — We have

(82)

/ = curlη

(84)

/ 0−d /trχ0 + χ0 ] · η − trχ0 η = −Ω−1 β divχ

(85)

/ 0−d /trχ0 + χ0 ] · η − trχ0 η = Ω−1 β. divχ

Note that the equations involving χ and χ are not mutually coupled, while those involving η and η are. On the other hand, the latter are linear in η and η. 17.4.5. Propagation equations for ω, ω. — We have (86)

Dω = Ω2 (2(η, η) − |η|2 − ρ)

(87)

Dω = Ω2 (2(η, η) − |η|2 − ρ).

17.4.6. The Gauss equation. — Let K denote the Gauss curvature of g/. Then 1 1 K + trχtrχ − (χ, χ) = −ρ. 2 2

ASTÉRISQUE 352

(1051)

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

309

17.4.7. The remaining propagation equations. — These are: 1 › / + ∇η / + 2η ⊗ η + (χ × χ + χ × χ) + ρg/) (88) D(Ωχ) = Ω2 (∇η 2 1 › / + ∇η / + 2η ⊗ η + (χ × χ + χ × χ) + ρg/). D(Ωχ) = Ω2 (∇η (89) 2 17.5. The Einstein equations from the structure equations The Einstein equations imply trα = 0, thus, from (78), we obtain Dtrχ0 = −Ω2 |χ0 |2 .

(90)

ˆ L) ˆ = 0. This thus represents Ric(L, We can eliminate β, β in the torsion equations by using the Codazzi equations. The ˆ X) = 0, Ric(L, ˆ X) = 0. torsion equations then become the Einstein equations Ric(L, We may eliminate ρ from (86) using the Gauss equation to obtain: ˆ L) ˆ = 0. Ric(L, For the remaining Einstein equation Ric(X, Y ) = 0, for X, Y ∈ Tp Su,u , we eliminate ρ from (88), using the Gauss equation. 17.6. Bianchi identities

(91)

(92)

 ˆ − 1 Ωtrχα + 2ωα + Ω −∇ ˆ − (4η + ζ)⊗β ˆ + 3χρ / ⊗β Dα ˆ + 3∗ χσ ˆ = 0, 2  ˆ − 1 Ωtrχα + 2ωα + Ω ∇ ˆ + 3ˆ ˆ + (4η − ζ)⊗β / ⊗β Dα χρ − 3∗ χ ˆ σ = 0, 2  3 / − (η ] + 2ζ ] ) · α = 0, Dβ + Ωtrχβ − Ωχ ˆ] · β − ωβ − Ω divα 2  3 / − (η ] − 2ζ ] ) · α = 0, Dβ − Ωtrχβ − Ωˆ χ] · β − ωβ + Ω divα 2  1 /ρ + ∗ d /σ + 3ηρ + 3∗ ησ + 2χ Dβ + Ωtrχβ − Ωχ ˆ · β + ωβ − Ω d ˆ] · β = 0, 2 © ¶ 1 /ρ − ∗ d /σ + 3ηρ − 3∗ ησ + 2ˆ Dβ + Ωtrχβ − Ωχ ˆ · β + ωβ + Ω d χ] · β = 0, 2 ™ ß 3 1 / + (2η + ζ, β) − (ˆ Dρ + Ωtrχρ − Ω divβ χ, α) = 0, 2 2 ß ™ 3 1 / + (2η − ζ, β) + (χ, Dρ + Ωtrχρ + Ω divβ ˆ α) = 0, 2 2 ß ™ 3 1 / + (2η + ζ, ∗ β) − χ Dσ + Ωtrχσ + Ω curlβ ˆ ∧ α = 0, 2 2 ß ™ 3 1 ∗ / + (2η − ζ, β) + χ Dσ + Ωtrχσ + Ω curlβ ˆ ∧ α = 0. 2 2

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

310

M. DAFERMOS

17.7. Weyl fields and Weyl currents A Weyl field on a general 4-dimension Lorentzian manifold ( M , g) is a tensor field on M with the same algebraic properties of the Weyl curvature tensor: Wβαγδ = Wαβδγ = −Wαβγδ , Wα[βγδ] = 0, (g −1 )µν Wµανβ = 0. Note that for a Weyl field W , we have that a left dual ∗W and a right dual W ∗ coincide and again define Weyl fields. We have ∇α Wαβγδ = J βγδ .

(93)

J βγδ inherits algebraic properties from W which define the notion of Weyl current. The above can be thought of as an analogue of (one part of) the Maxwell equations. In fact, for a Weyl field, the above is equivalent to ∗

∇[α, Wβγ]δ = µαβγ J µδ . Note that if W is a Weyl field, then in general L X W will not be a Weyl field because it will not be trace free. This can be remedied by introducing a modified ˜L X W . This moreover satisfies ∗ ˜L X W = ˜L X ∗ W . ∗ Similarly, for Weyl currents J , we define L X J satisfying ∗ ˜L X J = ˜L X J . Note the conformal property: Suppose on ( M , g), (W, J ) is a Weyl pair. Then 0 0 defining the rescaled metric g 0 = Ω−2 g, W 0 = Ω−1 W , J = Ω J , then (W 0 , J ) is a Weyl pair on ( M , g 0 ). As a consequence of the conformal property, we have ∇α ( ˜L X W )αβγδ = (X) J βγδ (W ) where (X)

J βγδ (W ) = ( ˜L X J )βγδ +

3 X

(i) (X)

J βγδ

i=1

and where (1) (X)

J βγδ =

1 (X) µν π ˜ ∇µ Wνβγδ , 2

(3) (X)

J βγδ =

J βγδ =

1 (X) Pµ ∇µ W µβγδ 2

ä 1 ÄX qµβγ W µνγδ + X qµγν W µβ νδ + X qµδν W µβγν . 2

Remarkably, q is again a Weyl current.

ASTÉRISQUE 352

(2) (X)

(1051)

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

311

REFERENCES [1] L. Bieri & N. Zipser – Extensions of the stability theorem of the Minkowski space in general relativity, AMS/IP Studies in Advanced Math., vol. 45, Amer. Math. Soc., 2009. [2] Y. Choquet-Bruhat & R. Geroch – “Global aspects of the Cauchy problem in general relativity”, Comm. Math. Phys. 14 (1969), p. 329–335. [3] D. Christodoulou – “Violation of cosmic censorship in the gravitational collapse of a dust cloud”, Comm. Math. Phys. 93 (1984), no. 2, p. 171–195. [4]

, “Nonlinear nature of gravitation and gravitational-wave experiments”, Phys. Rev. Lett. 67 (1991), no. 12, p. 1486–1489.

[5]

, “Examples of naked singularity formation in the gravitational collapse of a scalar field”, Ann. of Math. 140 (1994), no. 3, p. 607–653.

[6]

, “The instability of naked singularities in the gravitational collapse of a scalar field”, Ann. of Math. 149 (1999), no. 1, p. 183–217.

[7]

, “On the global initial value problem and the issue of singularities”, Classical Quantum Gravity 16 (1999), no. 12A, p. A23–A35.

[8]

, “The global initial value problem in general relativity”, in 9th Marcel Grosmann Meeting (Rome 2000), World Sci. Publishing, 2002, p. 44–54.

[9]

, The formation of black holes in general relativity, EMS Monographs in Math., European Mathematical Society (EMS), Zürich, 2009.

[10] [11]

, “Notes on the geometry of null hypersurfaces”. , “Topics on black holes and gravitational waves”, lectures held at ETHZürich, 2011.

[12] D. Christodoulou & S. Klainerman – The global nonlinear stability of the Minkowski space, Princeton Mathematical Series, vol. 41, Princeton Univ. Press, 1993. [13] M. Dafermos & I. Rodnianski – “A new physical-space approach to decay for the wave equation with applications to black hole spacetimes”, in XVIth International Congress on Mathematical Physics, World Sci. Publ., Hackensack, NJ, 2010, p. 421–432. [14]

, “Lectures on black holes and linear waves”, to be published by Clay Mathematics Institute.

[15] T. de Donder – “La gravifique einsteinienne”, Annales de l’Observatoire Royal de Belgique (1921). [16] A. Einstein – “Über Gravitationswellen”, Königlich Preussiche Akademie der Wissenschaften Berlin Sitzungberichte (1918), p. 154–167.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

312

M. DAFERMOS

[17] Y. Fourès-Bruhat – “Théorème d’existence pour certains systèmes d’équations aux dérivées partielles non linéaires”, Acta Math. 88 (1952), p. 141–225. [18] H. Friedrich – “The asymptotic characteristic initial value problem for Einstein’s vacuum field equations as an initial value problem for a first-order quasilinear symmetric hy”, Proc. Roy. Soc. London Ser. A 378 (1981), no. 1774, p. 401–421. [19] K. Friedrichs & H. Lewy – “Über die Eindeutigkeit und das Abhängigkeitsgebiet der Lösungen beim Anfangswertproblem linearer hyperbolischer Differentialgleichungen”, Math. Ann. 98 (1928), no. 1, p. 192–204. [20] H. Müller zum Hagen – “Characteristic initial value problem for hyperbolic systems of second order differential equations”, Ann. Inst. H. Poincaré Phys. Théor. 53 (1990), no. 2, p. 159–216. [21] S. W. Hawking & G. F. R. Ellis – The large scale structure of space-time, Cambridge Univ. Press, 1973, Cambridge Monographs on Mathematical Physics, No. 1. [22] D. Kennefick – “Controversies in the history of the radiation reaction problem in general relativity”, in The expanding worlds of general relativity (Berlin, 1995), Einstein Stud., vol. 7, Birkhäuser, 1999, p. 207–234. [23] S. Klainerman – “Uniform decay estimates and the Lorentz invariance of the classical wave equation”, Comm. Pure Appl. Math. 38 (1985), no. 3, p. 321–332. [24] S. Klainerman & F. Nicolò – The evolution problem in general relativity, Progress in Mathematical Physics, vol. 25, Birkhäuser, 2003. [25] S. Klainerman & I. Rodnianski – “Rough solutions of the Einstein-vacuum equations”, Ann. of Math. 161 (2005), no. 3, p. 1143–1193. [26] , “On emerging scarred surfaces for the Einstein vacuum equations”, Discrete Contin. Dyn. Syst. 28 (2010), no. 3, p. 1007–1031. [27] , “On the formation of trapped surfaces”, Acta Math. 208 (2012), no. 2, p. 211–333. [28] G. Lemaître – “L’univers en expansion”, Publication du Laboratoire d’Astronomie et de Géodésie de l’Université de Louvain 9 (1932), p. 171–205. [29] J. Leray – Hyperbolic differential equations, The Institute for Advanced Study, Princeton, N. J., 1953. [30] H. Lindblad & I. Rodnianski – “The global stability of Minkowski space-time in harmonic gauge”, Ann. of Math. 171 (2010), no. 3, p. 1401–1477. [31] J. Luk – “On the local existence for the characteristic initial value problem in general relativity”, Int. Math. Res. Not. 2012 (2012), no. 20, p. 4625–4678. [32] E. Newman & R. Penrose – “An approach to gravitational radiation by a method of spin coefficients”, J. Mathematical Phys. 3 (1962), p. 566–578.

ASTÉRISQUE 352

(1051)

THE FORMATION OF BLACK HOLES IN GENERAL RELATIVITY

313

[33] J. R. Oppenheimer & H. Snyder – “On continued gravitational contraction”, Phys. Rev. 56 (1939), p. 455–459. [34] R. Penrose – “Gravitational collapse and space-time singularities”, Phys. Rev. Lett. 14 (1965), p. 57–59. [35] F. A. E. Pirani – “Invariant formulation of gravitational radiation theory”, Phys. Rev. 105 (1957), p. 1089–1099. [36] F. Planchon & I. Rodnianski – “On uniqueness for the Cauchy problem in general relativity”, preprint. [37] M. Reiterer & E. Trubowitz – “Strongly focused gravitational waves”, Comm. Math. Phys. 307 (2011), no. 2, p. 275–313. [38] A. D. Rendall – “Reduction of the characteristic initial value problem to the Cauchy problem and its applications to the Einstein equations”, Proc. Roy. Soc. London Ser. A 427 (1990), no. 1872, p. 221–239. [39] J. Schauder – “Das Anfangswertproblem einer quasilinearen hyperbolischen Differentialgleichung zweiter Ordnung in beliebiger Anzahl yon unabhängigen Veränderlichen”, Fundam. Math. 24 (1935). [40] K. Stellmacher – “Zum Anfangswertproblem der Gravitationsgleichungen”, Math. Ann. 115 (1938), no. 1, p. 136–152. [41] K. S. Thorne – “Gravitational-wave bursts with memory: the Christodoulou effect”, Phys. Rev. D 45 (1992), no. 2, p. 520–524. [42] R. M. Wald – General relativity, University of Chicago Press, 1984. [43] P. Yu – “Dynamical formation of black holes due to the condensation of matter field”, preprint arXiv:1105.5898.

Mihalis DAFERMOS D.P.M.M.S. University of Cambridge Wilberforce Road Cambridge CB3 0WB – UK E-mail : [email protected]

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

352

ASTÉRISQUE 2013

SÉMINAIRE BOURBAKI VOLUME 2011/2012 EXPOSÉS 1043-1058 Quantum gravity and the KPZ formula Christophe GARBAN

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Séminaire BOURBAKI 64e année, 2011-2012, no 1052, p. 315 à 354

Mars 2012

QUANTUM GRAVITY AND THE KPZ FORMULA [after Duplantier-Sheffield] by Christophe GARBAN

1. INTRODUCTION The study of statistical physics models in two dimensions (d = 2) at their critical point is in general a significantly hard problem (not to mention the d = 3 case). In the eighties, three physicists, Knizhnik, Polyakov and Zamolodchikov (KPZ) came up in [14] with a novel and far-reaching approach in order to understand the critical behavior of these models. Among these, one finds for example random walks, percolation as well as the Ising model. The main underlying idea of their approach is to study these models along a two-step procedure as follows: – First of all, instead of considering the model on some regular lattice of the plane (such as Z2 for example), one defines it instead on a well-chosen “random planar lattice”. Doing so corresponds to studying the model in its quantum gravity form. In the case of percolation, the appropriate choice of random lattice matches with the so-called planar maps which are currently the subject of an intense activity (see for example [22]). – Then it remains to get back to the actual Euclidean setup. This is done thanks to the celebrated KPZ formula which gives a very precise correspondence between the geometric properties of models in their quantum gravity formulation and their analogs in the Euclidean case. It is fair to say that the nature and the origin of such a powerful correspondence remained rather mysterious for a long time. In fact, the KPZ formula is still not rigorously established and remains a conjectural correspondence. The purpose of this survey is to explain how the recent work of Duplantier and Sheffield enables to explain some of the mystery hidden behind this KPZ formula. To summarize their (∗)

Research partially supported by ANR grant MAC2.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

316

C. GARBAN

contribution in one sentence, their work implies a beautiful interpretation of the KPZ correspondence through a uniformization of the random lattice, seen as a Riemann surface. To fully appreciate the results by Duplantier-Sheffield, we will need to introduce beforehand several related concepts and objects. More precisely, the rest of this introduction is divided as follows: first we give a short and informal discussion about quantum gravity, then we introduce two universality classes of random lattices. Then we will come to the KPZ formula through a specific example (boundary of Random Walks hulls), and finally after stating the main Theorem by Duplantier-Sheffield, we will state a beautiful conjecture they made. 1.1. A first glance into quantum gravity Quantum gravity is intimately concerned with the following naive question: Question 1.1. — How does a “uniformly distributed” random metric on the sphere S2 typically look ? What is naive in this question is the fact that one would first need to specify what we mean by “a uniform probability measure” on the space of metrics on S2 . It turns out that defining a natural model of random metric on the sphere S2 already is a difficult and interesting problem. To illustrate this, let us ask a similar naive question in a one-dimensional setting: Question 1.2. — For any a, b ∈ Rd , how does a “uniformly distributed” path γ : [0, 1] → Rd going from a to b typically look ? This naive question was of crucial importance at the time Feynman developed the so-called path integral formulation of quantum mechanics. Already in this case, defining properly a “uniform measure” on paths was not an easy task. Yet, it had been mathematically settled prior to Feynman’s work and corresponds to the well-known Brownian motion. In some sense, the purpose of quantum gravity is to extend Feynman path integrals to Feynman integrals over surfaces. Physicists are particularly interested in such an extension, since this would provide a powerful tool to deal with the quantization of gravitation field theory, a notoriously hard problem. (1) With this background in mind, the problem of defining a proper mathematical object for a “uniformly chosen random metric on S2 ” thus corresponds to defining a two-dimensional analog of Brownian motion, i.e. a kind of Brownian surface. (1)

This approach towards the quantization of gravitation is called loop quantum gravity.

ASTÉRISQUE 352

(1052)

QUANTUM GRAVITY AND THE KPZ FORMULA

317

Even though physicists are primarily interested in the above continuum formulation of Question 1.1, a natural and very fruitful approach is to study an appropriate discretization of it and then to pass to the limit. This brings us to the next subsection. 1.2. Discretization of Question 1.1 and planar maps In the one-dimensional setting, if one asks Question 1.2, it is not straightforward to come up right away with Brownian motion. But, if instead we start by discretizing Question 1.2, say by allowing random 1/n-steps, then we end up with the model of random walks. Brownian motion is then obtained as the scaling limit (as n → ∞) of these rescaled random walks. It is thus tempting to apply the same strategy to Question 1.1, namely to find an appropriate discretization. Let us explain below a possible discretization which was used initially in the physics literature and was studied extensively recently among the mathematical community. See for example [22] and references therein. We will see in Subsection 1.3 that there are other ways to discretize Question 1.1 which lead to different universality classes (2), but the discretization below is in some sense the simplest and most natural one regarding the statement of Question 1.1. The idea of the discretization we wish to introduce is to consider discrete graphs, with say n faces, which have the topology of a sphere S2 and for which the metric ρn will correspond (up to a rescaling factor) to the graph distance, i.e. ρn := n−a dgr for some exponent a > 0. The exponent a will need to be well chosen as in the √ case of Random Walks, where space needs to be rescaled by n in order to obtain a limit. If we define our discretization in such a way that for each n ≥ 1, there are finitely many such graphs, we can pick one uniformly at random (in the spirit of Question 1.1) which thus gives us a random metric space (Mn , ρn ). We can then ask the question of the scaling limit of these random variables (Mn , ρn ) as n → ∞ in the space (K, dGH ) of all isometry classes of compact metric spaces, endowed with the Gromov-Hausdorff distance dGH (3). The advantage of this setup is that (K, dGH ) is a complete, separable, metric space (a Polish space) and is thus suitable to the analysis of convergences in law and so on. Note here, that even if one could prove that (Mn , ρn ) converges to a limiting random object (M∞ , ρ∞ ), it is not clear a priori that the topology is preserved at the scaling limit or in other words, it needs to be proved whether (M∞ , ρ∞ ) a.s. has the topology of a sphere or not. If all these steps Similarly as Random Walks with non-L2 steps converge to other Levy processes than Brownian Motion. (3) Informally, if (E1 , d1 ) and (E2 , d2 ) are two compact metric spaces, then dGH (E1 , E2 ) is computed as follows: we embed E1 and E2 isometrically into some larger metric space (E, d) and we compute using the common distance d the distance in the Hausdorff sense between the two embeddings. Then we take the infimum over the possible such embeddings. See [22].

(2)

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

318

C. GARBAN

can be carried on, then this would give us a good candidate (M∞ , ρ∞ ) for the random object used in Question 1.1. Let us now introduce one specific discretization. Definition 1.3 (planar map, following [20]). — A planar map M is a proper embedding of a finite and connected graph into the two-dimensional sphere S2 , which is viewed up to orientation preserving homeomorphisms of S2 (i.e. up to “deformations”). Loops and multiple edges are allowed. The faces of M are identified with the connected components of S2 \ M and the degree of a face f is defined as the number of edges incident to f , with the additional rule that if both sides of an edge belong to the same face, this edge is counted twice. Finally, for combinatorial reasons, it is often convenient to consider rooted planar − maps, meaning that one particular oriented edge → e is distinguished. The origin of → − that root edge e is called the root vertex ∅. See Figure 1 for an instance of a planar map where all faces happen to be squares.

→ − e

Figure 1. This is a planar map of the sphere S2 with exactly 17 squares (this includes the exterior square which is also in the sphere).

Definition 1.4 (p-angulations of the sphere). — For any integer p ≥ 3, let Mpn be the set of all rooted planar maps with n faces, where each face has degree p. The elements of Mpn are called rooted planar p-angulations. (p = 3 corresponds to triangulations and p = 4 to quadrangulations).

ASTÉRISQUE 352

(1052)

QUANTUM GRAVITY AND THE KPZ FORMULA

319

Since planar maps are defined up to deformations, there are finitely many rooted planar maps in Mpn , for any n ≥ 1. For example, one has Ç å 2 2 · 3n 2n 4 n #Mn = 3 Catn = . n+2 (n + 2)(n + 1) n The appearance of the n-th Catalan number here is explained through the celebrated Cori-Vauquelin-Schaeffer bijection, which gives a one-to-one correspondence between labelled plane trees and rooted quadrangulations of the sphere (see for example [22]). For a fixed integer p ≥ 3, we will denote by mn ∈ Mpn a sample of a planar map uniformly distributed over Mpn . Since in Question 1.1, we were interested in a uniformly distributed random metric on S2 , it makes sense to consider the random variable (mn , n−a dgr ) seen as a random point in the above space (K, dGH ). The study of these random planar maps has now a long history (see for example [22, 23, 19, 24]) and has culminated in the following breakthrough result proved independently by Le Gall ([20]) and Miermont ([25]) (4): Theorem 1.5 (Uniqueness of the scaling limit). — There exists a (unique) random compact metric space (m∞ , D∗ ) with values in K such that for any p ∈ 3 ∪ (2N + 4), there is a positive constant λp such that as n → ∞, λp (d) dgr ) −→ (m∞ , D∗ ) , 1/4 n in the Gromov-Hausdorff sense. This random compact metric space is called the Brownian map. (mn ,

Furthermore the following property holds. (It was first established in [23]. See also [24] for a different proof.) Theorem 1.6 (Sphericity of the Brownian map). — Almost surely, the random metric space (m∞ , D∗ ) is homeomorphic to the sphere S2 . This last theorem thus ensures that in some sense the Brownian map (m∞ , D∗ ) is a good candidate for the “uniform” random metric on S2 considered in Question 1.1. The only drawback being that the metric space (m∞ , D∗ ) which is a.s. homeomorphic to (S2 , k · kR3 ) is not provided with a “canonical” embedding into the sphere (5). We will come back to this question of embedding later. (4)

To be more precise, Miermont’s proof is restricted to the case p = 4 but gives slightly stronger estimates on the structure of the geodesics while Le Gall’s proof is more general in the sense that it proves the result also for p = 3 and all even p greater than 4. (5) This would be the case for example if (m∞ , D∗ ) happened to be a nice Riemann surface, but it is not.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

320

C. GARBAN

1.3. Quantum gravity coupled with “matter” Coming back to our earlier motivation, i.e. the study of statistical physics models on regular lattices, we will now introduce models of random lattices which are naturally associated with statistical physics models. The first one will be associated to the Ising model and will fall into a different quantum gravity universality class than the above planar maps. 1.3.1. Quantum gravity coupled with Ising model. — The standard and simplest way in statistical physics to model ferromagnetic matter (like a piece of iron for instance) is through the so-called Ising model. It is defined on a graph G = (V, E) which is supposed to represent the metallic structure of our ferromagnet. For a flat piece of iron, one might choose Z2 for example. On a finite graph G = (V, E), it is defined as a probability measure on spin configurations σ ∈ {−1, 1}V , where if x ∈ V , σx = +1 means that the spin of the atom at site x is oriented in the upward direction. The probability measure P = PJ is such that each spin configuration σ has a probability proportional to   X   PJ σ ∝ exp J σx σy , e=hx,yi

where the parameter J represents the strength of the electromagnetic interaction between atoms (6) . Note that the higher J is, the greater the tendency is for the spins to align in the same direction. In order to express the probability measure P more explicitly, it is natural to introduce the partition function of the graph G   X X σx σy , ZJ = ZJ (G) := exp J σ∈{−1,1}V

so that

e=hx,yi

  X   1 PJ σ = exp J σx σy . ZJ e=hx,yi

The Ising model has been studied extensively in the physics and mathematical community over the last 70 years. See for example [32] and references therein for a recent breakthrough paper on the subject. Now the idea of studying such a model from a quantum gravity perspective is to sample a spin configuration σ together with a random base-graph G. This is what one calls coupling quantum gravity with the Ising model (i.e. we are looking for a probability measure on pairs {G = (V, E), σ ∈ {−1, 1}V } ). One way to proceed would be to first sample the random lattice G, using the above planar maps mn uniformly (6)

Often, instead of the parameter J, one uses the inverse temperature β :=

 

model is defined so that Pβ σ ∝ e use this point of view here.

ASTÉRISQUE 352

β

P e=hx,yi

σx σy

1 kB T

and the Ising

, but mainly for notational reasons, we will not

(1052)

QUANTUM GRAVITY AND THE KPZ FORMULA

321

chosen among Mpn and then to sample an Ising configuration σ on the graph mn according to the above model P = PJ,mn . Doing so would not correspond so much to coupling quantum gravity with the Ising model, since the marginal of (mn , σ) on the graph-component would just be the above model of planar graphs. So we will use a more intricate way of coupling the graph with its spin-configuration. If we restrict ourselves to the case of planar graphs, the standard quantum gravity/Ising coupling works as follows: fix p ≥ 3 and some large n ≥ 1. For integrability reasons, the spins will be indexed by the faces of the planar maps m ∈ Mpn instead of the vertices. (In other words, we will consider our Ising model on the dual graphs m∗ which are no longer in Mpn ). With this slight change, a natural idea is to define a measure P = PJ,n on couplings (mn , σ) ∈ Mpn × {−1, 1}n (recall that planar maps in Mpn have exactly n faces) so that  X    PJ,n m, σ ∝ exp J σf σf 0 , f ∼f 0

where the sum is over pairs of adjacent faces in m. See Figure 2.

+



− + +

+

+ −

+

+

→ − e

− −





+

+ −

Figure 2. This is an Ising spin configuration on the same quadrangulation as in Figure 1 (were we removed the inside edges for convenience).

Note that, unless J ≡ 0, the marginal on m (the graph-component) is no longer uniformly chosen among Mpn , but follows a law which highly depends on the magnetic strength J. In probabilistic terms, the marginal on mn corresponds to weighting mn by its Ising partition function ZJ (mn ). As in the case of a fixed graph G, it is natural to define the following annealed partition function X X X  Z n (J) := exp J σf σf 0 = ZJ (mn ) . m m∈Mp n ,σ∈{−1,1}

m∈Mp n

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

322

C. GARBAN

Now, recall the KPZ formula is supposed to relate a critical Euclidean Ising model (say on Z2 ) with a critical Ising model defined together with a random planar map S m ∈ n Mpn in the above fashion. Therefore, we need a way to detect a phase transition in each model, Euclidean and quantum gravity. Among the many ways to “detect” phase transitions, one is to notice a failure of analyticity for certain thermodynamic quantities. In our case, partition functions enable us to detect a phase transition. More precisely, for the Euclidean Ising model on Z2 , for each n ≥ 1, let Zn (J) be the above partition function for the graph Gn = [−n, n]2 ∩Z2 . Then, from the work of Onsager [26], it can be shown that as n goes to infinity, the functions J 7→ n12 log Zn (J) converge to a limiting function f (J), called the free energy which is analytic for all √ values of J > 0 except at J = Jceucl = 21 log(1 + 2). On the quantum gravity side, the natural quantity to look at is the so called grand canonical ensemble partition function defined as P X X J σ σ 0 f ∼f 0 f f Z (β, J) := e−β|m| e n n≥1 m∈Mp n ,σ∈{−1,1}

=

X

e−nβ Z n (J) .

n≥1

The reason why such an annealed partition function is considered is because it was computed exactly by Kazakov ([13]) in the case of quadrangulations (p = 4). His computation relied on a deep relationship with some (random) matrix models. This type of exact computation occurs for what one calls exactly solvable models and is the reason why we changed slightly the definition of Ising model from vertices to faces. The exact computation by Kazakov enables to detect a bi-critical point (βc , Jc ) (7) around which the analyticity of Z (β, J) is broken. The analysis of Z around its bicritical point gives detailed information on the critical behavior of the system in its quantum gravity formulation. See [21] and Appendix B in [9] for thorough discussions of this. As mentioned above, the scaling limit as n → ∞ of these planar maps mn ∈ M4n weighted by ZJc =ln 2 (mn ) will fall in a different universality class than the “uniform” (or unweighted) planar maps. We will come back to this later. 1.3.2. Quantum gravity coupled with random walks, self avoiding walks or percolation. — If one wants to study statistical models such as random walk, percolation or selfavoiding walks (SAW), it turns out that all of them are naturally coupled with the planar maps introduced in Subsection 1.2. This regime corresponds to what one calls the pure gravity regime. It means in some sense that the random geometry of the planar map is insensitive to the model it is coupled to (as opposed to what happens (7)

When p = 4, one has Jc = JcQG = ln 2.

ASTÉRISQUE 352

(1052)

QUANTUM GRAVITY AND THE KPZ FORMULA

323

with Ising model). We will describe this pure gravity case in more details in the next subsection through the example of random walk. 1.4. The KPZ formula in the special case of random walk and Brownian motion Let us start by the Euclidean case. Consider a random walk Xt on the domain ΛN := [−N, N ]2 starting at the origin until it reaches the boundary ∂ΛN . One can look at several subsets of interest about this random walk among which: (i) The range R N of Xt , i.e. R N := {Xt }. (ii) The set of cut-points C N of Xt , i.e. the set of points x ∈ ΛN so that removing x disconnects the range into 2 disjoint components. (iii) The set of frontier points F N , i.e. all the points on the range that are connected to ∂ΛN in the complement ΛN \ R N . See Figure 3. One way to measure the typical size of a random subset of ΛN is via the following notion of scaling exponent. If K = (KN )N ≥1 is a certain sequence of random subsets of ΛN , then its Euclidean scaling exponent is defined as   log E |KN |/N 2 (1) x = x(K) := lim . N →∞ log 1/N 2 Note that we are being informal here since it might be that this limit does not exist. To be more rigorous, one should define instead upper and (lower) scaling exponents by using lim sup (and lim inf) instead. Nevertheless, to simplify the exposition we will neglect this issue in the remaining of this text and will assume that the random sets we will consider are such that these limits always exist (proving such a convergence can be very hard for some models and remains in many cases an open problem, for example scaling exponents for critical percolation on Z2 ). Note also that the greater the exponent x = x(K) ∈ [0, 1] is, the “smaller” the random sets KN are since having scaling exponent x means that asymptotically, KN is of size ≈ N 2−2x . The scaling exponents for the above subsets of random walk paths have been the focus of an intense activity over the last 20 years or so. In fact the road which culminated in their evaluation is quite an interesting story. Their values were first conjectured by Duplantier and Kwon in [10] based on conformal invariance and numerical simulations. Somewhat surprisingly, the powerful machinery of conformal field theory was unable at giving theoretical predictions for these exponents. In 1998, Bertrand Duplantier obtained in [8] (on a non-rigorous basis) these exponents with a completely different approach: his idea was to study a random walk path on a random planar map mn and to compute the scaling exponents, called quantum scaling exponents for the frontier and cut points of the random walk on mn . Once this was achieved, he was able to recover his previous conjecture via the KPZ formula. His work was

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

324

C. GARBAN

ΛN ∂mn CN

Xt Wm

Figure 3.

partly based on the seminal work [18] on Brownian intersection exponents. Finally, the story ends with the mathematical derivation of these exponents in [16, 17] which used yet another approach: the Schramm-Loewner-Evolution SLEκ processes (with κ = 6 here). Here is more precisely how it goes. Imagine that we have at our disposal a natural model of planar maps mn with boundary (i.e. with the topology of a disk), instead of planar maps mn with the topology of a sphere. This can be done in such a way that it gives a different, yet interesting model of planar maps: see [6] where Bettinelli considers random quadrangulations mn with n faces and which are such that ∂mn is √ of order n. Let thus mn be sampled uniformly among rooted quadrangulations with √ n faces and boundary of length n. Let Wm be a simple random walk on this graph mn starting at the root of mn until it reaches the boundary ∂mn . See Figure 3. One can consider the exact analogs of the above sets, i.e: (i) The range R n of Wm , i.e. R n := {Wm }. (ii) The cut-points C n of Wm , i.e. the set of points x ∈ mn so that removing x disconnects the range into 2 disjoint components. (iii) The frontier points F n , i.e. all the points on the range that can be connected to ∂mn via the complement mn \ R n . Similarly to the Euclidean case, if K = (Kn )n≥1 is a sequence of random subsets of mn , then its quantum scaling exponent is defined as:

ASTÉRISQUE 352

(1052)

(2)

QUANTUM GRAVITY AND THE KPZ FORMULA

325

    E log |Kn |/|mn | E log |Kn |/n ∆ = ∆(K) := lim = lim , n→∞ n→∞ log 1/|mn | log 1/n

where, once again, we implicitly assume here that the limits exist. Even though it was not exactly in the same setup, Duplantier determined in [8] the values of these quantum scaling exponents. He found ∆( F ) = 1/2 and ∆( C ) = 3/4. Now for this universality class (i.e. the pure gravity case of “uniform” planar maps mn ), the KPZ formula reads as follows: the scaling exponents x and ∆ of a certain subset of a random walk path in the Euclidean and quantum cases are related by the following quadratic expression: 2 1 (3) x = ∆2 + ∆ . 3 3 One thus finds x( F ) = 1/3 and x( C ) = 5/8. Note that for the range R , it is well known that an Euclidean random walk Xt visits about N 2 / log N sites before touching ∂ΛN , this means that x( R ) = 0 which is a fixed point of the above KPZ formula. This thus suggests that ∆( R ) = 0 as well, which in turn means that the random walk Wm should visit |V (mn )|1−o(1) = n1−o(1) sites of the planar map mn . This is a non-trivial fact in its own, which illustrates that the KPZ formula (if true) can be powerful in both directions. 1.5. The KPZ formula in general The planar maps mn uniformly chosen among some Mpn for some p ≥ 3 are the natural universality class for studying random walk on the quantum gravity side. Nevertheless, one might also consider an independent random walk on a planar map mn sampled together with an Ising model as we explained above. If one would do so, this would affect the typical size of the sets C n and F n and one would find different values for the quantum scaling exponents ∆ising ( F ) and ∆ising ( C ). This reflects the fact that the two different procedures we gave to sample planar maps do not fall asymptotically in the same universality class. For this Ising universality class, the KPZ relation reads as follows: 3 1 (4) x = ∆2ising + ∆ising . 4 4 Such a correspondence can be very useful to relate critical exponents for the Ising model in its quantum gravity form with the analogous Euclidean critical exponents. For example, one might hope that if Kn denotes the largest + cluster in the random map mn weighted according to ZJ (mn ), then its quantum scaling exponent ∆ising should relate to its Euclidean analog through the above formula. Yet, one has to be careful with such statements since, especially away from the pure gravity case (i.e. uniform planar maps), it is in general a subtle affair to know which critical exponents

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

326

C. GARBAN

are allowed to go through the KPZ formula or not. (8) In the case of the Ising model, quantum critical exponents are usually derived from the analytic study of Z (β, J) near its bi-critical point and are then transfered to the Euclidean setting using (4). See [9]. One can now state the general KPZ formula: consider some statistical physics model defined together with a random planar lattice (in the suitable universality class). Then, the quantum and Euclidean scaling exponents ∆ and x which describe the critical properties of the model, are such that the following quadratic KPZ formula holds (5)

x=

γ2 2 γ2 ∆ + (1 − )∆ , 4 4

where the parameter γ ∈ R+ determines in which universality class the model is. p We thus find that pure gravity corresponds to γ = 8/3 while Ising model corre√ sponds to γ = 3. More generally, it follows from this correspondence that critical two-dimensional models form in some sense a one-dimensional family space. This is consistent with the recent theory of SLEκ processes which are aimed at describing interfaces of critical two-dimensional systems and also form a one-dimensional family of processes indexed by κ ≥ 0. In fact, the two parameters are related one to another √ by γ ≡ κ. 1.6. Why go through quantum gravity ? The KPZ formula becomes particularly useful (at least on a non-rigorous level) when the critical exponents of a particular model happen to be much easier to compute, say, in its quantum gravity form than in its Euclidean one (or vice-versa). This is exactly what happens in the case of random walk ([8]). 1.6.1. Quantum gravity coupled with random walk. — Imagine we want to study the exterior frontier F t of a random walk Xt in Z2 as t increases ( F t is defined here as the set of points in R t which are connected to infinity in Z2 \ R t ). For each T ≥ 1, the evolution of F t for t ≥ T will not depend of what the random walk did inside the hull DT , defined as the complement of the unique infinite connected component of Z2 \ R T . Yet the evolution of F t , t ≥ T , will depend of the complicated law of the boundary ∂ DT = F T ⊂ Z2 which as T → ∞ looks more and more like a fractal set. On the quantum gravity side, such geometric processes as F t behave in some sense in a much more Markovian way. The subtlety lies partly in the fact that one needs the set K to be independent of the field eγh in the main Theorem 1.10, while here the largest + cluster would be highly correlated with the field eγh . (8)

ASTÉRISQUE 352

(1052)

QUANTUM GRAVITY AND THE KPZ FORMULA

327

To illustrate this, let us briefly describe a striking recent work by Benjamini and Curien [4]. In their work, they rely on an infinite version Q∞ of the above rooted quadrangulations of the sphere mn ∈ M4n . Q∞ is called a rooted UIPQ (for Uniform Infinite Planar Quadrangulations) and can be seen as a local limit of the quadrangulations mn as n → ∞. They consider a random walk Wm starting at the root of Q∞ and they explore the planar map Q∞ along the random walk path Wm . The crucial observation which goes back to [1] is that if at time m, F m denotes the exterior boundary of the domain which was explored by the random walk so far (9), then the law of the infinite connected component Q∞ \ Dm depends only on the length of ∂ Dm = F m and not at all on its shape. This simplifies things tremendously. Yet, it would remain to control how | F m | and | Dm | both increase as a function of m. This part turns out to be difficult but Benjamini and Curien are able to obtain in [4] that as m → ∞, | F m | behaves like | Dm |1/2 . This provides a rigorous derivation of the identity ∆( F ) = 1/2. (They also obtain another quantum scaling exponent for the so-called frontier points.) These nice spatial Markovian properties were also crucial in the seminal work on the quantum scaling exponents of random walk by Duplantier ([8]), where various quantum scaling exponents for the random walk were determined through an asymptotic analysis of the partition function of random walks coupled with planar maps. 1.6.2. Quantum gravity coupled with percolation. — Critical percolation has also been successfully analyzed from the quantum gravity perspective. Various quantum critical exponents for percolation were determined in [29] and were translated to the Euclidean setting via the KPZ formula. This is probably the first explicit use in the physics literature of the KPZ formula. In the mathematics literature, there is a work in progress by Angel and Curien [2], which gives among other things a rigorous determination of the critical points for bond percolation on the UIPT and UIPQ (the first one is the analog of the above Q∞ with triangles instead). Using the Markovian structure we briefly sketched above, they are able to compute some of the quantum scaling exponents of these critical percolation models, which is a very interesting step towards the understanding of statistical physics models on random lattices. 1.6.3. Quantum gravity coupled with Ising model. — The reason why it is interesting to study the Ising model in its quantum gravity form lies in the fact that (as was mentioned above), Kazakov was able to compute exactly the annealed partition function X X Z (β, J) = e−β n ZJ (mn ) . n≥1

m∈M4n

(9)

Some care is needed here, since one has to prove that under the law of Q∞ , there is a unique infinite connected component in Q∞ \ R m , but we will not enter in more details here. See [4].

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

328

C. GARBAN

As hinted previously, various quantum critical exponents for the Ising model can be extracted from the behavior of Z (β, J) near (βc , Jc ) and can be translated to the √ Euclidean setting via the KPZ Formula (5) with γ = 3. It is now time to introduce the main result we wish to explain in this survey. 1.7. The main result by Duplantier-Sheffield and a conjecture on the embedding of planar maps What remains mysterious so far in the KPZ correspondence we just described is the fact that it relates scaling exponents of sets which do not “live” on the same space. For example it relates the scaling exponent of cut-points of a random walk living in ΛN with the (quantum)-scaling exponent of cut-points of a random walk living on a random planar map mn . To overcome this, Duplantier and Sheffield discovered a setup in which the random set we are interested in, say K, lives on some single space (say [0, 1]2 or S2 ), but its size, given in terms of its scaling exponent, can be measured in two different ways: an “Euclidean” way which will output some Euclidean scaling exponent x = x(K) and a “quantum” way which will output a possibly different quantum scaling exponent ∆ = ∆(K). Their setup is built so that x(K) and ∆(K) will satisfy to the general KPZ relation (5). (More precisely for each value of γ ≥ 0, they found an adequate setup). Before going into the details of their setup, one sees here that we are getting closer to our initial naive Question 1.1. Indeed, if one had at our disposal a “uniform” random metric ρ on S2 , one could evaluate the size of K either using the Euclidean metric k · k (which would give us a scaling exponent x) or using the random metric ρ (which would give us an exponent ∆). Now from the preceding discussions, x and ∆ p should satisfy to (5) with γ = 8/3. Unfortunately we did not quite succeed yet in answering Question 1.1. Indeed, Theorems 1.5 and 1.6 provide us with a “uniform” probability distribution on compact metric spaces which a.s. have the topology of a sphere, but there is (at least for the moment) no canonical way to embed the limiting space (m∞ , D∗ ) into the sphere. In fact, because of this embedding issue, a proper answer to Question 1.1 remains an important open problem. Yet, before passing to the limit n → ∞, there are several ways to “naturally” embed the planar maps mn into the sphere. We present two of them. 1.7.1. Embedding of planar maps seen as Riemann Surfaces. — The main idea here is that one can view each planar map mn ∈ M4n as a Riemann surface. For this, view each face as a polygon (here a square) on which we give the obvious flat conformal structure given formally by z 7→ z. By the Schwarz reflexion principle, one can easily glue together the conformal structures of two adjacent faces along their edge. Some care is needed around each vertex x ∈ mn since the angle around x might not be

ASTÉRISQUE 352

(1052)

329

QUANTUM GRAVITY AND THE KPZ FORMULA

4

2π. Yet, one can use a local chart around each such x of the form z 7→ z k where k is the degree of vertex x (this corresponds to the fact that conic singularities of complex manifolds are removable). Altogether, this gives us a complex manifold of dimension one endowed with a finite atlas indexed by the set of edges and vertices of mn . By the Riemann uniformization theorem, since mn ' S2 , mn equipped with the above conformal structure can be mapped conformally to S2 and the embedding is unique up to Möbius maps of the sphere S2 . We thus found a natural way (up to Möbius transformations) to embed any planar maps mn into S2 . The same idea enables us to embed in a conformal way planar maps mn with the topology of a disc (with ∂mn 6= ∅) into the disc D or into [0, 1]2 . 1.7.2. Embedding of planar maps via circle packings. — If one considers planar maps mn ∈ M3n (i.e. triangulations of the sphere), then by Köbe Theorem, there is a unique (again up to Möbius transformations) circle packing in S2 whose connectivity graph corresponds to mn . See Figure 4. This circle-packing embedding is different from the one given by the conformal structure, yet one might conjecture that if mn is sampled uniformly from M3n , then the two embeddings should look almost alike with large probability. “ n ⊂ S2 be a “natural” em1.7.3. Scaling limit of planar maps embeddings. — Let m 2 p bedding of a random planar map mn ∈ Mn into S (mn may be sampled either uniformly as in Subsection 1.2 or weighted according to some statistical physics model as “ n , the renormalized graph distance n−a dgr in Subsection 1.3). To each embedding m 2 “ n ⊂ S can be easily extended to a metric ρn on the whole sphere on the vertices of m 2 S . If mn is sampled uniformly in Mpn , then we know from Theorem 1.5 that one should choose a = 1/4. If one could prove in this case that as n → ∞, the (random) metric ρn on S2 would converge in law, then it would give a “good” answer to Question 1.1 and it would enable us to build a setup for a concrete interpretation of the KPZ p formula when γ = 8/3. In some sense the idea of Duplantier and Sheffield is to focus on measures instead “ n ⊂ S2 is a natural embedding of a planar map mn , then it is natural of distances. If m to consider the pushforward in S2 of the Lebesgue measure on mn , renormalized so that mn has unit area (i.e. all faces of mn have Lebesgue measure exactly n−1 ). Let us denote by µn this pushforward measure on S2 . µn is thus a random measure on the sphere with µn (S2 ) = 1. As one can see from Figure 4, one expects that µn should look quite singular with respect to Lebesgue measure on S2 (or D if one considers maps with the topology of a disc). Let fn be the Radon-Nikodym derivative of µn with respect to the Euclidean Lebesgue measure, then we expect fn to become more and more “rough” as n → ∞. This brings us to the question.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

330

0e+00 −2e+06 −4e+06

Figure 4. This picture is a simulation by Maxim Krikun which represents a circle packing of a uniform triangulation on the disc.

−6e+06

Im(bbox(self$pos, max(self$r)))

2e+06

4e+06

6e+06

C. GARBAN

−8e+06

Question 1.7. — (i) If mn is sampled uniformly in Mpn , is it the case that µn converges as n → ∞ to a random measure on S2 ? (ii) What if mn ∈ M4n is weighted by ZJc (mn ) ? −6e+06

−4e+06

−2e+06

0e+00

2e+06

4e+06

6e+06

Re(bbox(self$pos, max(self$r)))

Solving this question is a major open problem in the area, but Duplantier and Sheffield made a decisive step in this direction: they managed to identify an explicit candidate for the scaling limit of µn , for which the KPZ equation holds (in the sense of measures). This candidate as we will see in more details below is given by the exponential of a Gaussian Free Field.

ASTÉRISQUE 352

(1052)

331

QUANTUM GRAVITY AND THE KPZ FORMULA

1.7.4. Setup and statement of the main Theorem. — The common base space will be [0, 1]2 and we will consider some deterministic subset K ⊂ [0, 1]2 . Now, we consider two measures on this space: (i) The Lebesgue measure L on [0, 1]2 (ii) A random measure µ = µγ which can be formally written as h is an instance of a Gaussian Free Field.

dµ dL

= eγ h , where

The Gaussian Free field (GFF for short) is a certain Gaussian process which will be defined in Section 2. It is “too rough” to live in the space of functions on [0, 1]2 (say L2 ([0, 1]2 ) ) and has to be viewed instead as a random Schwartz distribution. See Figure 5 for a representation of how a regularized GFF on D looks like.

Figure 5. An instance of a Gaussian Free Field h in the disc D with Dirichlet boundary conditions. Picture by Nam-Gyu Kang.

Since h is not a proper function, eγh is not well-defined a priori. This will be the content of Section 3 to give a meaning to such measures. See Figure 6 for an illustration of these measures when γ ∈ {3/2, 5}. These random measures are supposed to model the effect of quantum gravity on our base-space [0, 1]2 . They are called Liouville measures.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

332

C. GARBAN

Figure 6. In each picture, all the plain dyadic squares have about the same quantum area δ. The picture on the left is for γ = 3/2 while the picture on the right which looks much more singular is for γ = 5.

Let us now define Euclidean and quantum scaling exponents in this setting. For this, following the notations of [11], we will need the following notion of Euclidean and quantum balls. Definition 1.8 (Euclidean and quantum balls). — For any point z ∈ [0, 1]2 and any , δ > 0, define (i) B (z) to be the Euclidean ball of radius  around z. (ii) B δ (z) to be the ball Bτ (x) with τ := sup{r ≥ 0, µ(Br (z)) ≤ δ}. B δ (z) will be called the quantum ball around z of quantum area δ. (10) Definition 1.9 (Scaling exponents). — Let K ⊂ [0, 1]2 be fixed. 1. The Euclidean scaling exponent x = x(K) is defined as   log P B (z) ∩ K 6= ∅ (6) x = x(K) := lim , →0 log 2 where the point z is sampled uniformly on [0, 1]2 . 2. The quantum scaling exponent ∆ = ∆(K) is defined as    log E µ B δ (z) ∩ K 6= ∅ (7) ∆ = ∆(K) := lim , δ→0 log δ where z is “sampled” according to the a.s. finite measure µ = eγh and E averages over the random measure µ. Note that since we do not have at our disposal any “quantum distance” on S2 , our definition of quantum balls still relies somewhat on the Euclidean one. Nevertheless, it is believed that this slight Euclidean use should “average out” as δ → 0.

(10)

ASTÉRISQUE 352

(1052)

QUANTUM GRAVITY AND THE KPZ FORMULA

333

As we did before, we implicitly assume here that the limits exist. Note that these definitions are the exact analogs of Equations (6) and (7). Indeed “ n , then if one believes in µn → µ and if one approximates K to be a subset Kn ⊂ m with δ = 1/n one has    log E µ B δ (z) ∩ K 6= ∅ ∆ = ∆(K) ≈ log δ    “ n is contained in Kn log E µn the face containing z ∼ µn in m ≈ log 1/n   log E |Kn |/n = , log 1/n and similarly for x = x(K). We are now in position to state the main theorem of Duplantier and Sheffield. Theorem 1.10 (Duplantier and Sheffield [11]). — Consider the Liouville measure µγ = eγh on the unit square [0, 1]2 and let K be a (deterministic) subset of [0, 1]2 , such that the limits in (6) and (7) exist. Then if γ ∈ [0, 2), the quantum scaling exponent ∆ = ∆(K) for the Liouville measure µγ almost surely satisfies to the KPZ formula: γ2  γ2 2  ∆ + 1− ∆. (8) x= 4 4 Remark 1.11. — Note that in the statement of the theorem, by Fubini’s theorem, K may also be a random subset of [0, 1]2 but in that case, it needs to be chosen independently of µγ . Their theorem gives a concrete setup in which the KPZ formula holds and enabled Duplantier and Sheffield to state the following striking conjecture. Conjecture 1.12 (Duplantier, Sheffield [11]). — If mn ∈ Mpn are sampled according to a statistical physics model in the γ-universality class, then the pushfor“ n ⊂ S2 of mn weakly converge as ward measures µn of any “natural” embedding m n → ∞ towards a random measure which is closely related to the Liouville measure µγ = eγh , where h is an instance of the Gaussian Free Field on the sphere S2 (11). See Remark 2.20 for a definition of the GFF on the sphere S2 . The reason why the limiting measure is not given exactly by the Liouville measure eγh stands from the fact that the measures µn are renormalized to have measure one, while eγh has a random a.s. finite total mass. The actual limit is not given simply R by conditioning eγh to have measure one, nor by renormalizing by eγh , it is slightly (11)

If one keeps track of the root, asymptotically it will be distributed according to µγ = eγh .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

334

C. GARBAN

more subtle than that. See Section 6 in [31] for a precise conjecture on the limiting measure. The rest of this survey is divided as follows. In Section 2, we will give a short introduction to Gaussian Free Field. Then, along Section 3, we will give a meaning to the Liouville measures µγ = eγh . In [11], the Liouville measures are defined for all √ γ ∈ [0, 2), we will give here a simplified proof which holds only for γ ∈ [0, 2). Finally, in Section 4, we will sketch the main ideas behind the proof of the main theorem. Acknowledgments I wish to thank Vincent Beffara, Nathanael Berestycki, Cédric Bernardin, Nicolas Curien, Bertrand Duplantier, Grégory Miermont, Rémi Rhodes, Mikael De La Salle, Scott Sheffield, Vincent Vargas and Wendelin Werner for very useful discussions and Bertrand Duplantier, Nam-Gyu Kang, Maxim Krikun and Scott Sheffield for some of the nice pictures that appear here.

2. THE GAUSSIAN FREE FIELD (GFF) We will give here a short and by no means self-contained introduction to the Gaussian Free Field. We refer to [7, 30] for complete references on this topic. We will try to give a certain flavor of what the GFF is and at the same time, we will introduce some of its key properties which will be needed later. 2.1. Discrete Gaussian Free Field (DGFF) in the square Let us start by a discrete version, known as the Discrete Gaussian Free Field. To simplify, we will consider the case of the square domain [0, 1]2 . Definition 2.1. — The DGFF in ΛN := N1 Z2 ∩ [0, 1]2 with Dirichlet boundary conditions is a probability measure on functions hN : ΛN → R such that h| ∂ΛN = 0 (where ∂ΛN := N1 Z2 ∩ ∂[0, 1]2 ) and with density  1X Y   1 exp − (hN (x) − hN (y))2 dP hN := dhN (x) , Z 2 x∼y where the sum is over nearest neighbor pairs x ∼ y ∈ ΛN , and Z is a renormalizing constant to make it a probability measure. See Figure 7 for a sample of a DGFF. Due to the Dirichlet boundary conditions, the density is also equal to  Z −1 exp 1/2hhN , ∆hN i , where ∆ is the discrete Laplacian. Written this way, one sees that DGFF is a Gaussian random surface with covariance matrix given by ∆−1 . It is a standard fact that ∆−1 is given by the matrix [GN (x, y)]x,y∈ΛN ,

ASTÉRISQUE 352

(1052)

335

QUANTUM GRAVITY AND THE KPZ FORMULA

2 20

0 15

-2 10

5 10

5

15 20

Figure 7. A sample of a DGFF on Λ21 . Picture by S. Sheffield.

where GN (x, y) is the Green’s function for the Random Walk in ΛN killed on ∂ΛN . (A good reference for discrete Green’s functions is for example the book [15].) As such, one may give the following equivalent definition of DGFF: Definition 2.2. — The DGFF on ΛN with D.b.c is the centered Gaussian process hN indexed by the points x ∈ ΛN and with covariance structure given by     Cov hN (x), hN (y) = E hN (x)hN (y) := GN (x, y) . Remark 2.3. — Just to give an idea of the amount of fluctuations, “in the bulk”, say at xN := (N/2, N/2), one has (9)

  Var hn (xN ) = GN (xN , xN )  log N .

Remark 2.4. — If D $ C is any domain of the plane, one can define similarly a DGFF hN with D.b.c. in the domain D by using the discretization DN := N1 Z2 ∩ D (and with boundary defined as ∂DN := N1 Z2 ∩ Dc ). It turns out that as N → ∞, hN converges (in a certain sense to be precised later) towards a conformally invariant object called Gaussian Free Field.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

336

C. GARBAN

2.2. A first attempt at defining the Gaussian Free Field If we are following Definition 2.2, it is tempting to define the continuous limit of hN in the domain D as the centered Gaussian process indexed by the points x ∈ D with the following covariance structure:   (10) Cov h(x), h(y) := GD (x, y) for all x, y ∈ D , where GD (x, y) is the Green’s function of the domain D. See the later Subsection 2.4 for a definition (and more) on continuous Green’s functions. Unfortunately, this definition is “ill-posed” since, as suggested by Remark 2.3, one would have for any x ∈ D   Var h(x) := GD (x, x) = ∞ . One way to overcome this would be to regularize h using smooth functions, and this is what we will do when we will introduce the -regularization h (z). Before, let us follow a different approach to define GFF inspired by our initial Definition 2.1. 2.3. GFF as a Gaussian process indexed by Sobolev space H 1 Following Definition 2.1, it is natural to look for a probability measure on functions ¯ → R satisfying h|∂D ≡ 0 whose intensity, informally would be given by h:D  1Z    (11) P h ∝ exp − k∇hk2 . 2 D In order to find a well-defined object corresponding to this informal definition, it is useful to introduce the following Hilbert space: Definition 2.5 (The sobolev space H 1 ). — Let C = C D be the set of smooth functions f with compact support in D. We define the space H 1 (= H 10 (D)) as the closure of C for the norm Z 1 k∇f k2 . kf k2∇ := 2π D

H 1 is a separable Hilbert space for the scalar product 1 hf, gi∇ := 2π

Z ∇f ∇g .

We are thus trying to define a random function h ∈ H 1 such that  1    P h ∝ exp − khk2∇ . 2

(12)

To gain some intuition, if the Hilbert space H 1 happened to be finite dimensional, it would be some (Rk , k · k2 ), with k ≥ 1. In that case, if e1 , . . . , ek is any orthonormal (12)

We do not pay attention to the constant in the exponential through this informal discussion.

ASTÉRISQUE 352

(1052)

QUANTUM GRAVITY AND THE KPZ FORMULA

337

  2 basis of Rk , then a random variable x ∈ Rk with intensity P x ∝ e−1/2kxk2 can always be written k X x= ai ei , i=1

where (ai ) are independent Gaussian random variables. Since H 1 is a separable Hilbert space, let (en )n≥1 be an orthonormal basis for H 1 . By analogy with the finite dimensional case, we want to define the Gaussian Free Field h as X (12) h := an en , n≥1

where (an ) are independent Gaussian variables ∼ N (0, 1). The difference with the finite-dimensional case is that for any k ≥ 1, the above Gaussian random variable x was almost surely in Rk , while in our present case, it can be shown that almost surely, the above formal series (12) does not converge in H 1 . In fact, it does not even converge in L2 (D), and as such the Gaussian Free Field h will not be defined as a proper function, but instead as a generalized function in D0 (i.e. a Schwartz distribution). More precisely, it can be shown (see [7]) that almost surely, the above sum h converges in the space H −1 (13). Definition 2.6. — From now on, the Gaussian Free Field with Dirichlet b.c. in a domain D will be defined as the random distribution X h := an en a.s in H −1 , n≥1

where (en )n is an orthonormal basis of H 1 (D). (The Dirichlet b.c. is hidden in the fact that any f ∈ H 1 satisfies f|∂D = 0.) Example 2.7. — In the case where D is the square [0, 1]2 , one can write down an explicit basis for H 1 ([0, 1]2 ), namely for all j, k ∈ N∗ , let √ 1 (13) 2 2π sin(jπx) sin(kπy) . ej,k (x, y) := p j 2 + k2 It is not hard to check that (ej,k )j,k∈N∗ is indeed an orthonormal basis for ( H 1 , k·k∇ ). A Gaussian Free Field in the square [0, 1]2 with zero boundary conditions can thus be written as X √ a p j,k 2 2π sin(jπx) sin(kπy) , h= j 2 + k2 j,k∈N∗ where (aj,k )j,k are independent Gaussian variables of variance one and where the convergence for this series holds in the space H −1 . (13)

In fact, it turns out that a.s. h ∈ H − for any  > 0.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

338

C. GARBAN

P Definition 2.8. — If f = n≥1 αn en ∈ H 1 , then with a slight abuse of notation we will denote by hh, f i∇ the following quantity X hh, f i∇ := an αn . n≥1

It is straightforward to check that for any f ∈ H 1 , hh, f i∇ is a Gaussian variable. More precisely, the following proposition follows easily from the definition of hh, f i∇ . Proposition 2.9. — Let h be a Gaussian Free Field in D. Then the process  hh, f i∇ f ∈ H 1 is a centered Gaussian process indexed by the set H 1 and with covariance structure   Cov hh, f i∇ , hh, gi∇ = hf, gi∇ for any f, g ∈ H 1 . Remark 2.10. — In fact, this proposition can serve as another way to introduce the Gaussian Free Field. This is for example the point of view in [7, 30], where they introduce GFF as this Gaussian process indexed by H 1 . This approach thus gives a good generalization of Definition 2.1 to the continuous setting. In fact it can be proved that the DGFF hN weakly converges in the sense of distributions (for example in H −1 ) towards λZ2 h, where λZ2 is a lattice-dependent constant. The following proposition relates the Gaussian Free Field we have just defined with Definition 2.2. Proposition 2.11. — Let h be a Gaussian Free Field in D. For any ρ ∈ C D (the smooth functions with compact support in D), we will denote by hh, ρi the distri bution h tested against the smooth function ρ. Then the process hh, ρi ρ∈ C is a D centered Gaussian process indexed by C D with covariance matrix ZZ   ρ(x)ρ0 (y) GD (x, y) dxdy , Cov hh, ρi, hh, ρ0 i = D×D

where GD is the Green’s function of domain D. 2.4. The Green’s function GD of a domain D Definition 2.12 (Green’s function in the domain D). — The Green’s function of a domain D $ C will be denoted by the function GD : D × D → R+ . For any x ∈ D, define the function Gx (y) := GD (x, y). With such notations, the Green’s function GD (x, y) is characterized by the following properties (a) ∆Gx (·) = 0 on D \ {x}, namely it is harmonic in D \ {x}. (b) Gx (y) → 0 as y → ∂D. 1 (c) Gx (y) ∼ log |x−y| as y → x.

ASTÉRISQUE 352

(1052)

QUANTUM GRAVITY AND THE KPZ FORMULA

339

By removing the logarithmic singularity, one can rewrite Gx (y) in the following way 1 ˜ x (y), where G ˜ x (y) is the harmonic extension to D of the function Gx (y) = log |x−y| +G 1 − log |x−y| on the boundary ∂D. Here are some well-known properties of Green’s functions that we will use. Proposition 2.13 (Properties of the Green’s function). — (a) Conformal invariance: if φ : D → D0 is a conformal map, then for any x, y ∈ D, GD (x, y) = GD0 (φ(x), φ(y)) . (b) (c) (d) (e) (f)

This follows easily from the definition of Green’s function. 1 . Note that GD (0, y) = log kyk GD (x, y) = GD (y, x) (this can be seen for example using (a) with (b)). For any x ∈ D, Gx ∈ H 1 . x In the sense of distributions, −1 2π ∆[G (·)] = δx , the Dirac point mass at x. ˜ x (y) satisfies The above harmonic correction G ˜ x (x) = log C(x, D) , G where C(x, D) is the conformal radius of D viewed from x. If φ is a conformal map D → D with φ(x) = 0, then C(x, D) is simply defined as |φ0 (x)|−1 . This property (f ) can be easily checked using (a) and (b).

Let us now explain how one can recover (at least formally) Proposition 2.11 from 1 the above property (e). For any f ∈ C D , one can make sense of 2π h∇h, ∇f i where ∇h is understood in the sense of Schwartz distributions. It is not hard to check that this quantity is exactly hh, f i∇ . Now, since f has compact support, integration by parts implies 1 1 hh, f i∇ = h∇h, ∇f i = hh, [−∆]f i . 2π 2π Using this identity with ρ := [−∆]f ∈ C D , we find hh, ρi = hh, [−2π∆−1 ]ρi∇ . This implies Proposition 2.11 since     Cov hh, ρi, hh, ρ0 i = Cov hh, [−2π∆−1 ]ρi∇ , hh, [−2π∆−1 ]ρ0 i∇ = h[−2π∆−1 ]ρ, [−2π∆−1 ]ρ0 i∇ =

1 h∇[−2π∆−1 ]ρ, ∇[−2π∆−1 ]ρ0 i 2π ZZ

= hρ, [−2π∆−1 ]ρ0 i =

ρ(x)ρ(y)GD (x, y) dxdy , D×D

where in the last equality, we used property (e).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

340

C. GARBAN

Finally, let us mention that using property (b), it is not hard to extract the following striking property for Gaussian Free Field. Proposition 2.14 (Conformal invariance). — Let φ : D0 → D be a conformal map. If h is GFF in D, then h0 := h ◦ φ is a Gaussian Free Field in D0 . 2.5. The -regularized GFF h The purpose of this subsection is to regularize the Gaussian Free Field h in order to obtain a smooth function h . For this, we will rely on the following -regularization of the Green’s function. For any  > 0 and any point x ∈ D, let 1 ˜ x (y) . Gx (y) := log +G  ∨ |x − y| This regularization has the following important property: Proposition 2.15. — For any x ∈ D, and any  > 0, Gx ∈ H 1 . Furthermore, in the sense of distributions, one has the following identity −1 ∆[Gx (·)] = νx, , (14) 2π where νx, denotes the uniform measure on the circle of radius  around x, ∂B (x). Remark 2.16. — In fact, with the above definition of Gx , the proposition as stated is not correct when x is close to the boundary (d(x, ∂D) ≤ ). To overcome this issue while keeping the same statement for the proposition, the definition of Gx has to be modified accordingly near the boundary ∂D. To keep things simple, we choose in this paper to neglect these effects. We refer to [11] where this technicality is handled properly. This regularized Green’s function enables us to introduce h (z) the GFF evaluated against νx, , the uniform measure on ∂B (x). Informally, it corresponds to h (z) := hh, νx, i. Let us define it as follows Definition 2.17. — If h is a sample of a GFF in D, then for any z ∈ D, let h (z) := hh, Gx i∇ , which is well defined since Gx ∈ H 1 . In fact, it corresponds exactly to our informal definition thanks to the following computation: since Gx ∈ H 1 , one has h (z)

ASTÉRISQUE 352

= hh, Gx i∇ 1 = hh, [−∆]Gx i 2π = hh, νx, i .

(1052)

QUANTUM GRAVITY AND THE KPZ FORMULA

341

2.6. A Brownian motion out of the GFF Along this subsection, we will identify a very useful Brownian motion “within” the Gaussian Free Field. We start with the following lemma: Lemma 2.18. — For any z ∈ D and any  > 0(14), one has that (15)

  1 Var h (z) = log + log C(z, D) , 

where C(z, D) is the conformal radius of D viewed from z. Proof. — We have     Var h (z) = Var hh, Gz i∇ = hGz , Gz i∇ = hGz , νz, i Z 1 ˜ z (x)dνz, (dx) = log + G  1 = log + log C(z, D) .  The following proposition will be of crucial importance in the remaining of this text: Proposition 2.19. — Let h be a GFF with zero-boundary conditions in some domain D. For any point z ∈ D, let tz0 := inf{t ≥ 0 : Be−t (z) ⊂ D} and let Yt (z) := he−t (z) , be the stochastic process defined for any t ≥ tz0 . (Recall h (z) denotes the above regularization.) Then with such notations, the stochastic process

Bt (z) := Ytz0 +t − Ytz0 , is a standard Brownian motion. Proof. — The family of random variables { Bt (z)}t≥0 is clearly a Gaussian process.   Therefore, it only remains to check that for any 0 ≤ s ≤ t, Cov Bs (z), Bt (z) = s

(14)

To be self-contained, one should assume here that d(z, ∂D) ≥ 

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

342

C. GARBAN

z

z

z

(= s ∧ t). Let r0 := e−t0 , r1 := e−(t0 +s) and r2 := e−(t0 +t) . Let us first compute     Cov hr1 (z), hr2 (z) = E hh, Gzr1 i∇ hh, Gzr2 i∇ = hGzr1 , Gzr2 i∇ = hGzr1 , νr2 ,z i 1 + log C(z, D) z e−t0 −s = tz0 + s + log C(z, D) .     One can compute in the same way Cov hr0 (z), hr1 (z) and Cov hr0 (z), hr2 (z) . This gives us     Cov Bs (z), Bt (z) = Cov hr1 (z) − hr0 (z), hr2 (z) − hr0 (z) = log

= tz0 + s + tz0 − 2 ∗ tz0 = s. Let us conclude this section on the Gaussian Free Field by the following remark. Remark 2.20 (Gaussian Free Field on S2 ). — We have just defined the Gaussian Free Field on a domain D with Dirichlet Boundary conditions. In the same fashion, one can define a Gaussian Free Field on the sphere S2 (this is needed for example if one wants to make sense of Conjecture 1.12). In this case, the Green’s function is given by  θ GD (x, y) := log cotan for all x, y ∈ S2 , 2 where θ denotes the angle between x and y. If one wants to define the Gaussian Free Field on S2 as a Gaussian process similarly as in Definition 2.9, the construction can be done in the same fashion except that in this case, the natural Hilbert space to 0 consider would be the closure for the norm k · k∇ of the space C∞ (S2 ) of smooth R functions φ : S2 → R with S2 φ(x)dx = 0 (the integral here is with respect to the area measure on S2 ).

3. THE LIOUVILLE MEASURES eγh The purpose of this section is to make sense of these Liouville measures eγh , which are crucial in the main Theorem 1.10. The approach followed in [11] is to discretize eγ h into eγ h (where h is the -regularization of the GFF h we have introduced in Subsection 2.5) and to then let  → 0. As it will become clear below, without renormalization, eγ h would diverge in the space of measures. The natural discretization will be the following one:

ASTÉRISQUE 352

(1052)

QUANTUM GRAVITY AND THE KPZ FORMULA

343

Definition 3.1. — For any domain D, any γ ≥ 0 and any  > 0, let µ be the measure absolutely continuous with respect to Lebesgue measure L and such that dµ (z) := 

(16)

γ2 2

eγ h (z) dz .

Duplantier and Sheffield prove the following proposition in [11]: Proposition 3.2. — If γ ∈ [0, 2), then for any domain D, almost surely as  & 0 along powers of two, the measures µ weakly converge inside D towards a non-degenerate random measure µγ which we will call the Liouville measure of parameter γ. The Liouville measure µγ is measurable with respect to the Gaussian Free Field h and we will denote it sometimes by µγ = eγ h . Remark 3.3. — (i) If γ ∈ (0, 2), it can be shown that the Liouville measure µγ is a.s. singular with respect to Lebesgue measure. (ii) If γ ≥ 2, in some sense things become “singular”. See for example the work [3] which studies this case. We give here a new proof of this proposition which holds only for the regime √ γ ∈ [0, 2) and furthermore our convergence result will hold only along a certain subsequence k & 0 that we will not make explicit (in [11], it is also along a particular subsequence, but they show that k = 2−k is enough). We believe this proof is interesting in its own since it is slightly different from the one carried in [11], yet it cannot √ be extended to the range γ ∈ [ 2, 2). See the proof in [11] which gives the full range [0, 2). √ Proof in the case γ ∈ [0, 2). — To simplify, we will restrict ourselves to the case where D is a bounded domain. We wish to prove the following proposition: √ ¯ → R, Proposition 3.4. — If γ ∈ [0, 2), then for any continuous function φ : D the sequence of random variables ßZ ™ {µ (φ)}>0 = φ(z)µ (dz) D

>0

2

is a Cauchy sequence in L . Let us first see why this proposition implies Proposition 3.2 in the regime √ ¯ be the space of finite positive measures on D. ¯ It is well-known γ ∈ [0, 2). Let M(D) ∗ that this space equipped with the weak topology (called “weak convergence of measures” in Probability theory) is a complete, metrizable, separable space. Here is ¯ which induces the weak∗ topology. Let (φj )j≥1 be a an example of a metric on M(D)

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

344

C. GARBAN

¯ k · k∞ ) of continuous functions on D ¯ countable basis of the separable space ( C 0 (D), such that kφj k∞ ≤ 1 for all j. Then d(η 1 , η 2 ) :=

X |η 1 (φj ) − η 2 (φj )| 2j

j≥1

¯ for the weak∗ topology. defines a metric on M(D) Using Proposition 3.2, one can find a subsequence (k )k≥1 such that uniformly for all j ∈ {1, ..., k}, 2   E µk0 (φj ) − µk00 (φj ) ≤ 2−3k for all k 00 ≥ k 0 ≥ k .   By Markov’s inequality, this implies P |µk0 (φj ) − µk00 (φj )| ≥ 2−k ≤ 2−k for all k ≥ 1 and j ≤ k. Using Borel-Cantelli lemma, it is an easy exercise to show that ¯ d). Since the later this in turn implies that µk is a.s. a Cauchy sequence in (M(D), ¯ Furthermore, space is complete, we thus obtain an almost sure limit µ = µγ ∈ M(D). since each random measure µk is clearly measurable with respect to the Gaussian Free Field h, we obtain that µγ = lim µk (h) is itself measurable with respect to h as ¯ d) of h-measurable measures. a limit in (M(D), Proof of Proposition 3.2. — Let us start with the simpler lemma √ ¯ → R, we have Lemma 3.5. — If γ ∈ [0, 2), then for any continuous function φ : D that ZZ    γ 2 /2 γ 2 GD (x,y) E µ (φ)2 −→ φ(x)φ(y) C(x, D)C(y, D) e dxdy . →0

D×D

Proof of the lemma. —   E µ (φ)2 =

ZZ

  2 φ(x)φ(y) γ E eγh (x)+γh (y) dxdy D×D

ZZ

2

φ(x)φ(y) γ e

=

(17)

γ2 2





Var h (x)+h (y)

dxdy ,

D×D

where we used the fact that if X ∼ N (0, σ 2 ), then its Laplace transform is given   γ 2 σ2 by E eγX = e 2 . Now,         Var h (x) + h (y) = Var h (x) + Var h (y) + 2 Cov h (x), h (y)     = Var h (x) + Var h (y) + 2 hGx , ν,y i .

ASTÉRISQUE 352

(1052)

QUANTUM GRAVITY AND THE KPZ FORMULA

If |x − y| > , we find exactly

345

(15)

:

  1 Var h (x) + h (y) = 2 log + log C(x, D) + log C(y, D) + 2 GD (x, y) .  Let H(x, y) := log[C(x, D)C(y, D)] + 2 GD (x, y), then if |x − y| ≤ , one finds instead the inequality   1 Var h (x) + h (y) ≤ 2 log + H(x, y) .  Plugging these into (17) gives us ZZ    γ 2 /2 γ 2 GD (x,y) E µ (φ)2 = φ(x)φ(y) C(x, D)C(y, D) e dxdy |x−y|>

+

O(kφk2∞

ZZ e

γ2 2

H(x,y)

dxdy) .

|x−y|≤

To conclude the proof of the lemma, one needs to show that the second term goes to zero as  → 0 while the first one remains bounded. The key contribution in both 1 cases is what happens when x ∼ y. In that case, we know that GD (x, y) ∼ log |x−y| . 2

This implies that when x ∼ y, the term eγ GD (x,y) behaves like 1 γ 2 +o(1) 2 eγ GD (x,y) = , x−y RR 1 α where o(1) → 0 as x → y. Using the fact that if α < 2, then D×D x−y < ∞, it is an easy exercise to conclude the proof of the lemma. Now, let us prove Proposition 3.4, i.e. that {µ (φ)}>0 is a Cauchy sequence for ¯ For this, let us estimate for 0 < η < : any φ continuous on D.  2      E µ (φ) − µη (φ) =E µ (φ)2 + E µη (φ)2 ZZ   γ2 γ2 γ2 − 2 2 η 2 φ(x)φ(y)e 2 Var h (x)+hη (y) dxdy . D×D

Similarly as in the proof of the lemma, we find that   1 1 Var h (x) + hη (y) ≤ log + log + log(C(x, D)C(y, D)) + 2 GD (x, y) ,  η with equality if and only if |x − y| ≥  ∨ η (and d(x, ∂D) ∧ d(y, ∂D) ≥  as well). In √ particular, in the same fashion as above, if γ is chosen so that γ < 2, this implies (15) In fact we also need to assume here that d(x, ∂D) ∧ d(y, ∂D) ≥ , but we neglect these boundary issues here which are easy to be taken care of.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

346

C. GARBAN

that 

γ2 2

η

γ2 2

ZZ

γ2 2

D×D

φ(x)φ(y)e ZZ −→ 0 2 and where hzr := hr + γ Gzr (c = cγ is some explicit constant). See Subsection 4.1 in [11]. We will not prove this proposition, but instead we will convince ourselves through the computation of the expectation of µzγ (Br (z)) that one can indeed expect such a behavior: Lemma 4.3. — We have     z E µzγ (Br (z)) ∼ c rγQ E eγ hr (z) , as r → 0 for a certain constant c = cγ . Proof. — First of all, using Lemma 2.18, one has (if d(z, ∂D) ≥ r):     2 z z E eγ hr (z) = E eγ hr (z) eγ Gr (z) = C(z, D) = C(z, D)

ASTÉRISQUE 352

γ2 2

r−

3γ 2 2

γ2 2

r−3γ

2

C(z, D)γ r−γ 2

/2

.

2

(1052)

QUANTUM GRAVITY AND THE KPZ FORMULA

349

  In order to compute E µzγ (Br (z)) , let us approximate hz = h + γ Gz into hz := h + γ Gz : Z     γ2 2 z E eγh (x)+γ G (x) dx E µzγ (Br (z)) = lim  2 →0 Br Z γ2 ˜ z 2 z G e 2 (x) eγ G (x) dx using Lemma 2.18 = B Z r 2 γ ˜z 2 −1 2 ˜z e 2 G (x) eγ log |x−z| +γ G (x) = Br

Z exp

= Br

 3γ 2 z  1 ˜ (z) + o(1) dx , G 2 |x − z|γ 2

˜ z (x) is continuous. Therefore as r → 0: as r → 0, since x 7→ G   2 E µzγ (Br (z)) ∼ C(z, D)3γ /2 ∼ C(z, D)3γ

2

Z Br r

/2

1 dx |x − z|γ 2

Z

2

2π u1−γ du

u=0 2

∼ c C(z, D)3γ /2 r2−γ   ∼ c r γ Q E eγ h

2

Remark 4.4. — This first moment computation indeed provides some supporting evidence for Proposition 4.2. Yet, such a comparison of first moments is not so natural after all since, as it was pointed out to us by Nicolas Curien, the expected quantum √ area of Br (z) diverges as r → 0 when γ ∈ ( 2, 2] (in the above displayed equation, √ 2 − γ 2 < 0 when γ > 2). This counter-intuitive phenomenon is due to the fact   z that for any γ > 0, the main contribution in E eγ hr (z) does not come from typical properties of h (z) but follows instead from large deviations events for h (z). This is why first moments computations are not suitable for studying “typical” behavior as one is interested in the statement of Proposition 4.2. See Subsection 4.1 in [11] for a proof of this “law of large numbers” type of behavior.

Recall that the quantum ball B δ (r) for τ := sup{r ≥ 0, µzγ (Br (z)) ≤ δ}. The content should be very well approximated by the ball

a field hz is defined as Bτ (z) with of Proposition 4.2 tells us that B δ (z) ˜ δ (r) defined as Bτ˜ (z) with B

¶ © z τ˜ := sup r > 0 s.t. c rγQ eγ hr (z) ≤ δ .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

350

C. GARBAN

Plugging this into (18) gives us Z    E µ B δ (z) ∩ K 6= ∅  [0,1]2

Z  [0,1]2

Z ≈ [0,1]2

Z  [0,1]2

  ρ(z)dz Ph Bhδ z =h+γGz (z) ∩ K 6= ∅ h dz Eh 1B δ

i

(z)∩K6=∅ h+γGz

h i dz Eh 1Bτ˜ (z)∩K6=∅ h  i dz Eh E 1Bτ˜ (z)∩K6=∅ τ˜ .

As we will see below, it is not difficult to show that the law of the random radius ˜ τ˜ = τ˜(z) at point z depends very little on the point z ∈ [0, 1]2 (16). In particular, if P denotes this common law for τ˜, we have that Z Z    ˜ r) E µ B δ (z) ∩ K 6= ∅ ≈ dP(¯ dz1Br¯(z)∩K6=∅ [0,1]2

R+

Z ≈

˜ r) r¯2 x(K) by definition of x = x(K) dP(¯

R+

  ˜ τ˜2 x(K) . ≈E Therefore it only remains to understand the law of τ˜ (in some sense uniformly in the root z ∈ [0, 1]2 ). This will be done by identifying a drifted Brownian motion within hz := h + γ Gz . 4.4. Reduction to a large deviation question on Brownian motion Let us fix some z ∈ (0, 1)2 and let t0 ≥ 0 so that Be−t0 (z) ⊂ (0, 1)2 . Then similarly as in Proposition 2.19, if Wt (z) := hze−t−t0 − hze−t0   = he−t−t0 (z) − he−t0 (z) + γ Gze−t−t0 (z) − Gze−t0 (z) = he−t−t0 (z) − he−t0 (z) + γ t , (d)

then (Wt (z))t≥0 is a Brownian motion with drift γ. I.e Wt = Bt +γ t. τ˜ can be defined using this Brownian motion: indeed recall ¶ © z τ˜ := sup r > 0 s.t. c rγQ eγ hr (z) ≤ δ h ¶ ©i z = exp − inf t > 0 s.t. c (e−t )γQ eγ he−t (z) ≤ δ h ¶ ©i 2 ≈ exp − inf t > 0 s.t. (e−t )γQ eγ Bt +γ t ≤ δ (16)

We are neglecting boundary issues here.

ASTÉRISQUE 352

(1052)

QUANTUM GRAVITY AND THE KPZ FORMULA

351

ß ™ h log δ i = exp − inf t > 0 s.t. Bt + (γ − Q) t ≤ γ ´i ® 1 h ¯t + aγ t ≥ log δ , = exp − inf t > 0 s.t. B γ ¯t := (−Bt ) is a standard Brownian motion and where aγ := Qγ − γ = where B 2/γ − γ/2, which is positive when γ < 2. Let T = Tδ be the stopping time for the ¯t + aγ t stopped the first time it reaches level γ −1 log 1 . drifted Brownian motion B δ Since τ˜ ≈ e−Tδ , summarizing the above discussion, we obtain that ∆ = ∆(K) should be given by   log E e−2x Tδ ∆ = lim . δ→0 log δ   It remains to compute the quantity E e−2x Tδ . This is a classical computation for Brownian motion and it works as follows. Consider for any β ≥ 0 the process: t 7→ exp βBt −

β2  t , 2

which is a martingale. Using the optional stopping theorem for the stopping time Tδ , we get for any β ≥ 0,   1 E exp − β aγ Tδ + β/γ log − β 2 Tδ /2 = 1 , δ which in turn gives   E e−2xTδ = δ β/γ , if β = βγ is chosen so that 2x = β aγ + β 2 /2. Since ∆ = ∆(K) is given ultimately by βγ /γ, this indeed gives us a quadratic relation between x(K) and ∆(K). One can check that this quadratic relation is the KPZ Formula (8).

4.5. Other proofs of a KPZ formula in the literature Finally, let us mention that after Duplantier and Sheffield announced their result, other proofs of KPZ formulas have been proved in slightly different settings: – Benjamini and Schramm obtained in [5] a simple and enlightening proof of a KPZ formula for multiplicative dyadic cascades in dimension one. The advantage of their proof is that it gives a quadratic relation between actual Hausdorff dimensions as opposed to “expected box-counting dimensions” in [11]. Unfortunately, their argument is inherently one-dimensional and if one would extend their argument to higher dimensions, it would no longer deal with proper Hausdorff dimensions.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

352

C. GARBAN

– Rhodes and Vargas proved in [27] a KPZ formula in the general setting of Gaussian multiplicative Chaos. Their proof enables to deal with “stationary” measures (as opposed to [5] which relies on a discrete dyadic division). The difference with [11] is that their KPZ formula holds for a different notion of dimension (or rather scaling exponent) as the one considered in [11]. In that sense their work is complementary to the work [11]. More precisely, in rough terms, if K ⊂ [0, 1]2 and if µ denotes a measure (for example the Liouville measure), then their notion of scaling exponent is defined as ( ) X ˜ ∆(K) := inf s ∈ (0, 1], s.t. inf { µ(B(xi , ri ))s } = 0 , coverings K⊂∪B(xi ,ri )

i

where the balls B(xi , ri ) are Euclidean balls of radii ri . This notion is very different from the expected box-counting dimension considered in [11]. Note ˜ still rely that in both works [11] and [27], the notions of scaling exponents ∆, ∆ somewhat on the Euclidean metric. It seems one is still far from a “true” KPZ correspondence between Euclidean and quantum metrics.

REFERENCES [1] O. Angel – “Growth and percolation on the uniform infinite planar triangulation”, Geom. Funct. Anal. 13 (2003), no. 5, p. 935–974. [2] O. Angel & N. Curien – “Percolations on infinite random maps”, in preparation. [3] J. Barral, X. Jin, R. Rhodes & V. Vargas – “Gaussian multiplicative chaos and KPZ duality”, preprint arXiv:1202.5296. [4] I. Benjamini & N. Curien – “Simple random walk on the uniform infinite planar quadrangulation: Subdiffusivity via pioneer points”, preprint arXiv:1202.5454. [5] I. Benjamini & O. Schramm – “KPZ in one dimensional random geometry of multiplicative cascades”, Comm. Math. Phys. 289 (2009), no. 2, p. 653–662. [6] J. Bettinelli – “Scaling limit of random planar quadrangulations with a boundary”, preprint arXiv:1111.7227. [7] J. Dubédat – “SLE and the free field: partition functions and couplings”, J. Amer. Math. Soc. 22 (2009), no. 4, p. 995–1054. [8] B. Duplantier – “Random walks and quantum gravity in two dimensions”, Phys. Rev. Lett. 81 (1998), no. 25, p. 5489–5492.

ASTÉRISQUE 352

(1052)

[9]

[10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23]

[24] [25] [26]

QUANTUM GRAVITY AND THE KPZ FORMULA

353

, “Conformal fractal geometry & boundary quantum gravity”, in Fractal geometry and applications: a jubilee of Benoît Mandelbrot, Part 2, Proc. Sympos. Pure Math., vol. 72, Amer. Math. Soc., 2004, p. 365–482. B. Duplantier & K. H. Kwon – “Conformal invariance and intersection of random walks”, Phys. Rev. Lett. 61 (1988), p. 2514–2517. B. Duplantier & S. Sheffield – “Liouville quantum gravity and KPZ”, Invent. Math. 185 (2011), no. 2, p. 333–393. J.-P. Kahane – “Sur le chaos multiplicatif”, Ann. Sci. Math. Québec 9 (1985), no. 2, p. 105–150. V. A. Kazakov – “Ising model on a dynamical planar random lattice: exact solution”, Phys. Lett. A 119 (1986), no. 3, p. 140–144. V. G. Knizhnik, A. M. Polyakov & A. B. Zamolodchikov – “Fractal structure of 2D-quantum gravity”, Modern Phys. Lett. A 3 (1988), no. 8, p. 819–826. G. F. Lawler & V. Limic – Random walk: a modern introduction, Cambridge Studies in Advanced Math., vol. 123, Cambridge Univ. Press, 2010. G. F. Lawler, O. Schramm & W. Werner – “Values of Brownian intersection exponents. I. Half-plane exponents”, Acta Math. 187 (2001), no. 2, p. 237–273. , “Values of Brownian intersection exponents. II. Plane exponents”, Acta Math. 187 (2001), no. 2, p. 275–308. G. F. Lawler & W. Werner – “Intersection exponents for planar Brownian motion”, Ann. Probab. 27 (1999), no. 4, p. 1601–1642. J.-F. Le Gall – “The topological structure of scaling limits of large planar maps”, Invent. Math. 169 (2007), no. 3, p. 621–670. , “Uniqueness and universality of the Brownian map”, preprint arXiv:1105.4842. J.-F. Le Gall & G. Miermont – “Scaling limits of random planar maps with large faces”, Ann. Probab. 39 (2011), no. 1, p. 1–69. , “Scaling limits of random trees and planar maps”, preprint arXiv:1101.4856. J.-F. Le Gall & F. Paulin – “Scaling limits of bipartite planar maps are homeomorphic to the 2-sphere”, Geom. Funct. Anal. 18 (2008), no. 3, p. 893– 918. G. Miermont – “On the sphericity of scaling limits of random planar quadrangulations”, Electron. Commun. Probab. 13 (2008), p. 248–257. , “The Brownian map is the scaling limit of uniform random plane quadrangulations”, preprint arXiv:1104.1606. L. Onsager – “Crystal statistics. I. A two-dimensional model with an orderdisorder transition”, Phys. Rev. 65 (1944), p. 117–149.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

354

C. GARBAN

[27] R. Rhodes & V. Vargas – “KPZ formula for log-infinitely divisible multifractal random measures”, ESAIM Probab. Stat. 15 (2011), p. 358–371. [28] R. Robert & V. Vargas – “Gaussian multiplicative chaos revisited”, Ann. Probab. 38 (2010), no. 2, p. 605–631. [29] H. Saleur & B. Duplantier – “Exact determination of the percolation hull exponent in two dimensions”, Phys. Rev. Lett. 58 (1987), no. 22, p. 2325–2328. [30] S. Sheffield – “Gaussian free fields for mathematicians”, Probab. Theory Related Fields 139 (2007), nos. 3-4, p. 521–541. [31]

, “Conformal weldings of random surfaces: SLE and the quantum gravity zipper”, preprint arXiv:1012.4797.

[32] S. Smirnov – “Conformal invariance in random cluster models. I. Holomorphic fermions in the Ising model”, Ann. of Math. 172 (2010), no. 2, p. 1435–1467.

Christophe GARBAN École Normale Supérieure de Lyon U.M.P.A. CNRS UMR 5669 46 allée d’Italie F–69364 Lyon Cedex 07 E-mail : [email protected]

ASTÉRISQUE 352

352

ASTÉRISQUE 2013

SÉMINAIRE BOURBAKI VOLUME 2011/2012 EXPOSÉS 1043-1058 (1053) Space time resonances David LANNES

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Séminaire BOURBAKI 64e année, 2011-2012, no 1053, p. 355 à 388

Mars 2012

SPACE TIME RESONANCES [after Germain, Masmoudi, Shatah] by David LANNES

INTRODUCTION An important research program in nonlinear partial differential equations consists in proving the existence of global in time smooth solutions to various nonlinear dispersive equations on Rd (d integer, d ≥ 1) with small initial data. This program was initiated about three decades ago and has been the motivation for the development of powerful concepts. A general feature is that the linear dispersive terms of the equation tend to force the solution to spread and to decay. Various dispersive estimates have been derived to provide precise informations on this decay. The contribution of the nonlinear terms is very different. As for ordinary differential equations, they may be responsible for the development of finite time singularities. When dealing with small data, smooth nonlinearities behave roughly as their Taylor expansion at zero. The smaller the homogeneity p of the nonlinearity at the origin, the larger the nonlinear effects. A first class of global existence results can be obtained when dispersive effects dominate nonlinear effects. Since dispersive effects increase with the dimension d, this is the general situation in large dimension and/or large p; in this situation, nonlinearities do not contribute to the large time behavior of the solution (see for instance [39]). In smaller dimension or for lower order nonlinearities, the situation is more complicated and depends on the precise structure of the nonlinearity, not only on its order. For the quadratic wave equation in dimension d = 3, Klainerman identified [25] the so called null condition on the nonlinearities that ensures, with his powerful vector fields method, global existence for small data. This method is very robust and has been used for many other equations; a spectacular illustration is for instance [4] for the global nonlinear stability of the Minkowski space (see also [30] for a simplified proof using the notion of weak null condition). We also refer for instance to [20] for

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

356

D. LANNES

applications to the Schrödinger equation, to [27] for a small review, and to [8] for a new approach of the vector fields method. Another powerful technique to obtain global existence of nonlinear dispersive equations in low dimension or lower order nonlinearities is the normal form method popularized by Shatah who used it for the nonlinear Klein-Gordon equation [34] (see also [36] for a similar approach by Simon). The idea of this method is inspired by the theory of Poincaré’s normal forms for dynamical systems; for a quadratic equation for instance, it consists in making a quadratic change of unknown chosen so that the new unknown solves a cubic evolution equation, for which global existence is much easier to establish. In absence of, or with few time resonances, this method is very efficient, and has also been used in many works. See for instance [33, 37, 31], as well as [9] where the relevance of null conditions for the normal form method is exploited. In a series of papers [14, 16, 15, 12, 13], Germain, Masmoudi and Shatah introduced a new method to handle situations where the normal form approach cannot be used. The same idea has also been used independently by Gustafson, Nakanishi and Tsai [17, 18] for the Gross-Pitaevskii equation. Working on a Duhamel formulation of the equations in Fourier variables, they identify the normal form transform as an integration by parts in time in this formula. Time resonances are the natural obstruction since they create singularities when this integration by parts is performed. Germain, Masmoudi and Shatah propose to complement this approach with an integration by parts in frequency that provides extra time decay, which is helpful to prove global well posedness. The obstructions to this approach are called by the authors space resonances; they differ in general from time resonances, which explains why situations that were not covered by the normal form approach can be handled this way. As for the vector fields with the null condition, the structure of the nonlinearities plays an important role for the space time resonance approach; when the nonlinearities cancel some of the singularities created by time or frequency integration by parts, one may expect the normal form method or Germain, Masmoudi and Shatah’s more general approach to work even in situations where time and/or space resonances are present. Based on an analogy with optics, we call here these structural conditions time and space transparency. We tried in these notes to distinguish the notion of null condition from those of space and time transparencies; we also relate them to another structural condition on the nonlinearities called compatibility, and which is linked to the decay rate of products of solutions of homogeneous linear dispersive equations. Throughout these notes, we use the following quadratic wave equation as a simple example to explain Klainerman’s vector field method, the normal form approach, and

ASTÉRISQUE 352

(1053)

SPACE TIME RESONANCES

357

Germain-Masmoudi-Shatah’s new method, (1)

∂t2 u − ∆u = Q(∂u, ∂u),

u|t=0 = εu(0) ,

∂t u|t=0 = εu(1) ,

where Q(·, ·) is a symmetric bilinear form and ∂u = (∂t u, ∂1 u, . . . , ∂d u)T . When the simplicity of this example hides important phenomena, we also use a system of two coupled such equations. We also comment on the case of general first order symmetric systems because this framework is quite adapted for a comparison of the null condition, the space and time transparencies, and the compatibility condition. Section 1 is devoted to a general exposure of Klainerman’s vector field method, while Section 2 is centered on the normal form approach. These techniques are very classical and our goal is not to review recent results related to them; we just present their basic mechanisms to help understanding the rationale and the interest of the new method of Germain, Masmoudi and Shatah, which is described in Section 3. We also include in this section a description of the authors’ global existence result for the water waves equations [16], which is probably the most important example of application of this new method. Finally we point out in Section 4 that the null, transparency and compatibilities conditions play also a role in other contexts than the issue of global existence for small data.

1. KLAINERMAN’S VECTOR FIELDS METHOD As explained in the introduction, global existence for small initial data is the general scenario for nonlinear dispersive equations when the dimension is large and/or the nonlinearity is of high order at the origin. For the quadratic wave equation (1), global existence is always true when d ≥ 4. We sketch the proof of this classical result in § 1.1. 1.1. Global existence for the quadratic wave equation (1) in dimension d≥4 We prove in this section the following theorem using the vector fields method introduced by Klainerman [25]. Theorem 1.1 ([25]). — The Cauchy problem (1) with smooth compactly supported initial conditions has a smooth solution for all t ≥ 0 if d ≥ 4 and ε is small enough. For the linear homogeneous wave equation, (2)

∂t2 u − ∆u = 0,

u|t=0 = εu(0) ,

∂t u|t=0 = εu(1) ,

the energy 1 2

1 2

E(u) = |∂t u|22 + |∇u|22

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

358

D. LANNES

is conserved. More generally, one gets the following classical energy inequality after multiplying u by ∂t u and integrating in space, Z t 1/2 1/2 (3) E(u) (t) ≤ E(u) (0) + |u(τ, ·)|2 dτ. 0

If Z is a vector field that commutes with the operator  = ∂t2 − ∆, and if u solves (2), one also has (∂t2 − ∆)Zu = 0,

(4)

and E(Zu) is also conserved. More generally, if Z 1 , . . . , Z n is a family of vector fields that commute with the wave operator , the quantity E(Z 1 · · · Z n u) is conserved; this yields important information on the regularity and/or decay properties of the solution. For the wave equation, the vector fields that commute with  are ∂α ,

(5)

Zjk = xk ∂j − xj ∂k ,

Zj = xj ∂t + t∂j ,

where 0 ≤ α ≤ d, 1 ≤ j, k ≤ d, (t, x) = (x0 , x1 , . . . , xd ) and ∂α = ∂xα . These vector fields correspond to invariances of the equation, respectively translation and Lorentzian invariances. Another important vector field is given by Z0 = t∂t +

(6)

d X

xj ∂j ,

j=1

corresponding to scaling invariance; note that Z0 does not commute with  = ∂t2 − ∆ but that [, Z0 ] = 2, so that the property (4) holds. We call commuting vector fields the vector fields (5) and (6). One can then build Sobolev-type norms based on these vector fields and generalize the standard embedding H s (Rd ) ⊂ L∞ (Rd ) (s > d/2); more precisely, for all smooth and decaying function v of (t, x), the following Klainerman-Sobolev inequality (due to Klainerman [25], see also [21, 38] for a proof) holds, X d−1  (7) 1 + t + |x| 1 + |t − |x|| |v(t, x)|2 ≤ C |Z I v|22 , |I|≤d/2+1

where Z I denotes any product of |I| of the above commuting vector fields. Defining, for all s ≥ 0, the higher order energy X Es (v) = E(Z I v), |I|≤s

and remarking that for all 0 ≤ α ≤ d, (8)

Z I ∂α = linear combination of vector fields ∂β Z J , with |J| ≤ |I|,

the inequality (7) implies that for all product Z K of |K| commuting vector fields, d−1  (9) 1 + t + |x| 1 + |t − |x|| |Z K ∂v(t, x)|2 ≤ C Ed/2+1+|K| (v).

ASTÉRISQUE 352

(1053)

359

SPACE TIME RESONANCES

Since Ed/2+1+|K| (u) is a conserved quantity if u solves (2), (9) furnishes decay estimates for the solution of the homogeneous wave equation with smooth and compactly supported initial data. It is also the heart of Klainerman’s proof of global existence. Since either [, Z]U = 0 or [, Z]U = 2U = 2Q(∂u, ∂u), we get by applying Z I to (1) that (Z I u)

= =

(10)

[, Z I ]U + Z I Q(∂u, ∂u), X  QJK Z J ∂u, Z K ∂u |J|+|K|≤|I|

where the QJK are also bilinear forms on Rd+1 × Rd+1 . Therefore from (3), (11) X X X Z t E(Z I u)1/2 (t) ≤ E(Z I u)1/2 (0) + |QJK (Z J ∂u, Z K ∂u)(τ )|2 dτ. |I|≤s

|I|≤s

|J|+|K|≤s

0

Defining Ms (t) =

X

|Z I ∂u(t, ·)|2 ,

and

|I|≤s

ms (t) =

X

|Z I ∂u(t, ·)|∞

|I|≤s

(so that, thanks to (8), Ms (t) ∼ Es (u)1/2 ), and remarking that ∀J, K,

|QJK (Z J ∂u, Z K ∂u)(τ )|2 ≤ Cms/2 (τ )Ms (τ ),

|J| + |K| ≤ s,

we deduce from (11) that (12)

Z t   Ms (t) ≤ C Ms (0) + ms/2 (τ )Ms (τ )dτ . 0

We also deduce from (9) that (1 + t

d−1 2

)ms/2 (τ ) ≤ CMs/2+d/2+1 (τ )

and therefore, for all s ≥ d + 2 (so that s/2 + d/2 + 1 ≤ s), (13)

Z t   d−1 Ms (t) ≤ C Ms (0) + (1 + τ 2 )−1 Ms (τ )2 dτ , 0

for some constant C > 0. R∞ d−1 Denoting c∞ = 0 (1 + τ 2 )−1 < ∞ (since d > 3), we deduce that Ms (t) remains bounded from above by 2CMs (0) provided that 1 + 4Cc∞ Ms (0) < 2, which is always possible for small enough ε. Global existence then follows from a standard continuation argument.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

360

D. LANNES

1.2. Null forms and global existence in dimension d = 3 The global existence result proved in the previous section relies on the convergence R∞ d−1 of the integral 0 (1 + τ 2 )−1 dτ in (13). In dimension d = 3, this integral diverges logarithmically, and an adaptation of the same arguments yields a lower bound for the existence time, Tε ≥ exp( εc ), for some constant c > 0. One cannot expect a better result in general; Fritz John [22] showed for instance that (radial) solutions to the equation (14)

∂t2 u − ∆u = (∂t u)2 ,

u|t=0 = εu(0) ,

∂t u|t=0 = εu(1) ,

blow up at Tε ∼ exp( εc ) (see also [1] for other examples of blow up). On the other hand, as noticed by Nirenberg, it is easy to see that (15)

∂t2 u − ∆u = −(∂t u)2 + |∇u|2 ,

u|t=0 = εu(0) ,

∂t u|t=0 = εu(1) ,

admits global solutions for small ε. Let indeed v be the solution of the homogeneous wave Equation (2) with Cauchy data v|t=0 = exp(εu(0) ) − 1 and ∂t v|t=0 = ε exp(εu(0) )u(1) . Setting u ˜ = ln(1 + v) (this makes sense for small enough ε), one has u ˜|t=0 = εu(0) , ∂t u ˜|t=0 = εu(1) and  0 = ∂t2 v − ∆v = (exp u ˜) × ∂t2 u ˜ − ∆˜ u + (∂t u ˜)2 − |∇˜ u|2 ; it follows that u ˜ solves the same equation as u, and has the same Cauchy data, so that u = u ˜. Since u ˜ is obviously globally defined, the result follows. Of course, this method is not robust at all: it does not generalize to systems, or cubic perturbations, or to the quasilinear case treated by Klainerman. The different behavior observed for (14) and (15) can only come from the structure of the bilinear forms Q(ξ 1 , ξ 2 ) = τ 1 τ 2

and

Q(ξ 1 , ξ 2 ) = −τ 1 τ 2 + η 1 · η 2 =: −Q0 (ξ 1 , ξ 2 )

respectively (with ξ j = (τ j , η j ) ∈ R1+d , j = 1, 2)—here, d = 3, but this discussion holds for all d ≥ 2. If u and v denote two solutions of the homogeneous wave equation (2) with smooth and compactly supported initial data, then we can deduce from the Klainerman-Sobolev inequality (7) that ∂u and ∂v decay as O(t(−d+1)/2 ) so that Q(∂u, ∂v) = O(t−d+1 ). However, the decay of ∂u and ∂v is not uniform in all directions. It is of order O(t(−d+1)/2 ) in the direction ∂t − ∂r perpendicular to the light x cone but of order O(t(−d−1)/2 ) in the tangential directions ∂t + ∂r and ∂j − rj ∂r . The specific property about Q0 is that it does not contain quadratic terms involving only derivatives in the bad direction; consequently, one has a better decay estimate of the quadratic term (16)

ASTÉRISQUE 352

For all u, v solving (2),

Q0 (∂u, ∂v) = O(t−d ).

(1053)

SPACE TIME RESONANCES

361

It can be shown that a quadratic form satisfies this property if and only if it is proportional to Q0 ; we then say that it is compatible with the wave operator  (see §1.3 below for generalizations to first order hyperbolic systems). For the quadratic wave Equation (1), compatible forms coincide with the bilinear forms that satisfy the following null condition, identified by Klainerman (we follow here Klainerman’s proof [26]), X X C (17) |Q0 (∂u, ∂v)(t, x)|∞ ≤ |Z I u(t, x)| |Z I v(t, x)|, 1 + t + |x| |I|=1

|I|=1

3

for all t ≥ 0, x ∈ R , and all sufficiently smooth functions u and v. They behave therefore like cubic terms for time decay. Such forms are called null forms. The fact that Q0 is a null form follows easily from the double observation that Q0 (∂u, ∂v)

=

3 X  1 ∂t uZ0 v − Zi u∂i v t j=1

=

3 X  1 xi Zr u∂t v − ∂r uZ0 v − ∂i u Zij v , |x| |x| i,j=1

P P x x where ∂r = 3j=1 |x|j ∂j and Zr = 3j=1 |x|j Zj . Another important property about the null form Q0 (and therefore about all null forms for (1)) is that, for all commuting vector fields Z given by (5) or (6), (18)

if Q is a null form for (1), then [Z, Q] is also a null form,

with the notation [Z, Q](∂u, ∂v) = ZQ(∂u, ∂v) − Q(∂Zu, ∂v) − Q(∂u, ∂Zv). Thanks to (18), all the quadratic forms QJK in (10) are null forms. Using (17), we can replace the integral in the r.h.s. of the energy estimate (12) by Z t X X 1 (19) |Z L u(τ )|∞ |Z I u(τ, ·)|2 dτ ; 1 + τ 0 |L|≤s/2+1

|I|≤s+1

according to the discussion above, the previous proof should yield global existence thanks to this extra decay in time; unfortunately, if we set X X Ns (t) = |Z I u(t, ·)|2 and ns (t, x) = |Z I u(t, x)|, |I|≤s+1

|I|≤s+1

the quantities Ns (t) and |ns (t, ·)|∞ are not controlled by Ms (t) and ms (t) respectively (though the same number of derivatives are involved), and we cannot use the same bootstrap argument. The reason of this lack of control is that the energy E(u) controls |∂u|22 but not P I 2 |I|≤1 |Z u|2 . One possible way to deal with this obstruction is to look for a new vector field L(∂) such that uL(∂)u is a conservation law for a new energy F (u) that

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

362

D. LANNES

controls more vector fields than E(u) (which is obtained by taking L(∂) = ∂t ). The vector field L(∂)u = (1 + t2 + |x|2 )∂t + 2tx · ∇ + (d − 1)t, which had been introduced by Morawetz, has this remarkable property (see for instance [21, 38] for a proof). The associated energy is then given (in the case d = 3 we are interested in here) by

F (u) = E(u) +

3 3 1 X 1X 1 |Zjk u|22 + |Zj u|22 + |Z0 u + 2u|22 , 2 2 j=1 2 j,k=1

and one can then show that this energy provides the additional control we were looking for, X |Z I u|2 ∼ F (u)1/2 . |I|≤1

Proceeding as in §1.1 but with F (u) rather than E(u) (i.e. multiplying u by L(∂)u instead of ∂t u), the energy inequality (3) becomes Z t (20) F (u)1/2 (t) ≤ F (u)1/2 (0) + |(1 + τ + |x|)u(τ, ·)|2 dτ ; 0

similarly, (11) is replaced by (21)

 Ns (t) ≤ C Ns (0) +

X |J|+|K|≤s

Z

t

 |(1 + τ + |x|)QJK (Z J ∂u, Z K ∂u)(τ )|2 dτ .

0

By the null form property (17), we then get the following estimate instead of (12), Z t   (22) Ns (t) ≤ C Ns (0) + |ns/2 (τ, ·)|∞ Ns (τ )dτ , 0

and therefore, by Gronwall’s lemma, Z (23)

Ns (t) ≤ C1 Ns (0) exp C1

t

|ns/2 (τ, ·)|∞ dτ



0

for some constant C1 > 0. Using the Klainerman-Sobolev inequality to control ns/2 in terms of Ms is clearly not enough to get global existence since we obtain the same logarithmic divergence of the time integral as with the proof of §1.1. We can however use the following L1 − L∞ decay estimate (see [21] for a proof): for all v smooth enough and with zero Cauchy data (v|t=0 = ∂t v|t=0 = 0), the following holds Z Z t X 1 |Z I v(τ, y)|dτ dy. (24) (1 + t + |x|)|v(t, x)| ≤ C 1 + τ + |y| 3 R 0 |I|≤2

ASTÉRISQUE 352

(1053)

363

SPACE TIME RESONANCES

fi I u the solution to the homogeneous linear wave Equation (2) with same Denoting by Z Cauchy data as Z I u, we can use (24) to write X X fi fi I u)(t, x)| + I u(t, x)| ns/2 (t, x) ≤ |(Z I u − Z |Z |I|≤s/2+1



|I|≤s/2+1

C 1 + t + |x|

Z Z y

0

t

1 1 + τ + |y|

X

 |QJK (Z J ∂u, Z K ∂u)| + ε .

|J|+|K|≤s/2+3

Since we know by (18) that the QJK are null forms, we easily get from (17) that Z t  C2 1 (25) ns/2 (t, x) ≤ Ns (τ )2 dτ + ε 1 + t + |x| 0 (1 + τ )2 for some constant C2 > 0. We now prove Klainerman’s global existence result by a bootstrap argument on (23) and (25). It is indeed straightforward to prove that the largest time T∗ such that ∀t ∈ [0, T∗ ), x ∈ Rd

Ns (t) ≤ εC2 (1 + t)ε2C1 C2

and

ns/2 (t, x) ≤ ε

2C2 1 + t + |x|

is infinite (T∗ = +∞) if C2 is chosen large enough and if ε is small enough. We have thus proved the following theorem (of which Christodoulou gave independently another proof based on the conformal method [3]). Theorem 1.2 ([26, 3]). — Let d = 3 and Q satisfy the null form conditions (17) and (18). Then if u(0) and u(1) are smooth and compactly supported, the quadratic wave Equation (1) is globally well-posed when ε is small enough. Remark 1.3. — For the scalar wave Equation (1) we have seen that the only quadratic forms satisfying (17) and (18) are multiples of Q0 . The same proof works verbatim with, for instance, the system of wave equations introduced in Example 2 below and for which other null forms exist (see Theorem 1.5 below). Remark 1.4. — The result still holds if cubic terms of the form F (u, ∂u) = O(|u|3 + |∂u|3 ) are added to the quadratic null forms (treating cubic terms as in Theorem 2.1 below); Nirenberg’s trick does not cover this situation. Note also that Klainerman’s result also covers the quasilinear case not considered in these notes. 1.3. Generalizations to first order hyperbolic systems We propose here to discuss some basic generalization of the concepts introduced in the previous section. Sticking to the semilinear case with homogeneous dispersion let us consider here first order hyperbolic systems of the form (26)

∂t U + A(∂)U = Q(U, U ),

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

364

D. LANNES

P where U : (t, x) ∈ R+ × Rd → Rn , A(∂) = dj=1 Aj ∂j , the Aj are n × n real valued symmetric matrices and each of the n components of Q is a bilinear symmetric form. It follows that for all ξ ∈ Rd , the eigenvalues of A(ξ) are real and we assume for simplicity that they are of constant multiplicity for ξ 6= 0, m X (27) A(ξ) = λj (ξ)πj (ξ), j=1

where πj (ξ) is the eigenprojector associated to the eigenvalue λj (ξ); these mappings are smooth on Rd \{0} and homogeneous of order 0 and 1 respectively. By convention, we take λj (0) = 0 and πj (0) = I. We also assume that the section {λj (ξ) = 1} is strictly convex,  which is equivalent to saying that for all ξ 6= 0, the Hessian Hess(λj (ξ) is of rank d−1. The number of non zero sectional curvatures of the hypersurfaces {(ξ, λj (ξ)), ξ ∈ Rd } is indeed related to the L∞ -decay estimates of the homogeneous equation (28)

∀j = 1 . . . m,

(29)

∂t U + A(∂)U = 0,

through stationary phase arguments, and (28) implies that this decay is the same O(t−(d−1)/2 ) as for the homogeneous wave equation. Example 1 (Scalar wave equation). — Writing v = ∂t u, w = ∇u, the quadratic wave equation (1) can be written under the form (26), with ! ! ! 0 −ξ T Q(U, U ) v , A(ξ) = A (ξ) := , Q(U, U ) = . U= −ξ 0d×d 0d×1 w For all ξ 6= 0, A(ξ) has three eigenvalues λ0 (ξ) = 0 and λ± (ξ) = ±|ξ|; the eigenprojector π0 (ξ) is the orthogonal projector onto (0, ξ ⊥ ) while π± (ξ) = e± (ξ) ⊗ e± (ξ) 1 where the eigenvectors e± (ξ) are given by e± (ξ) = √2|ξ| (∓|ξ|, ξ T )T . This system satisfies (28) except for the identically zero eigenvalue λ0 which can easily be discarded “(t, ξ) = 0). since w remains a gradient for all times (so that π0 (ξ)U Example 2 (System of two wave equations). — Let us consider here a system of two coupled quadratic wave equations of the form (1),   u1 = Q1 (∂u1 , ∂u1 ) + Q1 (∂u1 , ∂u2 ) + Q1 (∂u2 , ∂u2 ), 11 12 22 (30)  u2 = Q2 (∂u1 , ∂u1 ) + Q2 (∂u1 , ∂u2 ) + Q2 (∂u2 , ∂u2 ), 11 12 22 where Qjkl (j = 1, 2, 1 ≤ j, k ≤ 2) are bilinear forms on Rd+1 . Defining U 1 and U 2 as in the previous example, this system can also be put under the form (26), with ! ! U1 Q1 (U, U ) U= , A(ξ) = diag(A (ξ), A (ξ)), Q(U, U ) = U2 Q2 (U, U )

ASTÉRISQUE 352

(1053)

365

SPACE TIME RESONANCES

with Qj = (Qj11 (U 1 , U 1 ) + Qj12 (U 1 , U 2 ) + Qj22 (U 2 , U 2 ), 0, . . . , 0)T . The eigenvalues are the same as in the previous example, but their multiplicity is twice as large. For the same reasons, we can discard the zero eigenvalue and focus on λ± (ξ) = ±|ξ|; the associated eigenprojectors are now of rank 2; they are a 2 × 2 block diagonal matrix with entries corresponding to the eigenprojectors of the scalar case. Klainerman’s vector fields method can be generalized to systems of the form (26) satisfying (28), and decay estimates in the spirit of (7) can be established [11]. One expects therefore global existence in dimension d ≥ 4 as for the scalar wave equation (note however that since the placeholders for the vector fields are not differential operators anymore, a formula like (10) is in general not true). Let us therefore focus our attention on the case d = 3. We have seen that for the scalar quadratic wave Equation (1), the only compatible quadratic forms Q (those that satisfy the improved decay estimate (16)) are proportional to Q0 . Compatible forms for (26) are defined similarly by the property that (31) Q(U, V ) = O(t−d )

for all U, V such that (∂t + A(∂))U = (∂t + A(∂))V = 0,

with smooth and decaying enough initial data U(0) , V(0) . As for the wave operator , compatible forms with hyperbolic systems (26) satisfying (28) can be identified [19]: they are those for which all the eigenspaces of A(ξ) are isotropic subspaces, (32) Q satisfies (31)

iff

∀ξ ∈ Rd \{0},

∀k = 1 . . . m,

Q(πk (ξ)·, πk (ξ)·) = 0.

This result holds for all d ≥ 2. In the case d = 3 which we are interested in, and for the system of two wave equations considered in Example 2, (32) is equivalent to  ∀(τ, ξ) ∈ R1+3 such that τ 2 = ξ12 + ξ22 + ξ32 , Qjkl (τ, ξ)T , (τ, ξ)T = 0, for j, k, l = 1, 2. The bilinear forms Qjkl must therefore be linear combinations of the null form Q0 for the scalar wave equation, and of the bilinear forms Qαβ defined as (33)

Q0 (∂u, ∂v) = ∂t u∂t v − ∇u · ∇v,

Qαβ (∂u, ∂v) = ∂α u∂β v − ∂β u∂α v,

with 0 ≤ α, β ≤ 3. As Q0 , the bilinear forms Qαβ are null forms in the sense that they satisfy (17) (the commuting vector fields are the same for the wave system (30) as for the scalar wave operator ). The null forms Q0 and Qαβ satisfy moreover the property (8), and with the same proof as in §1.2, we get the following result. Theorem 1.5 ([26, 3]). — Let d = 3 and assume that the bilinear forms Qjkl (1 ≤ j, k, l ≤ 2) are linear combinations of the null forms Q0 and Qαβ (0 ≤ α, β ≤ 3). Then for all smooth and compactly supported initial conditions, there exists a unique global solution to the wave system (30) if ε is small enough.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

366

D. LANNES

Though this is not apparent in the statement of the theorem, the null forms Q0 and Qαβ are of a different nature. This will be clearer with the normal form and space-time resonances approaches developed in the next sections.

2. NORMAL FORMS The method of normal form was used by Shatah [34] to prove global existence for the quadratic nonlinear Klein-Gordon equation in dimension d = 3. The idea is to introduce a nonlinear change of variables inspired by the theory of dynamical systems and which reduces the problem to an equation with cubic nonlinearity for which global existence is easier. As a first example, we apply in §2.1 Shatah’s method to a system of quadratic wave equations in dimension d = 3 and then discuss in §2.2 the case of general first order symmetric systems. 2.1. The method of normal forms for the quadratic wave equation 2.1.1. Global existence in dimension d = 3 for the cubic wave equation. — Consider the cubic wave equation u = F (u, ∂u),

(34)

u|t=0 = εu(0) ,

∂t u|t=0 = εu(1) ,

where F is smooth and F (u, ∂u) = O(|u|3 + |∂u|3 ). The following result is the motivation for the normal form method described in the next subsection. Theorem 2.1. — Let d = 3. Then for all smooth and compactly supported initial conditions, there exists a unique global solution to the cubic wave Equation (34) if ε is small enough. Remark 2.2. — The proof works exactly the same for the system of wave equations of Example 2 with cubic instead of quadratic nonlinearities. The proof of this result follows the same lines as the proof of Theorem 1.2; the extra decay provided by the null form property (17) in the latter case is implied here by the fact the nonlinearity is of higher order. We obtain, instead of (23), Z t  (35) Ns (t) ≤ C1 Ns (0) exp C1 |(1 + τ + |·|)ns/2 (τ, ·)2 |∞ dτ , 0

while (25) is replaced by (36)

ns/2 (t, x) ≤

C2 1 + t + |x|

Z 0

t

 1 |ns/2 (τ, ·)|∞ Ns (τ )2 dτ + ε . (1 + τ )

The same bootstrap argument as for Theorem 1.2 then applies.

ASTÉRISQUE 352

(1053)

367

SPACE TIME RESONANCES

2.1.2. Global existence for the quadratic wave equation in dimension d = 3 via normal forms. — Shatah’s normal form method works very well for the scalar quadratic wave Equation (1) when the quadratic term satisfies the null condition (17), i.e. when it is proportional to Q0 . It allows in this case to recover Klainerman’s result. This example can however be misleading, as we shall see by looking at the system of two wave equations of Example 2. As shown above, the null forms are then linear combinations of Q0 and the Qαβ (0 ≤ α, β ≤ 3) given by (33). Contrary to the proof of Theorem 1.2 based on the null form property (17) satisfied by both Q0 and the Qαβ , the normal form approach does not handle the null form Qαβ . We will comment on the structural difference between Q0 and the Qαβ in §2.2 below; let us also mention here that the space-time resonance approach of Germain-Masmoudi-Shatah handles such nonlinearities that are beyond the scope of standard normal forms. For the moment, let us show that Shatah’s approach is extremely simple when the nonlinearities are null forms of “Q0 -type”, i.e., when the quadratic forms Qjkl in (30) are of the form j Qjkl = αkl Q0 ,

(37)

j for some constants αkl . Indeed, we can then define

v j = uj −

j α11 αj αj (u1 )2 − 12 u1 u2 − 22 (u2 )2 , 2 2 2

(j = 1, 2)

so that v j

 1 j j j j 2α11 u1 u1 + α12 u1 u2 + α12 u2 u1 + 2α22 u2 u2 2 j j j −α11 Q0 (∂u, ∂u) − α12 Q0 (∂u, ∂v) − α22 Q0 (∂v, ∂v)  1 j j j j = − 2α11 u1 u1 + α12 u1 u2 + α12 u2 u1 + 2α22 u2 u2 . 2 =

uj −

We have achieved our normal form transform since the equation for v = (v 1 , v 2 )T is cubic in u and can therefore be treated as the cubic terms in the proof of Theorem 2.1. We now briefly sketch how to conclude to global existence in the scalar case j (corresponding to αkl = 0 if (j, k, l) 6= (1, 1, 1)), the adaptation to the general case being straightforward.. Defining Ns (v, t) and ns (v, t, x) as Ns (t) and ns (t, x) with u replaced by v, Ns (v, t) =

X

|Z I v|2

|I|≤s+1

and

ns (v, t, x) =

X

|Z I v(t, x)|,

|I|≤s+1

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

368

D. LANNES

and proceeding as for (22), we get Z t   (1 + τ + |x|)ns/2 (τ, x)2 N s (τ )dτ Ns (v, t) ≤ C Ns (v, 0) + ∞ 0

t

Z



≤ C Ns (v, 0) + Z

0 t

+ 0

(1 + τ + |x|)ns/2 (τ, x)2 |ns/2 (τ, ·)|∞ N s (τ )dτ ∞  (1 + τ + |x|)ns/2 (τ, x)2 N s (v, τ )dτ , ∞

where we used that (38)

N s (τ ) ≤ N s (v, τ ) + |ns/2 (τ, ·)|∞ N s (τ )

(this is a simple consequence of the chain rule and the identity u = v + 21 u2 ) to obtain the second inequality. By Gronwall’s lemma, we have therefore the following adaptation of (35), Z t  Ns (v, t) ≤ C Ns (v, 0) + |(1 + τ + |·|)ns/2 (τ, ·)2 |∞ |ns/2 (τ, ·)|∞ N s (τ )dτ 0

Z (39)

× exp

t

 |(1 + τ + |·|)ns/2 (τ, ·)2 |∞ dτ .

0

We finally remark as for (36) that ns/2 (t, x) ≤ ns/2 (v, t, x) + ns/2 (t, x)2 Z t  1 C2 (40) |ns/2 (τ, ·)|∞ Ns (τ )2 dτ + ε + ns/2 (t, x)2 . ≤ 1 + t + |x| 0 (1 + τ ) Global existence then follows from the same kind of bootstrap argument using (38), (39) and (40). 2.2. Normal form for first order symmetric systems As in §1.3, consider first order symmetric systems (41)

∂t U + A(∂)U = Q(U, U ),

U|t=0 = U(0) ,

satisfying (28). We want to implement the normal form approach by introducing a quadratic perturbation of U of the form  (42) V = U + B(U, U ) − e−tA(∂) U(0) + B(U(0) , U(0) ) , where B : Rn × Rn → Rn is bilinear and chosen in such a way that the equation on V is cubic. The last term in the right hand side of (42) is the solution of the linear homogeneous equation with same Cauchy data as U + B(U, U ). It can be removed

ASTÉRISQUE 352

(1053)

SPACE TIME RESONANCES

369

for the discussion below, its ony role being to ensure that V|t=0 = 0, which eases the comparison with the space time resonance approach in §3. One computes   ∂t V + A(∂)V = ∂t + A(∂) U + ∂t + A(∂) B(U, U ) =

Q(U, U ) + A(∂)B(U, U ) + B(∂t U, U ) + B(U, ∂t U ).

Replacing ∂t U by −A(∂)U + Q(U, U ) in the last two terms, we get ∂t V + A(∂)V

=

B(Q(U, U ), U ) + B(U, Q(U, U )),

:= T(U )

(43)

which has cubic nonlinearity T, provided that we are able to find B such that Q(U, U ) + A(∂)B(U, U ) − B(A(∂)U, U ) − B(U, A(∂)U ) = 0. Taking the Fourier transform with respect to x and projecting onto the eigenspaces of A(ξ), this is equivalent to solving, for all j = 1 . . . m, m Z X “k (ξ − η), U “l (η))dη (λj (ξ) − λk (ξ − η) − λl (η))πj (ξ)B(U k,l=1

Rd m Z X

=i

k,l=1

“k (ξ − η), U “l (η))dη, πj (ξ)Q(U

Rd

“k (ξ) stands for πk (ξ)U “(ξ). This leads us to define B as where U B(U 1 , U 2 ) =

(44)

m X

j Bkl (U 1 , U 2 ),

j,k,l=1

and (45)

j F Bkl (U 1 , U 2 )](ξ) = i



Z Rd

“1 (ξ − η), πl (η)U “2 (η)) πj (ξ)Q(πk (ξ − η)U dη. λj (ξ) − λk (ξ − η) − λl (η)

Defining the change of variable (42) requires therefore a close look at the set of time resonances T defined as (46) m [ T = T jkl , with T jkl = {(ξ, η) ∈ Rd × Rd , λj (ξ) − λk (ξ − η) − λl (η) = 0}. j,k,l=1

In order to give sense to (45), it is natural to impose the following condition for all 1 ≤ j, k, l ≤ m, (47)

∀(ξ, η) ∈ T jkl ,

η 6= 0,

ξ − η 6= 0,

πj (ξ)Q(πk (ξ − η)·, πl (η)·) = 0

(when ξ = 0, we set πj (0) = I); we will refer to (47) as the transparency condition, this terminology being rooted in nonlinear optics, see §4.2. This condition implies in particular that Q must be a compatible form (i.e., that it must satisfy (32)).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

370

D. LANNES

Example 3 (System of two wave equations). — For the system of two wave equations considered in Example 2, we have seen that the identically zero eigenvalue can be discarded, so that we have two relevant eigenvalues λ± (ξ) = ±|ξ|. The components of the time resonant set are therefore denoted by T ± ±,± , and one readily checks that

T+ −− = {0, 0}, T− ∃0 ≤ λ ≤ 1, ξ = λη}, +− = {(ξ, η),

T− ∃λ ≥ 1, ξ = λη}, −− = {(ξ, η), − T −+ = {(ξ, η), ∃λ ≤ 0, ξ = −λη},

± and T ∓ ∓,∓ = T ±,± . Since the eigenprojectors π± are homogeneous of order zero and π+ (ξ) = π− (−ξ), the transparency condition (47) is equivalent to the compatibility condition (32). Note however that this equivalence is not true in general (for a system of three wave equations with different speeds, this would not be the case because (λj (ξ), ξ) and (λl (η), η) are not necessarily colinear at resonances).

The transparency condition (47) is not sufficient to define and derive estimates for the change of variables (42), (44), (45) (this is a major difference with Poincaré’s theory of normal form for dynamical systems). Small divisors in (47) may indeed appear in (45) near the resonances and additional assumptions must be made on the order of cancellation of (47). For instance, the following strong transparency condition obviously ensures that (47) is well defined, (48)

∃C > 0,



πj (ξ)Q(πk (ξ − η)·, πl (η)·) 2 ≤ C|λj (ξ) − λk (ξ − η) − λl (η)| L

for all (ξ, η) ∈ Rd × Rd , ξ − η 6= 0, η 6= 0, and where k · k L 2 is the canonical norm for bilinear forms on Rd+1 . This assumption, however, is very strong and is not satisfied for most applications. In general, when the normal form approach can be implemented, the order of cancellation of the nonlinearity at resonances is intermediate between (47) and (48): the singularities in (45) are not completely removed, but they are controllable.

In order to illustrate these comments, let us go back to the system of two wave equations of Example 2. The difference between the null forms Q0 and Qαβ for the normal form approach observed in §2.1.2 can be interpreted in terms of transparency: the former is more transparent than the latter (i.e. it removes more singularities in (45)). When Q only involves Q0 (i.e. when it is as in (37)) one has, with the notations of Examples 1-2, and for all j, k, l = ± (recall that the identically zero eigenvalue can

ASTÉRISQUE 352

(1053)

SPACE TIME RESONANCES

371

be discarded), kπj (ξ)Q0 (πk (ξ − η)·, πl (η)·)k L 2

(49)

∼ Q0 ek (ξ − η), el (η) (ξ − η) · η = 1 − kl |ξ − η||η| j|ξ| + k|ξ − η| + l|η| = |ϕjkl (ξ, η)| , |ξ − η||η|

where we introduced the notation ϕjkl (ξ, η) = λj (ξ) − λk (ξ − η) − λl (η). The fact that the phase ϕjkl (ξ, η) can be factored out of the right-hand side of (49) reduces considerably the set of singularities. In general, singularities in (45) are located on the set of time-resonances T given by (46) (see Example 3 for the system of two wave equations), but (49) shows us that thanks to the structure of Q0 , singularities are reduced to the set {η = 0} ∪ {η = ξ}. For the null forms Qαβ , there is no factorization as in (49) and the set of singularities cannot be sufficiently reduced to make the normal form approach operative. Remark 2.3. — Even in the case where Q only involves Q0 , singularities in (45) are not entirely removed while we know from §2.1.2 that the normal form transform is extremely simple. This is because this transform is polynomial in u, and therefore singular in ∂u (or equivalently in U if the formulation (41) is used). To end this section, one can say as a rule of thumb that the normal form approach works if 1. The time resonance set T is small enough. This is for instance the case in Shatah’s paper [34] for the Klein-Gordon equation where T = ∅; all types of quadratic nonlinearities can then be removed. 2. The time resonance set T is not necessarily small, but the set of singularities in the normal form transform (45) is considerably reduced by some transparency property of the nonlinearity. For systems of wave equations, the null form Q0 satisfies such a property, but not the null forms Qαβ . The space-time resonance approach of Germain-Masmoudi-Shatah is an alternative to Klainerman’s vector fields method to handle situations that do not belong to one of the above two cases. As shown in the next section, this method is an elegant and natural extension of Shatah’s normal forms.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

372

D. LANNES

3. THE SPACE TIME RESONANCE APPROACH 3.1. General description 3.1.1. The profile formulation. — The space time resonance approach is based on the Duhamel formulation for the profile of the solution of the nonlinear dispersive equation under consideration. For the first order symmetric hyperbolic systems already considered in §1.3 and §2.2, namely, ∂t U + A(∂)U = Q(U, U ),

(50)

U|t=0 = U(0) ,

the profile of U is defined as W (t) = etA(∂) U (t) =

m X

eitλj (D) πj (D)U (t),

j=1

where we used the decomposition (27). The Duhamel formulation for (50) takes therefore the form Z tZ m X j c “ ck (τ, ξ − η), W cl (τ, η))dηdτ, W (t, ξ) = U(0) (ξ) + eiτ ϕkl (ξ,η) πj (ξ)Q(W j,k,l=1

(51)

0

Rd

ÿ W )(t, ξ), “(0) (ξ) + J(W, := U

where we used the notations ϕjkl (ξ, η) = λj (ξ) − λk (ξ − η) − λl (η),

Wj = πj (D)W.

The strategy is to construct global solutions to (51) that have the same decay properties as solutions of the homogeneous linear equation. One must therefore find a Banach space X adapted to this behavior; for instance, for systems (50) satisfying (28), one should have supt≥1 t|u(t)|∞ . |u|X to catch the O(t−1 ) time decay of free solutions in dimension d = 3. One then has to prove that the mapping W 7→ U(0) + J(W, W ) is a contraction in X in the neighborhood of the origin. Global existence then follows by a standard fixed point theorem. 3.1.2. Space transparency. — As said above, the choice of the space X in which we expect the existence of a fixed point for (51) depends on the behavior of the solutions to the homogeneous linear equation, but also on technical estimates on the bilinear form J. These estimates depend on the equation under consideration. Therefore, to make our discussion as general as possible here, we do not give a precise description of the space X here and focus on the strategy proposed by Germain-Masmoudi-Shatah to control the time behavior of J. More details will be given in §3.2 devoted to the application of this method to the water waves equations.

ASTÉRISQUE 352

(1053)

Decomposing J into J = j

373

SPACE TIME RESONANCES

Pm

j,k,l=1 j

∂τ (eiτ ϕkl ) = iϕjkl eiτ ϕkl

j Jkl with obvious notations, and remarking that

and

j

j

∂η (eiτ ϕkl ) = iτ ∂η ϕjkl eiτ ϕkl

(where ∂η denotes the partial derivative with respect to any of the coordinates of η), we can choose to integrate by parts either with respect to τ or η in the expression j for Jkl : 1. Integration by parts with respect to τ . We then obtain (omitting the subscripts k, l for the sake of clarity), t Z iτ ϕj  e j (W, W )(t, ξ) = c (τ, ξ − η), W c (τ, η) dη JŸ −iπj (ξ) Q W j Rd ϕ 0 Z tZ j   eiτ ϕ c (τ, ξ − η), W c (τ, η) dηdτ. (52) ∂τ Q W + iπj (ξ) j 0 Rd ϕ P iτ λj (D) Remarking that ∂τ W = j e πj (D)Q(U, U ) and using the notations (43) and (44), we get Z t j J j (W, W ) = −eitλj (D) B j (U, U ) + B j (U(0) , U(0) ) + eiτ λ (ξ) πj (D)T(U )dτ. 0

It follows that we can rewrite (51) under the form  U = e−tA(∂) (U(0) + B(U(0) , U(0) ) − B(U, U ) + V, where V is the solution of (∂t + A(∂))V = T(U ) with zero initial data. This is exactly the normal form transform (42). Performing a time integration in the integral defining J is therefore equivalent to looking for a standard normal form. 2. Integration by parts with respect to η. We now obtain (still omitting the subscripts k, l), Z tZ j  1  eiτ ϕ j (W, W )(t, ξ) = i c (τ, ξ − η), W c (τ, η) dηdτ, (53) JŸ ∂η πj (ξ)Q W j τ ∂η ϕ 1 Rd where we have changed the lower bound for the time integration in the definition of J to avoid any artificial singularity at τ = 0; since the difficulty in the control of J occurs for large t, this modification does not affect the discussion. The interest of this transformation is twofold: it provides an extra O(τ −1 ) time decay in the integrand (the same extra decay granted by the reduction to a cubic nonlinearity in the normal form approach when d = 3), and it changes the set of singularities which is not given by the time resonant set T anymore. Since the first of the two cases discussed above coincides with the normal form approach, we refer therefore to §2.2 for a discussion on the situations where this method can be or not successful. We consequently turn our attention towards the second case, and more particularly to the transformed expression (53).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

374

D. LANNES

The set of time resonances T defined in (46) is now irrelevant to describe the singularities of (53), and it must be replaced by the set of space resonances S defined as the set of all (ξ, η) such that ∇η ϕjkl vanishes for some 1 ≤ j, k, l ≤ m, (54)

S=

m [

S kl ,

with

S kl = {(ξ, η), ∇λk (ξ − η) = ∇λl (η)}.

k,l=1

Example 4. — With the notations of Example 3, we get for the system of two wave equations of Example 2,

S ++ = S −− = {(ξ, η), ∃λ > 1, ξ = λη}, S +− = S −+ = {(ξ, η), ∃λ < 1, ξ = λη}. − + − We can in particular remark that S +− = T + +− ∪ T +− and S ++ = T ++ ∪ T ++ (the other cases being deduced from these two); therefore, in this particular example, the set of singularities for (53) contains (up to endpoint cases) the set of singularities for the normal form transform (45).

The same discussion as in the end of §2.2 leads to expect two kinds of situations where this new approach may be successful: 1. The space resonance set S is small enough. 2. The space resonance set S is not necessarily small, but the set of singularities (53) is considerably reduced by some property of the nonlinearity. To describe more precisely the second part of this alternative, we now introduce two conditions on the nonlinearity inspired by the transparency and strong transparency conditions (47) and (48). We will call the first one space transparency condition, (55)

∀(ξ, η) ∈ S kl ,

η 6= 0,

ξ − η 6= 0,

πj (ξ)Q(πk (ξ − η)·, πl (η)·) = 0;

and the second one, which is a sufficient condition for the transformation (53) to be defined, will be referred to as the strong space transparency condition: ( Q = Q1 + · · · + Qd , (56) ∃C > 0,

πj (ξ)Qp (πk (ξ − η)·, πl (η)·) 2 ≤ C|∂p λk (ξ − η) − ∂p λl (η)|, L

d

d

for all p = 1 . . . d and (ξ, η) ∈ R × R , ξ − η 6= 0, η 6= 0. Remark 3.1. — Note that the singularities arising when ∂η hits (∂η ϕ)−1 in (53) are not directly controlled by this space transparency condition. However, these singularities are of the form |ξ − η|−1 or |η|−1 and (56) furnishes a control of the corresponding c , or, through Hardy type inequalities, in terms component of (53) in terms of |ξ|−1 W c of ∇ξ W . This is a quantity we already need to handle for other terms coming from the η differentiation in (53). See §3.1.3 for more comments on this point.

ASTÉRISQUE 352

(1053)

SPACE TIME RESONANCES

375

Example 5 (System of two wave equations). — We have seen that − S ±± = T + ±± ∪ T ±± ,

therefore, the fact that all the null forms Q0 and Qαβ satisfy the (time) transparency condition (47) implies that they also satisfy the space transparency condition (55). We have seen in §2.2 that Q0 does not satisfy the strong transparency condition (48) but that it removes enough singularities to allow the normal form transform (45) to work. We now check wether the situation is similar for Qαβ and the singular integral (53). One computes that, when αβ 6= 0, Qαβ (πk (ξ − η)·, πl (η)·) ∼ = =

(ξ − η)α ηβ − (ξ − η)β ηα |ξ − η||η|   kl ∂α λk (ξ − η)∂β λl (η) − ∂β λk (ξ − η)∂α λl (η)  klQαβ ∇λk (ξ − η) − ∇λl (η), ∇λl (η) ,

and (56) is satisfied. It can also be easily checked that Qα0 and Q0β also satisfy (56). The transformation (53) can then be well defined.

3.1.3. Compatibility condition on the phase. — We will not implement fully the space time resonance approach for the examples used throughout these notes (system of two wave equations for instance). This would raise specific technical details of little interest here; however, we point out here a difficulty inherent to the space resonance method. If we use the space resonance analysis and integrate by parts with respect to η in (51), we are left with (53) whose integrand contains frequency derivatives of the cl (τ, η). We need therefore to control ∂ξ W c (τ, ξ) (taking the inverse profiles, e.g. ∂η W Fourier transform, this is equivalent to providing weighted estimates on W ). In order to get such controls, let us differentiate (51) with respect to ξ. The most problematic terms are obtained when ∂ξ hits the exponential terms; they are given by Ajkl (τ, ξ)

Z tZ =i 0

Rd

 j ck (τ, ξ − η), W c (τ, η) dηdτ ; eitϕkl τ ∂ξ ϕjkl πj (ξ)Q W

frequency differentiation has therefore created a new time growing term τ in the integrand. In many situations (e.g. [15] for 2d quadratic NLS equations and [16] for water waves) these additional terms bring some new and helpful (space or time) transparency properties that can be used to get rid of the new time growing term. Such compatibility conditions seem to be quite related to the homogeneity of the λj ; in the present case, the homogeneity is of order one, so that ξ · ∇λj (ξ) = λj (ξ) and

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

376

D. LANNES

we get ξ · ∇ξ ϕjkl (ξ, η)

= ξ · (∇λj (ξ) − ∇λk (ξ − η)) = λj (ξ) − λk (ξ − η) − η · ∇λk (ξ − η) = ϕjkl (ξ, η) + η · ∇ϕjkl ,

which is the sum of a time strong transparent term and of a space strong transparent term. 3.1.4. Conclusion. — Combining what we have seen on time and space resonances, we can give another rule of thumb for the full space time resonance approach of Germain-Masmoudi-Shatah: it is likely to work if 1. The set of space time resonances R = S ∩ T is small enough. This is not the case for the system of two wave equations since T = S , but for some equations, R is much smaller than T (for the quadratic Schrödinger equation for instance [14]). 2. The space-time resonance set R is not necessarily small, but the set of singularities in the normal form transform (45) or the space resonance transform (53) is considerably reduced by some time or space transparency property of the nonlinearity—or by some compatibility condition of the phases. For the system of two waves equations, null forms Q0 yields time transparency, and the Qαβ give space transparency.

3.2. An example of application: global existence for 3d water waves in surface dimension d = 2 In their paper [16], the authors consider the three-dimensional irrotational water wave problem in presence of gravity. The surface S is parametrized by the graph of a function h, S = {(x, h(t, x)), x ∈ R2 }, and the fluid domain Ω is the region located below this graph. The fluid is assumed to be incompressible and its flow irrotational. The velocity field v inside the fluid can therefore be written as v = ∇x,z Φ, where Φ is harmonic in Ω. Denoting by ψ the trace of Φ on S, and seeing ψ as a function on R2 rather than on S, the initial value problem can be written [7],     ∂t h = G(h)ψ, ∂t ψ = −h − 12 |∇ψ|2 +

(57)

  

1 2(1+|∇h|2 ) (G(h)ψ

+ ∇h · ∇ψ)2 ,

(h, ψ)|t=0 = (h0 , ψ0 ),

where G(h) is the Dirichlet-Neumann operator, G(h)ψ =

ASTÉRISQUE 352

p 1 + |∇h|2 ∂n Φ|S .

(1053)

SPACE TIME RESONANCES

377

Using the space time resonance approach, Germain-Masmoudi-Shatah proved a global existence result for (57) for small initial data. Writing, with D = −i∇, (58)

Λ := |D|,

u := h + iΛ1/2 ψ,

1/2

f := eitΛ

u,

u0 := h0 + iΛ1/2 ψ0 ,

their result is the following. Theorem 3.2 ([16]). — Let δ > 0, N integer and define |u|X := sup t|u|W 4,∞ + (1 + t)−δ |u|H N + (1 + t)−δ |xf |2 + |u|2 . t≥0

If δ is small enough, N large enough, then there exists ε > 0 such that if 1/2 |e−itΛ u0 |X < ε, then there exists a unique global solution u of (57) such that |u|X < 2ε. Remark 3.3. — Due to a confusion of notations of the authors in their blow up criterion (see §3.2.1 below), the statement of this theorem should probably be modified; more precisely, one should replace |u|H N in the definition of X by |h|H N + |(∇X,z Φ)|S |H N −1/2 (S) , where Φ is the harmonic extension of ψ in the fluid domain. Remark 3.4. — For the water waves problem, the eigenvalues of the linear part of the equations are λ± (ξ) = ±|ξ|−1/2 . The Hessian of this matrix has maximal rank, and one expects from the stationary phase theorem a time decay in L∞ norm of order O(t−d/2 ) (versus O(t−(d−1)/2 ) for the wave equation). Since nonlinearities in (57) are quadratic, this decay is far from enough to conclude to global existence when the horizontal dimension is d = 1. If quadratic nonlinearities can be removed (by a normal form) or if an extra O(t−1/2 ) time decay can be gained (by a null form condition), we are in a situation comparable to the wave equation in dimension 3 with quadratic nonlinearities that do not satisfy the null condition (see §1.2). One expects in this 2 particular situation an existence time of size O(ect/ε ) for initial data of size O(ε). Such a result was proved by Wu [43] with methods combining Klainerman’s vector fields and a clever change of variables—note that for technical reasons, the result of 2 [43] gives an existence time O(ect/ε ) instead of O(ect/ε ). In horizontal dimension d = 2, the L∞ -decay is O(t−1 ), and the situation should be the same as for the quadratic wave equation in dimension 3: a generic existence time of order O(ect/ε ), and global existence if we are able to implement a normal form transform or use a null form condition. This corresponds to Theorem 3.2 above, as well as to another result by Wu [44], who extended the tools developed in [43] to the case d = 2. These two results are not the same though, and their proofs are completely different. A comparison of these results can be found in [16] (p. 696).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

378

D. LANNES

3.2.1. Local existence and blow up criterion. — The first step consists of course in proving a local existence theorem for (57). Since the works of S. Wu [41, 42], many local existence theorems have been derived without restrictive condition. The authors use here the approach of [35] to prove the following W 4,∞ -blow up criterion for these local solutions, Z t (59) ∀t ≥ 0, EN (t) . EN (0) + |u(τ )|W 4,∞ EN (τ )dτ 0

where u is as in (58) while the energy EN is EN ∼ |(∇x,z Φ)|S |2H N −1/2 (S) + |h|2H N (S) , where Φ is the harmonic extension of ψ in the fluid domain. Since (59) can be established by other means and is not related to the space time resonance approach, we do not spend time commenting on it here. Let us just mention here that due to a confusion of notations, the authors use that EN ∼ |u|2H N . This does not seem to be true because ∇ψ = (∇Φ)|S + (∂z Φ)|S ∇h; controlling |u|H N requires a control of |∇ψ|H N −1/2 and therefore of |h|H N +1/2 , which is not controlled by EN . This is the reason why we suggested in Remark 3.3 to change the space X in Theorem 3.2. 3.2.2. The profile formulation. — To give a formulation of the water waves Equations (57) in terms of profiles (see §3.1.1), we first expand the equations in powers of h and ψ up to quartic terms, using the expansion of the Dirichlet-Neumann operator of [6],   ∂ h = Λψ − ∇ · (h∇ψ) − Λ(hΛψ) − 1 Λ(h2 Λ2 ψ) + Λ2 (h2 Λψ) − 2Λ(hΛ(hΛψ)) + R t 1 2  ∂ ψ = −h − 1 |∇ψ|2 + 1 |Λψ|2 + Λψ hΛ2 ψ − Λ(hΛψ) + R ; t

2

2

2

with the notations (58), this allows us to write fb(t, ξ) = u b0 (ξ) +

j X

Z tZ cj,±,± 0

j=1

+

4 X

Z tZ Z cj,±,±,±

Z +

eiτ ϕ±,±,± mj (ξ, η, σ)fb∓ (τ, η)fb∓ (τ, σ)fb∓ (τ, ξ − η − σ)dηdσdτ

0

j=3 t

1/2

eis|ξ|

b ξ)dξ, R(s,

0

‘), (60) := u b0 (ξ) + J(f

ASTÉRISQUE 352

eiτ ϕ±,± mj (ξ, η)fb∓ (τ, η)fb∓ (τ, ξ − η)dηdτ

(1053)

SPACE TIME RESONANCES

379

where the cj,±,± and cj,±±,± are complex coefficients, and f+ = f , f− = f¯, while R = R1 + iΛ1/2 R2 . Formulas for the phases and the symbols mj will be given when needed. As in §3.1.1, the global existence result will follow from a fixed point theorem in X on the mapping f 7→ u0 + J(f ); we have therefore to prove that J is a contraction in X near the origin. The plan of the proof is the following: quadratic terms are first removed with a normal form transform. Controlling the cubic terms is a bit more complicated than for the wave equation (there is no such result as Theorem 2.1 for the water waves equations); this is done by another normal form transform (weakly resonant case) or by an integration by parts in frequency (strongly resonant case). Even though many space time resonances are present, this is made possible by a nonlinear compatibility condition of the phase. Finally, quartic and higher terms decay very fast and can easily be controlled; consequently, we do not comment on them here. 3.2.3. Quadratic terms. — We analyze here the quadratic terms in (60), which are of the form Z tZ (61) eiτ ϕ±,± mj (ξ, η)fb∓ (τ, η)fb∓ (τ, ξ − η)dηdτ (j = 1, 2). 0

The quadratic phases ϕ±,± are given by ϕ±,± (ξ, η) = |ξ|1/2 ± |η|1/2 ± |ξ − η|1/2 , and the symbols mj (ξ, η) are m1 (ξ, η) =

1 (ξ ·η −|ξ||η|), |η|1/2

m2 (ξ, η) =

Remark that the time resonant set is given by [ T = T ±,± , with T ++ = {(0, 0)},

 1 |ξ|1/2 η ·(ξ −η)+|η||ξ −η| . 2 |η|1/2 |ξ − η|1/2

T −− = {η = 0 or ξ − η = 0},

±,±

while T −+ and T +− are easily deduced from T −− by permutation of the variables. It follows that the symbols mj satisfy the (time) transparency property (47) but not the strong transparency property (48). There is actually an intermediate transparency property allowing a normal form transform. Before stating this transparency property, let us recall that the outcome of the normal form transformation (52) is a decomposition of (61) of the form (62)

(61) = g“1 (t, ξ) + cubic terms

(up to a time independent term that does not raise any difficulty), where g“1 is a quadratic term without time integration coming from the integration by parts, Z g“1 (t, ξ) = eiτ ϕ±,± µ(ξ, η)fb∓ (t, η)fb∓ (t, ξ − η)dη,

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

380

D. LANNES

m (ξ,η)

with µ = iϕj ±,± . The “transparency” property satisfied by m1 and m2 is that µ(ξ, η) belongs to the class of symbols such that – µ is homogeneous of degree one,  η – one has µ(ξ, η) = A |η|1/2 , |η| , ξ if |η|  |ξ| ∼ 1,  ξ−η – one has µ(ξ, η) = A |ξ − η|1/2 , |ξ−η| , ξ if |ξ − η|  |ξ| ∼ 1,  ξ – one has µ(ξ, η) = |ξ|1/2 A |ξ|1/2 , |ξ| , η if |ξ|  |η| ∼ 1, where A generically denotes a smooth function of its arguments. In particular, µ be1 longs to the class B of symbols defined below. s

Definition 3.5. — A symbol m(ξ, η) belongs to B if – It is homogeneous of degree s, – It is smooth outside {η = 0} ∪ {ξ − η = 0} ∪ {ξ = 0}, – One has   ξ1 if |ξ1 |  |ξ2 |, |ξ3 | ∼ 1, m = A |ξ1 |, , ξ2 , |ξ1 | where (ξ1 , ξ2 , ξ3 ) = (ξ, ξ − η, η) up to circular permutations. It is not complicated to show (Theorem C.1 of [16]) that the pseudoproduct operators associated to such symbols m, Z Bm (f1 , f2 ) := F −1 m(ξ, η)fb1 (η)db2 (ξ − η)dη satisfy standard product estimates. For instance, for s s ≥ 0, k ∈ N and m ∈ B ,

1 r

=

1 p

+ 1q , 1 < p, q < ∞, and if

|∇k Bm (f1 , f2 )|Lr . |f1 |W s+k,p |f2 |Lq + |f |Lp |g|W s+k,q ; the main difference between such pseudoproducts and standards products is that the endpoint cases p, q = 1, ∞ are excluded, which induces some slight technical complications. Using these pseudoproduct estimates one can obtain (see Prop. 4.1 of [16]), (63)

∀t ≥ 0,

1/2

t|e−itΛ

g1 (t, ·)|W 4,∞ . |u|2X

and

(1 + t)−δ |xg1 |2 . |u|2X ;

the second estimate requires more work than the first one; since |xg1 |2 = |∇ξ g“1 |2 , it is essential as explained in §3.1.3 that the frequency derivative of the phase, ∂ξ ϕ±,± (ξ, η), satisfies a compatibility condition allowing time or frequency integration by parts in the corresponding integral. This compatibility condition is given here by ∂ξ ϕ±,± =

ASTÉRISQUE 352

1 ξ−η 1 ξ ± . 2 |ξ|3/2 2 |ξ − η|3/2

(1053)

381

SPACE TIME RESONANCES

The contribution of the first term is harmless since we recall that we work here with a symbol µ vanishing at order 1/2 in ξ; the second term can be put with the term fb∓ (τ, ξ − η) in (61) and controlled by fractional integration. 3.2.4. Weakly resonant cubic terms. — Consider now the cubic terms. They are of the form Z tZ Z (64) gb2 (t, ξ) = eiτ ϕ±,±,± µ(ξ, η, σ)fb∓ (τ, η)fb∓ (τ, η)fb(τ, ξ − η − σ)dηdσdτ ; 0

some of them come from the second line of (60), and others come from the normal form transform of the quadratic terms—see (62). But the relevant distinction we have to make among all the cubic terms deals with their phase, not their provenance. The cubic phases are given by ϕ±,±,± (ξ, η, σ) = |ξ|1/2 ± |η|1/2 ± |σ|1/2 ± |ξ − η − σ|1/2 . Some of them have few time resonances (seen now as a subset of R2ξ × R2η × R2σ ), and we call them weakly resonant cubic terms. They correspond to ϕ+++ (for which the time resonant set T is reduced to a point), and ϕ−++ , ϕ+−+ , ϕ++− and ϕ−−− . Time resonances for ϕ−−− (the other cases can be deduced by permutation of the variables) are given by

T −−− = {η = σ = 0 or σ = ξ − η − σ = 0

or

η = ξ − η − σ = 0}.

1/2

We recall that we need to control e−itΛ g2 in W 4,∞ and xg2 in L2 . The difficulties to derive such estimates are essentially the same as those encountered for the weighted estimate of the quadratic terms g1 in the previous section. We thus get (65)

∀t ≥ 0,

1/2

t|e−itΛ

g2 (t, ·)|W 4,∞ . |u|3X

and

(1 + t)−δ |xg2 |2 . |u|3X .

3.2.5. Strongly resonant cubic terms. — We are thus left with cubic terms with phases ϕ−−+ , ϕ−+− and ϕ+−− , which are identical up to permutation of the variables. The situation is drastically different than in §3.2.4 because the time resonant set T −−+ is now very large (of dimension 5). The time growing terms associated to weighted estimates (see §3.1.3) cannot be controlled by a simple integration in time as for the weakly resonant cubic terms. With the hope of controlling them with an integration by parts in frequency, we look at the space resonant set S −−+ (defined as the set of all (ξ, η, σ) such that ∇η,σ ϕ−−+ (ξ, η, σ) = 0). According to the analysis of §3.1.4, we would like the space time resonant set R −−+ = T −−+ ∩ S −−+ to be small. This set is given by

R−−+ = {ξ = η = σ}, and is therefore much smaller than T −−+ (it is of dimension 2), but yet too large to control directly the singularities created by integration by parts in frequency. The

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

382

D. LANNES

key ingredient here is a bilinear compatibility condition satisfied by ϕ−−+ and bringing more transparency (see §3.1.3 for comments on this point). This compatibility condition can be written   ∂ξ ϕ−−+ = A (ξ, η, σ) ∂η ϕ−−+ , ∂σ ϕ−−+ , with A smooth in (ξ, η, σ) and bilinear in the arguments between brackets. This term is strongly space transparent in the sense of (56) (or more exactly, to its obvious generalization to cubic phases). This is the crucial point that allows the authors of [16] to conclude, after a delicate technical implementation of these ideas, that strongly resonant terms also satisfy (65).

4. COMPATIBLE FORMS, NULL CONDITION AND TRANSPARENCY IN OTHER CONTEXTS We have seen that the global existence issue for nonlinear dispersive equation is linked to various conditions on the structure of the nonlinearity, such as compatibility, null condition, or time and space transparency. It is also well known that the null condition plays also a central role for the well posedness issue below the standard regularity threshold s > d/2 for semilinear systems, as noticed by Klainerman and Machedon (see for instance [28]). We present here two lesser known examples where these notions also play a central role. 4.1. Compensated compactness Let Ω be an open subset of RN and consider a differential operator A(∂) and its domain H(Ω, A), A(∂) =

N X

Aj ∂j ,

H(Ω, A) = {u ∈ L2 (Ω)n ,

A(∂)u ∈ L2 (Ω)n },

j=1

where the Aj are n × n matrices with real constant coefficients. To every continuous function f : RN → R and every u ∈ H(Ω, A), one can associate a function f (u) defined almost everywhere on Ω by f (u)(x) = f (u(x)). If we assume that f has at most quadratic growth at infinity, f (u) is a distribution, and it is a typical question of compensated compactness motivated for instance by homogenization problems to answer the question “

When is f :

H(Ω, A) → u

ASTÉRISQUE 352

7→

D0 (Ω) f (u)

weakly sequentially continuous? ”;

(1053)

SPACE TIME RESONANCES

383

equivalently, when are we sure that for all uε * u0 in L2 such that A(∂)uε * A(∂)u0 in L2 , one has f (uε ) → f (u0 ) in D0 (Ω)? We refer to the earlier works of Murat and Tartar [32, 40] and many subsequent works for a full answer to this question. Our point here is to make a link between this problem and the different conditions on the nonlinearities seen in these notes (compatibility, null condition, transparency, etc.). Consider therefore A = ∂t + A(∂), with A satisfying (28) (and thus N = d + 1, ∂d+1 = ∂t ). It is a classical result of compensated compactness [32, 40] that bilinear forms having the weakly sequential continuity described above coincide with compatible forms in the sense of (32). We recall that compatible forms coincide with null forms in the sense of (17) for (systems of) wave equations, showing therefore an example of the relevance of null conditions for this problem. 4.2. Diffractive optics Consider here a first order symmetric system of the form (26) ∂t U + A(∂)U = Q(U, U ),

(66)

with fast oscillating initial conditions U|t=0 (x) = εp

(67)

N X l=1

u0l (x) exp(

kl · x ) + c.c., ε

d

where kl ∈ R \{0}, and c.c. stands for “complex conjugate”; when (66) are Maxwell’s equation, these initial conditions are sums of wave packets modeling laser pulses. We are interested in the propagation of these N laser pulses (i.e. of the corresponding solution to (66)) for “diffractive” times of order O(1/ε), for which the propagation is typically described by nonlinear Schrödinger equations. The problem of diffractive optics consists in constructing an approximate solution to (66) and to prove that it remains close to the exact solution over this time scale. The reason why we are interested in times of order O(1/ε) is because diffractive effects are of size O(ε) and their cumulated contribution is of size O(1) for such times. If we want nonlinear effects to be of the same order as the diffractive ones, the amplitude εp must be chosen such that the cumulated effects of the nonlinearities are also O(1) for such times. For a quadratic nonlinearity, this corresponds to p = 1/2. Denote by λj (k) and πj (k) the eigenvalues and eigenprojectors of A(k), and by cj = ∇λj (k) the group velocity. Assuming that the initial envelopes u0l satisfy πjl (kl )u0l = u0l for some 1 ≤ jl ≤ m (polarization condition), it can be proved [10, 23, 2] that consistent approximations to (66) must be of the form Uapp (t, x) =

N X l=1

ul (εt, x − cl t) exp(

kl · x − λjl (kl )t ) + c.c. + εhui(εt, t, x) + · · · ε

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

384

D. LANNES

where the sum accounts for the leading order oscillating terms, while hui is the leading order non oscillating term; dots account for lower order terms. Moreover, the ul (T, y) must satisfy the polarization condition (68)

πjl (kl )ul = ul

and the following linear Schrödinger equation, i ∂T ul − λ00jl (kl )(∂y , ∂y )ul = 0, 2 where λ00jl (kl ) stands for the Hessian of λjl at kl . Nonlinear effects are responsible for the creation of a non oscillating mode hui (even if it is not initially present) by quadratic interaction of the oscillating modes; this effect is called rectification; the equation modeling this effect is (69)

(70)

∂T hui + second order dispersive terms =

N X

Q(ul , ul ).

l=1

When the nonlinearity Q satisfies the transparency condition (47), nonlinearities disappear from (70) because of (68)—actually, (47) needs only be satisfied for ξ = 0 and η = k, a condition called weak transparency in optics. The nonlinear Equations (66) with initial conditions (67) are then approximated with an error O(ε) (e.g. in L∞ norm) for times of order O(1/ε) by a system of linear equations. In order to observe the nonlinear effects, it is natural to consider initial conditions of larger amplitude, and therefore take p = 0 in (67). The weak transparency condition now appears as a compatibility condition to construct an approximate solution in this setting. The set of N linear Schrödinger Equations (69) is now replaced by a set of N cubic Schrödinger equations (see [5] for N = 1). Let us make a few comments: – The cubic nonlinearity for these NLS equations is the same as the one obtained after the normal form transform in §2.2, even though the weak transparent property is not sufficient to implement fully this normal form transform. – It is possible to have sets of three coupled NLS equations. More precisely, the equations for ul , ul0 , ul00 are a priori coupled if kl00 = kl − kl0 and if (kl , k0l ) belongs to the time resonant set of the phase ϕ(ξ, η) = λjl (ξ)−λjl0 (ξ−η)−λjl00 (η). – Wave packets travelling at different group speeds do not interact significantly. Therefore, the a priori coupling terms identified above are effective if and only if the group speeds of ul , ul0 and ul00 are the same [23, 29]. Equivalently, (kl , k0l ) must also belong to the space resonant set of the phase ϕ. These comments give therefore a physical interpretation in diffractive optics of the space time resonant set (see §3.1.4): it is a representation of all the possible three wave interactions of diffractive wave packets.

ASTÉRISQUE 352

(1053)

SPACE TIME RESONANCES

385

Note also that the weak transparency condition only allows one to derive a formal model. Stronger notions of transparency, such as (47) or (48) are required to justify this approximation. A very rich discussion of the transparency in optics has been carried out by Joly, Métivier and Rauch [24]. Acknowledgments These notes benefited from precious discussions with J.-M. Delort, J. Rauch and J. Szeftel.

REFERENCES [1] S. Alinhac – “Blowup of small data solutions for a quasilinear wave equation in two space dimensions”, Ann. of Math. 149 (1999), no. 1, p. 97–127. [2] K. Barrailh & D. Lannes – “A general framework for diffractive optics and its applications to lasers with large spectrums and short pulses”, SIAM J. Math. Anal. 34 (2002), no. 3, p. 636–674. [3] D. Christodoulou – “Global solutions of nonlinear hyperbolic equations for small initial data”, Comm. Pure Appl. Math. 39 (1986), no. 2, p. 267–282. [4] D. Christodoulou & S. Klainerman – The global nonlinear stability of the Minkowski space, Princeton Mathematical Series, vol. 41, Princeton Univ. Press, 1993. [5] T. Colin – “Rigorous derivation of the nonlinear Schrödinger equation and Davey-Stewartson systems from quadratic hyperbolic systems”, Asymptot. Anal. 31 (2002), no. 1, p. 69–91. [6] W. Craig & M. D. Groves – “Hamiltonian long-wave approximations to the water-wave problem”, Wave Motion 19 (1994), no. 4, p. 367–389. [7] W. Craig & C. Sulem – “Numerical simulation of gravity waves”, J. Comput. Phys. 108 (1993), no. 1, p. 73–83. [8] M. Dafermos & I. Rodnianski – “A new physical-space approach to decay for the wave equation with applications to black hole spacetimes”, in XVIth International Congress on Mathematical Physics, World Sci. Publ., Hackensack, NJ, 2010, p. 421–432. [9] J.-M. Delort – “Existence globale et comportement asymptotique pour l’équation de Klein-Gordon quasi linéaire à données petites en dimension 1”, Ann. Sci. École Norm. Sup. 34 (2001), no. 1, p. 1–61; erratum: Ann. Sci. École Norm. Sup. 39 (2006), 335-345.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

386

D. LANNES

[10] P. Donnat, J.-L. Joly, G. Metivier & J. Rauch – “Diffractive nonlinear geometric optics”, in Séminaire sur les Équations aux Dérivées Partielles, 1995– 1996, Sémin. Équ. Dériv. Partielles, École Polytech., 1996, exp. no XVII. [11] V. Georgiev, S. Lucente & G. Ziliotti – “Decay estimates for hyperbolic systems”, Hokkaido Math. J. 33 (2004), no. 1, p. 83–113. [12] P. Germain – “Global solutions for coupled Klein-Gordon equations with different speeds”, to appear in Ann. Inst. Fourier. [13] P. Germain & N. Masmoudi – “Global existence for the Euler-Maxwell system”, submitted. [14] P. Germain, N. Masmoudi & J. Shatah – “Global solutions for 3D quadratic Schrödinger equations”, Int. Math. Res. Not. 2009 (2009), no. 3, p. 414–432. [15] , “Global solutions for 2D quadratic Schrödinger equations”, J. Math. Pures Appl. 97 (2012), no. 5, p. 505–543. [16] , “Global solutions for the gravity water waves equation in dimension 3”, Ann. of Math. 175 (2012), no. 2, p. 691–754. [17] S. Gustafson, K. Nakanishi & T.-P. Tsai – “Global dispersive solutions for the Gross-Pitaevskii equation in two and three dimensions”, Ann. Henri Poincaré 8 (2007), no. 7, p. 1303–1331. [18] , “Scattering theory for the Gross-Pitaevskii equation in three dimensions”, Commun. Contemp. Math. 11 (2009), no. 4, p. 657–707. [19] B. Hanouzet & J.-L. Joly – “Applications bilinéaires compatibles avec un opérateur hyperbolique”, Ann. Inst. H. Poincaré Anal. Non Linéaire 4 (1987), no. 4, p. 357–376. [20] N. Hayashi & P. I. Naumkin – “Asymptotics for large time of solutions to the nonlinear Schrödinger and Hartree equations”, Amer. J. Math. 120 (1998), no. 2, p. 369–389. [21] L. Hörmander – Lectures on nonlinear hyperbolic differential equations, Mathématiques & Applications, vol. 26, Springer, 1997. [22] F. John – “Blow-up for quasilinear wave equations in three space dimensions”, Comm. Pure Appl. Math. 34 (1981), no. 1, p. 29–51. [23] J.-L. Joly, G. Metivier & J. Rauch – “Diffractive nonlinear geometric optics with rectification”, Indiana Univ. Math. J. 47 (1998), no. 4, p. 1167–1241. [24] , “Transparent nonlinear geometric optics and Maxwell-Bloch equations”, J. Differential Equations 166 (2000), no. 1, p. 175–250. [25] S. Klainerman – “Uniform decay estimates and the Lorentz invariance of the classical wave equation”, Comm. Pure Appl. Math. 38 (1985), no. 3, p. 321–332. [26] , “The null condition and global existence to nonlinear wave equations”, in Nonlinear systems of partial differential equations in applied mathematics,

ASTÉRISQUE 352

(1053)

[27]

[28] [29] [30]

[31]

[32]

[33]

[34] [35]

[36] [37] [38] [39] [40]

[41]

SPACE TIME RESONANCES

387

Part 1 (Santa Fe, N.M., 1984), Lectures in Appl. Math., vol. 23, Amer. Math. Soc., 1986, p. 293–326. , “Linear stability of black holes (d’après M. Dafermos et I. Rodnianski)”, Séminaire Bourbaki, vol. 2009/2010, exposé no 1015, Astérisque 339 (2011), p. 91–135. S. Klainerman & M. Machedon – “Smoothing estimates for null forms and applications”, Int. Math. Res. Not. 1994 (1994), no. 9, p. 383–390. D. Lannes – “Dispersive effects for nonlinear geometrical optics with rectification”, Asymptot. Anal. 18 (1998), nos. 1-2, p. 111–146. H. Lindblad & I. Rodnianski – “Global existence for the Einstein vacuum equations in wave coordinates”, Comm. Math. Phys. 256 (2005), no. 1, p. 43– 110. K. Moriyama, S. Tonegawa & Y. Tsutsumi – “Almost global existence of solutions for the quadratic semilinear Klein-Gordon equation in one space dimension”, Funkcial. Ekvac. 40 (1997), no. 2, p. 313–333. F. Murat – “Compacité par compensation: condition nécessaire et suffisante de continuité faible sous une hypothèse de rang constant”, Ann. Scuola Norm. Sup. Pisa Cl. Sci. 8 (1981), no. 1, p. 69–102. T. Ozawa, K. Tsutaya & Y. Tsutsumi – “Global existence and asymptotic behavior of solutions for the Klein-Gordon equations with quadratic nonlinearity in two space dimensions”, Math. Z. 222 (1996), no. 3, p. 341–362. J. Shatah – “Normal forms and quadratic nonlinear Klein-Gordon equations”, Comm. Pure Appl. Math. 38 (1985), no. 5, p. 685–696. J. Shatah & C. Zeng – “Geometry and a priori estimates for free boundary problems of the Euler equation”, Comm. Pure Appl. Math. 61 (2008), no. 5, p. 698–744. J. C. H. Simon – “A wave operator for a nonlinear Klein-Gordon equation”, Lett. Math. Phys. 7 (1983), no. 5, p. 387–398. J. C. H. Simon & E. Taflin – “The Cauchy problem for nonlinear Klein-Gordon equations”, Comm. Math. Phys. 152 (1993), no. 3, p. 433–478. C. D. Sogge – Lectures on non-linear wave equations, International Press, 2008. W. A. Strauss – “Nonlinear scattering theory at low energy”, J. Funct. Anal. 41 (1981), no. 1, p. 110–133. L. Tartar – “Compensated compactness and applications to partial differential equations”, in Nonlinear analysis and mechanics: Heriot-Watt Symposium, Vol. IV, Res. Notes in Math., vol. 39, Pitman, 1979, p. 136–212. S. Wu – “Well-posedness in Sobolev spaces of the full water wave problem in 2-D”, Invent. Math. 130 (1997), no. 1, p. 39–72.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

388

D. LANNES

[42]

, “Well-posedness in Sobolev spaces of the full water wave problem in 3-D”, J. Amer. Math. Soc. 12 (1999), no. 2, p. 445–495.

[43]

, “Almost global wellposedness of the 2-D full water wave problem”, Invent. Math. 177 (2009), no. 1, p. 45–135.

[44]

, “Global wellposedness of the 3-D full water wave problem”, Invent. Math. 184 (2011), no. 1, p. 125–220.

David LANNES École normale supérieure Département de Mathématiques et Applications 45 rue d’Ulm 75230 Paris Cedex 05 E-mail : [email protected]

ASTÉRISQUE 352

352

ASTÉRISQUE 2013

SÉMINAIRE BOURBAKI VOLUME 2011/2012 EXPOSÉS 1043-1058 (1054) Arithmetic and polynomial progressions in the primes Julia WOLF

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Séminaire BOURBAKI 64e année, 2011-2012, no 1054, p. 389 à 427

Mars 2012

ARITHMETIC AND POLYNOMIAL PROGRESSIONS IN THE PRIMES [after Gowers, Green, Tao and Ziegler] by Julia WOLF

1. INTRODUCTION In 2004 Green and Tao [25] proved the following groundbreaking result. Theorem 1 (Green-Tao theorem). — The primes contain arbitrarily long arithmetic progressions. Moreover, the same is true of any subset of the primes of positive relative density.(1)(2) Theorem 1 vastly generalizes van der Corput’s result [11] that there are infinitely many 3-term arithmetic progressions in the primes, as well as a significant strengthening due to Green [22], which established the existence of 3-term progressions in any subset of the primes of positive relative density. It also represents a special case of a conjecture by Erdős and Turán [12], dating back to 1936. Conjecture 2 (Erdős-Turán conjecture). — Any subset X ⊆ N satisfying X 1 = +∞ x x∈X

contains arbitrarily long arithmetic progressions. What is truly remarkable about Theorem 1 is the diversity of methods which are brought together in its proof: it combines tools from arithmetic combinatorics (especially so-called higher-order Fourier analysis) with traditional analytic number (1)

It is easy to see that the primes cannot contain an infinite arithmetic progression. Suppose that P (j) = a + jd for some a, d ∈ N takes prime values for j = 0, 1, . . . , k. Then P (a) ≡ 0 mod a and P (a) > a. But if P (a) = ma for some integer m > 1, it is no longer prime and hence k < a. (2) The longest currently known arithmetic progression in the primes, 43 142 746 595 714 191 + 23 681 770 × 223 092 870 × j, where j = 0, 1, . . . 25, was found by Périchon with software by Wróblewski and Reynolds in 2010.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

390

J. WOLF

theory, all while taking inspiration from ergodic theory. The Erdős-Turán conjecture suggests that the existence of arithmetic structure in the primes is in fact merely a consequence of their density, and so it is perhaps not surprising that analytic and combinatorial (rather than classical number-theoretic) methods should play a major role. Indeed, in 1975 Szemerédi [47] showed in a purely combinatorial fashion that any subset of the integers of positive upper density contains arbitrarily long arithmetic progressions.(3) Denoting by [N ] the set of integers {1, 2, . . . , N }, we have the following finitary version of this statement. Theorem 3 (Szemerédi’s theorem). — Suppose that A ⊆ [N ] is a subset of density α which contains no k-term arithmetic progressions. Then α = ok (1), where ok (1) is a quantity that tends to zero as N tends to infinity. However, our current understanding of the decay rate of α does not allow us to immediately deduce Theorem 1. Indeed, the best known bound on the density of a subset of [N ] that contains no 3-term progressions, due to recent work of Sanders [43], is of the form (log N )−(1−o(1)) , falling just short of the density of the primes. For longer progressions, the discrepancy is much more alarming. For length 4, the best √ known bound on α is of the form exp(−c log log N ) [26], while for longer progressions it is (log log N )−c for some small positive constant c depending on k [17]. On the other hand, the best known example of a 3-term progression free set has density √ exp(−c log N ) [3], which is believed by many to be closer to the truth. However, proving upper bounds of this shape seems very much out of reach of currently available techniques (but see a recent result of Schoen and Shkredov [46]). Many excellent expository articles have been written on the proof of the Green-Tao theorem [23, 36, 48]; in particular, it was covered in the Séminaire Bourbaki in 2005 by Bernard Host [33]. In contrast to Host’s ergodic theoretic perspective we adopt a more analytic viewpoint in the present exposition. Moreover, our main focus will be on the developments that have taken place since the original proof of the Green-Tao theorem, which have brought new understanding and a number of additional exciting results to the subject. Shortly after the proof of Theorem 1, Green and Tao [31] extended their result from arithmetic progressions to solutions of more general systems of linear equations in the primes. This work covered essentially all systems of linear equations for which the conclusion is neither trivially false nor known to be extremely difficult (such as those systems related to Goldbach’s conjecture or the twin primes problem), but was (3)

A qualitative proof was given by Furstenberg [14] in 1977 and initiated the long-standing and fruitful interaction between combinatorics and ergodic theory.

ASTÉRISQUE 352

(1054)

ARITHMETIC AND POLYNOMIAL PROGRESSIONS IN THE PRIMES

391

conditional on two conjectures: the inverse conjecture for the uniformity norms, and the Möbius nilsequences conjecture. The latter was established by Green and Tao [28] shortly afterwards, and the former very recently by the same authors in joint work with Ziegler [30]. With the completion of this very substantial research programme the authors are able to assert not only the existence of general linear patterns in the primes, but give precise asymptotics for their frequency in the interval [N ]. In a further step towards generalization, Tao and Ziegler [50] proved in 2008 that the primes contain arbitrarily long polynomial progressions. Theorem 4 (Tao-Ziegler theorem). — Given polynomials P1 , . . . , Pk ∈ Z[m] such that P1 (0) = · · · = Pk (0) = 0, there exist infinitely many integers x, m such that x + P1 (m), . . . , x + Pk (m) are simultaneously prime. Moreover, the same is true of any subset of the primes of positive relative density. The first non-trivial example of such a polynomial pattern is a configuration consisting of two elements that differ by a square, which corresponds to P1 (m) = 0, P2 (m) = m2 . In dense subsets of the integers the existence of such a configuration is guaranteed by a theorem of Sárközy [45], which is obtained using a sophisticated application of the circle method. In fact, and in contrast with the situation for 3-term arithmetic progressions described above, the best known bound in Sárközy’s theorem is strong enough to directly imply the existence of square differences in any positivedensity subset of the primes. In the case of more general polynomial configurations, however, the results from arithmetic combinatorics are very far from implying a statement resembling that of Theorem 4. Worse, there is currently no quantitative theorem at all in the literature asserting that if a subset A ⊆ [N ] is dense enough, then it contains a polynomial configuration of the above type.(4) (5) What we do have is a qualitative polynomial Szemerédi theorem due to Bergelson and Leibman [6] proved by ergodic theoretic methods, whose statement is fundamental to the proof of Theorem 4. Moreover, Tao and Ziegler rely heavily on an induction technique which allowed Bergelson and Leibman to linearize a system of polynomials in successive stages, known as PET induction [4]. The general strategy of proof for Theorem 4 is largely the same as in the case of (linear) arithmetic progressions. There are two main novelties here: first, a transference principle is explicitly formulated for the first time, which was implicit in and absolutely fundamental to the proof of the Green-Tao theorem. Roughly speaking, the problem is that the von Mangoldt function (a weighted indicator function of the (4)

A paper by Green [21], which proves the existence of a 3-term progression whose common difference is a sum of two squares in any dense subset of the integers, may be regarded as an exception. (5) There are, however, colouring results of this type, see the combinatorial proof of the polynomial van der Waerden theorem by Walters [54].

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

392

J. WOLF

primes) is unbounded, while the quantitative techniques from arithmetic combinatorics only apply to bounded functions. However, it turns out that the von Mangoldt function can be majorized by a so-called pseudorandom measure which is quite wellbehaved. In particular, it can be shown that many statements involving truly bounded functions hold also, by transference, for functions that are bounded by this pseudorandom measure. The transference principle has received significant simplifications and a new conceptual context through work done by Gowers [18], and it is this more recent viewpoint that we shall adopt in our exposition. A similar approach was independently discovered by Reingold, Trevisan, Tulsiani and Vadhan [40] in theoretical computer science, where the transference principle is known as the dense model theorem and has found several applications in the context of complexity theory. The second novelty concerns a new family of norms. In his work on Szemerédi’s theorem, Gowers [17] introduced the U k norms, often called uniformity norms or Gowers norms, and showed that the (k + 1)-term progression count of a function is approximately invariant under small perturbations in the U k norm – in other words, the uniformity norms control long arithmetic progressions. This raises the question of what can be said about functions that are large in the U k norm, which is answered by the so-called inverse theorem. It is one of the central results in arithmetic combinatorics (although for k > 3, its strong form was only a conjecture until very recently) and states, roughly speaking, that if the U k norm of a function is large, then the function correlates with a polynomial structure of degree k − 1.(6) The inverse theorem, together with the above-mentioned approximate invariance under small perturbations in the U k norm, is essentially sufficient to prove Szemerédi’s theorem. It is not too difficult to see that the uniformity norms are not sufficient for controlling polynomial configurations. To put it very simply, the reason is that in a linear configuration such as x, x + d, x + 2d, which defines a 3-term progression, the range of both variables x and d is essentially linear in N . In contrast, in a configuration such as x, x + m2 , which represents a square difference, the range of m has to be restricted √ to N . Dealing with smaller parameter ranges required Tao and Ziegler to introduce new local uniformity norms, and study some of their properties. To conclude this section we give a brief overview of the structure of this paper. In Section 2 we define the uniformity norms and develop some of the fundamental notions of higher-order Fourier analysis, following Gowers’s harmonic analysis approach to Szemerédi’s theorem. In Section 3 we show how one uses the existence of a pseudorandom measure and the transference principle together with Szemerédi’s theorem to obtain the Green-Tao theorem on arithmetic progressions in the primes. Finally, in (6)

The uniformity norms have also appeared in the context of ergodic theory. A deep result of Host and Kra [34] on the structure of characteristic factors for certain multiple ergodic averages is in some sense analogous to the above-mentioned inverse theorem.

ASTÉRISQUE 352

(1054)

ARITHMETIC AND POLYNOMIAL PROGRESSIONS IN THE PRIMES

393

Section 4, we give more detail on the additional ingredients that are needed to treat polynomial configurations and obtain a proof of the Tao-Ziegler theorem. We shall give computations mostly in model cases. The reader wishing to skip the proofs should be able to do so at only moderate cost.

2. HIGHER-ORDER FOURIER ANALYSIS AND SZEMERÉDI’S THEOREM The first non-trivial case of Szemerédi’s theorem, namely the existence of 3-term progressions in sufficiently dense subsets of the integers, was established by Roth [41] in 1953. Here and in the sequel the symbol  stands for “is bounded above by a constant times”. Theorem 5 (Roth’s theorem). — Suppose that A ⊆ [N ] is a subset of density α which contains no 3-term arithmetic progressions. Then α  (log log N )−1 . The proof proceeds via a dichotomy between randomness and structure, which relies heavily on the Fourier transform. Given a function f : ZN → C, we define its Fourier transform fb : ZN → C, for each t ∈ ZN , by fb(t) = Ex f (x) exp(2πixt/N ), where, as is standard in the field, we use the expectation operator Ex∈ZN to denote P the normalized sum N1 x∈ZN .(7) Now given A ⊆ [N ], if all non-trivial Fourier coefficients of the characteristic function 1A are “small” (the trivial one, with the above normalization, being equal to the density α), then we can count the number of 3-term progressions in A precisely. This is because a set whose Fourier coefficients are small is distributed somewhat uniformly in the interval [N ], and, for the purpose of counting 3-term progressions, behaves like a random set whose elements are chosen independently with probability α. Specifically, the number of 3-term progressions in such a uniform set of density α is roughly α3 N 2 , which is the number expected in the random case. On the other hand, if A is non-uniform, then there must exist a large Fourier coefficient. By the definition of the Fourier transform, this means that the characteristic function of A exhibits a bias in some preferred “direction”, i.e. it has increased density on the (approximate) level set of at least one non-trivial character. This level (7)

One often prefers to work with the discrete Fourier transform on the finite abelian group ZN instead of [N ] ⊆ Z. It is not difficult to embed [N ] into the slightly larger group ZN 0 for some prime N 0 while sacrificing a factor of at most a constant. In the sequel we shall therefore make no distinction between [N ] and ZN , and switch between the two settings whenever convenient.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

394

J. WOLF

set can be seen to contain a very long arithmetic progression (of length tending to infinity with N ), and so by focusing on A restricted to this progression and rescaling, the argument can be iterated. The process stops when the density of A exceeds 1, which is clearly absurd. The trade-off between the density increase obtained at each step, and the size of the arithmetic progression on which this increase is obtained, gives rise to the bound on α stated above.(8) Unfortunately, the first part of this dichotomy breaks down when one tries to count progressions of length at least 4: it is not true that a set which is uniform in the Fourier sense defined above always contains the expected number of 4-term progressions. Example 1. — The set A ⊆ ZN defined by A = {x ∈ ZN : x2 ∈ [−αN, αN )} is uniform in the sense that supt6=0 |b 1A (t)| is “small”, but it contains “too many” 4-term progressions. Indeed, it is straightforward to show, using Gauss sums, that the Fourier transform on the non-trivial frequencies is very small (of the order of N −(1/2−o(1)) ). It is perhaps less immediate to confirm that this set contains many more than the expected number of 4-term progressions, which is easily seen to be approximately α4 N 2 . The reason is the elementary quadratic identity x2 − 3(x + d)2 + 3(x + 2d)2 − (x + 3d)2 = 0, which holds for all x, d ∈ ZN . Indeed, since (x + 3d)2 is a small linear combination of x2 , (x + d)2 and (x + 2d)2 , the event that x + 3d lies in A is not independent of x, x + d and x + 2d being in A, and so the number of 4-term progressions in A is more like cα3 N 2 for some absolute constant c. (9) 2.1. The uniformity norms If the Fourier transform is unable to help us reliably count 4-term progressions, we require an alternative analytic tool that does so. Developing such a tool was one of several profound innovations that were introduced by Gowers [17] in his harmonic analysis approach to Szemerédi’s theorem.

(8)

Various important refinements have been made to this basic Fourier iteration method, notably by Bourgain [7] and Sanders [43]. (9) It turns out that quadratic identities of this type are the only obstructions to uniform sets containing the expected number of solutions to a given system of linear equations, see [19].

ASTÉRISQUE 352

(1054)

ARITHMETIC AND POLYNOMIAL PROGRESSIONS IN THE PRIMES

395

Definition 1 (Uniformity norms). — Let k ≥ 2 be an integer. For any function f : ZN → C, define the U k norm via the formula Y k C |ω| f (x + ω · y), kf k2U k = Ex∈ZN ,y∈Zk N

ω∈{0,1}k

where for y = (y1 , . . . , yk ) ∈ ZkN and ω = (ω1 , . . . , ωk ) ∈ {0, 1}k we have written ω · y = ω1 y1 + · · · + ωk yk , as well as C |ω| f = f if |ω| = ω1 + · · · + ωk is even and f otherwise. First, it is not hard to show (but neither is it obvious) that this expression defines a norm for all k ≥ 2. The main technical device for this purpose is the so-called GowersCauchy-Schwarz inequality, which is proved using several applications of the ordinary Cauchy-Schwarz inequality. It states that for any family of functions gω : ZN → C, ω ∈ {0, 1}k , we have the bound Y Y |Ex∈ZN ,y∈Zk C |ω| gω (x + ω · y)| ≤ kgω kU k . N

ω∈{0,1}k

ω∈{0,1}k

With the help of this inequality it is straightforward to verify that the uniformity norms form a nested sequence kf kU 2 ≤ kf kU 3 ≤ · · · ≤ kf kU k ≤ . . . kf k∞ . We also record the fact that the U k norms can be defined inductively via the formula k

k−1

kf k2U k = Eh∈ZN k∆h f k2U k−1 , where ∆h f (x) = f (x)f (x + h) should be viewed as a discrete derivative of f . To see this, consider the case where f is a phase function of the form f (x) = exp(2πig(x)/N ), so that ∆h f (x) = exp(2πi(g(x) − g(x + h))/N ). Finally, one checks by simple calculation that X kf k4U 2 = Ex,a,b∈ZN f (x)f (x + a)f (x + b)f (x + a + b) = |fb(t)|4 = kfbk44 , t

so that the U norm is equivalent, for bounded functions, to the `∞ norm of the Fourier transform. (10) This immediately implies that the proof of Roth’s theorem based on the randomness-structure dichotomy sketched above can be rephrased replacing the Fourier transform by the U 2 norm. And proofs involving the U 2 norm turn out to be much more amenable to generalization than those involving the Fourier transform itself (although we shall recover some sort of “generalized Fourier transform” later). 2

Geometrically, we can picture the U 2 norm as averaging the value of f over all 2-dimensional parallelograms with vertices x, x + a, x + b and x + a + b, and analogously its kth-order sibling as averaging over k-dimensional parallelepipeds. These parallelepiped structures also play an important role in ergodic theory, where corresponding semi-norms were defined by Host and Kra [34].

(10)

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

396

J. WOLF

2.2. The generalized von Neumann theorem It was shown by Gowers that the U k norm controls the count of (k + 1)-term progressions in the following sense. Proposition 6 (U k norm controls (k + 1)-APs). — Let k ≥ 2 be an integer, and let f0 , f1 , . . . , fk : ZN → C be functions satisfying kfj k∞ ≤ 1 for j = 0, 1, . . . , k. Then |Ex,d∈ZN f0 (x)f1 (x + d)f2 (x + 2d) . . . fk (x + kd)| ≤ min kfj kU k . 0≤j≤k

Having defined the U k norms, and more importantly realized their potential for controlling progressions, the proof of this statement is not very difficult (if a little tedious). It involves a number of applications of the Cauchy-Schwarz inequality, combined with a suitable reparametrization of the progression itself. To give the reader a taste, we shall show in the next few lines how to control 3-term progressions by the U 2 norm when all functions fj are equal to f . Proof for k = 2:

We first set u = x + d and write

|Ex,d f (x)f (x + d)f (x + 2d)|2 = |Ex,d f (x)f (u)f (2u − x)|2 , which by Cauchy-Schwarz and the boundedness assumption on f is bounded above by Eu |Ex f (x)f (2u − x)|2 = Eu Ex,x0 f (x)f (2u − x)f (x0 )f (2u − x0 ). Reparameterizing once more by setting x0 = x + a and 2u − x0 = x + b gives Ex,a,b f (x)f (x + a)f (x + b)f (x + a + b) = kf k4U 2 , which concludes the proof.(11) This argument can of course be generalized, not only to longer progressions but to solutions of (almost) any system of linear equations with integer coefficients. This generalization was carried out by Green and Tao [31] in their paper on linear equations in the primes, resulting in the following proposition, dubbed the generalized von Neumann theorem.(12) In the statement a notion of complexity of a system of linear forms appears, of which we shall not give the exact definition since it is rather cumbersome and will not play an important role in the remainder of the article.(13) (11)

The attentive reader will have noticed that we have in fact shown that |Ex,d f (x)f (x + d)f (x + 2d)| ≤ kf k2U 2 , which is stronger than the statement originally claimed. For three distinct functions f0 , f1 , f2 , however, Proposition 6 is best possible. (12) Our terminology is non-standard here. Green and Tao gave this name to Proposition 13 below, which we shall refer to as the relative generalized von Neumann theorem. (13) The definition of the complexity of a linear system is based on how many times one needs to apply the Cauchy-Schwarz inequality in the proof of Proposition 7. For a precise statement see Definition 1.5 in [31].

ASTÉRISQUE 352

(1054)

ARITHMETIC AND POLYNOMIAL PROGRESSIONS IN THE PRIMES

397

Proposition 7 (Generalized von Neumann theorem). — For i = 1, . . . , m, let fi : ZN → C be a family of functions satisfying kfi k∞ ≤ 1 for all i = 1, . . . , m. Suppose that (Li )m i=1 is a system of linear forms of complexity k − 1 in d variables with integer coefficients. Then we have m Y |Ex∈Zd fi (Li (x))| ≤ min kfi kU k . i=1,...,m

N

i=1

The reader may wish to bear in mind a (k + 1)-term arithmetic progression as an example of a system of complexity k − 1, in which case we recover Proposition 6. What matters for the purpose of counting linear configurations in dense sets (and in the primes) is that the average on the left-hand side can be controlled by some U k norm. (14) 2.3. Inverse and decomposition theorems This section is not strictly necessary for a first attempt at understanding the GreenTao and the Tao-Ziegler theorem, and may thus be omitted on first reading. But it does play a crucial role for some of the subtler points we wish to make later on in the context of both linear and polynomial patterns. Proposition 6 above says that the count of (k + 1)-term arithmetic progressions is stable under small perturbations in the U k norm. In particular, if we could write the indicator function 1A of a set A as 1A = g + h, where khkU k is sufficiently small and g is bounded, then we would have Ex,d∈ZN

k Y

1A (x + jd) ≈ Ex,d∈ZN

j=0

k Y

g(x + jd).

j=0

Now if the part g = 1A − h had some helpful structure, in particular one that might allow us to actually compute the average on the right-hand side, then we would be able to give a good (and hopefully strictly positive) estimate of the quantity on the left-hand side. In particular, we might be able to show that if the density α of A ⊆ [N ] is fixed and N is sufficiently large, then Ex,d∈ZN

k Y

1A (x + jd) ≥ c(α)

j=0

for some constant c(α) only depending on α. It is not hard to prove that this statement is equivalent to Szemerédi’s theorem. A function whose U k norm is small is said to be uniform of degree k − 1. A natural question therefore arises: if h represents the uniform part of a decomposition of the characteristic function 1A , what does the non-uniform part g look like? Equivalently, (14)

What the smallest such k is turns out to be an interesting question, see [19].

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

398

J. WOLF

what is the structure of a function whose U k norm is large? Let us first answer this question for k = 2. Theorem 8 (Inverse theorem for U 2 ). — Let δ > 0. Suppose that f : ZN → C satisfies kf k∞ ≤ 1 and kf kU 2 ≥ δ. Then there exists a linear phase function φ : ZN → C such that |Ex f (x)φ(x)| ≥ δ 2 . This function φ is of the form φ(x) = exp(2πixt/N ) for some t ∈ ZN . Proof. — We have already seen that kf kU 2 = kfbk4 , which can be bounded above by kfbk2∞ kf k2∞ . Thus for a bounded function, the condition kf kU 2 ≥ δ implies that kfbk∞ ≥ δ 2 . Therefore, by definition of the Fourier transform, there exists a linear phase function φ(x) = exp(2πixt/N ) for some t ∈ ZN such that |Ex f (x)φ(x)| ≥ δ 2 . In other words, if f has large U 2 norm, then it correlates with a linear phase. For higher values of k, we can a priori only make a rather trivial statement, for which we need the following definition. Definition 2 (Dual function). — For any f : ZN → C, define the dual function Df of order k by the formula Y Df (x) = Ey∈Zk C |ω| f (x + ω · y). N

ω∈{0,1}k ,ω6=0k

It is immediate from this definition and that of the U k norm that if kf kU k is large, then so is the inner product hf, Df i := Ex f (x) Df (x), where Df is the kth order dual function of f . Therefore, a function whose U k norm is large correlates with its own kth order dual function. This is not a very useful statement, however, since we have little tangible information about the structure of the dual function of an arbitrary function f . However, we shall encounter these soft obstructions to uniformity again later on. In fact, a much stronger and more explicit statement is true, which is called the inverse theorem for the U k norm. For simplicity, we shall first state the case k = 3. We shall informally call a function a generalized quadratic phase if it “behaves quadratically” on an “approximate subgroup” of ZN , and give a rigorous definition in the more general case below.(15) (15) For example, φ can be expressed as 1B (x) exp(2πiq(x)/N ), where B(K, ρ) = {x ∈ ZN : kxt/N k ≤ ρ for all t ∈ K} is a Bohr set whose width ρ and dimension |K| are bounded in terms of δ, and q : B → ZN is a function that satisfies the quadratic identity q(x) − q(x + a) − q(x + b) − q(x + c) + q(x + a + b) + q(x + a + c) + q(x + b + c) − q(x + a + b + c) = 0, whenever all these terms are defined.

ASTÉRISQUE 352

(1054)

ARITHMETIC AND POLYNOMIAL PROGRESSIONS IN THE PRIMES

399

Theorem 9 (Inverse theorem for U 3 ). — Let δ > 0. Suppose that f : ZN → C satisfies kf k∞ ≤ 1 and kf kU 3 ≥ δ. Then there exists a generalized quadratic phase φ such that |Ex f (x)φ(x)| ≥ c(δ), for some constant c(δ) that depends on δ. Note that it is easy to see by direct calculation that when f (x) = exp(2πiq(x)/N ) for some quadratic polynomial q, then kf kU 3 = 1, so the inverse theorem gives a weak converse to this statement: if the U 3 norm is bounded away from 0, then f correlates with a generalized quadratic phase. The proof of this inverse theorem is ingenious and combines a number of heavyweight tools from additive combinatorics. It was largely contained in Gowers’s proof of Szemerédi’s theorem [17] culminating in a slightly weaker statement than Theorem 9; the strengthened version stated above is due to Green and Tao [24] who added one additional ingredient to the proof. The very rough idea of the proof of Theorem 9 is as follows: if kf kU 3 is large, then by the inductive definition of the U 3 norm we know that for many values of h, ∆h f has large U 2 norm. This means that, for many values of h, the derivative ∆h f of f correlates with a linear phase function. The main difficulty lies in collecting these weak linear structures together in such a way that one is able to integrate the statement and conclude that f itself correlates with a quadratic structure. This crucial step is achieved with the help of a purely combinatorial result known as Freiman’s theorem [13, 42]. (16) The bound in Theorem 9, i.e. the dependence of c(δ) on δ, which is currently quasi-polynomial in nature as a consequence of a recent result of Sanders [44], has been shown to be equivalent to the bound in Freiman’s theorem, and improving it remains an important focus of research in the area. It is only very recently that Green, Tao and Ziegler [30], in a major breakthrough, were able to prove an inverse theorem for higher values of k. Both statement and proof draw inspiration from ergodic theory, and in particular the deep structure theory of characteristic factors induced by the analogue of the U k norms in the ergodic context, developed in a seminal article by Host and Kra [34].(17) We shall need the following definition, which made its first appearance in [5]. Definition 3 (Nilsequence). — Let G be a k-step nilpotent group, i.e. a connected, simply connected Lie group with central series G = G1 ⊇ · · · ⊇ Gk+1 = {1}. Freiman’s theorem states that a set B ⊆ Z whose sumset B + B = {b + b0 : b, b0 ∈ B} is small, i.e. |B + B| ≤ K|B| for some constant K, is efficiently contained in a somewhat rigid algebraic substructure (a generalized arithmetic progression) whose size and dimension depend only on K. (17) For related work on the analysis of multiple ergodic averages see also Conze and Lesigne [10], Furstenberg and Weiss [15] and Ziegler [55]. (16)

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

400

J. WOLF

Let Γ ⊆ G be a discrete co-compact subgroup. Then the quotient G/Γ is a k-step nilmanifold, and a sequence of the form (F (g n x))n∈N with g ∈ G, x ∈ G/Γ and continuous F : G/Γ → R is called a k-step nilsequence. Note that G/Γ = R/Z is an example of a 1-step nilmanifold, and that any function of the form n 7→ F (x + nα) for α ∈ R and continuous F is a 1-step nilsequence. In particular, the linear characters n 7→ exp(2πinα) are examples of basic 1-step nilsequences. For higher values of k, including k = 2, a k-step nilsequence displays an undeniably non-commutative character.(18) A simple example of a 2-step nilmanifold is given by the quotient of the matrix group G and its discrete subgroup Γ defined by ê ê Ü Ü 1 Z Z 1 Z R G=

0

1

R

0

0

1

, Γ=

0

1

Z

0

0

1

,

which can be identified topologically with the 2-torus. Now let g ∈ G be given by Ü ê 1 m β g=

0

1

α

0

0

1

,

where m ∈ Z and α, β ∈ R. Then a shift of (x, y) ∈ T2 by g is given by (x, y) 7→ (x + α, y + β + mx), and the nilsequence F (g n (x, y)) for n ∈ N is given by F (x + nα, y + nβ + 21 mn(n + 1)α), clearly exhibiting the claimed quadratic behaviour. Observe in particular that a quadratic phase function such as n 7→ exp(πin(n + 1)α) belongs to the family of basic 2-step nilsequences.(19) We are now able to state the inverse theorem for the U k norm, which asserts that a function whose U k norm is large correlates with a (k − 1)-step nilsequence. Theorem 10 (Inverse theorem for U k ). — Let 0 < δ ≤ 1 and k ≥ 1 be an integer. Then there exists a finite collection M k,δ of k-step nilmanifolds G/Γ, each equipped with some smooth Riemannian metric dG/Γ as well as constants C(k, δ), c(k, δ) > 0 with the following property. Whenever N ≥ 1 and f : [N ] → C with kf k∞ ≤ 1 is a function such that kf kU k+1 [N ] ≥ δ, then there exist a nilmanifold G/Γ ∈ M k,δ , some g ∈ G and a function F : G/Γ → C with Lipschitz constant at most C(k, δ) with respect to the metric dG/Γ , such that |En∈[N ] f (n)F (g n x)| ≥ c(k, δ). (18)

This partly explains our difficulty in defining a “generalized quadratic phase” above. Further examples of 2-step nilsequences, such as the Heisenberg nilflow, are given in full detail in Section 12 of [24]. (19)

ASTÉRISQUE 352

(1054)

ARITHMETIC AND POLYNOMIAL PROGRESSIONS IN THE PRIMES

401

The passage from weak linearity of the derivative to the quadratic nature of the function itself, which we briefly alluded to earlier, amounts in the more general case to a certain “cohomological” task, in which one has to show that a certain “cocyle” is essentially a “coboundary”. This work is very recent and the current proof is almost certainly not the right one, so we shall say no more about it here but instead refer the interested reader to the carefully crafted announcement [29]. Given an inverse theorem, it is possible to deduce a decomposition theorem that allows us to write a bounded function f as a sum f = g + h, where h is uniform of degree k − 1 and g has polynomial structure of degree k − 1. Note that in the case k = 2, such a decomposition simply consists of a partition of the usual Fourier expansion into small and large coefficients, which is straightforward to write down since the linear characters form an orthonormal basis. For k > 2, no such canonical basis exists, and a number of other methods have been employed, such as an energy increment strategy on factors [27], or the so-called boosting method from theoretical computer science [51]. The connection between inverse theorems and decomposition theorems has recently been formalized by Gowers [18] (see also the first application in [20]), who showed that the Hahn-Banach theorem from functional analysis can be used to deduce decomposition theorems from inverse theorems for a large class of norms, including the uniformity norms. In the same paper, he showed that the HahnBanach theorem gives an alternative proof of the transference principle, which we shall discuss in Section 3.2. Moreover, we shall see in Section 3.4 that it is precisely the existence of a higher-order inverse and corresponding strong decomposition theorem which provides asymptotics for linear configurations in the primes. 2.4. Polynomial generalizations It is natural to ask for polynomial generalizations of Szemerédi-type theorems: is it true that any sufficiently dense subset of the first N integers contains a given polynomial configuration? For example, is it true that any sufficiently dense subset of [N ] contains a configuration of the form x, x + n2 for x, n ∈ N? The latter question was answered in the affirmative by Sárközy [45], whose theorem (with the best known bound due to Pintz, Steiger and Szemerédi [38]) we state below.(20) Theorem 11 (Sárközy’s theorem). — Suppose that A ⊆ [N ] is a subset of density α which contains no two distinct elements whose difference is a perfect square. Then 1

α  (log N )− 4 log log log log N . An analogous statement is easily seen to be false for a difference of the form n2 + 1. Since there are no squares congruent to 2 mod 3, we can take the set of multiples of 3 as a (very dense) counterexample. (20)

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

402

J. WOLF

By the prime number theorem, the exceptionally strong quantitative information in Theorem 11 immediately implies the existence of square differences in any positive density subset of the primes, for density reasons alone. The proof of Sárközy’s theorem proceeds via classical Fourier analysis on Z, following the circle method approach of Hardy and Littlewood, and can be extended to configurations of the form x, x + P (n), where P is an “intersective” polynomial.(21) Unfortunately, no such quantitative results are known for more general polynomial systems such as x, x + n2 , x + 2n2 or x, x + n, x + n2 . What we do have is a result of Bergelson and Leibman [6], proved entirely within the realm of ergodic theory, which states in a purely qualitative fashion that any subset of the integers of positive upper density contains the translate of a simultaneous image of a system of polynomials with zero constant coefficient.(22) Theorem 12 (Bergelson-Leibman theorem). — Let A ⊆ Z be a set of positive upper density, and let P1 , . . . , Pk be polynomials with rational coefficients satisfying Pi (0) = 0 for i = 1, . . . , k. Then there exist x, n ∈ Z such that x + Pi (n) ∈ A for i = 1, . . . , k. Theorem 12 follows from an abstract result about the convergence of multiple ergodic averages in a measure-preserving dynamical system, via Furstenberg’s correspondence principle [14]. The latter gives an explicit way of constructing a dynamical system in such a way that the recurrence results obtained therein can be transferred to corresponding statements in the integers. A combinatorial proof of the BergelsonLeibman theorem is yet to be found. We shall discuss this theorem further in the context of the primes in Section 4.1.

3. LINEAR CONFIGURATIONS IN THE PRIMES Having explored what is known about arithmetic structure in dense subsets of the integers in some detail in the preceding section, we now turn our attention to the primes. It is convenient to weight the indicator function of the primes so that their density is roughly constant throughout an interval. The tool traditionally used for this purpose is the von Mangoldt function, denoted by Λ and defined by ( log(p) if n = pm for some m ∈ N, Λ(n) = 0 otherwise. (21)

An intersective polynomial has a root modulo q for every q ∈ N. The most general version of Theorem 12 is in fact multidimensional and holds for any system of intersective polynomials. (22)

ASTÉRISQUE 352

(1054)

ARITHMETIC AND POLYNOMIAL PROGRESSIONS IN THE PRIMES

403

The prime number theorem tells us that En∈[N ] Λ(n) = 1 + o(1) (and is in fact equivalent to this statement). The first obstacle that needs to be overcome when trying to prove Theorem 1 is that the primes are not equidistributed amongst all residue classes. As a trivial example, note that very few primes (indeed) are even. However, it is easy to check that the odd primes no longer show any bias towards either residue class modulo 2 after applying the map x 7→ (x − 1)/2. In a similar manner, one can remove the bias with respect to two of the residue classes modulo 3, and similarly for all small primes p. This is called the W -trick by Green and Tao, and leads to the e : N → R+ via the formula(23) definition of the modified von Mangoldt function Λ ( φ(W ) W log(W n + 1) if W n + 1 is prime, e Λ(n) = 0 otherwise, Q where φ is the Euler totient function and W = p≤w p is the product of all primes not e exceeding a threshold w.(24) Clearly the normalization is chosen so that En∈[N ] Λ(n) = (25) 1 + o(1), by the Siegel-Walfisz theorem on primes in arithmetic progressions. e is unbounded, A second and much more serious obstacle is that the function Λ and therefore none of the results from the preceding section are directly applicable. Overcoming this latter impediment is where the main achievement of Green and Tao lies: they developed a way of “transferring” known results and techniques for dense subsets to a non-dense setting. The main idea is to embed the primes into a wellbehaved set with respect to which they are dense. A natural candidate for such a set would be the set of almost primes. However, it turns out to be more convenient to use not a set but a majorizing pseudorandom measure.(26) Definition 4 (Pseudorandom measure). — We say that ν : ZN → R+ is a k-pseudorandom measure that majorizes the primes if it satisfies the following properties.(27) • ν is normalized: Ex∈ZN ν(x) = 1 + o(1); (23)

In order to establish the existence of arbitrarily long progressions in a positive-density subset A of the primes, one needs to replace the residue class n ≡ 1 mod W by n ≡ b mod W , where (b, W ) = 1 and the residue class b is chosen according to the pigeonhole principle so as to coincide with a positive fraction of A. (24) The parameter w can be thought of as roughly log log N , although Green and Tao remark that it is possible to set it equal to a very large constant. ) (25) e(n) differs from φ(W Λ(W n + 1) only on the negligible set of prime powers. Note that Λ W (26) The pseudorandom measure should more accurately be called a weight function, or probability density. It is also sometimes referred to as an enveloping sieve, see for example [39]. (27) The exact values of the constants depending on k which appear in the definition are rather unimportant, and in fact it is quite probable that these conditions can be somewhat relaxed in general.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

404

J. WOLF

˜ for all k N ≤ n ≤ 2k N , where k = (2k (k + 4)!)−1 , we have • ν majorizes Λ: ˜ ν(n) ≥ k −1 2−k−5 Λ(n); • ν satisfies the linear forms condition: for any t ≤ 3k − 4, m ≤ k · 2k−1 , Ex∈ZtN ν(ψ1 (x)) . . . ν(ψm (x)) = 1 + ok (1), where the rational coefficients of the affine linear forms ψi : ZtN → ZN have denominator at most k, and the ψi satisfy a mild non-degeneracy condition; • ν satisfies the correlation condition: for any h1 , . . . , hm ∈ ZN , m ≤ 2k−1 , X Ex∈ZN ν(x + h1 ) . . . ν(x + hm ) ≤ τ (hi − hj ), 1≤i 0, there exists  > 0 with the following property. Let ν be a (k + 1)-pseudorandom measure satisfying kν − 1kU k ≤ , and suppose that f : ZN → R is a function satisfying 0 ≤ f ≤ ν. Then there exists a function g such that 0 ≤ g ≤ (1 − δ)−1 and kf − gkU k ≤ η. (28)

Specifically, one writes f = E(f | B) + (f − E(f | B)) for a σ-algebra B constructed out of level sets of dual functions using an energy increment strategy. For further details see Host’s exposition [33]. (29) For example, this method gives strongly quantitative quadratic decomposition theorems, which resemble an inversion formula for a type of “quadratic Fourier transform” [20]. It has also found important, more combinatorial applications in recent work of Conlon and Gowers [8].

ASTÉRISQUE 352

(1054)

ARITHMETIC AND POLYNOMIAL PROGRESSIONS IN THE PRIMES

407

Let us first sketch how this result, together with the relative generalized von Neumann theorem and Szemerédi’s theorem, implies the Green-Tao theorem. Sketch proof of Theorem 1: We wish to estimate from below the average Ex,d f (x)f (x + d) . . . f (x + kd), e where f (n) = Λ(n), the modified von Mangoldt function defined above, is bounded above by (a constant time) ν. Theorem 14 gives us a function 0 ≤ g ≤ 1 + δ such that kf − gkU k ≤ η, and so by Proposition 13 the above average is, up to small error terms, equal to (a constant multiple of) Ex,d g(x)g(x + d) . . . g(x + kd). Now g is an (almost) bounded function, so Theorem 3 applies, implying that the latter average is bounded below by a constant depending only on the density of g. But the density of g is strictly positive since Eg = Ef −E(f −g), and |E(f −g)| ≤ kf −gkU k ≤ η, concluding the proof for an appropriate choice of the parameters δ and η. Before we delve into a sketch proof of Theorem 14, we first verify that when ν is a (k + 1)-pseudorandom measure, the U k norm cannot distinguish it from the constant function 1, and so the additional hypothesis in Theorem 14 is always satisfied. Lemma 15. — If ν is a (k + 1)-pseudorandom measure, then kν − 1kU k = o(1). Proof. — We simply rearrange the definition of the Gowers norm and write Y X Y k kν − 1k2U k = Ex,h1 ,...,hk (ν(x + ω · h) − 1) = Ex,h1 ,...,hk (−1)|S| ν(x + ω · h). ω∈{0,1}k

S⊆{0,1}k

ω∈S

The latter expression equals X Y (−1)|S| Eh1 ,...,hk (Ex ν(x + ω · h)), S⊆{0,1}k

ω∈S

where the expectation in x can be written as Ex ν(ψ1 (x)) · · · ν(ψm (x)) for some linear forms ψi . For each h1 , . . . , hk , this expectation evaluates to 1 + o(1) by the linear forms condition, and the result follows on summing. Let us recall the statement of the classical Hahn-Banach theorem in the context of finite dimensional vector spaces over R, which will be used as a black box in the proof of the transference principle. Consequently, the function g that appears in its statement is not constructed explicitly, but rather its existence is the result of an argument by contradiction. Theorem 16 (Hahn-Banach theorem). — Let X = (RN , k · k) be a normed space and let x ∈ X be a vector with kxk ≥ 1. Then there is a vector z ∈ RN such that hx, zi > 1 and such that |hy, zi| ≤ 1 whenever kyk ≤ 1.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

408

J. WOLF

Defining the dual norm of k·k by kxk∗ = sup{|hx, yi| : kyk ≤ 1}, we can reformulate the statement of the theorem as follows: if x ∈ X satisfies kxk ≥ 1, then there exists z such that hx, zi > 1 and kzk∗ ≤ 1. We shall actually need a slightly modified version. For i = 1, 2, let k · ki be a norm defined on a subspace Vi of RN , and assume that V1 + V2 = RN . For α1 , α2 ∈ R+ , define the norm kxk = inf{α1 kx1 k1 + α2 kx2 k2 : x = x1 + x2 }, whose dual is easily seen to be(30) kzk∗ = max{α1−1 kzk∗1 , α2−1 kzk∗2 }. With this notation we immediately deduce the following corollary. Corollary 17. — Let V1 , V2 be as above, and let α1 , α2 ∈ R+ . Suppose that it is not possible to write the vector x ∈ RN as x1 + x2 in such a way that xi ∈ Vi for each i, and α1 kx1 k1 + α2 kx2 k2 ≤ 1. Then there exists a vector z ∈ RN such that hx, zi > 1 and such that kzk∗i ≤ αi for i = 1, 2. We are now in a position to sketch the deduction of the transference principle from Corollary 17. Note that the statement of the transference principle can indeed be viewed as a kind of decomposition theorem: we want to write the function f , which is bounded by the pseudorandom measure ν, as a sum g + h, where h = f − g is small in U k and g is (almost) bounded. Sketch proof of Theorem 14: Suppose for the sake of contradiction that it is not possible to write f = g+h with kgk∞ ≤ (1−δ)−1 and khkU k ≤ η. Then the hypotheses of Corollary 17 are satisfied with V1 = (RN , k · k∞ ), V2 = (RN , k · kU k ), α1 = 1 − δ and α2 = η −1 . Therefore there exists φ ∈ RN satisfying kφk∗∞ = kφk1 ≤ 1 − δ and kφk∗U k ≤ η −1 but hf, φi > 1. Now suppose for a moment (and this is a significant oversimplification) that φ only took positive values. Then we would have 1 < hf, φi ≤ hν, φi = h1, φi + hν − 1, φi. Now since φ has U k dual norm bounded by η −1 and k1 − νkU k ≤ , this is, up to an error of η −1 , equal to h1, φi = kφk1 ≤ 1 − δ, giving the desired contradiction if  is chosen sufficiently small. Of course, in reality things are not quite as easy as that. Denoting by φ+ = max(0, φ) the positive part of φ, we have 1 < hf, φi ≤ hf, φ+ i ≤ hν, φ+ i. (30)

Here kzk∗i = sup{|hz, xi| : x ∈ Vi , kxki ≤ 1} is a semi-norm.

ASTÉRISQUE 352

(1054)

ARITHMETIC AND POLYNOMIAL PROGRESSIONS IN THE PRIMES

409

In order to proceed as above, that is, to say that the latter inner product is approximately equal to h1, φ+ i, we would need to know that φ+ is bounded in the U k dual norm. But a priori we know nothing about where φ is positive or negative, just that its U k dual norm is bounded. One can, however, use the Weierstrass approximation theorem to obtain a polynomial P such that φ+ ≈ P (φ). So it suffices to show that kP (φ)k∗U k is bounded whenever kφk∗U k is. For, in that case, we could continue the above string of inequalities, up to an error depending on the quality of the polynomial approximation, via hν, P (φ)i ≈ h1, P (φ)i ≈ h1, φ+ i ≤ 1 − δ. In order to show that kP (φ)k∗U k is bounded under the assumption that kφk∗U k is, it suffices by linearity to consider the case where P is a monomial x1 x2 · · · xm . Since kφk∗U k is small, we know that φ is essentially a kth order dual function (although of course this needs to be made precise). Thus, in order to complete the proof of the transference principle it is enough to prove a lemma to the effect that products of dual functions have bounded U k dual norm. Since the function h that gave rise to the bound kφk∗U k ≤ η −1 is only bounded by 1 + ν instead of 1, we need to consider dual functions of functions that are bounded by a pseudorandom measure.(31) Lemma 18. — Suppose that the functions f1 , . . . , fm : ZN → C satisfy |fj (x)| ≤ ν(x) for each j = 1, . . . , m, where ν is a (k + 1)-pseudorandom measure. Then there exists a constant C(m) such that k Df1 · · · Dfm k∗U k ≤ C(m), where D refers to the kth order dual operator introduced in Definition 2. Proof. — We need to show that hg, Df1 · · · Dfm i is bounded by a constant depending on m whenever g : ZN → C is such that kgkU k ≤ 1. The inner product can be written as m Y Y Ex∈ZN g(x) Eh(j) ∈Zk fj (x + ω · h(j) ), N

j=1

ω∈{0,1}k \0k

and with a change of variable h(j) = h + H (j) becomes Ex∈ZN g(x)

m Y

Eh,H (j) ∈Zk

Y

N

j=1

fj (x + ω · h + ω · H (j) ).

ω∈{0,1}k \0k

(31) In order to make this step precise, one P defines another Pnorm kf kBAC = max{|hf, Dgi| : 0 ≤ g ≤ 1 + ν}, whose dual kf k∗BAC = inf{ i |λi | : f = λ Dfi , 0 ≤ fi ≤ 1 + ν} measures i i the extent to which a function f can be written as a small linear combination of dual functions. A sufficient condition for khkU k to be at most η is then that khkBAC ≤ η, and hence the actual condition on φ we end up with is kφk∗BAC ≤ η −1 . This, together with the remark following the proof of Proposition 13, explains the hypotheses in Lemma 18.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

410

J. WOLF

Rearranging, we obtain Y

EH=(H (1) ,...,H (m) )∈(Zk )m Ex∈ZN g(x)

Eh∈Zk

N

N

Qm

j=1

fj (x + ω · h + ω · H (j) ),

j=1

ω∈{0,1}k \0k

which, with gω,H (x) = form

m Y

fj (x + ω · H (j) ), equals a Gowers inner product of the Y

EH∈(Zk )m Ex∈ZN g(x)Eh∈Zk

gω·H (x + ω · h).

N

N

ω∈{0,1}k \0k

By the Gowers-Cauchy-Schwarz inequality from Section 2.1, we find that this expression is bounded above in absolute value by Y k sup EH∈(Zk )m kgω·H k2U k . kgω·H kU k ≤ EH∈(Zk )m kgkU k N

N

ω∈{0,1}k \0k

ω∈{0,1}k \0k

But for fixed ω ∈ {0, 1}k \ 0k , as H runs through (ZkN )m , ω · H runs through all values of ZN , so the expression we are trying to bound can be rewritten as Y

m Y

ω 0 ∈{0,1}k

j=1

Eu(1) ,...,u(m) ∈ZN Ex∈ZN ,h∈Zk

N

fj (x + u(j) + ω 0 · h)

= Ex∈ZN ,h∈Zk

N

m Y

(Eu(j) ∈ZN

Y

fj (x + u(j) + ω 0 · h)).

ω 0 ∈{0,1}k

j=1

By hypothesis on fj and Hölder’s inequality the latter average is bounded above by Y Y Ex∈ZN ,h∈Zk (Eu∈ZN ν(x+u+ω 0 ·h))m = Eh∈Zk (Ey∈ZN ν(y+ω 0 ·h))m , N

N

ω 0 ∈{0,1}k

ω 0 ∈{0,1}k

which, by the correlation condition in Definition 4 applied to the expectation in y and the triangle inequality, is bounded by X Eh∈Zk ( τ (h · (ω 0 − ω 00 )))m ≤ C(m) sup Eh∈Zk τ (h · (ω 0 − ω 00 ))m . N

ω 0 6=ω 00 ∈{0,1}k

ω 0 6=ω 00 ∈{0,1}k

N

But for ω 0 6= ω 00 , h · (ω 0 − ω 00 ) uniformly covers ZN as h runs through ZkN , and τ is assumed to have bounded moments of all order, so the proof is complete. Even though Green and Tao’s original approach to the transference principle is quite different, this lemma also played a crucial role there. It is the only point in the argument where the correlation condition is used, and it concludes our sketch of the proof of the transference principle.

ASTÉRISQUE 352

(1054)

ARITHMETIC AND POLYNOMIAL PROGRESSIONS IN THE PRIMES

411

3.3. Existence of a pseudorandom measure In order to complete the proof of the Green-Tao theorem, it remains to establish the existence of a pseudorandom measure that satisfies the conditions given in Definition 4. That is, we need to find a majorant for the modified von Mangoldt function that averages roughly 1 and satisfies the linear forms and correlation conditions. As e we observed before, the Siegel-Walfisz theorem tells us that En∈[N ] Λ(n) = 1 + o(1), but higher-order correlations, such as the ones necessary for the linear forms and correlation conditions, are in general rather poorly understood. However, it is possible to replace Λ, which can be written as X n Λ(n) = µ(d) log , d d|n

where µ is the Möbius function(32), by a truncated version which is localized not to primes but to “almost” primes, meaning integers with no small prime factors. For example, averages such as En∈[N ] ΛR (n + h1 ) · · · ΛR (n + hm ) for arbitrary h1 , . . . , hm , where the truncated divisor sum ΛR (for R a small power of N ) is defined by ΛR (n) =

X d|n,d 3 were given conditional on the U k inverse theorem (Theorem 10), which was only conjectured at the time. Furthermore, Green and Tao required an additional fact regarding the Möbius function, namely the Möbius and nilsequences conjecture, which they were able to resolve shortly afterwards [28]. Theorem 19 (Möbius is orthogonal to nilsequences). — Let G/Γ be a k-step nilmanifold and F (g n x) be a k-step nilsequence. Then for any C > 0, we have |En∈[N ] µ(n)F (g n x)|  (log N )−C , where the implied constant depends on G/Γ, k, C and the Lipschitz constant of F (but not on x or g). Let us briefly outline how to use the transference principle, the inverse theorem and Theorem 19 to obtain asymptotics for k-term arithmetic progressions in the primes. First, note that the transference principle and the inverse theorem can be combined to give a transferred inverse theorem, that is, an inverse theorem for functions that are bounded by a pseudorandom measure instead of a constant.(35) Using the decomposition of the von Mangoldt function in terms of the Möbius function together with relatively standard methods from analytic number theory, Theorem 19 implies that Λ − 1 is almost orthogonal to all (k − 1)-step nilsequences. One immediately deduces that Λ − 1 has small U k norm: otherwise Λ − 1 correlates with one of the nilsequences by the transferred inverse theorem, which leads to a contradiction. Then, by the relative generalized von Neumann theorem (Proposition 13), the average over a product of different instances of Λ = 1 + (Λ − 1) is essentially, up to local factors, just the product over the constant part. The error terms remain ineffective without GRH. Using a relative version of the more general Proposition 7 together with the transferred inverse theorem, one obtains asymptotics not only for long arithmetic progressions in the primes, but more generally for all systems of affine linear forms of finite complexity, no two of which are linearly dependent.(36) This solves the generalized Hardy-Littlewood prime tuples conjecture, excluding only notoriously hard problems such as the twin primes and Goldbach’s conjecture (which have infinite complexity). A quirky consequence, for example, is a strengthening of Vinogradov’s result [53] that every sufficiently large odd integer can be written as a sum of three primes p1 +p2 +p3 : one may impose the additional constraint that p1 − p2 be equal to a prime minus 1.(37) (35)

Such a statement was first given as Proposition 10.1 in [31]. One needs to adjust the majorant slightly since it is now necessary to simultaneously control ) e b1 , . . . , Λ ebt for different values of b1 , . . . , bt , where Λ eb (n) = φ(W Λ log(W n + b) whenever W n + b is W prime, and zero otherwise. (37) For a precise statement of the generalized Hardy-Littlewood prime tuples conjecture, see Conjecture 1.4 in [31]. (36)

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

414

J. WOLF

4. POLYNOMIAL PROGRESSIONS IN THE PRIMES The general philosophy of the proof of Theorem 4 is the same as that of the GreenTao theorem. However, there are two immediate and serious obstacles to a straightforward adaptation of the argument. The first is that, as mentioned in Section 2.4, there is no quantitative version of a polynomial Szemerédi theorem, and we only have the qualitative Bergelson-Leibman theorem (Theorem 12) at our disposal. However, it is possible to obtain a “pseudo”-quantitative, finitary version of Theorem 12. This remains completely ineffective, which is why the final statement in Theorem 4 contains no explicit bounds. We discuss this step in more detail in Section 4.1. The second and in some sense more serious difficulty is a direct consequence of the polynomial nature of the problem. Recall that when we were dealing with linear systems such as x, x + d, x + 2d, if the variable x ranged over the interval [N ], then the range of the variable d was still comparable to [N ]. However, in the case of polynomial systems such as x, x + m2 , the range of the variable m has to be restricted to a smaller √ range [M ] = [ N ]. This means that we can no longer control our averages by the uniformity norms introduced in Section 2.1. Instead, one has to define local versions of these norms, in which the ranges of some of the parameters are restricted to smaller scales. We shall give the precise definition of these norms in Section 4.2. The resulting modifications of the remainder of the argument are somewhat more routine, but contain numerous subtleties and are technically formidable. In Section 4.3 we show how to explicitly derive a relative generalized von Neumann theorem for the specific case of the polynomial system x, x + m2 mentioned above. This involves linearizing the polynomial system by the so-called Polynomial Exhaustion Theorem (or PET induction), which is an inductive process on polynomial systems that was crucial to the proof of Theorem 12.(38) A key ingredient for showing that these local uniformity norms are good for transference will be established, again in a special case, in Section 4.4. Of course, one requires somewhat more stringent conditions on the majorizing pseudorandom measure ν in order to be able to handle polynomial systems, labelled the polynomial forms and the polynomial correlation condition. Because of their technical complexity, we shall not state these formally but only describe some of the ideas that go into verifying these properties in Section 4.5. The generalization of the argument to arbitrary families of polynomials brings with it an intimidating amount of notation, which we shall try to avoid as much as possible by presenting only special cases of (parts of) the argument. There are many different scales of parameters involved in the proof of Theorem 4: a coarse scale (the range M of m above, which should be thought of as a small power of N (38)

See also [54] for a combinatorial application.

ASTÉRISQUE 352

(1054)

ARITHMETIC AND POLYNOMIAL PROGRESSIONS IN THE PRIMES

415

depending on the maximal degree of the family of polynomials P1 , . . . , Pk ), the degree of pseudorandomness required of the measure, the sieve level R, the error term in the transference principle, the “complexity” of the polynomial system and a fine scale H arising from applications of van der Corput’s lemma. Since we cannot accurately represent the dependencies between these parameters in the remaining pages, we have chosen to refer to all error terms by o(1) and ask the reader to take on trust (or to check for themselves) that these errors can be made to depend on each other in the way required. 4.1. The quantitative Bergelson-Leibman theorem First we shall outline very briefly how to obtain a quantitative but ineffective polynomial Szemerédi theorem from the Bergelson-Leibman theorem. This approach is very much in line with Tao’s general efforts to bring results from ergodic theory to the discrete setting. To save space and remain closer to the original presentation of Tao and Ziegler, we shall from now on adopt ergodic theory notation, setting X = ZN , R using the integral X instead of the expectation Ex∈X and writing T for the shift map on X, which acts by T f (x) = f (x − 1). Theorem 20 (Quantitative Bergelson-Leibman theorem). — Let δ > 0, and let R g : X → R be any function satisfying 0 ≤ g ≤ 1 + o(1) as well as X g ≥ δ − o(1). Then Z T P1 (W m)/W g · · · T Pk (W m)/W g ≥ c(δ) − o(1),

Em∈[M ] X

for some c(δ) depending on δ, P1 , . . . , Pk (but not on N or W ). The appearance of the parameter W in the statement may appear odd, but its role is identical to that in the linear case: it helps us deal with non-uniform distribution modulo small primes. In fact, the above statement with g replaced by the normalized counting function f : X → R+ , defined by ( φ(W ) whenever n ∈ [N/2], W n + b ∈ A, W log R f (n) = 0 otherwise, where A is a subset of the primes of positive relative density, precisely corresponds to the “moreover” part of Theorem 4. As before, the parameter R denotes the sieve level and the ratio between log R and log N represents the relative density between the primes and almost primes. The integer b is chosen by the pigeonhole principle to ensure that W N |{n ∈ [N/2] : W n + b ∈ A}|  . φ(W ) log N Sketch proof of Theorem 20: The deduction of Theorem 20 from (a multidimensional version of) Theorem 12 proceeds by a non-standard application of the

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

416

J. WOLF

Furstenberg correspondence principle [14]. One argues by contradiction and supposes that Theorem 20 fails. An averaging argument attributed to Varnavides [52] tells us that it does so in a strong way.(39) After lifting to a higher-dimensional setting to eliminate the dependence on W and m, one invokes Furstenberg’s correspondence principle to pass from the (quasi-)finite formulation to a dynamical system involving several commuting transformations, whose recurrence properties correspond to the structural information we already possess about the function g. Finally, weak sequential compactness is used to derive a contradiction with the multidimensional version of Theorem 12. This procedure can be written up in detail in less than two pages, and naturally gives no explicit bounds for c(δ) in terms of δ.(40) 4.2. Local uniformity norms Motivated by the discussion in the introduction to this section, we need to introduce several scales into our usual definition of the U k norm. Definition 5 (Averaged local uniformity norms). — For steps a = (a1 , . . . , ad ) ∈ Zd , a define the local uniformity norm U√ of f : ZN → R(41) by the formula M Z Y (ω) 2d √ kf kU√a = Em(0) ,m(1) ∈[ M ]d T a·m f, M

X ω∈{0,1}d

(i)

(i)

(ω )

(ω )

where ω = (ω1 , . . . , ωd ), m(i) = (m1 , . . . , md ) and a·m(ω) = a1 m1 1 +· · ·+ad md d . Moreover, given any integer t ≥ 0 and any Q = (Q1 , . . . , Qd ) ∈ Z[h1 , . . . , ht , W ]d , write Q(h1 , . . . , ht , W ) for the d-tuple (Q1 (h1 , . . . , ht , W ), . . . , Qd (h1 , . . . , ht , W )) of Q([H]t ,W ) polynomials. Define the averaged local uniformity norm U√M as d

d

kf k2 Q([H]t ,W ) = Eh1 ,...,ht ∈[H] kf k2 √Q(h1 ,...,ht ,W ) . U√

M

U

M

While the global uniformity norms in Definition 1 measure the extent to which a function f behaves like a polynomial of degree at most k on all of ZN , the local norms measure the extent to which f is polynomial on arithmetic progressions of the √ form {x + a · m : m1 , . . . , md ∈ [ M ]}. The averaged version arises from various applications of van der Corput’s lemma (Lemma 21 below). It turns out that these averages need to be taken over tiny ranges H (H should be thought of as a very small power of N , basically depending on all other parameters in the problem). This is one (39)

Whenever we can assert the existence of one non-trivial progression in a subset A ⊆ [N ] of density α, it is easy to show by averaging that we actually have c(α)N 2 many. (40) See Appendix B of [50]. (41) We shall omit the complex conjugate signs here since the functions we will be dealing with only take positive real values.

ASTÉRISQUE 352

(1054)

ARITHMETIC AND POLYNOMIAL PROGRESSIONS IN THE PRIMES

417

of the subtleties that make the adaptation of the argument from the linear case not entirely straightforward.(42) It can be verified without too much trouble that each of the formulae in Definition 5 does indeed define a norm. An example which will make an appearance later on is the averaged local norm defined by Z 0 0 0 T 2(h −h)k f T 2(h −h)k f. kf k2ex = Eh,h0 ∈[H] Ek,k0 ∈[√M ] X

Here t = 2, d = 1 and Q(h, h0 , W ) = 2(h0 − h). Contrary to the global U k norms, which are by now rather well understood, we know relatively little about the local ones. In the next section we shall use them to bound above a polynomial average in the spirit of the relative generalized von Neumann theorem. 4.3. The relative generalized von Neumann theorem for polynomials The proof of the relative generalized von Neumann theorem for polynomial systems contains an important new ingredient over the linear case, borrowed from relevant work in ergodic theory (in particular, the proof of Theorem 12). PET induction is needed to linearize the polynomial system in successive stages before the CauchySchwarz inequality can take over to bound the resulting linear system by an expression resembling a local uniformity norm. In a final step one has to get rid of a certain weight function introduced by this procedure, by applying the Cauchy-Schwarz inequality one more time, similarly to what we saw in Proposition 13. In order to carry out the linearization procedure, one requires a slight but well-known variant of the CauchySchwarz inequality which allows one to replace coarse-scale averages by coarse-scale averages of shifts over much smaller scales. Lemma 21 (van der Corput). — Let N, M, H be as above. Let (xm )m∈Z be a sequence of reals satisfying xm  N  for all  > 0, m ∈ Z. Then Em∈[M ] xm = Eh∈[H] Em∈[M ] xm+h + o(1) and |Em∈[M ] xm |2  Eh,h0 ∈[H] Em∈[M ] xm+h xm+h0 + o(1). Proof. — By assumption on the growth of xm , Em∈[M ] xm = Em∈[M ] xm+h + o(1) (42) The parameter W will not appear in our sample calculations, but is necessary for the final result (see Theorem 20 and the discussion that follows).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

418

J. WOLF

for all h ∈ [H]. The same is certainly true for the average in h, and so the first part of the result follows. The second part is obtained by applying the Cauchy-Schwarz inequality to the first. We shall use the very simple example of a polynomial system x, x + m2 to illustrate how to combine PET linearization and Cauchy-Schwarz to prove a polynomial version of the relative generalized von Neumann theorem.(43) It should give the reader an idea of what kinds of polynomial averages of ν need to be controlled by the polynomial forms condition, which we shall not state formally in this text. Example 2. — Let f1 , f2 : ZN → R be any functions satisfying |fj (x)| ≤ ν(x) for j = 1, 2, where ν satisfies the polynomial forms condition. Then Z 2 |Em∈[M ] f1 T m f2 |  kf2 k1/2 ex + o(1). X

Proof of Example 2. — The first step is reminiscent of Weyl differencing: we turn the polynomial system into one that is somewhat more linear. We begin with Z Z Z 2 2 |Em∈[M ] f1 T m f2 |2 ≤ ( ν)( ν|Em∈[M ] T m f2 |2 ), X

X

X

which equals Z (1 + o(1))

2

ν|Em∈[M ] T m f2 |2 ,

X

by assumption on ν. By the second part of van der Corput’s lemma(44), we have Z Z 2 0 2 m2 2 ν|Em∈[M ] T f2 | = Eh,h0 ∈[H] Em∈[M ] νT (m+h) f2 T (m+h ) f2 + o(1). X

X

As mentioned above, it turns out that the range H needs to be very small compared with M (we shall see why in Example 3 below). Exploiting the translation invariance of the integral over X, we shall now shift the entire integrand by −(m + h)2 to obtain new shifts R1 (m, h, h0 ) = −(m + h)2 , R2 (m, h, h0 ) = 0, R20 (m, h, h0 ) = 2m(h0 − h) + (h02 − h2 ), the latter now being linear in m. So we need to estimate from above the expression Z 0 0 02 2 Eh,h0 ∈[H] Em∈[M ] f2 T R1 (m,h,h ) νT 2m(h −h)+(h −h ) f2 . X

(43)

Of course, this system is covered by the strong bound in Sárközy’s theorem (Theorem 11) and therefore the procedure that follows is not strictly speaking necessary in this case. However, even the only slightly more complicated system x, x + m, x + m2 results in a local uniformity norm involving ten different variables, for which the amount of notation required would be almost as off-putting as the general case, given by Proposition 5.9 in [50]. (44) Here we need the estimate ν  N  for every  > 0. Fortunately this is a simple consequence of the well-known fact that the number of divisors of an integer N is  N  for any  > 0.

ASTÉRISQUE 352

(1054)

ARITHMETIC AND POLYNOMIAL PROGRESSIONS IN THE PRIMES

419

√ Let k ∈ [ M ], and observe that the first part of van der Corput’s lemma yields that the above expression is equal to Z 0 02 2 Eh,h0 ∈[H] Em∈[M ] Ek∈[√M ] f2 g1 T 2(m−k)(h −h)+(h −h ) f2 + o(1), X

0

where g1 = T R1 (m−k,h,h ) ν. Letting Q0 = Q0 (k, h, h0 ) = 2(h0 − h)k and shifting again, we have Z 0 0 0 02 2 Ek∈[√M ] T Q0 (k,h,h ) f2 T Q0 (k,h,h ) g1 T 2m(h −h)+(h −h ) f2 + o(1), Eh,h0 ∈[H] Em∈[M ] X

the crucial point being that the final instance of f2 is independent of k. Writing 0 02 2 g2 = T 2m(h −h)+(h −h ) ν and applying the Cauchy-Schwarz inequality one more time, we obtain an upper bound of Z Z |Ek∈[√M ] T Q0 f2 T Q0 g1 |2 g2 )1/2 (Eh,h0 ∈[H] Em∈[M ] (Eh,h0 ∈[H] Em∈[M ] g2 )1/2 + o(1). X

X

The average in g2 is exactly of a form controlled by the polynomial forms condition, and hence bounded above by a constant. The first average, on the other hand, can be rewritten (ignoring the square-root) as Z 0 0 0 Eh,h0 ∈[H] Ek,k0 ∈[√M ] T Q0 (k,h,h ) f2 T Q0 (k ,h,h ) f2 W (h, h0 , k, k 0 ), X

0

0

0

where W (h, h0 , k, k 0 ) = Em∈[M ] g2 T Q0 (k,h,h ) g1 T Q0 (k ,h,h ) g10 , and g10 is identical to g1 except with k replaced by k 0 . Now clearly Z 0 0 0 Eh,h0 ∈[H] Ek,k0 ∈[√M ] T Q0 (k,h,h ) f2 T Q0 (k ,h,h ) f2 = kf2 k2ex , X

and it thus remains to replace the weight function W , consisting of averages of shifts of ν, by 1 asymptotically. This is done by applying the Cauchy-Schwarz inequality one more time to the difference between the expression we have and the local uniformity norm we are aiming for, and expanding out the square (W (h, h0 , k, k 0 ) − 1)2 similarly to the end of the proof of Proposition 13. All resulting averages of shifts of ν are controlled by the polynomial forms condition. The general PET induction scheme assigns a weight vector to each family of polynomials, and the aim is to reduce the weight of the polynomials that appear in the average (in some ordering) until the point where one reaches linearity in the variable m for all “active” functions (those that have not been replaced by ν).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

420

J. WOLF

4.4. Transference in the polynomial case In order to apply the transference technique from Section 3.2, we need to check that the local uniformity norms satisfy the required properties (in the terminology of Gowers [18], that they are quasi-algebra predual norms). In particular, we need an analogue of Lemma 18 for the local norms. As before, we shall only do a toy calculation so as to avoid overburdening the reader with notation. As a simple example of a dual function consider 0

0

Dex f = Eh,h0 ∈[H] Ek,k0 ∈[√M ] T 2(h−h )(k−k ) f, which corresponds to the local uniformity norm k·kex we obtained when bounding the system x, x + m2 in the preceding section. While in Section 3 we showed directly that the U k dual norm of a product of these dual functions was small, we shall proceed more indirectly here and prove the consequence of this fact that we actually need, namely that the product of dual functions is practically orthogonal to ν −1.(45) Again, our hope is that following the calculation in this example will convey a good picture of the type of polynomial correlation condition the majorant ν needs to satisfy. Example 3. — Let f1 , . . . , fm : ZN → R be any functions satisfying |fj (x)| ≤ ν(x) for j = 1, . . . , m, where ν satisfies the polynomial correlation condition. Then Z ( Dex f1 · · · Dex fm )(ν − 1) = o(1), X

where the dual operator Dex is the one defined above. Before we begin the proof, note that if one simply applied absolute value signs and bounded everything above by ν, then the pseudorandomness properties of ν would only imply an upper bound of O(1). One might also naively want to proceed by applying the Cauchy-Schwarz inequality many times, but this would result in problems since m could be too large to be multiplied with some of the o(1) error terms. Proof of Example 3. — The left-hand side can be rewritten as Z Y m 0 0 0 Eh1 ,...,hm ,h01 ,...,h0m Ek1 ,...,km ,k10 ,...,km T 2(hj −hj )(kj −kj ) fj (ν − 1). X j=1

Here the range of the variables h will be the very short interval [H], while that of √ Q the variables k is the coarse scale [ M ]. Setting uj = l6=j (hl − h0l ) and shifting (45)

The general statement to this effect is Proposition 6.5 in [50].

ASTÉRISQUE 352

(1054)

ARITHMETIC AND POLYNOMIAL PROGRESSIONS IN THE PRIMES

421

each variable kj by uj (n − n0 ) for n, n0 ∈ [M 1/4 ], this expression equals, by van der Corput’s lemma Z Y m 0 0 0 0 En,n0 ∈[M 1/4 ] Eh1 ,...,hm ,h01 ,...,h0m Ek1 ,...,km ,k10 ,...,km T 2(hj −hj )((kj −kj )+uj (n−n )) fj (ν − 1) + o(1). X j=1

Note that this was only possible because each h belonged to the narrow range [H]. The introduction of the new variables now allows us to get away with a single application of Cauchy-Schwarz by separating n and n0 . With this in mind, we shift the entire Q 0 1/4 , and integral by n0 u, where u = 2 m l=1 (hl − hl ) is again small compared with M find that the above is equal to Z m Y 0 0 0 0 T nu ( T 2(hj −hj )(kj −kj ) fj )T n u (ν − 1) + o(1). En,n0 ∈[M 1/4 ] Eh1 ,...,hm ,h01 ,...,h0m Ek1 ,...,km ,k10 ,...,km X

j=1

We can now factor this expression as Z m Y 0 0 0 Eh1 ,...,hm ,h01 ,...,h0m En∈[M 1/4 ] Ek,k0 T nu+2(k−k )(hj −hj ) fj × En0 ∈[M 1/4 ] T n u (ν − 1) + o(1), X

j=1

which by Cauchy-Schwarz and the assumption on fj is at most Z (E

h1 ,...,hm ,h01 ,...,h0m

(En∈[M 1/4 ] X

m Y

0

0

Ek,k0 T nu+2(k−k )(hj −hj ) ν)2 )1/2

j=1

Z × (E

h1 ,...,hm ,h01 ,...,h0m

0

(En0 ∈[M 1/4 ] T n u (ν − 1))2 )1/2 + o(1),

X

It turns out that this is precisely the kind of average that is controlled by the polynomial correlation condition.(46) In particular, upon expanding the square, the first average equals 1 + o(1), while the second splits into three separate averages over ν whose constant contributions cancel, leaving us with a final estimate of o(1). 4.5. Existence of the pseudorandom measure Finally, one needs to look for a measure ν that majorizes the function f defined in Section 4.1 pointwise, and satisfies the polynomial forms and polynomial correlation conditions, of which we hope to have given the reader a taste in the preceding two sections. In any case, the exact conditions are somewhat artificial and a compromise between what is needed and what can be proved about the primes.

(46)

It is important here that m can be arbitrarily large (otherwise this statement reduces to a special case of the polynomial forms condition), and that the inside averages are over coarse scales.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

422

J. WOLF

As in the linear case, the construction of ν can be given completely explicitly by é Ñ ã 2 Å X φ(W ) log d ν(n) = log R µ(d)χ , W log R d|W n+b

where χ is a smooth compactly supported cutoff obeying the normalization condition R1 0 2 |χ (t)| dt = 1. Correlations over coarse scales are controlled rather well, either 0 by the methods of Goldston and Yıldırım, or using the more elementary approach described in Section 3.3 which exploits the smoothness of χ. However, those averages that involve parameters on the finer scale [H], which we were forced to introduce in Example 2 and whose magnitude was determined by the calculation in Example 3, are no longer controlled by elementary sieve theory methods. Indeed, some of the estimates required would be equivalent to understanding the distribution of primes in short intervals, which are beyond current techniques. The way to handle this situation is to first fix the fine-scale parameters and estimate the remaining sums using sieve theory methods, before the resulting (now tractable) sums are averaged over finer scales. In the process of verifying the polynomial forms and correlation conditions, one needs to control the density of varieties such as {x ∈ Fdp : W P (x) + b = 0}. In the most general case this requires the Weil conjectures, but here the polynomial P will always be linear in at least one of the coarse-scale variables and one can get away with much more elementary estimates, avoiding the modern tools from arithmetic geometry altogether. An adaptation of the combinatorial Nullstellensatz in [1] to the case of several jointly coprime polynomials turns out to be sufficient.(47) The verification of the pseudorandomness conditions for ν is nevertheless highly technical, and we shall be able to say no more about it in the present exposition.(48)

5. CONCLUDING REMARKS The proof of Theorem 4 shows that there are cN M/ logk N polynomial progressions x + P1 (m), . . . , x + Pk (m) in the primes with x ∈ [N ], m ∈ [M ], for some constant c. Moreover, it is true that there are infinitely many “short” progressions, that is progressions for which m is comparable to x1/2d , where d is the maximal degree of the family of polynomials. Indeed, disregarding the values of x of size  N , we can assume that x is comparable to N and similarly, m is comparable to M . For fixed k, one therefore obtains infinitely many progressions of the form x + P1 (m), . . . , x + Pk (m) in which (47)

See Appendix D of [50]. The interested reader is in the first instance referred to the excellent discussion on page 270 of [50]. (48)

ASTÉRISQUE 352

(1054)

ARITHMETIC AND POLYNOMIAL PROGRESSIONS IN THE PRIMES

423

m is comparable to x1/2d . By a diagonalization argument one can actually obtain infinitely many such progressions with m = xo(1) . In a subset A of the integers of positive upper density something stronger is true: there is a fixed m 6= 0 for which the set {x : x + Pj (m) ∈ A for all j ∈ [k]} is infinite, and in fact of positive upper density (this follows from the Bergelson-Leibman theorem). A similar result for the primes, even in the simplest case, amounts to saying that the primes have bounded gaps arbitrarily often, which even by the strong results of Goldston, Pintz and Yıldırım is not known unconditionally. The conjectured asymptotics for polynomial configurations in the primes are given by the Bateman-Horn conjecture [2]. Conjecture 22 (Bateman-Horn conjecture). — Let P1 , . . . , Pk ∈ Z[m] be irreducible polynomials with positive leading coefficient, of degree d1 , . . . , dk , respectively, such that the product P1 · · · Pk has no non-trivial constant factor.(49) Then the number of positive integers m ∈ [N ] such that P1 (m), . . . , Pk (m) are all prime is asymptotic to Z C(P1 , . . . , Pk ) N du , d1 · · · dk logk u 2 where C(P1 , . . . , Pk ) =

ω(p) p , − p1 )k

Y 1− p

(1

and ω(p) is the number of solutions to the congruence P1 (x) · · · Pk (x) ≡ 0 mod p. While the work of Tao and Ziegler is consistent with these predictions, these asymptotics are out of reach for now. This is largely due to the lack of an inverse theorem for the local Gowers norms (see Section 3.4 for a discussion of how such an inverse theorem for the global Gowers norms implies asymptotics for certain linear configurations). Some interesting work has also been done on this sphere of problems in the function field setting. In particular, Lê [37] proved a version of the Green-Tao theorem for function fields: for every k, there exists f, g ∈ Fq [t], g 6= 0 such that the elements of {f + P g : P ∈ Fq [t], deg(P ) < k} are all irreducible. While the function field setting appears to be a useful model for polynomial problems in the integers, it turns out that the naive analogue of the Bateman-Horn conjecture is false in this context.(50)

(49) (50)

If a prime p divides P1 · · · Pk , it can be the only prime amongst the values of the polynomials. For a discussion see [9].

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

424

J. WOLF

Acknowledgements The author would like to thank Tim Gowers, Ben Green and Terence Tao for their thoughts on the manuscript as well as the many insights they have generously shared over the years. She is also greatly indebted to Bernard Host and Tamar Ziegler for numerous useful comments and corrections, and Tom Sanders for helpful conversations and moral support.

REFERENCES [1] N. Alon – “Combinatorial Nullstellensatz”, Combin. Probab. Comput. 8 (1999), nos. 1-2, p. 7–29. [2] P. T. Bateman & R. A. Horn – “A heuristic asymptotic formula concerning the distribution of prime numbers”, Math. Comp. 16 (1962), p. 363–367. [3] F. A. Behrend – “On sets of integers which contain no three terms in arithmetical progression”, Proc. Nat. Acad. Sci. U. S. A. 32 (1946), p. 331–332. [4] V. Bergelson – “Weakly mixing PET”, Ergodic Theory Dynam. Systems 7 (1987), no. 3, p. 337–349. [5] V. Bergelson, B. Host & B. Kra – “Multiple recurrence and nilsequences”, Invent. Math. 160 (2005), no. 2, p. 261–303. [6] V. Bergelson & A. Leibman – “Polynomial extensions of van der Waerden’s and Szemerédi’s theorems”, J. Amer. Math. Soc. 9 (1996), no. 3, p. 725–753. [7] J. Bourgain – “On triples in arithmetic progression”, Geom. Funct. Anal. 9 (1999), no. 5, p. 968–984. [8] D. Conlon & W. T. Gowers – “Combinatorial theorems in sparse random sets”, preprint arXiv:1011.4310. [9] K. Conrad – “Irreducible values of polynomials: a non-analogy”, in Number fields and function fields—two parallel worlds, Progr. Math., vol. 239, Birkhäuser, 2005, p. 71–85. [10] J.-P. Conze & E. Lesigne – “Sur un théorème ergodique pour des mesures diagonales”, C. R. Acad. Sci. Paris Sér. I Math. 306 (1988), no. 12, p. 491–493. [11] J. G. van der Corput – “Über Summen von Primzahlquadraten”, Math. Ann. 116 (1939), p. 1–50.

Primzahlen

und

[12] P. Erdös & P. Turán – “On Some Sequences of Integers”, J. London Math. Soc. S1-11 , no. 4, p. 261–264. [13] G. A. Fre˘ıman – Foundations of a structural theory of set addition, Translations of Mathematical Monographs, vol. 37, Amer. Math. Soc., 1973.

ASTÉRISQUE 352

(1054)

ARITHMETIC AND POLYNOMIAL PROGRESSIONS IN THE PRIMES

425

[14] H. Furstenberg – “Ergodic behavior of diagonal measures and a theorem of Szemerédi on arithmetic progressions”, J. Analyse Math. 31 (1977), p. 204–256. [15] H. Furstenberg & B. Weiss – “A mean ergodic theorem for P n n2 x)”, in Convergence in ergodic theory and probability (1/N ) N n=1 f (T x)g(T (Columbus, OH, 1993), Ohio State Univ. Math. Res. Inst. Publ., vol. 5, de Gruyter, 1996, p. 193–227. [16] D. A. Goldston & C. Y. Yıldırım – “Higher correlations of divisor sums related to primes. III. Small gaps between primes”, Proc. Lond. Math. Soc. 95 (2007), no. 3, p. 653–686. [17] W. T. Gowers – “A new proof of Szemerédi’s theorem”, Geom. Funct. Anal. 11 (2001), no. 3, p. 465–588. [18] , “Decompositions, approximate structure, transference, and the HahnBanach theorem”, Bull. Lond. Math. Soc. 42 (2010), no. 4, p. 573–606. [19] W. T. Gowers & J. Wolf – “The true complexity of a system of linear equations”, Proc. Lond. Math. Soc. 100 (2010), no. 1, p. 155–176. [20] , “Linear forms and quadratic uniformity for functions on ZN ”, J. Anal. Math. 115 (2011), p. 121–186. [21] B. Green – “On arithmetic structures in dense sets of integers”, Duke Math. J. 114 (2002), no. 2, p. 215–238. [22] , “Roth’s theorem in the primes”, Ann. of Math. 161 (2005), no. 3, p. 1609– 1636. [23] , “Long arithmetic progressions of primes”, in Analytic number theory, Clay Math. Proc., vol. 7, Amer. Math. Soc., 2007, p. 149–167. [24] B. Green & T. Tao – “An inverse theorem for the Gowers U 3 (G) norm”, Proc. Edinb. Math. Soc. 51 (2008), no. 1, p. 73–153. [25] , “The primes contain arbitrarily long arithmetic progressions”, Ann. of Math. 167 (2008), no. 2, p. 481–547. [26] , “New bounds for Szemerédi’s theorem. II. A new bound for r4 (N )”, in Analytic number theory, Cambridge Univ. Press, 2009, p. 180–204. [27] , “An arithmetic regularity lemma, an associated counting lemma, and applications”, in An irregular mind, Bolyai Soc. Math. Stud., vol. 21, János Bolyai Math. Soc., 2010, p. 261–334. [28] , “The Möbius function is strongly orthogonal to nilsequences”, Ann. of Math. 175 (2012), no. 2, p. 541–566. [29] B. Green, T. Tao & T. Ziegler – “An inverse theorem for the Gowers U s+1 [N ]-norm”, Electron. Res. Announc. Math. Sci. 18 (2011), p. 69–90. [30] , “An inverse theorem for the Gowers U s+1 [N ]-norm”, Ann. of Math. 176 (2012), no. 2, p. 1231–1372.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

426

J. WOLF

[31] B. Green & T. Tao – “Linear equations in primes”, Ann. of Math. 171 (2010), no. 3, p. 1753–1850. [32] M. Hamel & I. Łaba – “Arithmetic structures in random sets”, Integers 8 (2008), p. A04, 21. [33] B. Host – “Progressions arithmétiques dans les nombres premiers (d’après B. Green et T. Tao)”, Séminaire Bourbaki, vol. 2004/2005, exposé no 944, Astérisque 307 (2006), p. 229–246. [34] B. Host & B. Kra – “Nonconventional ergodic averages and nilmanifolds”, Ann. of Math. 161 (2005), no. 1, p. 397–488. [35] Y. Kohayakawa, T. Łuczak & V. Rödl – “Arithmetic progressions of length three in subsets of a random set”, Acta Arith. 75 (1996), no. 2, p. 133–163. [36] B. Kra – “The Green-Tao theorem on arithmetic progressions in the primes: an ergodic point of view”, Bull. Amer. Math. Soc. (N.S.) 43 (2006), no. 1, p. 3–23. [37] T. H. Lê – “Green-Tao theorem in function fields”, Acta Arith. 147 (2011), no. 2, p. 129–152. [38] J. Pintz, W. L. Steiger & E. Szemerédi – “On sets of natural numbers whose difference set contains no squares”, J. London Math. Soc. 37 (1988), no. 2, p. 219–231. [39] O. Ramaré & I. Z. Ruzsa – “Additive properties of dense subsets of sifted sequences”, J. Théor. Nombres Bordeaux 13 (2001), no. 2, p. 559–581. [40] O. Reingold, L. Trevisan, M. Tulsiani & S. Vadhan – “Dense subsets of pseudorandom sets”, in 49th Annual IEEE Symposium on Foundations of Computer Science (FOCS), Philadephia, 2008, p. 76–85. [41] K. F. Roth – “On certain sets of integers”, J. London Math. Soc. 28 (1953), p. 104–109. [42] I. Z. Ruzsa – “Generalized arithmetical progressions and sumsets”, Acta Math. Hungar. 65 (1994), no. 4, p. 379–388. [43] T. Sanders – “On Roth’s theorem on progressions”, Ann. of Math. 174 (2011), no. 1, p. 619–636. , “On the Bogolyubov-Ruzsa lemma”, Anal. PDE 5 (2012), no. 3, p. 627–

[44] 655.

[45] A. Sárkőzy – “On difference sets of sequences of integers. I”, Acta Math. Acad. Sci. Hungar. 31 (1978), nos. 1–2, p. 125–149. [46] T. Schoen & I. Shkredov – “Roth’s theorem in many variables”, preprint arXiv:1106.1601. [47] E. Szemerédi – “On sets of integers containing no k elements in arithmetic progression”, Acta Arith. 27 (1975), p. 199–245.

ASTÉRISQUE 352

(1054)

ARITHMETIC AND POLYNOMIAL PROGRESSIONS IN THE PRIMES

427

[48] T. Tao – “The dichotomy between structure and randomness, arithmetic progressions, and the primes”, in International Congress of Mathematicians. Vol. I, Eur. Math. Soc., Zürich, 2007, p. 581–608. [49]

, “A remark on Goldston-Yıldırım correlation estimates”, http://www. math.ucla.edu/~tao/preprints/Expository/gy-corr.dvi.

[50] T. Tao & T. Ziegler – “The primes contain arbitrarily long polynomial progressions”, Acta Math. 201 (2008), no. 2, p. 213–305. [51] L. Trevisan, M. Tulsiani & S. Vadhan – “Regularity, boosting, and efficiently simulating every high-entropy distribution”, in 24th Annual IEEE Conference on Computational Complexity, Paris, 2009, p. 126–136. [52] P. Varnavides – “On certain sets of positive density”, J. London Math. Soc. 34 (1959), p. 358–360. [53] I. M. Vinogradov – “Some theorems concerning the primes”, Mat. Sbornik 2 (1937), p. 179–195. [54] M. Walters – “Combinatorial proofs of the polynomial van der Waerden theorem and the polynomial Hales-Jewett theorem”, J. London Math. Soc. 61 (2000), no. 1, p. 1–12. [55] T. Ziegler – “Universal characteristic factors and Furstenberg averages”, J. Amer. Math. Soc. 20 (2007), no. 1, p. 53–97.

Julia WOLF École Polytechnique Centre de Mathématiques Laurent Schwartz 91128 Palaiseau Cedex E-mail : [email protected]

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

352

ASTÉRISQUE 2013

SÉMINAIRE BOURBAKI VOLUME 2011/2012 EXPOSÉS 1043-1058 (1055) La conjecture des sous-groupes de surfaces Nicolas BERGERON

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Séminaire BOURBAKI 64e année, 2011-2012, no 1055, p. 429 à 458

Juin 2012

LA CONJECTURE DES SOUS-GROUPES DE SURFACES [d’après Jeremy Kahn et Vladimir Markovic] par Nicolas BERGERON

Une variété hyperbolique est une variété riemannienne, lisse, connexe, complète et de courbure sectionnelle constante égale à −1. On note H3 l’unique — à isométrie près — variété hyperbolique simplement connexe de dimension 3. Dans ce 2 2 rapport, on utilise le modèle du demi-espace H3 = (C × R∗+ , |dz| t2+dt ). L’extension de Poincaré de l’action par homographies de PSL2 (C) sur P1 (C) fournit une action de PSL2 (C) sur H3 par isométries et donc — via la différentielle — une action sur le fibré des repères. Cette action est simplement transitive ; le choix d’un point base p0 = (0, 1) ∈ H3 et de deux vecteurs tangents unitaires orthogonaux ~u0 = (0, 1) et ~n0 = (1, 0) permet donc d’identifier PSL2 (C) au fibré des repères de H3 via l’application g 7→ g · (p0 , ~u0 , ~n0 , ~u0 ∧ ~n0 ). Sauf mention contraire, dans tout ce rapport le terme variété désignera dorénavant une variété lisse, compacte, connexe, orientable et sans bord, et surface une variété de dimension 2. Un choix indifférent de point base est effectué lorsque l’on parle du groupe fondamental d’un espace connexe par arc, et un choix approprié de points bases est effectué lorsque l’on parle de morphisme entre groupes fondamentaux.

1. INTRODUCTION : LA CONJECTURE VH ET SES AMIES Soit M une variété hyperbolique de dimension 3. On conjecture tour à tour les énoncés suivants (voir [37, p. 380]) : (1) Le groupe fondamental de M contient un sous-groupe isomorphe au groupe fondamental d’une surface de genre au moins 2. (2) La variété M possède un revêtement fini qui contient une surface plongée de sorte que l’inclusion induise une injection au niveau des groupes fondamentaux. (3) La variété M possède un revêtement fini dont le premier nombre de Betti est non nul.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

430

N. BERGERON

(4) Pour tout entier n, la variété M possède un revêtement fini dont le premier nombre de Betti est supérieur à n. (5) La variété M possède un revêtement fini dont le groupe fondamental se surjecte sur un groupe libre de rang 2. (6) La variété M possède un revêtement fini qui fibre sur le cercle. Il n’est pas difficile de vérifier que(1) (5) ⇒ (4) ⇒

(3)

⇒ (2) ⇒ (1)

⇑ (6) La conjecture VH (pour virtuellement Haken) est l’énoncé (2). L’objet de ce rapport est d’expliquer les grandes idées de la démonstration, par Jeremy Kahn et Vladimir Markovic [22], de la conjecture (1) : Théorème 1.1 (Kahn-Markovic). — Soit M une variété hyperbolique de dimension 3 ; alors il existe une surface S de genre g ≥ 2 et une injection π1 S ,→ π1 M. Commentaires. — 1. Dans une prépublication récente, Dani Wise démontre notamment l’implication (2) ⇒ (6). Son résultat est plus général, nous revenons sur ses travaux au §6.2. Tout récemment Ian Agol a fait circuler une prépublication dans laquelle, en se reposant sur les travaux de Wise et de Kahn et Markovic, il démontre les six conjectures ci-dessus. 2. Dans le cas où M est arithmétique, le théorème 1.1 est dû à Marc Lackenby [28]. 3. Dans le cas où M est une variété hyperbolique de dimension 3 de volume fini mais non compacte, Daryl Cooper, Darren Long et Alan Reid [12] démontrent (5) et les résultats de Wise s’appliquent encore pour démontrer (6). 4. Dans un cadre plus général, Mikhail Gromov pose : Question 1.2. — Soit Γ un groupe hyperbolique au sens de Gromov qui ne contient pas un sous-groupe libre d’indice fini. Le groupe Γ contient-il un sous-groupe isomorphe au groupe fondamental d’une surface de genre au moins 2 ? On renvoie à [11] pour des travaux récents en lien avec cette question. (1)

L’implication (2) ⇒ (1) est la plus délicate, voir [20, Lem. 6.6].

ASTÉRISQUE 352

(1055)

CONJECTURE DES SOUS-GROUPES DE SURFACES

431

2. CONSTRUCTION D’UNE SURFACE À PARTIR DE PANTALONS Dans toute cette partie, M = Γ\H3 est une variété hyperbolique de dimension 3 uniformisée, où Γ est un sous-groupe discret et sans torsion du groupe PSL2 (C). De cette manière, on identifie le fibré des repères de M à Γ\PSL2 (C). Définition 2.1. — Soit S une surface dont on fixe un revêtement universel Se → S, de groupe de revêtement π1 (S). Une structure de PSL2 (C)-surface sur S est la donnée d’une immersion F : Se → H3 et d’une représentation ρ ∈ Hom(π1 (S), PSL2 (C)) telles que F soit équivariante relativement à ρ. Deux structures de PSL2 (C)-surfaces (F1 , ρ1 ) et (F2 , ρ2 ) sur S sont équivalentes s’il existe un élément g de PSL2 (C) tel que F2 = gF1 et ρ2 = gρ1 g −1 . Par analogie avec la notion de (G, X)-structure, on dira que F est l’application développante et ρ le morphisme d’holonomie de la structure de PSL2 (C)-surface. Le groupe de surface du théorème 1.1 sera obtenu comme groupe de monodromie d’une structure de PSL2 (C)-surface sur une surface S immergée dans M . On aura également besoin de considérer des surfaces à bord ; on demande alors que l’application développante envoie chaque composante de bord sur une géodésique. 2.1. L’espace des futals Fixons Π un pantalon orienté (à bord). On numérote C1 , C2 et C3 les composantes de bord orientées de Π et on choisit un élément cn ∈ π1 (Π) dans la classe de conjugaison correspondant à chaque composante de bord Cn pour n = 1, 2, 3, de sorte que c1 c2 c3 = id. Rappelons qu’un élément A ∈ PSL2 (C) — vu comme isométrie de H3 — a une longueur de translation complexe `(A) ∈ (R∗+ + iR)/2iπZ, telle que(2) trace(A) = ±2 cosh(`(A)/2). Étant donné un morphisme ρ : π1 (Π) → PSL2 (C), on note `n = `n (ρ) les longueurs de translation complexes des ρ(cn ) pour n = 1, 2, 3. Kourouniotis [26, Prop. 1.6] montre que trois nombres complexes σn ∈ (R∗+ +iR)/2iπZ où n = 1, 2, 3, déterminent deux hexagones gauches à angles droits isométriques, mais d’orientations opposées, dont trois côtés non-adjacents sont de longueurs complexes σ ˆ1 , σ ˆ2 , σ ˆ3 pour un choix de σ ˆn ∈ {σn , σn + iπ}. En recollant ces deux hexagones on (2) On prendra garde au fait que la trace de A n’est définie qu’au signe près et que la demi-longueur `(A)/2 n’est définie que modulo iπ.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

432

N. BERGERON

munit le pantalon Π d’une structure de PSL2 (C)-surface de représentation d’holonomie ρ : π1 (Π) → PSL2 (C) telle que `n (ρ) = 2σn pour n = 1, 2, 3. Réciproquement, si ρ est le morphisme d’holonomie d’une structure de PSL2 (C)-surface sur Π et si les extrémités des axes de translation des ρ(cn ) pour n = 1, 2, 3 sont deux à deux distinctes, alors ρ est conjuguée à une représentation d’holonomie associée comme ci-dessus à trois demi-longueurs σn = σn (ρ) ∈ (R∗+ + iR)/2iπZ où n = 1, 2, 3. Remarque 2.2. — 1. Quitte à conjuguer ρ dans PSL2 (C), on peut supposer que l’axe de translation de ρ(c1 ) est la géodésique (orientée) iR∗+ de H3 qui va de 0 à l’infini. Les perpendiculaires communes à iR∗+ et aux axes de translation des ρ(cn ) où n = 2, 3, déterminent deux éléments v− et v+ , de points base p− et p+ , du fibré unitaire normal à iR∗+ que l’on numérote de sorte que l’orientation du segment [p− , p+ ] coïncide avec l’orientation de la géodésique iR∗+ . Alors l’homographie z 7→ eσ1 z est l’unique isométrie directe de H3 qui préserve l’axe iR∗+ et envoie v− sur v+ . Cela détermine l’élément σ1 ∈ (R∗+ + iR)/2iπZ ; on procède de même pour σ2 et σ3 . 2. Toute représentation ρ comme ci-dessus admet un relevé ρ˜ à SL2 (C) tel que trace(˜ ρ(cn )) = −2 cosh σn pour n = 1, 2, 3. Les σn déterminent la classe de SL2 (C)-conjugaison de ρ˜. Définition 2.3. — (1) Un futal dans M est la classe de conjugaison Π = [ρ] dans Γ d’un morphisme injectif ρ : π1 (Π0 ) → Γ ⊂ PSL2 (C) tel que ρ est l’holonomie d’une structure de PSL2 (C)-surface sur Π, les extrémités des axes de translation des ρ(cn ) pour n = 1, 2, 3 sont deux à deux distinctes et ρ vérifie (1)

σn (ρ) =

1 `n (ρ), 2

n = 1, 2, 3.

Dans la suite on choisira toujours des représentants `n ∈ R∗+ + iR tels que −π < Im(`n ) ≤ π. (2) Un futal marqué dans M est la donnée (Π, g ∗ ) d’un futal et d’une géodésique fermée orientée g ∗ dans M qui représente la classe de conjugaison de ρ(cn ) pour un certain n = 1, 2, 3. On note P l’ensemble des futals marqués dans M muni de la topologie discrète. Le groupe Γ opère, à gauche diagonalement et par conjugaison, sur Γ3 et un futal marqué (Π, g ∗ ) est uniquement déterminé par la classe de conjugaison du triplet ordonné (γ1 , γ2 , γ3 ) = (ρ(cn ), ρ(cn+1 ), ρ(cn+2 )) ∈ Γ3 , où l’entier n, considéré modulo 3, est tel que g ∗ représente la classe de conjugaison de ρ(cn ). Un tel triplet vérifie en outre la relation (2)

ASTÉRISQUE 352

γ1 γ2 γ3 = id

(1055)

CONJECTURE DES SOUS-GROUPES DE SURFACES

433

qui est préservée par l’action par conjugaison de Γ. Notons  “ P = Γ\ (γ1 , γ2 , γ3 ) ∈ Γ3 : γ1 γ2 γ3 = id . On identifiera dorénavant P à un sous-ensemble de “ P. “ L’ensemble P est naturellement muni d’une involution R définie par :

R(γ1 , γ2 , γ3 ) = (γ1−1 , γ3−1 , γ2−1 ) et d’un tricycle rot défini par rot(γ1 , γ2 , γ3 ) = (γ2 , γ3 , γ1 ). Remarque 2.4. — On peut penser à l’involution R comme à l’application qui envoie un futal marqué (Π, g ∗ ) ∈ P sur le futal Π muni de l’« orientation opposée » et marqué par la géodésique −g ∗ (c’est-à-dire g ∗ munie de l’orientation opposée). Le tricycle rot préserve également le sous-ensemble P ; il correspond à un changement cyclique du marquage.

Soit (Π, g ∗ ) = [γ1 , γ2 , γ3 ] ∈ P un futal marqué. On note σ = σ(Π, g ∗ ) ∈ (R∗+ +iR)/2iπZ la demi-longueur complexe de la composante de bord marquée : σ = 12 `(γ1 ). 2.2. Étiquetage des futals et construction d’une surface Soit E un ensemble fini. Définition 2.5. — Un étiquetage légal est un triplet (E, R E , rotE ), que par abus nous noterons juste E, constitué de trois applications E : E → P , R E : E → E et rotE : E → E telles que (1) l’application R E est involutive et vérifie

R ◦ E = E ◦ RE , (2) l’application rotE est d’ordre 3 et vérifie rot ◦ E = E ◦ rotE . Étant donnés un étiquetage légal E et un élément e ∈ E, on note (Πe , ge∗ ) le futal marqué E(e). Définition 2.6. — Une involution τ : E → E est dite admissible, relativement à un étiquetage légal E, si, pour tout e dans E, on a : gτ∗(e) = −ge∗ .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

434

N. BERGERON

On associe à un étiquetage légal E : E → P et à une involution admissible τ : E → E un graphe G trivalent : l’ensemble des sommets est E/hrotE i et deux sommets sont reliés par une arête si et seulement s’ils ont des représentants dans E échangés par τ . Quitte à ne considérer qu’une composante connexe choisie arbitrairement, nous supposerons dorénavant que G est connexe. Le bord d’un épaississement de G est alors une surface S qui fibre en cercles au-dessus de G et les cercles au-dessus des milieux des arêtes découpent S en pantalons orientés. On note Πe (e ∈ E) le pantalon correspondant au sommet [e] dans E/hrotE i dont on marque la composante de bord associée au milieu de l’arête joignant les sommets [e] et [τ (e)]. L’étiquetage légal E associe à chaque élément e ∈ E un futal Πe = [ρe ], où ρe est le morphisme d’holonomie d’une structure de PSL2 (C)-surface (Fe , ρe ) sur Πe , ainsi qu’une géodésique fermée orientée ge∗ ⊂ M correspondant à la composante de bord marquée de Πe . Soit σe = σ(Πe , ge∗ ) ∈ (R∗+ + iR)/2iπZ. Puisque τ est admissible, on a : (3)

στ (e) = σe .

La surface à bord obtenue en recollant Πe et Πτ (e) selon les composantes de bord marquées est donc naturellement munie d’une structure de PSL2 (C)-surface qui induit sur Πe et Πτ (e) des structures de PSL2 (C)-surfaces équivalentes à (Fe , ρe ) et (Fτ (e) , ρτ (e) ).(3) De cette manière on obtient la proposition suivante. Proposition 2.7. — Pour tout étiquetage légal E : E → P et toute involution admissible τ : E → E, il existe une surface S munie d’une structure de PSL2 (C)-surface de représentation d’holonomie ρE,τ : π1 (S) → Γ telle que S est découpée en pantalons orientés Πe avec une composante de bord marquée et la structure de PSL2 (C)-surface sur S induit sur chaque Πe une structure de PSL2 (C)-surface équivalente à (Fe , ρe ). 2.3. Coordonnées de Fenchel-Nielsen Soient γ un élément de Γ et g la géodésique fermée non orientée dans M associée à la classe de conjugaison de γ dans Γ. On note Zγ le centralisateur de γ dans PSL2 (C). La longueur complexe ` de γ, vue dans R∗+ + iR avec −π < ` ≤ π, ne dépend que de “γ = hγi\Zγ et Tg le tore euclidien C/ (σZ + 2iπZ) où σ = 1 `. On note g. On note T 2 enfin (TM , d) l’espace métrique obtenu en formant la réunion disjointe des Tg , où g parcourt l’ensemble des géodésiques fermées (non orientées) dans M . Si h est un élément de PSL2 (C) la conjugaison par h induit un difféomorphisme “γ vers T “hγh−1 . Mais si l’axe (orienté) de γ est iR∗ , alors le groupe Zγ est égal de T + (3)

Noter qu’il est nécessaire pour cela que στ (e) = σe plutôt que στ (e) = σe + iπ.

ASTÉRISQUE 352

(1055)

 à Aζ =

eζ/2

CONJECTURE DES SOUS-GROUPES DE SURFACES

435



: ζ ∈ C . L’isomorphisme Aζ 7→ ζ identifie canoniquement Zγ e “γ comme revêtement de degré 2 de Tg . au groupe C ; il permet de réaliser T −ζ/2

Considérons maintenant un futal marqué (Π, g ∗ ) = [γ1 , γ2 , γ3 ] ∈ P . Comme dans la remarque 2.2 (1), la perpendiculaire commune aux axes de γ1 et γ2 , resp. γ1 et γ3 , détermine un élément du fibré unitaire normal à l’axe de γ1 et donc, en prenant d’abord le vecteur tangent de l’axe de translation orienté de γ1 puis en complétant par leur produit vectoriel, un élément du fibré des repères de H3 . On note r− et r+ ces deux repères, ordonnés de sorte que l’on passe de r− à r+ en suivant l’axe de γ1 dans le sens positif. Le groupe Zγ1 opère simplement transitivement sur le sous-ensemble constitué des repères en un point de l’axe de γ1 . On écrit r− = A− ·(p0 , ~u0 , ~n0 , ~u0 ∧~n0 ) et r+ = A+ ·(p0 , ~u0 , ~n0 , ~u0 ∧~n0 ) avec A− et A+ dans Zγ1 . Il découle de la remarque 2.2 que A+ = Aσ1 A− ; dans la suite on identifie les tores euclidiens Tg et hAσ1 i\Zγ1 . On prendra cependant garde au fait que l’action (ζ, B) 7→ Aζ B de C sur hAσ1 i\Zγ1 dépend d’un choix d’orientation de g. Définition 2.8. — On appelle pied du futal marqué (Π, g ∗ ) l’image commune p(Π, g ∗ ) de A− et A+ dans le tore Tg . On note p : P → TM l’application qui à un futal marqué (Π, g ∗ ) associe son pied p(Π, g ∗ ) ∈ Tg ⊂ TM . Considérons maintenant un étiquetage légal E : E → P et une involution admissible τ : E → E. Soit e ∈ E. On a στ (e) = σe mais en général p(Πe , ge∗ ) 6= p(Πτ (e) , gτ∗(e) ). Définition 2.9. — On appelle paramètre de décalage associé à la géodésique marquée ge∗ l’élément te ∈ C/ (σe Z + 2iπZ) tel que Ate +iπ p(Πe , ge∗ ) = p(Πτ (e) , gτ∗(e) ). Remarque 2.10. — L’action (ζ, B) 7→ Aζ B de C sur Tge dépend du choix d’orientation ge∗ , le changer revient à changer l’action en (ζ, B) 7→ A−1 ζ B. On en déduit que te = tτ (e) et donc que, comme la demi-longueur σe , le paramètre de décalage te ne dépend que de la composante de bord marquée et pas du futal. Les demi-longueurs complexes (σe )e∈ E déterminent une structure de PSL2 (C)-surface sur chaque pantalon Πe . Si tous les paramètres (σe , te )e∈ E sont réels la représentation ρE,τ est injective et conjuguée à une représentation dans PSL2 (R). Elle est déterminée, à conjugaison près, par les paramètres (de Fenchel-Nielsen) E E (σe , te /σe )e∈ E ∈ (R× + ) × (R/Z) . Cette dernière assertion reste vraie lorsque les paramètres sont complexes : la représentation ρE,τ : π1 (S) → PSL2 (C) est encore déterminée, à conjugaison près, par les paramètres (σe , te )e∈ E qui sont les paramètres de Fenchel-Nielsen complexes introduits par Kourouniotis [26] et Tan [36].

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

436

N. BERGERON

2.4. Surfaces presque plates Définition 2.11. — Soient R et ε deux réels strictement positifs. Un futal Π = [ρ] dans M est (R, ε)-plat si, pour n = 1, 2, 3, on a : R σn (ρ) − ≤ ε. 2 Dans la partie suivante, nous déduirons le théorème 1.1 des deux théorèmes qui suivent. Le premier — qui découlera du fait que le flot des repères sur M est exponentiellement mélangeant — affirme que si l’on fixe ε et laisse tendre R vers l’infini, il existe « beaucoup » de futals (R, ε)-plats dans M et que les pieds de ces futals sont « bien distribués ». On dispose donc d’une grande flexibilité pour construire des surfaces à partir de ces futals presque plats. Le second théorème fournit une recette d’assemblage de futals presque plats de sorte que la représentation de monodromie de la structure de PSL2 (C)-surface obtenue à l’issue de l’assemblage soit injective. Étant donné un espace métrique (X, d), on note M (X) l’ensemble des mesures boréliennes finies positives à support compact dans X. Par analogie avec la métrique de Levy-Prokhorov, voir [7], on pose : Définition 2.12. — Deux mesures µ, ν ∈ M (X) sont dites δ-proches, pour un certain réel strictement positif δ, si (1) µ(X) = ν(X), et (2) pour tout borélien A de X, on a µ(A) ≤ ν(Vδ (A)), où Vδ (A) désigne le δ-voisinage de A dans X. Noter qu’être δ-proche est une relation symétrique.(4) Par abus de notation, on note M ( P ) l’espace des mesures boréliennes positives µ à support fini sur P qui sont préservées à la fois par l’involution R et le tricycle rot. L’application p qui à un futal marqué (Π, g ∗ ) associe son pied dans Tg permet de pousser une mesure µ ∈ M ( P ) sur une mesure p∗ µ ∈ M (TM ). Définition 2.13. — Soient δ un réel strictement positif et ν une mesure dans M (TM ). On note Λν la moyenne de ν sous l’action de C, de sorte que : ï ò ν(Tg ) Λν |Tg = Λ, Λ(Tg ) où Λ est une mesure de Lebesgue sur Tg . On dit que ν est δ-équidistribuée si ν est δ-proche de Λν . On écrira alors ν ∈ M δ (TM ). (4)

En effet : ν(A) ≤ ν(X) − ν(Vδ (X \ Vδ (A))) ≤ µ(X) − µ(X \ Vδ (A)) = µ(Vδ (A)).

ASTÉRISQUE 352

(1055)

CONJECTURE DES SOUS-GROUPES DE SURFACES

437

Théorème 2.14. — Il existe des constantes strictement positives q et D telles que pour tout réel ε ∈ ]0, 1], il existe un réel Rε tel que pour tout R ≥ Rε , il existe une mesure non nulle µ = µε,R ∈ M ( P ) telle que (1) µ est supportée sur les futals (R, ε)-plats, et (2) p∗ µ est DRe−qR -équidistribuée. Définition 2.15. — Soient E : E → P un étiquetage légal, τ : E → E une involution admissible et ε et R deux réels strictement positifs. On dit que la représentation ρE,τ est (R, ε)-plate si pour tout e ∈ E, (1) le futal Πe est (R, ε)-plat, ou encore |σe − R/2| ≤ ε, et (2) le paramètre de décalage te est

ε R -proche

de 1 : |te − 1| ≤ ε/R.

Si R est fixé alors, pour ε suffisamment petit, une représentation (R, ε)-plate est la monodromie d’une structure de PSL2 (C)-surface qui est arbitrairement proche d’être fuchsienne ; en particulier elle est injective. L’intérêt du résultat qui suit est de montrer que puisque l’on a imposé aux paramètres de décalage d’être proches de 1, on peut en fait choisir ε uniforme par rapport à R. Théorème 2.16. — Il existe des réels strictement positifs ε0 et R0 tels que pour tout étiquetage légal E : E → P et toute involution admissible τ : E → E et quel que soit R ≥ R0 , ε ∈ ]0, ε0 ], si la représentation ρE,τ est (R, ε)-plate alors ρE,τ est injective.

3. DÉMONSTRATION DU THÉORÈME 1.1 Dans cette partie, on admet les théorèmes 2.14 et 2.16 et on en déduit le théorème 1.1. Soient q, D et ε0 les constantes fournies par les théorèmes 2.14 et 2.16. On fixe ε ∈ ]0, min(ε0 , 1)]. Soit Rε le nombre réel strictement positif qui lui est associé par le théorème 2.14. La proposition qui suit garantit l’existence d’une représentation (R, ε)-plate avec R ≥ R0 et ε ≤ ε0 . Le théorème 2.16 implique alors que cette représentation est injective, ce qui démontre le théorème 1.1. Proposition 3.1. — Soit R > Rε . Il existe un étiquetage légal E : E → P et une involution admissible τ : E → E tels que pour tout e ∈ E, on a : (1) |σe − R/2| ≤ ε, et (2) |te − 1| ≤ 2DRe−qR . On explique maintenant comment déduire la proposition 3.1 du théorème 2.14. Il s’agit de passer des mesures aux étiquetages. On fixe R > Rε .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

438

N. BERGERON

3.1. Une conséquence métrique du théorème des mariages de Hall Une mesure µ ∈ M ( P ) est presque un étiquetage, la difficulté est de construire l’involution admissible τ . L’outil technique est la proposition générale suivante. Proposition 3.2. — Soient (X, d) un espace métrique, A et B deux ensembles finis de même cardinal, f : A → X et g : B → X deux applications et δ un réel strictement positif. On note #A , resp. #B , la mesure de comptage sur A, resp. B. Et on suppose que les mesures f∗ #A et g∗ #B sont δ-proches. Alors, il existe une bijection h : A → B telle que pour tout a ∈ A, on ait d(g(h(a)), f (a)) ≤ δ. Démonstration. — On définit : M = {(a, b) ∈ A × B : d(f (a), g(b)) ≤ δ} comme ensemble des mariages possibles. Il s’agit de construire une bijection h : A → B telle que pour tout a ∈ A, on ait (a, h(a)) ∈ M . Le théorème des mariages de Philip Hall [19] fournit un critère pour l’existence d’une telle application de mariage : Lemme 3.3. — Pour qu’il existe une application de mariage, il suffit que pour tout sous-ensemble C de A il y ait au moins |C| éléments de B qui puissent être mariés à un élément de C. Il s’agit donc de montrer que si C est un sous-ensemble de A, le sous-ensemble MC = {b ∈ B : ∃ a ∈ C, (a, b) ∈ M } de B contient au moins |C| éléments. Cela résulte du calcul suivant, reposant sur l’hypothèse que les mesures f∗ #A et g∗ #B sont δ-proches : |MC | = (g∗ #B )(Vδ (f (C))) ≥ (f∗ #A )(f (C)) ≥ |C|. 3.2. Démonstration de la proposition 3.1 Le théorème 2.14 fournit une mesure µ ∈ M ( P ) telle que p∗ µ soit DRe−qR -proche de sa moyenne sous l’action de C. En particulier, on a : (4)

p∗ µ et (A1+iπ ◦ p)∗ µ sont 2DRe−qR -proches.

On commence par montrer qu’il existe une mesure rationnelle vérifiant (4). Lemme 3.4. — Il existe une mesure non nulle µrat ∈ M ( P ) supportée par des futals (R, ε)-plats, vérifiant (4) et telle que pour tout (Π, g ∗ ) ∈ P , on ait µrat (Π, g ∗ ) ∈ Q. Démonstration. — Les mesures p∗ µ et (A1+iπ ◦ p)∗ µ sont atomiques à support fini. Notons ai et bj leurs atomes respectifs. La relation (4) est alors équivalente à un système linéaire fini S d’inégalités entre les valeurs xi = p∗ µ(ai ) et yj = (A1+iπ ◦ p)∗ µ(bj ) dont les coefficients sont entiers (et même dans {0, 1}). Puisque le système S a une rat solution réelle, on peut trouver des solutions rationnelles xrat arbitrairement i , yj

ASTÉRISQUE 352

(1055)

CONJECTURE DES SOUS-GROUPES DE SURFACES

439

proches. On peut alors remplacer µ par une mesure µrat avec les mêmes atomes mais rationnelle et telle que xrat = p∗ µrat (ai ) et yjrat = (A1+iπ ◦ p)∗ µrat (bj ). La mesure µrat i vérifie les conclusions du lemme. Nous supposons dorénavant que µ = µrat . Quitte à multiplier µ par un entier suffisamment grand, on peut même supposer que chaque µ(Π, g ∗ ) est entier. On peut alors écrire µ comme une somme formelle R -symétrique de futals (non marqués)(5) : µ = n1 (Π1 + R (Π1 )) + n2 (Π2 + R (Π2 )) + . . . + nm (Πm + R (Πm )),

(ni ∈ N∗ ).

Pour chaque s = 1, . . . , m, on fixe un marquage (Πs , gs∗ ). Considérons maintenant l’ensemble E = {(j, k) : j = 1, 2, . . . , 2(n1 + n2 + . . . + nm ), k ∈ Z/3Z}. On associe à µ l’étiquetage E : E → P défini par ( rotk (Πs , gs∗ ) si j est impair et 2(n1 + . . . + ns−1 ) < j ≤ 2(n1 + . . . + ns ) E(j, k) = R ◦ rotk (Πs , gs∗ ) si j est pair et 2(n1 + . . . + ns−1 ) < j ≤ 2(n1 + . . . + ns ). L’ensemble E est naturellement muni d’une involution R E : (j, k) 7→ (j + (−1)j+1 , k) et d’un tricycle rotE : (j, k) 7→ (j, k + 1) qui font de l’application E un étiquetage légal. Noter que, puisque µ est supportée par des futals (R, ε)-plats, pour tout e ∈ E, on a |σe − R/2| ≤ ε. Il nous reste à construire une involution admissible τ : E → E telle que, pour tout e ∈ E, on ait d(A1+iπ p(Πe , ge∗ ), p(Πτ (e) , gτ∗(e) )) ≤ 2DRe−qR . Pour cela, on décompose E en la réunion disjointe des sous-ensembles

E(g∗ )± = {(j, k) : E(j, k) = (·, g∗ ), ± = (−1)j+1 }, où g ∗ parcourt l’ensemble des géodésiques fermées orientées de M . Lemme 3.5. — Soit g ∗ une géodésique fermée orientée de M . Il existe une bijection h = hg∗ : E(g ∗ )+ → E(−g ∗ )− telle que pour tout e ∈ E(g ∗ )+ , d ((A1+iπ ◦ p ◦ E)(h(e)), (p ◦ E)(e)) ≤ 2DRe−qR . Démonstration. — Posons α+ = (p◦E)∗ # E(g∗ )+ et α− = (p◦E)∗ # E(−g∗ )− . Il découle de la R -symétrie de µ (ou de l’étiquetage E) que les mesures α+ et α− coïncident. On a alors p∗ µ|Tg = 4α− = 4α+ et l’équation (4) implique que les mesures α+ et (A1+iπ )∗ α− sont 2DRe−qR -proches. Le lemme découle donc de la proposition 3.2. On définit alors l’involution τ : E → E par ( hg∗ (e) si e ∈ E(g ∗ )+ τ (e) = h−1 si e ∈ E(g ∗ )− . −g ∗ (e) (5) La mesure µ, étant rot-invariante, attribue le même poids à deux futals marqués qui ne diffèrent que par le marquage.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

440

N. BERGERON

La proposition 3.1 est démontrée et donc aussi le théorème 1.1.

4. DÉMONSTRATION DU THÉORÈME 2.14 On note K le stabilisateur de p0 dans PSL2 (C) et at la matrice t ∈ R.

et/2 0 0 e−t/2



, où

4.1. Le flot des repères La courbe t 7→ pt = (0, et ) = at · p0 est la géodésique dans H3 de conditions initiales (p0 , ~u0 ). Le repère (pt , ~ut , ~nt , ~ut ∧ ~nt ) associé à la matrice at est obtenu par transport parallèle de (p0 , ~u0 , ~n0 , ~u0 ∧ ~n0 ) pendant un temps t le long de la géodésique (pt )t∈R . Et pour tout g ∈ PSL2 (C), la géodésique (g · pt )t∈R a pour condition initiale g · (p0 , ~u0 ). L’action du flot géodésique sur le fibré des repères par transport parallèle pendant un temps t correspond donc — dans PSL2 (C) — à la multiplication à droite par la matrice at . Cette action induit une action — appelée flot des repères — sur Γ\PSL2 (C). La mesure de Haar sur PSL2 (C) induit une mesure finie — invariante sous l’action du flot des repères — sur Γ\PSL2 (C) ; on note ν la mesure de probabilité correspondante. Le théorème suivant — dû à Calvin Moore [31] — affirme que le flot des repères est exponentiellement mélangeant relativement à la mesure de Haar ; on donne les grandes idées de sa démonstration en appendice. Théorème 4.1. — Il existe une constante q = q(M ) > 0 telle que si f et g sont deux fonctions de classe C ∞ de Γ\PSL2 (C) dans R, alors il existe une constante C, fonction continue des normes de Sobolev de f et de g, telle que pour tout t ∈ R, Z Z  Z  g(xa )f (x)dν(x) − f dν gdν ≤ Ce−q|t| . t Γ\PSL2 (C)

Γ\PSL2 (C)

Γ\PSL2 (C)

4.2. Une application du mélange On munit le groupe PSL2 (C) d’une métrique riemannienne d invariante à gauche sous l’action de PSL2 (C), invariante à droite sous l’action de K et qui relève la métrique hyperbolique sur H3 . Soit ε un réel strictement positif. On fixe une fonction χε positive, de classe C ∞ sur PSL2 (C), supportée dans la boule de rayon ε/2 centrée en l’identité et vérifiant : (1) χε (Id) > 0, et R (2) PSL2 (C) χε (x)dν(x) = 1. On associe à la fonction χε le noyau kε (x, y) = χε (x−1 y) sur PSL2 (C).

ASTÉRISQUE 352

(1055)

CONJECTURE DES SOUS-GROUPES DE SURFACES

441

Définition 4.2. — Soit r un réel strictement positif. On pose : Z ∀ x, y ∈ PSL2 (C), aε,r (x, y) = kε (x, gar )kε (y, g)dν(g) PSL2 (C)

et ∀ x, y ∈ PSL2 (C),

Aε,r (x, y) =

X

aε,r (x, γy).

γ∈Γ

Le noyau aε,r est un noyau invariant sur PSL2 (C) : aε,r (gx, gy) = aε,r (x, y), pour tous x, y, g ∈ PSL2 (C). Le noyau Aε,r définit lui un noyau C ∞ sur Γ\PSL2 (C) ; il mesure si deux repères dans M sont proches d’être envoyés l’un sur l’autre par l’action du flot des repères pendant un temps r. Proposition 4.3. — Il existe une constante C = C(ε, M ) telle que pour tous x, y ∈ PSL2 (C), on a : |Aε,r (x, y) − 1| ≤ Ce−qr . Démonstration. — Soient x, y ∈ PSL2 (C) et D ⊂ PSL2 (C) un domaine fondamental pour l’action de Γ. On a : XZ Aε,r (x, y) = kε (x, gar )kε (y, γ −1 g)dν(g) γ∈Γ

=

PSL2 (C)

X Z γ,γ 0 ∈Γ

kε (x, γ 0 gar )kε (y, γ −1 γ 0 g)dν(g)

D

Z Kε (x, gar )Kε (y, g)dν(g),

= Γ\PSL2 (C)

P où Kε (x, y) = γ∈Γ kε (x, γy) définit une fonction de classe C ∞ sur Γ\PSL2 (C) × Γ\PSL2 (C). Le théorème 4.1(6) appliqué aux fonctions f = Kε (y, ·) et g = Kε (x, ·), fournit alors une constante c(x, y) telle que |Aε,r (x, y) − 1| ≤ c(x, y)e−qr . Enfin, par compacité de M , on peut choisir C majorant uniformément c(x, y). Remarque 4.4. — Il découle de la proposition 4.3 que pour r suffisamment grand, il existe γ ∈ Γ tel que aε,r (x, γx) soit strictement positif. Il existe alors g ∈ PSL2 (C) tel que d(gγ −1 g, ar ) ≤ ε. Et la géodésique fermée orientée dans M associée à γ a donc pour longueur (complexe) un nombre ` tel que |` − r| < ε. Ce résultat – ainsi que le principe de sa démonstration – est dû à Gregori Margulis [29].

(6)

Noter que l’on a :

R Γ\PSL2 (C)

Kε (x, g)dν(g) =

R PSL2 (C)

kε (x, g)dν(g) = 1.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

442

N. BERGERON

4.3. Des repères aux futals Soit x ∈ PSL2 (C) ; on note (p, ~u, ~n, ~u ∧ ~n) = x · (p0 , ~u0 , ~n0 , ~u0 ∧ ~n0 ). Étant donné un réel r, on associe à x les éléments x(k,r) = xR 2ikπ ar/4 ∈ PSL2 (C) pour k = 0, 1, 2, 3 cos(θ/2) −i sin(θ/2)  où Rθ = −i sin(θ/2) cos(θ/2) est l’élément de PSL2 (C) d’extension de Poincaré la rotation d’angle θ dans le sens direct autour de la géodésique passant par p0 et dirigée par le vecteur ~n0 .(7) Soit ω k (~u) le vecteur obtenu par rotation directe d’angle 2kπ u autour du vecteur ~n. Le repère x(k,r) · (p0 , ~u0 , ~n0 , ~u0 ∧ ~n0 ) est l’image de 3 de ~ k (p, ω (~u), ~n, ω k (~u) ∧ ~n) par le flot des repères pendant un temps r/4.

r/2

x(0,−r)

y(0,r) m ~

γ1 ~ v

~ n

`(r)

ω 2 (~ v) ω(~ v)

`(r)

ω 2 (~ u) ω(~ u) ~ u

x(2,−r)

r/2

y(1,r)

γ2

x(1,−r)

y(2,r)

γ3

Figure 1. Des repères aux futals

ar/4 ; on a x(k+1,r) = x(k,r) gr pour k = 0, 1, 2. On écrit la Soit gr = a−r/4 R 2iπ 3 décomposition de Cartan gr = Rθ1 (r)+π a`(r) Rθ2 (r) avec r 7→ `(r) impaire. Un calcul simple montre alors qu’il existe une constante universelle C > 0 telle que pour tout r > 0, les trois nombres r r 4 (5) |`(r) − + log |, |θ1 (r)| et |θ2 (r)| sont inférieurs à Ce− 4 . 2 3 (7)

On prendra garde au fait que Rθ et at n’ont pas le même axe et ne commutent donc pas en général.

ASTÉRISQUE 352

(1055)

CONJECTURE DES SOUS-GROUPES DE SURFACES

443

Définition 4.5. — À tout triplet A = (Ak )k=0,1,2 ∈ Γ3 on associe la représentation ρA : π1 (Π) → Γ donnée par les formules : ρA (cn ) = An−1 A−1 n

pour n = 1, 2, 3.

L’image de (γ1 , γ2 , γ3 ) = (ρA (c1 ), ρA (c2 ), ρA (c3 )) dans “ P est uniquement détermi3 née par la classe de A dans le quotient Γ\Γ . Définition 4.6. — Soit dn la mesure de comptage sur Γ3 . On note βbε,r la mesure sur PSL2 (C) × PSL2 (C) × Γ3 définie par Y aε,r/2 (x(−k,−r) , Ak y(k,r) ) dν(x) ⊗ dν(y) ⊗ dn(A). k∈Z/3Z

La mesure βbε,r est Γ-invariante à gauche (pour l’action diagonale) et non triviale d’après la proposition 4.3. Elle induit donc une mesure non nulle βε,r sur le quotient Γ\(PSL2 (C) × PSL2 (C) × Γ3 ). On note Φ : Γ\(PSL2 (C) × PSL2 (C) × Γ3 ) → “ P l’application qui à la classe de (x, y, A) associe [ρA ]. Proposition 4.7. — Il existe une constante D > 0 telle que pour tout ε > 0, il existe un réel rε tel que pour tout r ≥ rε la mesure Φ∗ βε,r sur “ P est supportée dans 4 l’ensemble des futals (2r − 2 log 3 , Dε)-plats. Démonstration. — Soit (x, y, A) dans le support de βbε,r . Il s’agit de calculer les demilongueurs complexes des éléments γn = ρA (cn ) pour n = 1, 2, 3. Considérons le cas n = 1. Puisque aε,r/2 (x(0,−r) , A0 y(0,r) ) est non nul, il existe g0 ∈ PSL2 (C) tel que d(x(0,−r) , g0 ar/2 ) et d(A0 y(0,r) , g0 ) soient inférieurs à ε/2. Il existe donc des éléments (1)

(2)

gε et gε dans la boule de rayon ε/2 autour de l’identité dans PSL2 (C) tels que (1) (2) x(0,−r) gε = g0 ar/2 et g0 gε = A0 y(0,r) ; on a alors : x(0,−r) gε(1) a−r/2 gε(2) = A0 y(0,r) .

(6)

De la même manière, puisque aε,r/2 (x(2,−r) , A1 y(1,r) ) est non nul, il existe des éléments (3)



(7)

(4)

et gε

dans la boule de rayon ε/2 autour de l’identité dans PSL2 (C) tels que A1 y(1,r) gε(3) ar/2 gε(4) = x(2,−r) .

En utilisant tour à tour que x(0,−r) = x(2,−r) Rθ1 (−r) Rπ a−`(r) Rθ2 (−r) et que y(1,r) = y(0,r) Rθ1 (r) Rπ a`(r) Rθ2 (r) , on déduit de (6) et (7) que (2) (3) (4) (1) A0 A−1 1 g0 = g0 (gε Rθ1 (r) Rπ a`(r) Rθ2 (r) gε ar/2 gε Rθ1 (−r) Rπ a−`(r) Rθ2 (−r) gε a−r/2 ).

Puisque Rπ at = a−t Rπ , comme la distance d est K-invariante à gauche et à droite et puisque pour r grand les Rθi (r) sont proches de l’identité, on obtient qu’il existe

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

444

N. BERGERON

(i)

un réel strictement positif rε tel que pour tout r ≥ rε il existe des éléments hε pour i = 1, . . . , 4, dans la boule de rayon ε autour de l’identité dans PSL2 (C), tels que (2) (3) (4) γ1 g0 = g0 (h(1) ε a−`(r) hε a−r/2 hε a−`(r) hε a−r/2 ).

Mais un calcul élémentaire, utilisant (5), implique que, quitte à augmenter rε , on peut supposer que pour r ≥ rε , la matrice (2) (3) (4) h(1) ε a−`(r) hε a−r/2 hε a−`(r) hε a−r/2

est de la forme (8)

e−2r+2 log(4/3) + O(ε)

e2r−2 log(4/3) O(ε)

O(ε)

e2r−2 log(4/3) (1 + O(ε))

! .

La trace de γ1 est donc égale à e2r−2 log(4/3) (1 + O(ε)). En raisonnant de la même manière avec γ2 et γ3 (et en augmentant au besoin rε ), on conclut qu’il existe une constante universelle D telle que pour r ≥ rε les longueurs complexes de la représentation ρA vérifient, pour tout n = 1, 2, 3, `n (ρA ) − 2r + 2 log 4 ≤ Dε. 3 En particulier les éléments ρA (cn ) pour n = 1, 2, 3 sont loxodromiques. Enfin, puisque la matrice a−2r+2 log(4/3) est réelle, un argument de continuité en ε montre que σn (ρA ) = 21 `n (ρA ) pour n = 1, 2, 3. La classe de conjugaison de la représentation ρA représente donc un futal (2r − 2 log 43 , Dε)-plat. Remarque 4.8. — 1. Il découle des propositions 4.3 et 4.7 que pour R suffisamment grand il existe bien des futals (R, ε)-plats. Ce point crucial est dû à Lewis Bowen [8] qui était lui aussi motivé par la conjecture des sous-groupes de surfaces. 2. La démonstration montre plus(8) : un calcul simple implique en effet que, pour r suffisamment grand, les points fixes z± ∈ C ∪ {∞} de la matrice (8) vérifient 1 |z− | = O(ε) et |z+ | ≥ O(ε) . Cela montre que — quitte à augmenter les constantes D et rε — on peut supposer que pour tout r ≥ rε l’axe de la matrice (8) reste à distance au plus Dε du point base p0 et donc que l’axe de γ1 ∈ Γ est à distance ≤ Dε de g0 (p0 ). Par symétrie on en déduit que l’on peut supposer que l’axe de γ1 est à distance ≤ Dε des points x(0,−r) · p0 , A0 y(0,r) · p0 , x(2,−r) · p0 et A1 y(1,r) · p0 de H3 . Définition 4.9. — Étant donnés un réel ε > 0 et un réel R > 0, on pose µε,R = Φ∗ βD−1 ε, R/2+log 34 . Et on note Rε = 2rε − 2 log 43 . (8)

C’est d’ailleurs uniquement pour cette raison que l’on a commencé par transporter parallèlement les repères associés à x et y pendant un temps r/4, voir la proposition 4.13.

ASTÉRISQUE 352

(1055)

CONJECTURE DES SOUS-GROUPES DE SURFACES

445

Il découle de la proposition 4.7 que pour R ≥ Rε , la mesure µε,R ∈ M ( P ) — qui est non nulle d’après la proposition 4.3 — est supportée sur les futals (R, ε)-plats. Pour démontrer le théorème 2.14, il reste à démontrer la proposition suivante ; c’est l’objet des paragraphes qui suivent. Proposition 4.10. — Il existe une constante strictement positive D0 telle que pour tout ε ∈ ]0, 1], la mesure p∗ µε,R sur TM est D0 Re−qR -équidistribuée. 4.4. L’application $ Soient ε et r deux réels strictement positifs.

Soient γ ∈ Γ et Z = Zγ son centralisateur dans PSL2 (C). Un couple (x, y) ∈ PSL2 (C)2 détermine une géodésique orientée dans H3 allant de yR 4iπ (∞) ∈ P1 (C) à 3 (9) xR 2iπ (0) ∈ P1 (C). Si l’axe de translation de γ n’intersecte pas cette géodé3 sique la perpendiculaire commune détermine un élément du fibré unitaire normal à l’axe de γ et donc, comme au §2.3, un repère de H3 au-dessus de l’axe de γ. On écrit $γ (x, y) · (p0 , ~u0 , ~n0 , ~u0 ∧ ~n0 ), avec $γ (x, y) ∈ Z, ce repère. En tant que groupe, Z opère sur lui-même et diagonalement (à gauche) sur PSL2 (C)2 . Si z ∈ Z, on a $γ (zx, xy) = z$γ (x, y). L’application $γ passe donc au quotient par le groupe hγi (dont l’action commute à celle de Z) en une application Z-équivariante, définie presque partout, “γ = hγi\Z. $γ : hγi\(PSL2 (C) × PSL2 (C)) → T “γ et T “hγh−1 et on a : Noter que si h ∈ PSL2 (C), la conjugaison par h identifie T $hγh−1 (hx, hy) = h$γ (x, y)h−1 .

(9)

Définition 4.11. — On note αγ = αε,r,γ la mesure sur hγi\(PSL2 (C) × PSL2 (C)) induite par la mesure γ-invariante (à gauche) aε,r/2 (x(0,−r) , y(0,r) )aε,r/2 (γx(2,−r) , y(1,r) )dν(x) ⊗ dν(y). Noter que la mesure αγ est Z-invariante de sorte que ñ ô “γ ) ($γ )∗ αγ (T (10) ($γ )∗ αγ = Λ($γ )∗ αγ = Λ, “γ ) Λ(T “γ . où Λ est la mesure de Lebesgue sur le tore T (9)

Noter que yR 4iπ (∞) = limr→+∞ y(2,r) et xR 2iπ (0) = limr→+∞ x(1,−r) . 3

3

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

446

N. BERGERON

y(0,r) x(0,−r)

m ~

γ1 ~ v

~ n

x(1,−∞) ← x(1,−r)

ω 2 (~ v) ω(~ v)

→ y(2,∞) y(2,r)

ω 2 (~ u) ω(~ u) ~ u x(2,−r)

y(1,r)

Figure 2. Pied abstrait

Définition 4.12. — Soit $ : Γ\(PSL2 (C) × PSL2 (C) × Γ3 ) → TM l’application qui à la classe de (x, y, A) associe l’image de $γ1 (x, A0 y) dans le tore abstrait Tg où g est la géodésique fermée de M associée à γ1 = A0 A−1 1 ; voir figure 2. Noter que l’application $ est bien définie : changer (x, y, A) en γ · (x, y, A) revient à changer $γ1 (x, A0 y) en $γγ1 γ −1 (γx, γA0 y) qui — en vertu de (9) — a la même image dans le tore euclidien Tg . L’application qui à un futal marqué associe son pied induit également une application p ◦ Φ : Γ\(PSL2 (C) × PSL2 (C) × Γ3 ) → TM . Proposition 4.13. — Il existe des constantes c, K > 0 telles que pour tout ε ∈ ]0, 1], il existe un réel rε0 tel que pour tout r ≥ rε0 et pour tout élément [x, y, A] dans le support de βε,r , on a : d(p ◦ Φ(x, y, A), $(x, y, A)) ≤ Ke−cr . Démonstration. — La proposition résulte du fait général que dans un espace hyperbolique, pour tout M > 0, il existe des constantes c, K > 0 telles que deux géodésiques qui restent à distance ≤ M pendant un temps r sont Ke−cr -proches au temps r/2 ;

ASTÉRISQUE 352

(1055)

CONJECTURE DES SOUS-GROUPES DE SURFACES

447

voir figure 2. On renvoie à [22, Lem. 4.2] pour plus de détails et des constantes explicites. Corollaire 4.14. — Les mesures (p ◦ Φ)∗ βε,r et $∗ βε,r sont Ke−cr -proches. 4.5. Démonstration de la proposition 4.10 Soit γ ∈ Γ. On note Cγ le sous-ensemble de PSL2 (C) × PSL2 (C) × Γ3 constitué des triplets (x, y, A) tels que A0 A−1 1 = γ. Soit χ : Cγ → PSL2 (C) × PSL2 (C) l’application (x, y, A) 7→ (x, A−1 y). Le lemme suivant découle de la définition de Aε,r/2 . 0 Lemme 4.15. — On a : χ∗ (βbε,r |Cγ ) = Aε,r/2 (x(1,−r) , y(2,r) )aε,r/2 (x(0,−r) , y(0,r) )aε,r/2 (γx(2,−r) , y(1,r) )dν(x) ⊗ dν(y). La mesure χ∗ (βbε,r |Cγ ) sur PSL2 (C)2 est γ-invariante ; on note βγ la mesure induite sur le quotient hγi\PSL2 (C)2 . On peut maintenant pousser — à l’aide de l’application “γ . D’après la définition de αγ , $γ — les mesures αγ et βγ en des mesures sur le tore T le lemme 4.15 et la proposition 4.3, on a : (1 − Ce−qr )($γ )∗ αγ ≤ ($γ )∗ βγ ≤ (1 + Ce−qr )($γ )∗ αγ . Mais, poussée sur le tore abstrait Tg , où g est la géodésique fermée de M associée à γ, les mesures ($γ )∗ βγ et [$∗ βε,r ] |Tg coïncident. Il découle alors de (10) que l’on a : (11)

(1 − Ce−qr )Λ($γ )∗ αγ ≤ [$∗ βε,r ] |Tg ≤ (1 + Ce−qr )Λ($γ )∗ αγ .

Le lemme suivant est élémentaire ; voir [22, Lem. 3.1]. Lemme 4.16. — Soient a, b ∈ C tels que T = C/(aZ + ibZ) soit un tore. Soient f une fonction continue et positive sur T et δ ∈ ]0, 13 [ tels que (1 − δ)Λf Λ ≤ f Λ ≤ (1 + δ)Λf Λ . Alors, la mesure f Λ est 4δ(|a| + |b|)-équidistribuée. D’après la proposition 4.7, un tore Tg = (R∗+ +iR)/(σZ+ 2iπZ) qui intersecte non trivialement le support de $∗ βε,r vérifie |σ| ≤ 2r. Il découle donc du lemme 4.16 et de l’équation (11) que la mesure $∗ βε,r est 8rCe−qr -équidistribuée. Le corollaire 4.14 implique alors que pour r sufisamment grand (et en supposant q ≤ c) les mesures (p ◦ Φ)∗ βε,r et Λ(p◦Φ)∗ βε,r sont 9rCe−qr -proches. Puisque — compte tenu de la définition 4.9 — on a p∗ µε,R = (p ◦ Φ)∗ βD−1 ε,R/2+log 43 , cela suffit à démontrer la proposition 4.10.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

448

N. BERGERON

5. DÉMONSTRATION DU THÉORÈME 2.16 Si ε est suffisamment petit, une représentation (R, ε)-plate est la monodromie d’une structure de PSL2 (C)-surface. Si ε = 0 cette structure est en fait une structure hyperbolique réelle ; nous dirons alors que c’est une surface de type R. 5.1. Géométrie des surfaces de type R Une surface S de type R est munie d’une décomposition en pantalons. On appelle revers de cette décomposition les courbes simples fermées géodésiques qui découpent S en pantalons. Chaque revers est de longueur R et chaque paramètre de décalage est égal à 1. Dans un pantalon hyperbolique dont toutes les composantes de bord sont de longueur R, la distance entre deux composantes de bord est égale à 2e−R/4 + O(e−3R/4 ), lorsque R tend vers l’infini. Il découle donc de la formule du pentagone [10, Thm. 2.3.4] que, pour R suffisamment grand, une courbe de longueur ≤ R/5 joignant deux composantes de bord est homotope, relativement au bord, à une géodésique minimisante entre ces deux composantes de bord.

w1−

w0−

w1+

w0+ g

w2+ C1

w2−

C3 C2

C0

Figure 3. Le segment g et les Ci

Soient g un segment géodésique de H2 et C0 , . . . , Ck l’ensemble ordonné des géodésiques (bi-infinies) de H2 qui se projettent sur les revers de S et qui intersectent g, voir la figure 3. Alors deux géodésiques adjacentes Ci et Ci+1 sont soit proches, à distance ≈ 2e−R/4 , soit éloignées, à distance > R/5. Pour i = 0, . . . , k on note zi le point d’intersection de g et Ci et wi+ le pied dans Ci+1 de la perpendiculaire commune à Ci et Ci+1 .

ASTÉRISQUE 352

(1055)

CONJECTURE DES SOUS-GROUPES DE SURFACES

449

Dans le plan hyperbolique, les géodésiques s’éloignent à vitesse linéaire (voir [10, Thm. 2.3.1]) : pour i = 0, . . . , k − 1, on a +

d(Ci , Ci+1 )ed(wi

,zi+1 )

≤ ed(zi+1 ,Ci ) .

Le fait que le paramètre de décalage le long de chaque revers soit égal à 1 implique donc que pour R suffisamment grand si, pour i = 1, . . . , k, les géodésiques Ci−1 et Ci sont proches et d(zi−1 , zi ) ≤ 1 alors k ≤ R. En distinguant les sous-segments de g qui correspondent à une suite (zi )i=0,...k telle que d(zi−1 , zi ) ≤ 1 et les « sauts » correspondants aux sous-segments complémentaires, on obtient la proposition suivante, voir [22, Lem. 2.3]. Proposition 5.1. — Il existe un réel R0 et une constante C tels que pour tout R ≥ R0 , tout segment géodésique de longueur ` sur une surface S de type R coupe au plus CR` fois les revers. 5.2. Démonstration du théorème 2.16 Une représentation (R, ε)-plate ρ est la monodromie d’une structure de PSL2 (C)-surface sur une surface S munie d’une décomposition en pantalons. On munit S de la structure hyperbolique de type R associée à cette décomposition. La surface S est alors uniformisée par le plan hyperbolique H2 et on note F : H2 → H3 l’application développante de la structure de PSL2 (C)-surface sur S associée à ρ. Puisque F est ρ-équivariante, pour démontrer le théorème 2.16, il suffit de montrer qu’il existe des réels strictement positifs ε0 et R0 tels que si R ≥ R0 et ε ∈]0, ε0 ] alors F envoie toute géodésique de H2 sur une courbe bi-infinie dans H3 . Mais l’application F envoie les géodésiques Ci de H2 au-dessus des revers de la surface S (de type R) sur des géodésiques de H3 . Il suffit donc de montrer que si g est une géodésique de H2 transversale aux Ci alors F (g) est une courbe bi-infinie de H3 . Comme dans la démonstration de la proposition 5.1, on découpe g en deux types de sous-segments : ceux qui rencontrent une suite de Ci proches et les « sauts ». L’image d’un saut est un long segment quasi-géodésique, dont la constante de quasigéodésie ne dépend que de ε et pas de R. La difficulté consiste donc à contrôler les segments géodésiques de C qui correspondent à une suite de Ci proches. Mais d’après la proposition 5.1, une telle suite contient au plus R éléments alors que le long des revers l’angle de décalage est ≤ ε/R. L’image d’un tel segment est donc là encore un segment quasi-géodésique, dont la constante de quasi-géodésie ne dépend que de ε et pas de R. Grâce à l’hyperbolicité de H3 , on conclut que la courbe F (g) est quasi-géodésique ; elle est en particulier bi-infinie. Remarque 5.2. — Les détails de cette « démonstration » sont un peu laborieux à écrire. Noter néanmoins que le mélange exponentiel permet en fait de construire des

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

450

N. BERGERON

surfaces (R, e−dR )-plates pour une constante d = d(M ) > 0. Il est alors plus facile de faire fonctionner l’approche décrite ci-dessus ; Dragomir Sarik [38] réalise d’ailleurs toute surface (R, ε/R)-plate comme surface plissée. Dans [22], Kahn et Markovic démontrent le théorème 2.16 à l’aide d’une formule, due à Caroline Series [35], de variation de la distance d(C0 , Ck ) le long d’une déformation quasi-fuchsienne t 7→ ρt . Ils montrent que le long d’une déformation (R, ε)-plate la dérivée d(C0 , Ck )0 est un O(ε). Cela leur permet de montrer que, quitte à diminuer ε0 , on peut supposer que l’image du bord ∂H2 , par l’application induite ∂F : ∂H2 → ∂H3 , est arbitrairement proche d’un vrai cercle dans ∂H3 . Enfin puisque l’on peut démarrer la construction à partir de deux repères appartenant à un plan arbitraire de H3 , la démonstration du théorème 2.14 implique en fait le théorème suivant. Théorème 5.3. — Soit M = Γ\H3 une variété hyperbolique uniformisée de dimension 3. Pour tout cercle C dans ∂H3 , il existe une suite de PSL2 (C)-surfaces (Fn : Sen → H3 )n≥0 dans M telle que (∂Fn (Sen ))n∈N converge vers C, pour la distance de Hausdorff dans ∂H3 .

6. APPLICATIONS ET GÉNÉRALISATIONS 6.1. Du théorème 1.1 à la conjecture VH Soit M une variété hyperbolique de dimension 3. D’après le théorème 1.1, il existe une surface S de genre g ≥ 2 et une immersion π1 -injective f : S → M . Peter Scott [34] donne un critère algébrique d’existence d’un revêtement fini de M auquel f se relève en un plongement. Définition 6.1. — Soit G un groupe de type fini. Un sous-ensemble S de G est séparable si S est fermé dans la topologie profinie de G, c’est-à-dire si S est une intersection de classes à gauche de sous-groupes d’indice fini de G. Proposition 6.2. — Supposons f∗ (π1 S) séparable dans π1 M . Alors f se relève à un revêtement fini de M en un plongement, ou en une application isotope à un plongement. Si de plus f∗ (π1 S) est quasi-convexe dans π1 M , alors il existe un revêtement fini c de M qui contient deux élévations plongées et disjointes de f (S) dont la réunion M c) est non séparante, voir par exemple [5, Théorème 2]. En particulier le groupe π1 (M se surjecte sur un groupe libre de rang 2. En plus des conjectures mentionnées en

ASTÉRISQUE 352

(1055)

CONJECTURE DES SOUS-GROUPES DE SURFACES

451

introduction, il convient donc d’ajouter l’énoncé suivant(10) qui fait le lien entre la conjecture des sous-groupes de surfaces et la conjecture VH. (7) Tout sous-groupe de type fini dans π1 M est séparable. Scott [34] puis Ian Agol, Darren Long et Alan Reid [3] montrent qu’un sous-groupe quasi-convexe d’un groupe de réflexions dans un polyèdre hyperbolique à angles droits est séparable. Ce résultat est étendu au cas des sous-groupes quasi-convexes d’un groupe de Coxeter — ou d’un groupe d’Artin — à angles droits abstrait par Haglund [17]. Depuis une quinzaine d’années, Dani Wise met en œuvre un vaste programme visant à démontrer la conjecture (7) et plus généralement à démontrer la séparabilité des sous-groupes quasi-convexes dans certains groupes G hyperboliques (au sens de Gromov), à l’aide de la méthode de Scott. Un groupe de Coxeter — ou d’Artin — à angles droits abstrait possède une réalisation géométrique qui est un complexe cubique à courbure négative. La première étape du programme de Wise passe alors par la « cubulation » du groupe G. On renvoie à [9] pour une introduction aux complexes cubiques et à la notion de courbure négative dans ce contexte. 6.2. Cubulation des variétés hyperboliques ; groupes spéciaux Dans [6] avec Wise, et indépendamment Guillaume Dufour dans sa thèse [15], on déduit du théorème 5.3 et des travaux de Michah Sageev [33] le résultat suivant. Théorème 6.3. — Soit M une variété hyperbolique de dimension 3. Alors π1 M opère librement, proprement avec quotient compact sur un complexe cubique CAT(0) localement fini. Définition 6.4. — Un complexe cubique C connexe de courbure négative est spécial s’il existe une isométrie locale de C dans le complexe cubique associé à un groupe d’Artin à angles droits. On dit alors que π1 C opère spécialement sur tout revêtement universel de C. La notion de complexe cubique spécial est due à Frédéric Haglund et Dani Wise, voir [18] où elle est définie en termes de configurations interdites pour les hyperplans immergés. Haglund et Wise démontrent notamment que si C est un complexe cubique spécial compact et si π1 C est un groupe hyperbolique au sens de Gromov, alors tout sous-groupe quasi-convexe de π1 C est séparable. Ian Agol [1] montre par ailleurs que si M est une variété de dimension 3 dont le groupe fondamental est isomorphe au groupe fondamental d’un complexe cubique spécial alors M possède un revêtement fini qui fibre sur le cercle. (10)

Énoncé également conjecturé dans [37].

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

452

N. BERGERON

Dans [18] puis [39] Haglund et Wise démontrent des critères puissants pour qu’un complexe cubique CAT(0) possède un revêtement fini spécial. Tout récemment, en se reposant sur ces travaux, Agol [2] a annoncé la démonstration du théorème suivant. Théorème 6.5. — Soit G un groupe hyperbolique au sens de Gromov qui opère librement, proprement avec quotient compact sur un complexe cubique CAT(0) localement fini C. Alors G contient un sous-groupe d’indice fini qui opère spécialement sur C. Corollaire 6.6. — Soit M une variété hyperbolique de dimension 3. Alors M vérifie les conjectures (2)–(7). 6.3. Dénombrement des surfaces incompressibles Soit M une variété hyperbolique de dimension 3. De même que l’argument ergodique de Margulis lui a permis de retrouver (et d’étendre en courbure variable) le « théorème des géodésiques premières » sur le comptage des géodésiques dans une surface hyperbolique, Kahn et Markovic [23] développent leurs méthodes ainsi que des résultats antérieurs de Joseph Masters [30] pour compter le nombre c(M, g) de classes de conjugaison de sous-groupes de π1 M isomorphes au groupe fondamental d’une surface de genre g. Théorème 6.7. — On a : lim

g→+∞

log c(M, g) = 1. 2g log g

6.4. Généralisation à tous les espaces symétriques et conjecture d’Ehrenpreis Soient G un groupe de Lie réel semi-simple connexe de centre trivial et sans facteur compact, K un sous-groupe compact maximal de G et X = G/K l’espace symétrique associé. Conjecture 6.8. — Soit Γ un réseau uniforme dans G. Alors Γ contient un sousgroupe isomorphe au groupe fondamental d’une surface de genre au moins 2. Il est tentant de chercher à étendre la méthode de Kahn et Markovic à ce cadre et plus généralement, partant d’un plongement PSL2 (R) ⊂ G correspondant à un plongement totalement géodésique de H2 dans X, de chercher à construire des surfaces immergées S → Γ\X dont un relevé Se → X soit arbitrairement proche de l’image de H2 . Si X est de rang réel égal à 1, la démonstration du théorème 2.16 s’étend naturellement. Le rang supérieur semble plus difficile. En ce qui concerne le théorème 2.14, notons qu’un aspect crucial de sa démonstration est le fait que le centralisateur d’une isométrie hyperbolique possède un sous-groupe compact connexe qui contient

ASTÉRISQUE 352

(1055)

CONJECTURE DES SOUS-GROUPES DE SURFACES

453

la rotation d’angle π autour de l’axe de translation ; cela permet en effet de s’assurer que les futals (R, ε)-plats sont équidistribués autour d’une géodésique donnée. Dans [24], Kahn et Markovic considèrent cependant le cas où PSL2 (R) est plongé diagonalement dans G = PSL2 (R) × PSL2 (R) et Γ est un produit de deux groupes fuchsiens. Ils démontrent le théorème suivant initialement conjecturé par Leon Ehrenpreis [16]. Théorème 6.9. — Soient S et T deux surfaces de Riemann compactes connexes de genre au moins 2. Pour tout K > 1, il existe des revêtements finis Sb de S et Tb de T , et un homéomorphisme f : Sb → Tb tel que f soit K-quasi-conforme, c’est-à-dire que b on a : pour tout x ∈ S, Hf (x) = lim sup r→0

sup{d(f (z), f (x)) : d(x, z) = r} ≤ K. inf{d(f (z), f (x)) : d(x, z) = r}

Ils montrent plus précisément qu’étant donnés une surface hyperbolique S et un réel strictement positif ε, pour tout réel R suffisamment grand, il existe une surface hyperbolique (réelle) (R, ε)-plate immergée dans S. La démonstration est dans un premier temps identique à celle du théorème 2.14 mais cette fois le fibré normal à une géodésique fermée dans S n’est pas connexe. Il se peut donc qu’il y ait plus de futals immergés d’un côté de la géodésique que de l’autre. Il s’agit alors de corriger ce défaut par un poids dont l’existence est le cœur des arguments de [24], voir également [25] pour un premier résultat sur cette question.

APPENDICE : MÉLANGE EXPONENTIEL DU FLOT DES REPÈRES Dans cet appendice, G est un groupe de Lie simple réel, connexe, non compact et de centre trivial dont on fixe une décomposition d’Iwasawa G = N AK et une décomposition de Cartan compatible G = KA+ K. On note n l’algèbre de Lie de N . Définition 6.10. — (1) Une représentation unitaire π de G dans un espace de Hilbert (séparable) H π est un morphisme G → U ( H π ) tel que pour tout v ∈ H π l’application G → H π ; g 7→ π(g)v soit continue. Si cette application est lisse on dit que v ∞ est un vecteur C ∞ de π ; on note H ∞ de π. π l’ensemble des vecteurs C (2) Étant donnés deux vecteurs v, w ∈ H π , on appelle coefficient de π la fonction continue cv,w : G → C définie par cv,w : g 7→ hπ(g)v, wi. On dit que le coefficient cv,w est K-fini si les espaces vectoriels engendrés par respectivement π(K) · v et π(K) · w sont de dimension finie. (3) On note p(π) la borne inférieure de tous les p ≥ 2 tels que les coefficients K-finis de π soient dans Lp (G).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

454

N. BERGERON

(4) Une représentation unitaire σ est faiblement contenue dans π si tout coefficient de σ est limite uniforme sur tout compact de coefficients de π. On dit que π a un trou spectral si elle ne contient pas faiblement la représentation triviale de G. Le théorème de Howe-Moore affirme que si π est une représentation unitaire de G sans vecteurs invariants alors les coefficients g 7→ cv,w (g) de π tendent vers 0 lorsque g tend vers l’infini dans G. Michael Cowling [13] montre en fait que si G a la propriété (T ) il existe un entier p = p(G) < +∞ tel que si π est une représentation unitaire de G sans vecteurs invariants alors p(π) ≤ p, voir aussi [32, §7]. Si G est localement isomorphe à SO(n, 1) ou SU(n, 1), ce n’est plus vrai mais la classification des représentations irréductibles unitaires de ces groupes [21, 27] implique que si π est une représentation unitaire de G qui a un trou spectral, alors p(π) < +∞.(11) Le fait suivant est bien connu ; on peut en trouver une démonstration dans [4, Lemma 3]. Proposition 6.11. — Soit Γ un réseau dans G. La représentation régulière droite ρ0Γ de G dans le sous-espace L20 (Γ\G) de L2 (Γ\G) orthogonal aux fonctions constantes a un trou spectral. Étant donné un élément g = nak ∈ G, on pose H(g) = a. On appelle fonction d’Harish-Chandra la fonction Ξ = ΞG : G → R définie par Z ρ(H(kg −1 ))−1/2 dk où ρ(a) = det n (Ad(a−1 )). Ξ(g) = K

La fonction Ξ décroît exponentiellement vite le long de A+ : modulo un facteur logarithmique, on a Ξ(a)  ρ(a)−1/2 . Puisque la mesure de Haar dg est égale à ρ(a)dndadk, on en déduit en particulier que Ξ ∈ L2+ε (G) pour tout réel ε > 0. Exemple 6.12. — Si G = PSL2 (C), on a, pour les choix usuels de groupes K, A, N , Z 1 π/2 −r Ξ(ar ) = (e cos2 θ + er sin2 θ)−1 sin(2θ)dθ π 0 r = . π sinh r Notons d la dimension de K et fixons une base B de l’algèbre de Lie k de K. Étant donnés une représentation unitaire π et un vecteur v ∈ H ∞ π , on pose X S(v) = ||π(D)v||, ord(D)≤d+1

où D parcourt l’ensemble des monômes en les éléments de B de degré ≤ d + 1 et, si X1 , . . . , Xr sont des éléments de B, on a π(X1 · · · Xr ) = π(X1 ) · · · π(Xr ) et chaque π(Xi ) opère par dérivation. (11)

Toute la puissance de la classification des représentations irréductibles unitaires n’est pas utile ici. Il suffit de considérer la partie de π formée des représentations sphériques.

ASTÉRISQUE 352

(1055)

455

CONJECTURE DES SOUS-GROUPES DE SURFACES

La proposition suivante — qui est essentiellement due à Michael Cowling, Uffe Haagerup et Roger Howe [14] — appliquée à la représentation ρ0Γ implique finalement le théorème 4.1. Proposition 6.13. — Soit π une représentation unitaire de G telle que p(π) ≤ 2k avec k ∈ N∗ . Il existe une constante C = C(G, k) telle que pour tous v, w ∈ H ∞ π et pour tout g ∈ G, on a : (12)

|hπ(g)v, wi| ≤ CS(v)S(w)Ξ1/k (g).

Démonstration. — Quitte à remplacer π par le produit tensoriel π ⊗k on peut supposer que k = 1 ; voir [14, p. 108]. Il découle alors de [14, Thm. 1] que π est faiblement contenue dans la représentation régulière (droite) L2 (G). On se ramène alors facilement à démontrer la proposition dans le seul cas où π est la représentation régulière de G (et k = 1) ; voir la démonstration de [14, Thm. 2] pour plus de détails sur cette dernière réduction. Soient v et w dans L2 (G) ∩ C ∞ (G). Les fonctions ϕ : x 7→ supk∈K |v(xk)| et R ψ : x 7→ supk∈K |w(xk)| sont positives, K-invariantes et |hπ(g)v, wi| ≤ G ϕ(xg)ψ(x)dx. Mais il découle du lemme de Sobolev qu’il existe une constante C telle que pour tout x ∈ G, X ||(π(D)v)(x·)||2L2 (K) . ϕ(x)2 ≤ C ord(D)≤d+1



En particulier ||ϕ|| ≤ CS(v) et de même pour ψ. Il nous reste donc à vérifier que si ϕ, ψ ∈ L2 (G) sont des fonctions positives, K-invariantes et de norme 1, alors |hπ(g)ϕ, ψi| ≤ Ξ(g). C’est le calcul détaillé p. 106–107 de [14] que nous reprenons ici : Z ÅZ ã −1 |hπ(g)ϕ, ψi| = ϕ(na)ψ(nakg )ρ(a)dnda dk K

NA

Z ÅZ

ã1/2 ψ(naH(kg −1 ))2 ρ(a)dnda

≤ ||ϕ|| K

dk

NA

Z = ||ϕ|| · ||ψ||

ρ(H(kg −1 ))−1/2 dk,

K

où l’on a utilisé l’inégalité de Cauchy-Schwarz dans L2 (N A) et la K-invariance de ϕ et ψ. Remerciements Un grand merci à Laurent Clozel, Gilles Courtois, Ruben Dashyan, Bertrand Deroin, Olivier Guichard, Antonin Guilloux, Frédéric Haglund, Hélène EynardBontemps, Elisha Falbel, François Labourie, Frédéric Paulin et Maxime Wolff pour leur aide dans l’élaboration de ce texte.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

456

N. BERGERON

RÉFÉRENCES [1] I. Agol – Criteria for virtual fibering, J. Topol. 1 (2008), no 2, p. 269–284. [2] I. Agol, D. Groves & J. Manning – The virtual Haken conjecture, prépublication arXiv:1204.2810. [3] I. Agol, D. D. Long & A. W. Reid – The Bianchi groups are separable on geometrically finite subgroups, Ann. of Math. 153 (2001), no 3, p. 599–621. [4] M. B. Bekka – On uniqueness of invariant means, Proc. Amer. Math. Soc. 126 (1998), no 2, p. 507–514. [5] N. Bergeron – Premier nombre de Betti et spectre du laplacien de certaines variétés hyperboliques, Enseign. Math. 46 (2000), nos 1-2, p. 109–137. [6] N. Bergeron & D. T. Wise – A boundary criterion for cubulation, Amer. J. Math. 134 (2012), no 3, p. 843–859. [7] P. Billingsley – Convergence of probability measures, second éd., Wiley Series in Probability and Statistics : Probability and Statistics, John Wiley & Sons Inc., 1999. [8] L. Bowen – Weak forms of the Ehrenpreis conjecture and the surface subgroup conjecture, prépublication arXiv:math/0411662. [9] M. R. Bridson & A. Haefliger – Metric spaces of non-positive curvature, Grund. Math. Wiss., vol. 319, Springer, 1999. [10] P. Buser – Geometry and spectra of compact Riemann surfaces, Modern Birkhäuser Classics, Birkhäuser, 2010. [11] D. Calegari – Surface subgroups from homology, Geom. Topol. 12 (2008), no 4, p. 1995–2007. [12] D. Cooper, D. D. Long & A. W. Reid – Essential closed surfaces in bounded 3-manifolds, J. Amer. Math. Soc. 10 (1997), no 3, p. 553–563. [13] M. Cowling – Sur les coefficients des représentations unitaires des groupes de Lie simples, in Analyse harmonique sur les groupes de Lie (Sém., NancyStrasbourg 1976–1978), II, Lecture Notes in Math., vol. 739, Springer, 1979, p. 132–178. [14] M. Cowling, U. Haagerup & R. Howe – Almost L2 matrix coefficients, J. reine angew. Math. 387 (1988), p. 97–110. [15] G. Dufour – Cubulations de variétés hyperboliques compactes, thèse de doctorat, Université Paris-Sud, 2012. [16] L. Ehrenpreis – Cohomology with bounds, in Symposia Mathematica, Vol. IV (INDAM, Rome, 1968/69), Academic Press, 1970, p. 389–395. [17] F. Haglund – Finite index subgroups of graph products, Geom. Dedicata 135 (2008), p. 167–209.

ASTÉRISQUE 352

(1055)

CONJECTURE DES SOUS-GROUPES DE SURFACES

457

[18] F. Haglund & D. T. Wise – Special cube complexes, Geom. Funct. Anal. 17 (2008), no 5, p. 1551–1620. [19] P. Hall – On representatives of subsets, J. London Math. Soc. 1 (1935), p. 26– 30. [20] J. Hempel – 3-manifolds, AMS Chelsea Publishing, Providence, RI, 2004. [21] T. Hirai – On irreducible representations of the Lorentz group of n − th order, Proc. Japan Acad. 38 (1962), p. 258–262. [22] J. Kahn & V. Markovic – Immersing almost geodesic surfaces in a closed hyperbolic three manifold, Ann. of Math. 175 (2012), no 3, p. 1127–1190. [23] , Counting essential surfaces in a closed hyperbolic 3-manifold, prépublication arXiv:1012.2828. [24] , The good pants homology and a proof of the Ehrenpreis conjecture, prépublication arXiv:1101.1330. [25] , Random ideal triangulations and the Weil-Petersson distance between finite degree covers of punctured Riemann surfaces, prépublication arXiv:0806.2304. [26] C. Kourouniotis – Complex length coordinates for quasi-Fuchsian groups, Mathematika 41 (1994), no 1, p. 173–188. [27] H. Kraljević – Representations of the universal convering group of the group SU(n, 1), Glasnik Mat. Ser. III 8(28) (1973), p. 23–72. [28] M. Lackenby – Surface subgroups of Kleinian groups with torsion, Invent. Math. 179 (2010), no 1, p. 175–190. [29] G. A. Margulis – Certain applications of ergodic theory to the investigation of manifolds of negative curvature, Funkcional. Anal. i Priložen. 3 (1969), no 4, p. 89–90. [30] J. D. Masters – Thick surfaces in hyperbolic 3-manifolds, Geom. Dedicata 119 (2006), p. 17–33. [31] C. C. Moore – Exponential decay of correlation coefficients for geodesic flows, in Group representations, ergodic theory, operator algebras, and mathematical physics (Berkeley, Calif., 1984), Math. Sci. Res. Inst. Publ., vol. 6, Springer, 1987, p. 163–181. [32] H. Oh – Uniform pointwise bounds for matrix coefficients of unitary representations and applications to Kazhdan constants, Duke Math. J. 113 (2002), no 1, p. 133–192. [33] M. Sageev – Ends of group pairs and non-positively curved cube complexes, Proc. London Math. Soc. 71 (1995), no 3, p. 585–617. [34] P. Scott – Subgroups of surface groups are almost geometric, J. London Math. Soc. 17 (1978), no 3, p. 555–565.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

458

N. BERGERON

[35] C. Series – An extension of Wolpert’s derivative formula, Pacific J. Math. 197 (2001), no 1, p. 223–239. [36] S. P. Tan – Complex Fenchel-Nielsen coordinates for quasi-Fuchsian structures, Internat. J. Math. 5 (1994), no 2, p. 239–251. [37] W. P. Thurston – Three-dimensional manifolds, Kleinian groups and hyperbolic geometry, Bull. Amer. Math. Soc. (N.S.) 6 (1982), no 3, p. 357–381. [38] D. Šarić – Complex Fenchel-Nielsen coordinates with small imaginary parts, prépublication arXiv:1204.5778. [39] D. T. Wise – The structure of groups with a quasiconvex hierarchy, prépublication disponible sur http://www.math.mcgill.ca/wise/papers.html, 2012.

Nicolas BERGERON Université Pierre et Marie Curie et Institut Universitaire de France Département de Mathématiques 4 place Jussieu F-75005 PARIS E-mail : [email protected]

ASTÉRISQUE 352

352

ASTÉRISQUE 2013

SÉMINAIRE BOURBAKI VOLUME 2011/2012 EXPOSÉS 1043-1058 (1056) Les espaces de Berkovich sont modérés Antoine DUCROS

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Séminaire BOURBAKI 64e année, 2011-2012, no 1056, p. 459 à 507

Juin 2012

LES ESPACES DE BERKOVICH SONT MODÉRÉS [d’après Ehud Hrushovski et François Loeser] par Antoine DUCROS

Conventions préalables Il sera question tout au long de ce texte de valuations, pour lesquelles deux notations sont en concurrence : la notation additive et la notation multiplicative. Nous avons opté pour la notation multiplicative, naturelle en géométrie de Berkovich. Une valuation sur un corps k consiste donc en la donnée : d’un groupe abélien ordonné G noté multiplicativement d’élément neutre 1 ; et d’une application |.| de k vers G0 := G ∪ {0} (où 0 est absorbant, et plus petit que tout élément de G) telle que |0| = 0, |1| = 1, |ab| = |a| · |b| et |a + b| 6 max(|a|, |b|) pour tout (a, b) ∈ k 2 ; nous n’exigeons pas que |k| = G0 . L’anneau de la valuation |.| est égal à {x ∈ k, |x| 6 1} ; on le notera k ◦ . Son idéal maximal est k ◦◦ := {x ∈ k, |x| < 1} ; son corps résiduel ˜ Un corps valué est un corps muni d’une valuation ; un corps ulk ◦ /k ◦◦ sera noté k. tramétrique est un corps muni d’une valeur absolue ultramétrique, c’est-à-dire encore d’une valuation à valeurs réelles.

INTRODUCTION À la fin des années quatre-vingt, Vladimir Berkovich a proposé une nouvelle approche de la géométrie analytique ultramétrique ([2], [3] ; cf. aussi l’exposé [11] de ce séminaire). L’un de ses traits distinctifs est qu’elle fournit des espaces ayant d’excellentes propriétés topologiques, qui se sont avérées très utiles pour des raisons techniques, mais aussi psychologiques dans la mesure où elles sont souvent remarquablement conformes à l’intuition classique : par exemple, le disque unité fermé est, dans ce contexte, une partie compacte et à bord non vide de la droite affine. (∗)

Durant la préparation de cet exposé, l’auteur était responsable du projet ANR Jeunes Chercheurs Espaces de Berkovich (07-JCJC-0004-CSD5). L’auteur est membre junior de l’Institut universitaire de France.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

460

A. DUCROS

La connaissance de ces propriétés topologiques a récemment progressé de manière considérable grâce à l’article [17] de Ehud Hrushovski et François Loeser, auquel ce texte est consacré. Avant d’en présenter les grandes lignes, nous allons succinctement exposer l’état de l’art antérieur à sa parution. On peut, grossièrement, classer les propriétés qui étaient connues jusqu’alors en trois catégories. 1) Celles qui relèvent de la topologie générale. Les espaces de Berkovich sont localement compacts, localement connexes par arcs, et de dimension topologique finie lorsqu’ils sont compacts. Elles ont été établies par Berkovich lui-même (pour l’essentiel dans [2]) aux débuts de la théorie. Leurs preuves reposent sur des arguments très généraux, tel le théorème de Tychonoff, ainsi que sur une étude explicite du disque unité. 2) Celles qui relèvent de la modération(1) homotopique. Elles sont là encore dues à Berkovich, qui les a prouvées dans l’article [4]. Soit X un espace analytique compact sur un corps ultramétrique complet k. Supposons que X admet un modèle formel polystable X sur k ◦ . La combinatoire des singularités de la fibre spéciale X ⊗ k˜ de X peut être codée par un polytope P de dimension inférieure ou égale à celle de X ; Berkovich démontre, en se ramenant par localisation étale à une situation torique qui se traite à la main, que P est homéomorphe à un fermé de X, sur lequel X se rétracte par déformation. À l’aide des altérations de de Jong, il en déduit que si la valeur absolue de k n’est pas triviale, tout espace k-analytique lisse est localement contractile ; il montre plus généralement que c’est le cas de tout espace k-analytique localement isomorphe à un domaine strictement k-analytique d’un espace k-analytique lisse. Donnons quelques très brèves explications sur les termes employés, en renvoyant le lecteur en quête de définitions détaillées au texte fondateur [3] de Berkovich. Les domaines analytiques d’un espace analytique X sont des sous-ensembles de X qui ont une structure canonique d’espace analytique. Parmi eux, on trouve entre autres les ouverts de X et certains compacts intéressants mais pas, en général, les fermés de Zariski de X (qui peuvent admettre plusieurs structures analytiques, à cause des phénomènes de nilpotence). Quant à l’adverbe « strictement », il fait référence à une condition sur les paramètres de définition. Illustrons ces notions par un exemple : pour tout n-uplet r = (r1 , . . . , rn ) de réels strictement positifs, le polydisque fermé Dr de polyrayon r est un domaine analytique compact de l’espace affine analytique An,an , et Dr est k ∗ Q strictement k-analytique si et seulement si les ri appartiennent à |k | . Mentionnons (1)

Nous ne chercherons pas ici à définir précisément le terme « modération ». Il est à prendre dans une acception assez vague, dans l’esprit d’Esquisse d’un programme : il évoque une certaine forme de finitude, ainsi que l’absence de pathologies.

ASTÉRISQUE 352

(1056)

LES ESPACES DE BERKOVICH SONT MODÉRÉS

461

incidemment que An,an est lisse, mais pas Dr si n > 0 car ce dernier a alors un bord k non vide. 3) Celles qui relèvent de la modération en matière de composantes connexes. Il y en a essentiellement deux, l’une portant sur les « parties semi-algébriques » de l’analytifié d’une variété algébrique, et l’autre sur certaines « familles réelles » d’espaces analytiques. - Modération des ensembles semi-algébriques. Soit X une variété algébrique sur un corps ultramétrique complet k. Une partie V de son analytifié X an est dite semialgébrique si elle peut être définie, localement pour la topologie de Zariski sur X an , par une combinaison booléenne finie d’inégalités de la forme |f | o n λ|g|, où f et g sont des fonctions polynomiales, où λ ∈ R+ , et où le symbole o n appartient à {, 6, >}. Toute partie semi-algébrique de X an a un nombre fini de composantes connexes, elles-mêmes semi-algébriques. Ce résultat a été établi dans [10] par l’auteur(2) ; la preuve repose sur différents résultats difficiles d’algèbre commutative normée, reliant les propriétés d’une algèbre affinoïde à celles de sa réduction, qui sont dus à Grauert et Remmert d’une part ([13]), à Bosch d’autre part ([8]). - Modération en famille réelle. Soit X un espace analytique compact et soit f une fonction analytique sur X. Pour tout ε > 0, notons Xε l’ensemble des x ∈ X tels que |f (x)| > ε. Il existe une partition finie de P de R+ en intervalles, possédant la propriété suivante : pour tout I ∈ P et tout couple (ε, ε0 ) d’éléments de I tel que ε 6 ε0 , l’application naturelle π0 (Xε0 ) → π0 (Xε ) est bijective. Ce théorème a été prouvé par Jérôme Poineau dans [20], à l’aide de deux résultats de désingularisation : le « théorème de la fibre réduite » (forme affaiblie du théorème de réduction semi-stable, démontrée en toute dimension par Bosch, Lütkebohmert et Raynaud dans [9]), et un théorème d’élimination de la ramification sauvage, établi par Epp dans [12]. Indiquons que le cas particulier où la fonction f est inversible avait été traité antérieurement par Abbes et Saito dans leur travail [1] sur la ramification sauvage. Mentionnons pour conclure ce survol une interprétation conceptuelle de l’espace topologique sous-jacent à un espace analytique — ou à tout le moins de sa cohomologie. Soit k un corps ultramétrique complet, soit k a une clôture algébrique de k, et soit X une k-variété algébrique. La cohomologie de l’espace topologique X ana a alors ten“ k dance à s’identifier de manière Galois-équivariante, lorsque cela a un sens, à la partie de poids zéro de la cohomologie « usuelle » de Xka . Pour plus de précisions, le lecteur intéressé pourra consulter : l’article [5] de Berkovich, qui traite le cas d’un corps local, d’un corps de type fini sur son sous-corps premier, et de C (la valeur absolue dans ces deux derniers cas est triviale) ; et les articles [6] et [19] (le premier de Berkovich, (2)

Dans [10] seul le cas des variétés affines est considéré, mais il est immédiat qu’il entraîne le cas général.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

462

A. DUCROS

le second de Johannes Nicaise), qui traitent le cas du corps C((t)) muni d’une valeur absolue t-adique, en lien avec les familles à un paramètre de variétés complexes. Les résultats de Hrushovski et Loeser. On peut les résumer en disant qu’ils étendent 2) et 3) à toutes les situations provenant de la géométrie algébrique (projective). Plus précisément, soit k un corps ultramétrique complet, soit X une k-variété algébrique quasi-projective, et soit V une partie semi-algébrique de X an . Hrushovski et Loeser démontrent entre autres les assertions suivantes. A) Modération globale. Il existe un fermé S de V homéomorphe à un complexe simplicial fini de dimension inférieure ou égale à celle de X, et une rétraction par déformation de V sur S telle que tous les points d’une trajectoire donnée aient même image terminale sur S. B) Modération locale. L’espace topologique V est localement contractile. C) Modération en famille algébrique. Soit Y une k-variété algébrique et soit f un morphisme de X vers Y . L’ensemble des types d’homotopie des fibres de f an |V : V → Y an est fini. D) Modération en famille réelle. Soit g ∈ OX (X). Pour tout ε > 0, notons Vε l’ensemble des x ∈ V tels que |g(x)| > ε. Il existe une partition finie de P de R+ en intervalles, possédant la propriété suivante : pour tout I ∈ P et tout couple (ε, ε0 ) d’éléments de I tel que ε 6 ε0 , l’inclusion Vε0 ⊂ Vε est une équivalence homotopique. Commentaires. En ce qui concerne A), soulignons que même dans le cas où X est projective et lisse et où V = X an , cette assertion n’était jusqu’alors connue que lorsque X admet un modèle polystable, cf. les résultats globaux mentionnés en 2). En ce qui concerne B), notons que V possède une base de voisinages qui sont des parties semi-algébriques de X an ; cela permet de déduire B) de A) et de la locale contractibilité des complexes simpliciaux finis. Par ailleurs, tout domaine analytique de X an possède une base d’ouverts qui sont des parties semi-algébriques de X an . Il s’ensuit que tout espace analytique localement isomorphe à un domaine analytique (de l’analytifié) d’une variété algébrique est localement contractile. Comme un espace analytique lisse est localement isomorphe à un ouvert d’une variété algébrique lisse, on retrouve comme cas particulier les résultats locaux mentionnés plus haut en 2), de surcroît un peu étendus : il n’y a plus besoin de supposer que la valeur absolue de k est non triviale, ni que les domaines en jeu sont strictement analytiques. Les méthodes de Hrushovski et Loeser. L’intérêt de leur travail réside non seulement dans les résultats que nous venons d’évoquer, mais aussi dans les méthodes totalement

ASTÉRISQUE 352

(1056)

LES ESPACES DE BERKOVICH SONT MODÉRÉS

463

inédites qu’ils emploient pour aborder ce type de questions. Elles reposent entièrement sur la théorie des modèles des corps non trivialement valués algébriquement clos (dont nous utiliserons l’acronyme anglophone ACVF), et plus précisément sur des progrès récents en la matière dus à Haskell, Hrushovski et Macpherson ([15], [14]). Contrairement à celles qui ont été utilisées dans les preuves évoquées aux points 1), 2) et 3) plus haut, elles ne font aucun appel à l’étude de la réduction des variétés algébriques ou des espaces analytiques, ni à travers les théorèmes sur la réduction des algèbres affinoïdes, ni à travers ceux qui assurent l’existence de modèles pas trop singuliers (réduction semi-stable, altérations de de Jong, fibre réduite). Dans [15], Haskell, Hrushovski et Macpherson introduisent une version enrichie du langage des corps valués, dans laquelle la théorie ACVF « élimine les imaginaires », ce qui veut dire que le quotient d’un foncteur définissable par une relation d’équivalence définissable est encore un foncteur définissable. Nous allons donner un exemple d’un tel quotient qui jouera un rôle important dans la suite ; on utilise à partir de maintenant le langage de [15]. Soit (k, |.| : k ∗ → G) un corps valué, et soit k a une clôture algébrique de k munie d’un prolongement |.| : (k a )∗ → GQ . Soit M la catégorie des modèles F de ACVF (c’est-à-dire des corps non trivialement valués et algébriquement clos), munis d’un diagramme commutatif FO

ka

|.|

/ |F | O

|.|

/ GQ 0

dans lequel les flèches verticales sont des plongements. Soit T le foncteur qui envoie F ∈ M sur le groupe !) ( a b . 0 a ∗ a∈F ,b∈F

Il est k-définissable ; on note T 0 le sous-foncteur k-définissable F 7→ T (F )∩GL2 (F ◦ ) de T . Le foncteur quotient T /T 0 est k-définissable par élimination des imaginaires dans la variante de ACVF utilisée. On vérifie immédiatement que l’application qui envoie la matrice ! a b 0

a

sur la boule de centre b et de rayon |a| induit une bijection, fonctorielle en F , entre T (F )/T 0 (F ) et l’ensemble B(F ) des boules fermées de F dont le rayon appartient à |F ∗ |. Ainsi, B est k-définissable. L’ensemble B(F ) des boules fermées de F dont le rayon appartient à |F | (le rayon nul est maintenant autorisé) est isomorphe à ` B(F ) F , fonctoriellement en F . Le foncteur B est donc lui aussi k-définissable.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

464

A. DUCROS

Supposons que G = R et que k est complet, et soit F un corps ultramétrique appartenant à M. On dispose alors d’une flèche B(F ) → A1,an , qui est surjective si k F est maximalement complet (cela signifie que toute famille décroissante de boules fermées de F a une intersection non vide). Si F = k la flèche B(F ) → A1,an est F injective, et bijective si F est maximalement complet. Ce foncteur B peut s’interpréter comme un cas particulier d’une construction très générale de Hrushovski et Loeser, qui est au cœur de leur article et que nous allons maintenant présenter. On ne suppose plus que G = R (ni que k est complet). Soit X une k-variété algébrique ; on identifie X au foncteur F 7→ X(F ) de M vers Ens. Soit U un sous-foncteur (k, G)-définissable de X ; il est donné, localement pour la topologie de Zariski de X, par une combinaison booléenne finie d’inégalités de la forme |f | o n λ|g|, où f et g sont des fonctions polynomiales à coefficients dans k, où λ ∈ G, et où le symbole o n appartient à {, 6, >}. Si G = R et si k est complet, les formules qui décrivent U définissent sans ambiguïté une partie semi-algébrique U an de X an , et toute partie semi-algébrique de X an est de cette forme. “ le foncteur qui envoie un corps F ∈ M sur l’enHrushovski et Loeser notent U semble des types stablement dominés F -définissables situés sur U . Nous ne donnerons pas dans cette introduction la définition de type stablement dominé ; c’est l’une des notions centrales du livre [14], et nous en disons quelques mots dans ce texte au para“ est fonctorielle en U , pour les applications définissables. graphe 2.6. La formation de U “ Le foncteur U jouit des propriétés suivantes. “ est muni d’un plongement naturel U ,→ U “. a) Le foncteur U “ b) Le foncteur U est (k, G)-pro-définissable, et (k, G)-définissable si X est de dimension 6 1. c) Pour tout corps F ∈ M et toute fonction polynomiale g à coefficients dans F sur un ouvert de Zariski V de XF , la fonction |g| : V (F ) ∩ U (F ) → |F | se prolonge en une “(F ) ∩ U “(F ) → |F |. On munit U “(F ) de la topologie la plus grossière fonction |g| : V “(F ) ∩ U “(F ) est ouvert et |g| continue pour tout (V, g) comme ci-dessus pour laquelle V “(F ) → U “(F 0 ) est une (la topologie sur |F | est celle de l’ordre). Si F ⊂ F 0 , la flèche U injection ; elle est ouverte sur son image, mais pas continue en général. “(F ) est un homéomord) Pour tout F ∈ M, le plongement canonique U (F ) ,→ U phisme sur son image, laquelle est dense. e) Supposons que X soit propre et que U soit défini Zariski-localement par une combinaison booléenne positive d’inégalités larges. Pour tout F ∈ M, l’espace topo“(F ) est alors définissablement compact (cela signifie grosso modo que tout logique U ultrafiltre définissable, en un sens convenable, y converge). f) Supposons que G = R et que k est complet, et soit F un corps ultramétrique “(F ) → U an , qui est une appartenant à M. On dispose d’une application continue U

ASTÉRISQUE 352

(1056)

LES ESPACES DE BERKOVICH SONT MODÉRÉS

465

surjection topologiquement propre si F est maximalement complet. Lorsque F = k, “(F ) → U an est injective (elle a pour image les points de U an qui sont défila flèche U nissables, en un sens à préciser), et c’est un homéomorphisme si F est maximalement complet. “ est alors égal à B. On a vu plus Un exemple : le cas où U = X = A1k . Le foncteur U haut que B est définissable, ce qui redonne b) dans ce cas particulier. Soit F ∈ M. Le plongement mentionné en a) est celui qui envoie un élément de U (F ) = F sur la boule singleton correspondante. La topologie mentionnée en c) est telle que si x ∈ F , l’application qui associe à r ∈ |F | la boule fermée de centre x et de rayon r induit un homéomorphisme de |F | sur son image. Quant à l’application mentionnée en f), elle coïncide avec la flèche B(F ) → A1,an évoquée précédemment. k L’essentiel du travail de Hrushovski et Loeser est consacré à l’étude des foncteurs “. Ils sont relativement proches des espaces de Berkovich en vertu de f) ; de la forme U mais ils sont en vertu de c) plus maniables du point de vue de la théorie des modèles, notamment pour ce qui concerne la définissabilité et la modération. Ils apparaissent plus précisément comme les objets d’une géométrie qui code l’ensemble des questions de modération et de définissabilité en géométrie de Berkovich. L’apport majeur de Hrushovski et Loeser est, en un sens, la mise au jour de cette géométrie ; les preuves des assertions A), B), C) et D) ci-dessus constituent le premier témoignage de sa fécondité. Celles-ci sont pour l’essentiel d’abord établies dans le monde des espaces chapeautés, avant d’être rapatriées à la toute fin de l’article (chapitre 13) dans celui des espaces de Berkovich, grâce aux liens étroits entre les deux géométries, et notamment aux applications considérées en f). À titre d’exemple, nous allons décrire plus avant cette stratégie concernant l’assertion A). Introduisons un peu de vocabulaire. On note Γ (resp. Γ0 ) le foncteur F 7→ |F ∗ | (resp. F 7→ |F |) de M dans Ens. Si a et b sont deux éléments de |k| avec a 6 b, le segment [a; b] sera considéré comme un sous-foncteur de Γ0 envoyant F sur {x ∈ |F |, a 6 |x| 6 b}. Un segment généralisé est un foncteur qui est une concaténation finie de segments, avec identifications des extrémité et origine de deux segments consécutifs(3) ; un segment généralisé possède lui-même deux extrémités. Nous appellerons polytope un sous-foncteur de Γn0 (pour un certain n) qui est k-définissable ; cela signifie qu’il peut être décrit par une combinaison booléenne d’inégalités de la forme Q Q i a xni i o n b xm n à {6, >, }. i , où a et b appartiennent à |k|, les ni et mi à N, et o Si P est un polytope (resp. un segment généralisé), alors pour tout F appartenant à M, l’ensemble P (F ) est de façon naturelle un espace topologique (resp. un espace (3)

On prendra garde qu’un tel foncteur n’est pas en général définissablement isomorphe à un segment, cf. la remarque 1.11.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

466

A. DUCROS

topologique définissablement compact) ; il existe une notion naturelle de dimension d’un polytope. L’avatar chapeauté de l’assertion A), dont celle-ci est déduite, est le suivant. On suppose que X est quasi-projective. Il existe alors : “; • un sous-foncteur S de U • un polytope P de dimension inférieure ou égale à celle de X, et un isomorphisme S ' P définissable sur une extension finie(4) de k contenue dans k a , tels que la bijection S(F ) ' P (F ) soit un homéomorphisme pour tout F ∈ M ; • un segment généralisé I, d’origine o et d’extrémité e ; “×I → U “ qui fixe S point par point, • une transformation naturelle définissable h : U “ induit l’identité au-dessus de o et une rétraction U → S au-dessus de e, satisfait les égalités h(h(x, t), e) = h(x, e) pour tout (x, t), et est telle que h(F ) soit continue pour tout F ∈ M. Disons quelques mots de la démonstration. On fixe un ensemble fini F de fonctions “ vers Γ0 qui contient la fonction caractéristique de U “. Dans ce définissables de X qui suit, toutes les rétractions, homotopies, déformations, etc. seront implicitement supposées définissables. On dira qu’une homotopie h(., .) préserve F si ϕ ◦ h(t, .) = ϕ pour tout ϕ ∈ F et tout t. “ Quitte à agrandir X, on peut la supposer projective. Le but est de déformer U “ tout entier sur un polytope, en présur un polytope. On va en réalité déformer X “ servant F . Cela garantira la stabilité de U sous l’homotopie construite ; que l’image “ soit un polytope résultera immédiatement d’un argument de définisterminale de U sabilité. Notons qu’il est important de traiter le cas d’un ensemble F quelconque, même si le cas où F = {χUb } semble suffire ici : certaines étapes de la récurrence qui est au cœur de la preuve (et dont nous donnons une description extrêmement succincte ci-dessous) requièrent en effet de savoir préserver un ensemble fini arbitraire de fonctions définissables. On traite tout d’abord le cas où X est une courbe. Si X = P1k la démonstration se fait plus ou moins « à la main » : dans une carte affine standard on construit, en gros, l’homotopie requise en faisant croître le rayon des boules et en stoppant c1 est l’espace des boules fermées). Si X est une lorsqu’il convient (rappelons que A k courbe quelconque, on choisit un morphisme fini et plat f : X → P1k , et l’on cherche à b1 qui se relève sur X “ en une homotopie répondant aux construire une homotopie sur P k b1 déjà menée, et grâce conditions prescrites. C’est possible grâce à l’étude directe de P k b à un lemme assurant que le cardinal des fibres de f a un comportement raisonnable, c1 . Plus précisément, on prouve d’abord en tant que fonction à valeurs entières sur P k (4)

La présence de cette extension finie est inévitable, cf. la remarque 3.9.

ASTÉRISQUE 352

(1056)

LES ESPACES DE BERKOVICH SONT MODÉRÉS

467

que le « sens de variation » de cette fonction est génériquement ce qu’on attend, puis un argument de définissabilité permet de passer de ce fait générique à une assertion ferme. Pour construire la rétraction dans le cas général, on procède par récurrence sur la dimension n de X (après s’être ramené au cas équidimensionnel). Le caractère projectif de X assure l’existence d’une modification X 0 → X, qui est un éclatement de centre un sous-schéma de dimension 0, telle que X 0 admette une fibration propre en courbes sur une variété projective Y purement de dimension n − 1. Soit D la réunion des diviseurs exceptionnels de X 0 → X. On cherche à construire une rétraction de c0 sur un polytope, qui préserve F et stabilise D. “ Cela assurera qu’elle descend X “ “ s’écrasant sur un point. à X, chaque composante connexe de D, et partant de D, “ il suffit de rajouter sa fonction caractéristique à Pour garantir la stabilisation de D, l’ensemble F ; on peut ainsi oublier D. c0 sur un polytope en préservant F l’idée est, très grossièrement, Pour rétracter X c0 → Y “ en combinant une rétraction convenable de la base d’utiliser la fibration X (fournie par l’hypothèse de récurrence) et une rétraction fibre à fibre bien choisie (fournie par le cas des courbes déjà traité, dans sa variante relative). Ce procédé permet de construire une homotopie h0 ayant les propriétés requises, mais qui n’est c0 de la forme (X c0 \ ∆) “ ∪D ”0 , où ∆ et D0 sont deux définie que sur une partie de X 0 diviseurs sur X (l’un des points délicats est la vérification de la continuité de h0 ). c0 tout entier, il faut encore travailler. On Pour obtenir une homotopie h définie sur X ”0 point commence par faire précéder h0 d’une homotopie h1 dite d’inflation qui fixe D “ “ ” par point, préserve F et éloigne un peu de ∆ les points de ∆ − D0 . On obtient ainsi c0 tout entier, préserve F et déforme X c0 sur un une homotopie qui est définie sur X polytope, mais ce dernier n’est plus nécessairement fixé point par point pendant toute la durée du processus, l’homotopie h1 pouvant le perturber. On résout le problème en faisant suivre la concaténation de h1 et h0 d’une troisième homotopie h2 , dont l’essentiel de la construction se déroule dans le monde polytopal. Dans les grandes lignes que nous venons d’esquisser, la preuve semble reposer essentiellement sur des idées géométriques. Mais les arguments de théorie des modèles y sont omniprésents, notamment ceux tournant autour de la définissabilité et de la compacité (au sens modèle-théorique du terme). Notons qu’à chaque fois que l’on veut appliquer cette dernière, il est nécessaire de considérer tous les modèles de ACVF contenant le corps k. C’est pourquoi il est indispensable de faire intervenir tout au long de la preuve des corps valués quelconques, même si la motivation initiale porte sur les corps ultramétriques complets ; pour plus de commentaires sur ce sujet, cf. 2.3 infra.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

468

A. DUCROS

Pour conclure, mentionnons qu’Amaury Thuillier travaille actuellement à l’extension des résultats de modération homotopique de Berkovich (aux espaces non nécessairement lisses et/ou n’admettant pas nécessairement de modèle polystable) par des méthodes plus proches de la stratégie originale de Berkovich : utilisation des altérations de de Jong et descente homotopique — c’est la mise en œuvre de ce dernier point qui nécessite de nouvelles idées. Remerciements Je tiens à faire part de toute ma gratitude à Ehud Hrushvoski et François Loeser pour toutes les discussions que j’ai eues avec eux depuis maintenant trois ans au sujet de leur travail. Je suis également extrêmement redevable à tous les participants du groupe de travail qui s’est tenu sur le sujet de 2009 à 2011 à l’Institut de mathématiques de Jussieu : Luc Bélair, Elisabeth Bouscaren, Zoé Chatzidakis, Françoise Delon, Deirdre Haskell, Pierre Simon, ainsi que Martin Hils ; je sais particulièrement gré à ce dernier d’avoir relu très attentivement une première version de ce texte et fait un grand nombre de suggestions qui m’ont permis de l’améliorer significativement.

1. UN PEU DE THÉORIE DES MODÈLES 1.1. Langages, formules, énoncés Références : le lecteur intéressé pourra par exemple consulter [18] ou [21]. Définition 1.1. — Un langage est une collection de symboles comprenant : • les symboles logiques usuels, ainsi qu’une liste (dénombrable) de variables ; • des symboles de fonctions, chacun ayant une arité fixée ; • des symboles de relations, chacun ayant une arité fixée. En général, pour décrire un langage, on se contente de donner la liste des symboles de fonctions et de relations, les autres étant plus ou moins implicites ; les fonctions d’arité 0 sont le plus souvent appelées constantes. Dans ce qui suit, les langages seront également implicitement supposés contenir un symbole de relation = d’arité 2. Donnons quelques exemples. Le langage Lann des anneaux comprend deux constantes 0 et 1 et deux symboles fonctionnels d’arité 2, à savoir + et ×. Le langage Lco des corps ordonnés comprend les mêmes symboles, ainsi qu’un symbole de relation 6 d’arité 2. Le langage Lgao des groupes abéliens ordonnés (notés multiplicativement, avec adjonction formelle d’un plus petit élément absorbant) comprend une constante 1, une constante 0, un symbole de fonction × d’arité 2, et un symbole de relation 6 d’arité 2.

ASTÉRISQUE 352

(1056)

LES ESPACES DE BERKOVICH SONT MODÉRÉS

469

Une structure d’un langage L est un ensemble non vide M muni : pour chaque symbole fonctionnel f d’arité n de L , d’une fonction fM : M n → M (souvent notée simplement f s’il n’y a pas d’ambiguïté) ; et pour chaque symbole de relation R d’arité n, d’une relation à n termes RM (ou simplement R), c’est-à-dire d’un sousensemble de M n . On demande que la relation =M soit l’égalité usuelle. Ainsi, une structure du langage des corps ordonnés est un ensemble muni de deux éléments distingués 0 et 1, de deux lois de composition internes + et ×, et d’une relation binaire 6. Une sous-structure d’une structure M est une partie non vide de M qui est stable par les (interprétations des) symboles fonctionnels. On se permettra d’écrire N ⊆ M pour signifier que N est une sous-structure de M . On peut écrire des formules dans un langage L en agençant des symboles de L selon les règles syntaxiques usuelles, en respectant les arités des symboles de fonction et de relation. Par exemple, ∀x, ∃y, (y + x) 6 z ou (yt > u + 1 et x = t) est une formule du langage Lco . Une formule peut contenir des variables libres (qui ne sont pas quantifiées) ; dans la formule ci-dessus, z, u et t sont libres. Une formule sans variable libre est appelée un énoncé. À titre d’illustration, ∀x, ∃y, x + y = 0 est un énoncé de Lann . Si L est un langage et si M est une structure de L , tout énoncé de L admet une interprétation dans M , laquelle peut être vraie ou fausse : par exemple, l’énoncé ∀x, ∃y, x + y = 0 est vrai dans la structure Z de Lann , mais faux dans sa structure N. Une formule ϕ de L donne naissance, si l’on remplace certaines de ses variables libres par des éléments de M , à une formule du langage L à paramètres dans M ; lorsqu’on spécialise ainsi toutes les variables libres de ϕ, on obtient un énoncé du langage L à paramètres dans M . Un tel énoncé possède une valeur de vérité dans M , et plus généralement dans toute structure M 0 ⊇ M . 1.2. Langages multisortes Les définitions des langages, structures, énoncés et formules s’étendent dans un contexte un peu plus général, dit multisorte. On se donne un ensemble S . Un langage d’ensemble des sortes égal à S se définit comme un langage au sens précédent, à ceci près qu’il ne suffit plus de fixer les arités des symboles fonctionnels et relationnels : on doit également préciser la ou les sortes dans lesquels vivent leurs arguments, et leurs valeurs pour les fonctions. Une structure M d’un tel langage est une famille ( S (M )) S ∈S d’ensembles non vides (on dit que S (M ) est « la partie de sorte S », ou plus simplement « la sorte S », de la structure M ), munie d’une interprétation des

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

470

A. DUCROS

symboles par de vraies relations ou fonctions. Les définitions des énoncés et formules dans ce cadre sont mutatis mutandis celles du paragraphe précédent. Exemple 1.2. — Le langage des corps valués Lval est un langage à trois sortes : F, R et Γ0 . Ses symboles sont : • les constantes 0F et 1F , 0R et 1R , 0Γ0 et 1Γ0 (la sorte est indiquée en indice) ; • les fonctions +F et ×F , à deux arguments dans la sorte F et à valeurs dans la sorte F ; • les fonctions +R et ×R , à deux arguments dans la sorte R et à valeurs dans la sorte R ; • la fonction ×Γ0 , à deux arguments dans la sorte Γ0 et à valeurs dans la sorte Γ0 ; • la fonction |.| à un argument, de la sorte F vers la sorte Γ0 ; • la fonction res à deux arguments, de la sorte F vers la sorte R ; • la relation binaire 6 sur la sorte Γ0 . Soit (k, |.| : k → G0 ) un corps valué (rappelons qu’on ne demande pas que |.| : k → G0 soit surjective). On peut le voir de façon naturelle comme une structure de Lval , dont les sortes sont ˜ et Γ0 (k, |.| : k → G0 ) = G0 . F(k, |.| : k → G0 ) = k, R(k, |.| : k → G0 ) = k, Les symboles 0, 1, + et × indexés par les différentes sortes ont le sens que l’on imagine, de même que la fonction |.| et la relation 6. Quant à res, elle envoie un couple (x, y) fl si |x| 6 |y| et y 6= 0 et sur (disons) 0 sinon. sur (x/y) Remarque 1.3. — Au lieu d’écrire « soit (k, |.| : k → G0 ) un corps valué » nous dirons souvent plus simplement « soit (k, G0 ) un corps valué », et nous identifierons (k, G0 ) à la structure de Lval qu’il définit. Lorsque nous écrirons « soit k un corps valué » sans mentionner explicitement G0 , cela signifiera qu’on s’intéresse au corps valué (k, |k|) ; autrement dit, on voit k comme une structure de Lval dont les sortes sont F(k) = k, ˜ et Γ0 (k) = |k|. R(k) = k, 1.3. Théories Définition 1.4. — Soit L un langage, éventuellement multisorte. Une théorie T dans le langage L est un ensemble d’énoncés de L qui est consistant ; cela signifie qu’il existe une structure M de L dans laquelle tous les énoncés de T sont vrais. On dit qu’une telle structure est un modèle de T . Si M est une structure de L , l’ensemble des énoncés vrais dans M est une théorie, qu’on appelle la théorie de M . Voici maintenant quelques exemples moins triviaux qui sont très fréquemment considérés.

ASTÉRISQUE 352

(1056)

LES ESPACES DE BERKOVICH SONT MODÉRÉS

471

• Dans le langage Lann . La théorie des corps, qui comprend les énoncés de Lann vrais dans n’importe quel corps, comme par exemple ∀x, (x 6= 0) ⇒ (∃y, xy = 1). On définit de même la théorie des corps algébriquement clos, la théorie des corps algébriquement clos de caractéristique fixée, etc. • Dans le langage Lco . La théorie des corps ordonnés ; la théorie des corps réels clos, c’est-à-dire des corps ordonnés R tels que tout élément positif de R soit un carré dans R et tels que tout polynôme de degré impair à coefficients dans R ait une racine dans R. • Dans le langage Lgao . La théorie des groupes abéliens ordonnés ; la théorie des groupes abéliens ordonnés divisibles non triviaux, dite DOAG (divisible ordered abelian groups). • Dans le langage Lval . La théorie des corps valués, qui comprend les énoncés vrais dans toute structure (k, G0 ). Et la théorie des corps non trivialement valués algébriquement clos, dite ACVF (algebraically closed valued fields), qui comprend les énoncés vrais dans tout corps valué et algébriquement clos k tel que |k ∗ | = 6 {1}. Remarque 1.5. — Soit T l’une des théories que l’on vient d’énumérer. On vérifie que les modèles de T sont exactement les structures dont elle porte le nom, car celles-ci sont caractérisées par un ensemble d’énoncés dans le langage concerné ; par exemple, les modèles de ACVF sont exactement les corps non trivialement valués et algébriquement clos. On dit que T élimine les quantificateurs si pour toute formule ϕ(x1 , . . . , xn ) dans le langage L à variables libres x1 , . . . , xn , il existe une formule ψ(x1 , . . . , xn ) dans le langage L à variables libres x1 , . . . , xn et sans quantificateurs telle que ∀(x1 , . . . , xn ),

ϕ(x1 , . . . , xn ) ⇐⇒ ψ(x1 , . . . , xn )

soit un énoncé de T . Lemme 1.6. — Supposons que T élimine les quantificateurs, soit A une structure du langage L , et soient M et M 0 deux modèles de T tels que A ⊆ M et A ⊆ M 0 . Soit Φ un énoncé du langage L à paramètres dans A. Il est alors vrai dans M si et seulement si il est vrai dans M 0 . Démonstration. — Cela résulte de la définition d’une sous-structure si Φ est sans quantificateurs, et l’hypothèse faite sur T permet de se ramener à ce cas. La théorie des corps algébriquement clos, la théorie des corps réels clos, la théorie DOAG et la théorie ACVF éliminent les quantificateurs. C’est pour bénéficier de l’élimination des quantificateurs qu’on a choisi, en définissant ACVF, de se limiter aux corps algébriquement clos non trivialement valués ; en effet, la théorie T des corps

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

472

A. DUCROS

valués algébriquement clos généraux (avec valuation triviale autorisée) dans le langage Lval n’élimine pas les quantificateurs. Pour le voir, fixons un corps algébriquement clos k trivialement valué, et une extension non trivialement valuée et algébriquement close K de k. L’énoncé « ∃x, x 6= 0 et |x| = 6 1 » est alors par construction faux dans k et vrai dans K ; il en résulte en vertu du lemme 1.6 que T n’élimine pas les quantificateurs. 1.4. Ensembles et foncteurs définissables Soit T une théorie dans un langage L dont on note S l’ensemble des sortes ; on suppose que T élimine les quantificateurs. On note Σ(L ) la collection de toutes les structures de L , à laquelle on rajoute l’ensemble vide. Soit A ∈ Σ(L ). On note MA la catégorie des modèles de T tels que A ⊆ M (si A = ∅, on a donc affaire à la catégorie de tous les modèles de T ) ; les morphismes sont les inclusions comme sous-structures. Pour tout S ∈ S , on note S A la restriction de M 7→ S (M ) à MA . Définition 1.7. — Soit M appartenant à MA et soit (n S ) S ∈S une famille d’enQ tiers presque tous nuls. Un sous-ensemble E de S (M )n S (resp. un sous-foncteur D Q nS de S A ) est dit A-définissable s’il existe une formule Φ([x S ] S ) du langage L , à paramètres dans A, en variables libres (x S ) où chaque x S est un n S -uplet de variables de la sorte S , telle que © ¶ Y S (M )n S , Φ([a S ]) E = (a S ) ∈ ¶ © Q (resp. D(N ) = (a S ) ∈ S (N )n S , Φ([a S ]) pour tout N ∈ MA ). Remarque 1.8. — Que N 7→ sulte du lemme 1.6.

¶ © Q (a S ) ∈ S (N )n S , Φ([a S ]) définisse un foncteur ré-

Q Soit E un sous-ensemble A-définissable de S (M )n S et soit E 0 un sous-ensemble Q A-définissable de S (M )m S . Une application f : E → E 0 est dite A-définissable si Q son graphe est une partie A-définissable de S (M )n S +m S . Si f est A-définissable, Q f (E) est un sous-ensemble A-définissable de S (M )m S . Q nS De même, soit D un sous-foncteur A-définissable de S A et soit D0 un sousQ mS foncteur A-définissable de S A . Une transformation naturelle f : D → D0 est dite Q n S +m S A-définissable si son graphe est un sous-foncteur A-définissable de S . Si f Q mS A est A-définissable, f (D) est un sous-foncteur A-définissable de SA . Q Soit E un sous-ensemble A-définissable de S (M )n S , décrit par une formule Φ comme dans la définition 1.7. Le foncteur © ¶ Y S (N )n S , Φ([a S ]) N 7→ (a S ) ∈

ASTÉRISQUE 352

(1056)

LES ESPACES DE BERKOVICH SONT MODÉRÉS

473

Q nS est un sous-foncteur A-définissable de S A . Supposons A 6= ∅. Ce foncteur ne dépend alors que de E, et pas du choix de la formule Φ utilisée pour décrire ce dernier. En effet, si Ψ est une autre formule décrivant E, le fait que Φ et Ψ décrivent le même ensemble au niveau du modèle M se propage en vertu du lemme 1.6 à tout N ∈ MA (c’est ici qu’on utilise le fait que A est non vide : le lemme 1.6 requiert l’existence d’une sous-structure commune aux deux modèles qu’il met en jeu). Il est dès lors licite de noter ce foncteur E. Remarque 1.9. — L’assertion précédente est fausse en général lorsque A = ∅. Par exemple, supposons que T est la théorie des corps algébriquement clos, et soit D (resp. D0 ) le foncteur qui associe à un modèle F de T l’ensemble {x ∈ F, x + 1 = x} (resp. l’ensemble {x ∈ F, x + x = 1}). Les foncteurs D et D0 sont ∅-définissables, et si F est un modèle de T de caractéristique 2, alors D(F ) = D0 (F ) = ∅. Mais D et D0 ne coïncident pas pour autant : si F est un modèle de T de caractéristique différente de 2 alors D(F ) = ∅ et D0 (F ) = {1/2}. Soit M ∈ MA . Notons DA,M la catégorie définie comme suit. • Ses objets sont les couples ((n S ), E) où (n S ) S ∈S est une famille d’entiers presque Q tous nuls, et E un sous-ensemble A-définissable de S (M )n S . • Ses morphismes sont les applications A-définissables. On définit de même la catégorie DA en remplaçant sous-ensembles A-définissables Q Q de S (M )n S par sous-foncteurs A-définissables de S nAS , et applications A-définissables par transformations naturelles A-définissables. Si A est non vide, les flèches E 7→ E et D 7→ D(M ) établissent alors un isomorphisme entre les catégories DA,M et DA . Donnons maintenant quelques exemples. • On suppose que L est le langage des corps ordonnés, et que T est la théorie des corps réels clos. Soit R0 un modèle de T et soient a et b deux éléments de R0 . Le sous-ensemble E := {x ∈ R0 , a 6 x 6 b} de R0 est visiblement définissable sur la sousstructure A := Q(a, b) de R0 . Le foncteur E envoie R ∈ MA sur {x ∈ R, a 6 x 6 b} ; on le note [a; b]. Le foncteur [0; 1] : R 7→ {x ∈ R, 0 6 x 6 1} est défini sur M∅ et est ∅-définissable. • On suppose que L est le langage des corps valués, et que T est égale à ACVF. Soit F0 un modèle de T . – Soient a et b deux éléments de |F0 |. Le sous-ensemble E := {x ∈ |F0 |, a 6 x 6 b} de |F0 | est visiblement définissable sur la sous-structure A := (k0 , h|k0 |, a, bi) de F0 , où k0 est le sous-corps premier de F0 . Le foncteur E envoie un modèle F appartenant à MA sur l’ensemble {x ∈ |F |, a 6 x 6 b} ; on le note [a; b]. Le foncteur [0; 1] : F 7→ {x ∈ |F |, 0 6 x 6 1} est défini sur M∅ et est ∅-définissable.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

474

A. DUCROS

– Soit λ ∈ F et soit r ∈ |F |. Le sous-ensemble E := {y ∈ F, |y − λ| 6 r} est visiblement définissable sur la sous-structure A := (k0 (λ), h|k0 (λ)|, ri) de F0 . Le foncteur E envoie F ∈ MA sur {y ∈ F, |y − λ| 6 r} ; on le note b(λ, r). On dit que c’est la boule fermée de centre λ et de rayon r. On définit de même le foncteur bouv (λ, r) (boule ouverte de centre λ et de rayon r). Les foncteurs b(0, 1) : F 7→ {x ∈ F, |x| 6 1} et bouv (0, 1) : F 7→ {x ∈ F, |x| < 1} sont définis sur M∅ et ∅-définissables. Il arrive fréquemment que l’on dise d’un foncteur covariant h : MA → Ens qu’il est A-définissable. Cela signifie qu’il existe un foncteur D ∈ DA et un isomorphisme de foncteurs h ' D. Le problème est que le foncteur D en question n’a a priori pas de raison d’être canonique, si l’on s’en tient à cette définition. En réalité, à chaque fois que l’on emploiera cette terminologie, le foncteur D sera bien défini, pour une raison simple : on se donnera toujours implicitement un peu plus qu’un foncteur covariant de MA vers Ens, et ces données supplémentaires rigidifieront la situation. Nous allons expliquer ci-après en détail de quoi il retourne. Soit D ∈ DA . Soit B ∈ Σ(L ) telle que A ⊆ B. Le foncteur D définit par restriction un élément de DB , noté DB , et partant un foncteur contravariant HomB (., DB ) de DB dans Ens ; si A ⊆ B ⊆ B 0 , on a une inclusion naturelle HomB (∆, DB ) ⊂ HomB 0 (∆B 0 , DB 0 ) pour tout ∆ ∈ DB . Remarquons par ailleurs que pour tout M ∈ MA , on a D(M ) = HomM ({∗}, DM ), où {∗} est un singleton Q arbitrairement choisi dans un produit S (M )n S quelconque (notons que {∗} est un objet de DM,M ' DM ). Soit CA la catégorie définie comme suit. • Ses objets sont les couples (B, D), où B ∈ Σ(L ), où A ⊂ B, et où D ∈ DB . 0 ) • L’ensemble des morphismes de (B, D) dans (B 0 , D0 ) est l’ensemble HomB (D, DB 0 si B ⊆ B, et est vide sinon. Si D ∈ DA alors (B, ∆) 7→ HomB (∆, DB ) est de façon naturelle un foncteur contravariant de CA vers Ens, noté Hom• (., D• ). On dira qu’un foncteur contravariant h : CA → Ens est A-définissable s’il existe D ∈ DA tel que h soit isomorphe à Hom• (., D• ). Le lemme de Yoneda assure que D est dans ce cas uniquement déterminé. On peut maintenant préciser quelles sont les données implicites évoquées plus haut. Lorsqu’on dira qu’un foncteur covariant h : MA → Ens est A-définissable, il sera sousentendu : – que le foncteur h « se met en familles de façon naturelle », c’est-à-dire qu’il existe un foncteur contravariant h] de CA dans Ens, dont la définition est censée découler clairement du contexte, et des identifications naturelles h(M ) = h] (M, {∗}) pour tout M appartenant à MA ; – que le foncteur h] est A-définissable.

ASTÉRISQUE 352

(1056)

LES ESPACES DE BERKOVICH SONT MODÉRÉS

475

En pratique, la première de ces conditions se produit lorsqu’on s’est donné une classe d’objets C , lorsque h(M ) se décrit comme l’ensemble des objets de C définis sur M , et lorsque la notion de famille B-définissable d’objets de C tombe peu ou prou sous le sens : on définit alors justement h] (B, D) comme l’ensemble des familles B-définissables d’objets de C paramétrées par D. Soit h un foncteur A-définissable, c’est-à-dire un foncteur covariant de MA dans Ens qui est A-définissable au sens ci-dessus. Il existe un objet D ∈ DA , canoniquement déterminé, tel que h ' D. Il en résulte une définition naturelle de sous-ensemble A-définissable de h(M ) pour tout M ∈ MA , de transformation naturelle A-définissable de h vers un autre foncteur A-définissable h0 , etc. Si A 6= ∅ alors pour tout M ∈ MA , tout sous-ensemble A-définissable E de h(M ) induit un sous-foncteur A-définissable E de h ; et les flèches E 7→ E et g 7→ g(M ) mettent en bijection l’ensemble des parties A-définissables de h(M ) et celui des sous-foncteurs A-définissables de h. Si B ∈ Σ(L ) est telle que A ⊆ B, tout foncteur A-définissable h induit par restriction à MB un foncteur B-définissable hB . Donnons maintenant quelques exemples de foncteurs définissables. • On se place dans la théorie des corps algébriquement clos. Soit k un corps et soit X un k-schéma de type fini ; il induit un foncteur k-définissable, encore noté X. • On se place dans la théorie des corps réels clos. Soit k un corps ordonné, et soit X un k-schéma de type fini ; il induit un foncteur k-définissable, encore noté X. Un sous-foncteur U de X est k-définissable si et seulement s’il peut être défini Zariski-localement sur X par une combinaison booléenne d’inégalités entre fonctions régulières. • On se place dans la théorie ACVF. Soit (k, G0 ) un corps valué, et soit X un k-schéma de type fini ; il induit un foncteur k-définissable, encore noté X. Un sousfoncteur U de X(k,G0 ) est (k, G0 )-définissable si et seulement s’il peut être défini Zariski-localement sur X par une combinaison booléenne d’inégalités de la forme |f | o n λ|g|, où f et g sont des fonctions régulières, où λ ∈ G0 et où o n∈ {, 6, >}. • On se place dans la théorie ACVF. Soit (k, G0 ) un corps valué, et soient (ai )16i6n et (bi )16i6n deux familles finies d’éléments de G0 . Le foncteur qui envoie F ∈ M(k,G0 ) sur ! a {x ∈ |F |, min(ai , bi ) 6 x 6 max(ai , bi )} /R i

où R identifie pour tout i 6 n − 1 l’élément bi du i-ème sommande avec l’élément ai+1 du (i + 1)-ème sommande, est (k, G0 ) définissable. On appelle un tel foncteur un segment généralisé ; le foncteur singleton F 7→ {a1 } (resp. F 7→ {bn }) est appelé son origine (resp. extrémité).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

476

A. DUCROS

En s’autorisant à identifier origines et/ou extrémités de plus de deux segments, on définit de même des foncteurs (k, G0 )-définissables appelés graphes finis, dont certains sont des arbres. Nous laissons au lecteur le soin d’en donner des définitions précises. Remarque 1.10. — Soit D un foncteur G0 -définissable dans la théorie DOAG. Le foncteur D ◦ Γ0 : F 7→ D(|F |) est alors un foncteur (k, G0 )-définissable dans la théorie ACVF. On vérifie que l’application ∆ 7→ ∆ ◦ Γ0 établit une bijection entre l’ensemble des sous-foncteurs G0 -définissables de D et celui des sous-foncteurs (k, G0 ) définissables de D ◦ |.| . En bref, la trace de la théorie ACVF sur la sorte Γ0 coïncide avec la théorie DOAG. De même, la trace de la théorie ACVF sur la sorte « corps résiduel » coïncide avec la théorie des corps algébriquement clos. Remarque 1.11. — On prendra garde qu’un segment généralisé n’est pas, en général, définissablement isomorphe à un segment F 7→ {x ∈ |F |, a 6 x 6 b}. Le lecteur ` vérifiera par exemple que la concaténation [0; 1] [0; 1] (qui est ∅-définissable) ne 1=0

peut pas être identifiée à un segment, car le langage autorisé pour une telle identification est Lgao (cf. la remarque 1.10 ci-dessus), qui comprend simplement la relation d’ordre et la multiplication. Par contre, une concaténation de segments à extrémités non nulles est encore (définissablement isomorphe à) un segment. 1.5. Élimination des imaginaires ; le langage des corps valués de Haskell, Hrushovski et Macpherson Références : nous renvoyons le lecteur à l’ouvrage [14], ainsi qu’aux transparents d’exposé d’Ehud Hrushovski ([16]). On conserve les notations de la section précédente. Soit D un foncteur A-définissable. On dira qu’un sous-foncteur R de D × D est une relation d’équivalence A-définissable si R est A-définissable et si R(M ) est pour tout M ∈ MA le graphe d’une relation d’équivalence sur D(M ). Le foncteur quotient D/R est alors bien défini. Définition 1.12. — On dit que la théorie T élimine les imaginaires dans le langage L si pour toute A ∈ Σ(L ), pour tout foncteur A-définissable D et toute relation d’équivalence A-définissable R ⊂ D × D, le quotient F/R est A-définissable (la flèche quotient F → F/R est alors automatiquement A-définissable). Remarque 1.13. — Pour que T élimine les imaginaires, il suffit que la condition cidessus soit vérifiée lorsque A = ∅ : cela provient du fait qu’en général, toute relation d’équivalence A-définissable peut être vue, en « faisant varier les paramètres », comme une spécialisation d’une relation ∅-définissable.

ASTÉRISQUE 352

(1056)

LES ESPACES DE BERKOVICH SONT MODÉRÉS

477

La théorie des corps algébriquement clos ou celle des corps réels clos éliminent les imaginaires, mais ce n’est pas le cas de ACVF : on peut montrer que le foncteur quotient F 7→ GL2 (F )/GL2 (F ◦ ) (autrement dit, le foncteur « espace des réseaux du plan »), défini sur M∅ , n’est pas ∅-définissable. Notons par contre que F 7→ GL1 (F )/GL1 (F ◦ ) est isomorphe à F 7→ |F ∗ |, et est donc ∅-définissable. Il existe un procédé standard pour enrichir le langage L de façon à forcer la théorie T à éliminer les imaginaires : il consiste à rajouter, pour toute famille (n S ) Q nS d’entiers presque tous nuls, tout sous-foncteur ∅-définissable D de S ∅ et toute relation d’équivalence ∅-définissable R ⊂ D × D définissable sans paramètres, une sorte « quotient de D par R » et un symbole fonctionnel « application quotient de D vers D/R ». Ce langage étendu L ∗ possède les propriétés suivantes : • si A ∈ Σ(L ), si M ∈ MA et si D est un foncteur A-définissable, un sousfoncteur de D (resp. un sous-ensemble de D(M )) est A-définissable au sens de L ∗ si et seulement si il l’est au sens de L ; • le lemme 1.6 est encore valable pour L ∗ ; • la théorie T élimine les imaginaires dans le langage L ∗ . Par contre, la théorie T n’élimine plus nécessairement les quantificateurs dans le langage L ∗ . On peut y remédier sans modifier l’ensemble des sortes, ni la notion de foncteur ou de sous-ensemble A-définissable : il suffit de rajouter, au langage L ∗ , pour toute formule (quantifiée) Φ de L∗ en les variables libres (x1 , . . . , xn ), un symbole de relation n-aire σΦ , que l’on interprète dans un modèle M de T en disant que σΦ (m1 , . . . , mn ) ⇐⇒ Φ(m1 , . . . , mn ). Si le langage ainsi obtenu a un intérêt théorique, il n’est en général pas forcément très explicite ni très maniable, étant donnée la profusion de sortes supplémentaires introduites. Aussi cherche-t-on, lorsque c’est possible, à mettre en évidence un ensemble limité de quotients tel que l’adjonction des sortes et symboles fonctionnels correspondants suffise à rendre définissables tous les quotients. C’est ce que Haskell, Hrushovski et Macpherson ont fait dans [15] à propos de la théorie ACVF. Ils ont démontré que pour qu’elle élimine les imaginaires, il suffit de rajouter au langage Lval les sortes et symboles fonctionnels suivants, où GLn (resp. GL◦n , resp. GL◦◦ n ) désigne le foncteur qui envoie un modèle F de ACVF sur GLn (F ) (resp. GLn (F ◦ ), resp. In + F ◦◦ Mn (F ◦ )) : • pour tout n > 0, une sorte S n pour le quotient GLn /GL◦n , et un symbole fonctionnel ρn codant l’application quotient correspondante ; • pour tout entier n > 0, une sorte T n pour le quotient GLn /GL◦◦ n , et un symbole ◦◦ fonctionnel τn codant l’application quotient GLn /GLn → GLn /GL◦n .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

478

A. DUCROS

Remarque 1.14. — Soit F un modèle de ACVF. On peut identifier naturellement S n (F ) à l’espace des réseaux de F n , et T n (F ), via l’application τn , à l’espace total du « fibré des bases » d’un certain « fibré vectoriel » sur S n (F ) ; plus précisément, la ˜ fibre de τn en un point correspondant à un réseau Λ est l’espace des bases du Λ-espace ◦◦ vectoriel Λ/F Λ. ∗ Appelons Lval le langage des corps valués enrichi par les sortes S n et T n et les symboles ρn et τn , et convenablement étendu de façon à assurer l’élimination des quantificateurs(5). C’est désormais avec lui que nous travaillerons, et l’acronyme ACVF désignera à partir de maintenant la théorie des corps non trivialement valués et al∗ gébriquement clos dans le langage Lval . Cette nouvelle version de ACVF élimine par construction les quantificateurs et les imaginaires. Le foncteur des boules fermées B de M∅ vers Ens qui associe à un corps F ∈ M∅ l’ensemble {b(λ, r)F }λ∈F,r∈|F | est ∅-définissable ; en effet, il se décrit simplement, comme on l’a vu dans l’introduction(6), à partir d’un quotient de deux foncteurs en groupes ∅-définissables dans le langage classique Lval . On vérifie sans peine que si F ∈ M∅ , l’application de F × |F | vers B(F ) qui envoie (λ, r) sur b(λ, r)F est ∅-définissable.

2. TYPES Références : pour ce qui concerne les types, nous renvoyons le lecteur aux premiers chapitres de l’article étudié [17], à l’ouvrage [14], et aux transparents d’exposés de Hrushovski ([16]). 2.1. Généralités On fixe un langage L et une théorie T dans le langage L ; on suppose que T élimine les quantificateurs. Soit A une structure de L , et soit D un foncteur A-définissable. Soient N et N 0 deux objets de MA . Soit x ∈ D(N ) et soit x0 ∈ D(N 0 ). On dit que (N, x) et (N 0 , x0 ) sont A-équivalents si pour tout sous-foncteur A-définissable ∆ de D, on a x ∈ ∆(N ) ⇐⇒ x0 ∈ ∆(N 0 ) (autrement dit, x et x0 ne sont pas discernables par une formule à paramètres dans A). Un type sur D est une classe de A-équivalence de couples (N, x) comme ci-dessus. Si (5)

Nous avons expliqué ci-dessus comment atteindre ce dernier objectif par adjonction d’un ensemble de symboles relationnels. Celui-ci peut sembler absolument gigantesque, et peu tangible. Mais dans loc. cit., Haskell, Hrushovski et Macpherson exhibent un ensemble explicite et de taille raisonnable de tels symboles qui s’avère suffisant. (6) Dans l’introduction, on travaillait au-dessus d’une structure A particulière, mais celle-ci ne jouait aucun rôle dans la description évoquée.

ASTÉRISQUE 352

(1056)

LES ESPACES DE BERKOVICH SONT MODÉRÉS

479

t est la classe de (N, x), on dira que x réalise le type t. Soit t un type sur D et soit x une réalisation de t, appartenant à un modèle N . Soit ∆ un sous-foncteur A-définissable de D. L’appartenance ou non de x à ∆(N ) ne dépend que de t ; si elle est avérée, on dira que t est situé sur ∆. Il n’y a pas de conflit de terminologie : le couple (N, x) définit justement dans ce cas sans ambiguïté un type sur ∆. Notons que le type t est par définition caractérisé par l’ensemble des sous-foncteurs A-définissables de D sur lesquels il est situé. On note S(D) l’ensemble(7) des types sur D. Soit D0 un foncteur A-définissable et soit f : D → D0 une transformation naturelle définissable. Soit t ∈ S(D) et soit x une réalisation de t ; son image f (x) induit un type sur D0 qui ne dépend que de t, et que l’on note f (t). Supposons que A soit un modèle de T . Si x ∈ D(A) il définit un type sur D (dont il est une, et même la seule, réalisation) ; un tel type est qualifié de simple. Donnons maintenant quelques exemples plus intéressants. (1) On suppose que L = Lann , et que T est la théorie de corps algébriquement clos. Soit F un corps et soit X un F -schéma de type fini ; on peut le voir comme un foncteur F -définissable. Soit x un point du schéma X et soit F 0 une extension algébriquement close du corps résiduel F (x). Le point x définit un point de X(F 0 ), et partant un type sur X. Cette construction induit une bijection entre l’ensemble sous-jacent au schéma X et S(X). À titre d’illustration, supposons que X est intègre, et soit x son point générique. Le type correspondant est alors caractérisé par le fait qu’il n’est situé sur aucun fermé de Zariski strict de X. (2) On suppose que L = Lco , et que T est la théorie des corps réels clos. Soit R un corps ordonné, et soit X un R-schéma de type fini ; on peut le voir comme un foncteur R-définissable. Rappelons que le spectre réel Xr de X est l’ensemble des couples (x, 6) où x est un point du schéma X et 6 un ordre sur le corps résiduel R(x) prolongeant l’ordre sur R. Soit ξ = (x, 6) un point de Xr et soit R0 la clôture réelle de (R(x), 6). Le point x définit un point de X(R0 ), et partant un type sur X. Cette construction induit une bijection entre l’ensemble Xr et S(X). À titre d’illustration, supposons que X = A1R , et soit u la fonction coordonnée sur X. Munissons R(u) de l’ordre tel que u > 0 et u < ε pour tout élément ε > 0 de R. On définit par ce biais un point de Xr , supporté par le point générique de X. Le type correspondant est noté 0+ R ; il est caractérisé par le fait qu’il est situé sur ]0; ε[R pour tout élément ε > 0 de R. Soit F l’ensemble des sous-foncteurs A-définissables de D (qui s’identifie, rappelons-le, à l’ensemble des parties A-définissables de D(M ) pour tout M ∈ MA ). On peut par ce qui précède voir un type sur D comme une application de F vers {0, 1} ; par conséquent, S(D) est bien un ensemble.

(7)

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

480

A. DUCROS

∗ (3) On suppose que L = Lval , et que T est la théorie ACVF. Soit F un corps valué, et soit X un F -schéma de type fini ; on peut le voir comme un foncteur F -définissable. Rappelons que le spectre valuatif Xv de X est l’ensemble des couples (x, |.|) où x est un point du schéma X et |.| une valuation sur le corps résiduel F (x), qui prolonge la valuation de F . Soit ξ = (x, |.|) un point de Xv et soit F 0 une extension non trivialement valuée et algébriquement close de (F (x), |.|). Le point x définit un point de X(F 0 ), et partant un type sur X. Cette construction induit une bijection entre l’ensemble Xv et S(X).

À titre d’illustration, supposons que X = A1F , et soit u la fonction coordonnée sur X. Soit λ ∈ F et soit r ∈ |F |. Munissons F (u) de la valuation |.| telle que l’on P P ait | ai (u − λ)i | = max|ai |ri pour tout polynôme ai (u − λ)i à coefficients dans F . On définit par ce biais un point de Xv , supporté par le point générique de X ; on note ηλ,r,F le type correspondant. Si F est un modèle de ACVF, le type ηλ,r,F est caractérisé par le fait qu’il est situé sur b(λ, r)F , mais qu’il n’est situé sur aucune boule fermée ou ouverte F -définissable contenue strictement dans b(λ, r)F ; il s’ensuit aisément que ηλ,r,F = ηµ,s,F si et seulement si b(λ, r)F = b(µ, s)F . On appelle parfois ηλ,r,F le type générique de b(λ, r)F . Supposons que r > 0. Donnons-nous maintenant un groupe abélien ordonné contenant |F ∗ | ainsi qu’un élément ω de ce groupe tel que ω < 1 et α < ω pour tout α ∈ P |F ◦◦ |. Munissons F (u) de la valuation |.| telle que l’on ait | ai (u−λ)i | = max|ai |ri ω i P pour tout polynôme ai (u − λ)i à coefficients dans F . On définit par ce biais un point de Xv , supporté par le point générique de X ; on note ηλ,r− ,F le type correspondant. Lorsque F est un modèle de ACVF, le type ηλ,r− ,F est caractérisé par le fait qu’il est situé sur bouv (λ, r)F mais qu’il n’est situé sur aucune boule fermée β ∈ B(F ) contenue dans bouv (λ, r)F ; il s’ensuit aisément que ηλ,r− ,F = ηµ,s− ,F si et seulement si bouv (λ, r)F = bouv (µ, s)F . On appelle parfois ηλ,r− ,F le type générique de bouv (λ, r)F . ∗ (4) On travaille toujours avec le langage Lval ; soit k un corps ultramétrique complet. Soit X un k-schéma de type fini ; on peut le voir comme un foncteur k-définissable. Rappelons que l’analytifié X an de X (au sens de Berkovich) est l’ensemble des couples (x, |.|) où x est un point du schéma X et où |.| est une valeur absolue ultramétrique sur le corps résiduel k(x). Soit ξ = (x, |.|) un point de X an et soit k 0 une extension ultramétrique non trivialement valuée et algébriquement close de (k(x), |.|). Le point x définit un point de X(k 0 ), et partant un type sur X qui est ultramétrique, au sens où il admet une réalisation dans un modèle ultramétrique de ACVF. Cette construction induit une bijection entre l’ensemble X an et l’ensemble des types ultramétriques situés sur X.

ASTÉRISQUE 352

(1056)

LES ESPACES DE BERKOVICH SONT MODÉRÉS

481

2.2. Topologies sur les espaces de types On conserve les notations L et T introduites au début de 2.1. Soit A une structure de L et soit D un foncteur A-définissable. On munit S(D) de la topologie dont une base d’ouverts est constituée des S(∆), où ∆ parcourt l’ensemble des sous-foncteurs A-définissables de D. Reprenons l’exemple (1) de 2.1. L’ensemble S(X) s’identifie au schéma X. La topologie sur X déduite de celle de S(X) est alors la topologie constructible (celle qui est engendrée par les ouverts et les fermés de Zariski). Reprenons l’exemple (2) de 2.1. On a vu que S(X) s’identifie au spectre réel Xr de X. La topologie sur Xr déduite de celle de S(X) est alors la topologie constructible (celle qui est engendrée Zariski-localement par les combinaisons booléennes d’inégalités strictes ou larges entre fonctions régulières). La topologie ainsi définie sur S(D) a l’avantage d’en faire un espace topologique compact (nous discuterons cette propriété plus avant un peu plus bas). Elle a l’inconvénient de faire de tout définissable un ouvert, indépendamment de la nature de la formule qui le décrit. Dans certaines circonstances, où l’on estime que certaines formules « doivent » être ouvertes et d’autres non, on peut donc être amené à introduire une topologie alternative en prenant pour base d’ouverts les S(∆), pour ∆ parcourant un certain sous-ensemble de l’ensemble des sous-foncteurs A-définissables de D. Reprenons l’exemple (1) de 2.1. L’ensemble S(X) s’identifie au schéma X. On peut munir S(X) de la topologie engendrée par les S(∆), où ∆ est un ouvert de Zariski de X. La topologie ainsi définie sur S(X) correspond évidemment à la topologie de Zariski de X. Reprenons l’exemple (2) de 2.1. On a vu que S(X) s’identifie au spectre réel Xr de X. On peut munir S(X) de la topologie engendrée par les S(∆), où ∆ est défini Zariski localement par combinaison booléenne positive d’inégalités strictes entre fonctions régulières. La topologie sur Xr à laquelle elle correspond est la topologie usuelle du spectre réel. 2.3. Digression sur la compacité La compacité des espaces de type joue un rôle majeur en théorie des modèles en général, et chez Hrushovski et Loeser en particulier, où elle intervient à maints endroits — même si cela n’apparaîtra guère dans ce texte, où nous nous contenterons de brosser très grossièrement les preuves. Le plus souvent, elle s’utilise sous la forme du principe suivant, à l’énoncé volontairement vague : si P est une propriété à l’énoncé raisonnable dans le langage L , il revient au même de la démontrer en situation relative sur un modèle M donné ou en situation absolue sur tous les modèles M 0 tels que M ⊆ M 0 . C’est ce qui explique qu’il puisse être nécessaire, même si l’on s’intéresse

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

482

A. DUCROS

à un modèle M bien défini, de travailler sur des modèles éventuellement beaucoup plus gros. Nous allons étayer notre propos à travers deux exemples. Le premier concerne la trivialisation constructible d’un faisceau cohérent. Soit F un corps et soit X un F -schéma de type fini. Soit F un faisceau cohérent sur X. Il existe alors une partition constructible finie et localement fermée (Xi ) de X telle que F |Xi soit libre pour tout i (où Xi est muni de sa structure réduite). En effet, si x est un point du schéma X alors F ⊗ F (x) est libre (c’est la forme absolue du résultat à établir, sur le corps F (x)), et cette propriété se propage au-dessus d’un ouvert de Zariski non vide de {x}red ; on conclut en invoquant la compacité de X pour la topologie constructible — ou une récurrence noethérienne si l’on préfère, ce qui revient au même. On voit que si l’on s’était contenté de ne considérer que des F -points de X, on n’aurait pas pu aboutir même si F est algébriquement clos : si x ∈ X(F ), la liberté de F ⊗ F (x) n’a aucune raison a priori de se propager au-delà du singleton constructible {x}. Le second concerne le théorème de Hardt ; nous allons donner les grandes lignes de la preuve qu’en ont proposée Jacek Bochnak, Michel Coste et Marie-Françoise Roy ([7], th. 9.3.1) ou disons plutôt d’une traduction de celle-ci dans le langage des types (ils utilisent quant à eux celui du spectre réel). Soit R un corps réel clos, et soient Y ⊂ AnR et X ⊂ Am R deux foncteurs R-définissables dans le langage des corps ordonnés (on dit aussi qu’ils sont semi-algébriques). Soit f : Y → X une transformation naturelle R-définissable. On la suppose continue dans le sens suivant : pour tout corps réel clos R0 contenant R, l’application f (R0 ) : Y (R0 ) → Y (R0 ) est continue pour les topologies déduites de l’ordre sur R0 (il suffit en vertu du lemme 1.6 de le tester sur un tel corps R0 , par exemple sur R). Il existe alors une partition finie et R-définissable (Xi ) de X et, pour tout i, un sous-foncteur R-définissable Zi de AnR telle que f −1 (Xi ) soit R-définissablement homéomorphe à Zi × Xi . En effet, soit t ∈ S(X) et soit x une réalisation de t, appartenant à X(R0 ) pour un certain corps réel clos R0 contenant R. 0 n La fibre fR−1 0 (x) est un sous-foncteur R -définissable de AR0 , et possède à ce titre une triangulation R0 -définissable(8). L’ensemble simplicial correspondant admettant m une réalisation dans Am S , il en admet une, disons Z, dans AR (par le lemme 1.6). Par −1 conséquent, il existe un homéomorphisme R0 -définissable fR0 (x) ' ZR0 (c’est la forme absolue du résultat à établir, sur le corps réel clos R0 ). Cette propriété se propage : il existe un sous-foncteur R-définissable T de X tel que t ∈ S(T ) et tel que f −1 (T ) (8)

Cela signifie qu’elle s’identifie à une union finie de cellules ouvertes d’un complexe simplicial (elle n’est pas forcément fermée bornée) ; l’expression « ensemble simplicial » que nous employons ensuite fait référence à la donnée combinatoire de ces cellules ouvertes.

ASTÉRISQUE 352

(1056)

LES ESPACES DE BERKOVICH SONT MODÉRÉS

483

soit R-définissablement homéomorphe à Z × T . On conclut en utilisant la compacité de S(X). On voit que si l’on s’était contenté de ne considérer que des R-points, on n’aurait pas pu aboutir : le type d’homéomorphie semi-algébrique de la fibre en un tel point x n’a aucune raison a priori de se propager au-delà du singleton {x}. Remarque 2.1. — Soit M un modèle de T , et soit D un foncteur M -définissable. Soit x ∈ S(D), et soit Ex l’ensemble des sous-foncteurs M -définissables de D sur lesquels x est situé. L’ensemble Ux des parties M -définissables de D(M ) de la forme ∆(M ), où ∆ ∈ E , est un ultra-filtre de parties M -définissables. Réciproquement, il résulte de la compacité de S(D) que tout ultrafiltre de parties M -définissables de D(M ) est de la forme Ux pour un certain x ∈ S(D) (nécessairement unique par définition d’un type). 2.4. Types définissables On conserve les notations L et T introduites au début de 2.1. Définition 2.2. — Soit M un modèle de T , soit D un foncteur M -définissable et soit t ∈ S(D). On dit que t est M -définissable s’il possède la propriété suivante : pour tout foncteur M -définissable D0 et tout sous-foncteur M -définissable ∆ ⊂ D × D0 , le sous-ensemble de D0 (M ) formé des points x tels que t soit situé sur ∆ ×D0 {x} ⊂ D est M -définissable. Donnons quelques exemples et contre-exemples. • Plaçons-nous dans la théorie des corps algébriquement clos, et soit D un foncteur F -définissable pour un certain corps algébriquement clos F . Tout type sur D est alors F -définissable. • Plaçons-nous dans la théorie des corps réels clos et soit R un corps réel clos. Le type 0+ R défini à la fin de l’exemple (2) de 2.1 est R-définissable. Cela provient essentiellement du fait suivant. Soit f ∈ R(u) et soit D le sous-foncteur de A1R défini par la condition f o n 0, où o n est un symbole appartenant à {, 6, >}. Le type 0+ R est alors situé sur D si et seulement si il existe ε > 0 dans R tel que f (x) o n 0 pour tout x tel que 0 < x < ε, et cette condition s’exprime visiblement par une formule de Lco à paramètres dans R et portant sur les coefficients de f . • Plaçons-nous dans la théorie ACVF et soit F un modèle de celle-ci. Les types ηλ,r,F et ηλ,r− ,F définis à l’exemple (3) de 2.1 sont F -définissables : cela résulte es∗ sentiellement de leurs descriptions par des formules de Lval à paramètres dans F . • Plaçons-nous dans la théorie des corps réels clos, et soit R0 la fermeture algébrique de Q dans R (c’est un corps réel clos). Le nombre réel π ∈ A1 (R) définit un type sur

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

484

A. DUCROS

A1R0 ; il n’est pas R0 -définissable : si f ∈ R0 (u), le signe de f (π) ne s’exprime pas par une formule de Lco à paramètres dans R0 en les coefficients de f . • On reste dans la théorie des corps réels clos. On se donne un corps réel clos R contenant strictement R (il existe alors dans R un élément supérieur à tout réel positif). Munissons R(u) de l’ordre pour lequel un élément f est strictement positif si et seulement si il existe N ∈ N tel que f (x) soit strictement positif pour tout x appartenant à R et strictement supérieur à N . On définit ainsi un point du spectre réel de A1R , et partant un type sur A1R . Ce type n’est pas R-définissable ; cela résulte essentiellement du fait que R n’est pas une partie R-définissable de R. Restriction des types, extension des types définissables. Soit M un modèle de T , soit D un foncteur M -définissable, et soit M 0 ∈ MM . Soit θ un type sur DM 0 . Si x désigne une réalisation de θ, alors x induit un type sur D, qui ne dépend que de θ, et pas du choix de x ; on dispose ainsi d’une application naturelle S(DM 0 ) → S(D), parfois dite de restriction au modèle M . Soit maintenant t un type M -définissable situé sur D. Il existe alors un antécédent canonique t0 de t sur S(DM 0 ) qui est M 0 -définissable (on dit que c’est l’extension canonique de t au modèle M 0 ) ; grossièrement, le type t0 est défini par les mêmes formules que t. Plus précisément, soit ∆ un sous-foncteur M 0 -définissable de DM 0 . En « faisant varier les paramètres de la formule qui définit ∆ », on montre l’existence d’un foncteur M -définissable D1 , d’un sous-foncteur M -définissable D2 de D × D1 , et d’un point x ∈ D1 (M 0 ) tel que ∆ = D2,M 0 ×D1,M 0 {x}. Le type t étant M -définissable, il existe un sous-foncteur M -définissable D3 de D1 tel que pour tout y ∈ D1 (M ), le point y appartienne à D3 (M ) si et seulement si t est situé sur D2 ×D1 {y}. Le type t0 est alors situé sur ∆ si et seulement si x ∈ D3 (M 0 ). Donnons maintenant quelques exemples d’extension canonique. • Si x ∈ D(M ) il définit un type simple t sur D ; l’extension canonique de t au modèle M 0 est le type simple sur DM 0 associé à x ∈ D(M ) ⊂ D(M 0 ). • On reprend les notations de l’exemple (1) de 2.1, en supposant que F est algébriquement clos. Soit F 0 une extension algébriquement close de F , soit t ∈ S(X), et soit t0 ∈ S(XF 0 ) son extension canonique. Le type t correspond à un point x du schéma X. Le fermé de Zariski {x}F 0 de XF 0 est irréductible (car F est algébriquement clos). Son point générique x0 est précisément le point du schéma XF 0 qui correspond à t0 . • On reprend les notations de l’exemple (2) de 2.1 en supposant que R est réel clos. Soit R0 une extension réelle close de R. L’extension canonique du type 0+ R au modèle R0 est le type 0+ . 0 R

ASTÉRISQUE 352

(1056)

LES ESPACES DE BERKOVICH SONT MODÉRÉS

485

• On reprend les notations de l’exemple (3) de 2.1 en supposant que F est un modèle de ACVF. Soit F 0 une extension valuée algébriquement close de F . L’extension canonique du type ηλ,r,F (resp. ηλ,r− ,F ) au modèle F 0 est le type ηλ,r,F 0 (resp. ηλ,r− ,F 0 ). Terminons ce paragraphe en mentionnant que si f : D → D0 est une transformation naturelle M -définissable entre deux foncteurs M -définissables, et si t est un type M -définissable sur D, alors le type image f (t) est M -définissable. 2.5. Topologies définissables ; compacité définissable On conserve les notations L et T introduites au début de 2.1. Soit A une structure de T , et soit D un foncteur A-définissable. Une topologie définissable T sur D consiste en la donnée, pour tout M ∈ MA , d’une famille TM de sous-foncteurs M -définissables de DM , que l’on appelle les ouverts M -définissables de DM , possédant les propriétés suivantes(9) : • la famille TM est stable par intersections finies ; S • si (Ui ) est une famille d’éléments de TM telle que Ui (M ) = V (M ) pour un certain sous-foncteur M -définissable V de DM alors V ∈ TM ; • si M ⊆ M 0 et si U est un sous-foncteur M -définissable de DM alors U ∈ TM si et seulement si UM 0 ∈ TM 0 . Soit T une topologie définissable sur D. Elle induit pour tout M une topologie T (M ) sur D(M ), à savoir celle engendrée par les U (M ) pour U parcourant TM . Lorsque M ⊆ M 0 , la topologie T (M ) est plus grossière (et, en général, strictement plus grossière) que la topologie induite par celle T (M 0 ). Si B est une structure telle que A ⊆ B, on dira qu’un sous-foncteur B-définissable U de DB est un ouvert B-définissable si UM est un ouvert définissable de DM pour tout M ∈ MB — il suffit que ce soit le cas pour un tel M . Si D0 est un foncteur A-définissable muni d’une topologie définissable T 0 , une transformation naturelle A-définissable f : D → D0 est dite continue si pour tout M ∈ MA et tout U ∈ TM0 , le foncteur f −1 (U ) appartient à TM . Il revient au même de demander que f (M ) : D(M ) → D0 (M ) soit continue pour tout modèle M ∈ MA . Soit M ∈ MA , soit t un type sur DM et soit x ∈ D(M ). On dit que x adhère à t si pour tout U ∈ TM tel que x ∈ U (M ), le type t est situé sur U . On dira que D est définissablement compact si pour tout M ∈ MA et tout type M -définissable t sur DM , il existe un unique x ∈ D(M ) qui est adhérent à t. Cela revient en quelque sorte à demander que « tout ultra-filtre M -définissable de parties M -définissables de D(M ) converge », cf. rem. 2.1. (9)

On impose également des conditions de finitude très raisonnables sur lesquelles nous ne nous étendrons pas ici.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

486

A. DUCROS

Si D est définissablement compact et si ∆ est un sous-foncteur A-définissable de D, alors ∆ est un fermé A-définissable (i.e. le complémentaire d’un ouvert A-définissable) si et seulement si il est définissablement compact. Exemple 2.3. — On se place dans la théorie des corps réels clos. Soit R0 un corps réel clos et soit X un R0 -schéma de type fini. Pour tout corps réel clos R contenant R0 , notons TR la famille des sous-foncteurs R-définissables de XR définis Zariskilocalement sur XR par une combinaison booléenne positive d’inégalités strictes entre fonctions régulières. La donnée des TR constitue une topologie définissable sur X et en induit une, par restriction, sur tout sous-foncteur R0 -définissable de X. Si R est un corps réel clos contenant R0 , la topologie T (R) sur X(R) est celle déduite de la topologie de corps ordonné de R. Remarquons que si R0 est un corps réel clos contenant R et s’il existe un élément strictement positif ε de R0 qui est inférieur à x pour tout x > 0 dans R, la topologie de X(R) induite par T (R0 ) est la topologie discrète : en effet, pour tout x ∈ R on a {x} = {y ∈ R0 , −ε < y − x < ε}. Si X = AnR0 et si Y est un sous-foncteur R-définissable de X alors Y est définissablement compact si et seulement si il est fermé (autrement dit, X \ Y ∈ TR0 ) et borné, c’est-à-dire contenu dans [−x; x]nR0 pour un certain x > 0 dans R0 . Donnons un exemple de point adhérent à un type. On suppose maintenant que X est égal à A1R0 . Le point 0 ∈ A1 (R0 ) = R0 est alors adhérent au type 0+ R0 (et c’est le seul point de R0 dans ce cas). On voit ainsi pourquoi ]0; 1[R0 n’est pas définissablement + compact : 0+ R0 est situé sur ]0; 1[R0 , mais aucun R0 -point de ce dernier n’adhère à 0R0 . Insistons à ce propos sur l’importance, pour la compacité définissable, de se limiter à manipuler des types définissables. Pour s’en convaincre, il suffit de considérer le cas où R0 est la fermeture algébrique de Q dans R. Le sous-foncteur R0 -définissable [0; 4]R0 de A1R0 est définissablement compact. Le nombre réel π induit un type t sur [0; 4]R0 qui n’est pas R0 -définissable... et de fait, aucun R0 -point de [0; 4]R0 n’adhère à t. 2.6. Types stablement dominés ; le cas de ACVF Commençons par une remarque, qui sera implicitement utilisée dans toute la suite du texte. Soit F un modèle de ACVF, et soit D un foncteur |F |-définissable dans la théorie des groupes abéliens divisibles ordonnés non triviaux (resp. un foncteur F˜ -définissable dans la théorie des corps algébriquement clos). Soit D0 le foncteur qui ˜ Il résulte alors de la remarque 1.10 qu’il existe envoie L ∈ MF sur D(|L|) (resp. D(L)). une bijection canonique S(D) ' S(D0 ), et qu’un type sur D0 est F -définissable si et seulement si le type correspondant sur D est |F |-définissable (resp. F˜ -définissable). Venons-en maintenant à la stabilité. Il n’est pas question de donner des définitions précises en la matière ; nous renvoyons le lecteur intéressé à l’ouvrage [14] de Haskell,

ASTÉRISQUE 352

(1056)

LES ESPACES DE BERKOVICH SONT MODÉRÉS

487

Hrushovski et Macpherson. Nous allons nous contenter de quelques explications très sommaires. 1) Il existe différentes définitions équivalentes d’une théorie stable. L’une d’elles consiste à exiger « qu’elle ne contienne pas d’ensemble ordonné infini » ; une autre requiert que pour tout modèle M et tout foncteur M -définissable D, le cardinal de S(DM 0 ) croisse raisonnablement en fonction de celui du modèle M 0 ⊇ M . La théorie des corps algébriquement clos est stable. La théorie des groupes abéliens divisibles ordonnés non triviaux, la théorie des corps réels clos et la théorie ACVF ne sont pas stables : chacune d’elles « contient un ensemble ordonné infini ». 2) Une théorie T possède toutefois une sorte de « plus grande sous-théorie stable » Tstab . Si T est la théorie des groupes abéliens divisibles ordonnés non triviaux, Tstab ne voit que les foncteurs définissables finis (c’est-à-dire dont l’ensemble des points à valeur dans un modèle donné, et donc dans tout modèle, est fini). Si T = ACVF, la théorie Tstab est essentiellement la théorie de la sorte « corps résiduel » (qui s’identifie à celle des corps algébriquement clos). 3) Un type définissable dans une théorie T est dit stablement dominé s’il est déterminé par sa trace sur la plus grande sous-théorie stable de T . Un type simple est toujours stablement dominé. La réciproque est parfois vraie. Ainsi, si T est la théorie des groupes abéliens divisibles ordonnés non triviaux, et si D est un foncteur M -définissable pour un certain modèle M de T , un type stablement dominé sur D est un type M -définissable t qui doit être caractérisé par f (t) pour une certaine transformation naturelle M -définissable de D vers un foncteur M -définissable fini D0 ; il n’est pas difficile de voir que cela équivaut à demander que t soit simple. La théorie des types stablement dominés est donc triviale dans la théorie T . Il n’en va pas de même dans la théorie ACVF. Donnons un exemple de type stablement dominé qui n’est pas simple. On fixe un modèle F . On dispose d’une transformation naturelle F -définissable ρ de b(0, 1)F vers A1F˜ (la réduction modulo l’idéal maximal). Soit t ∈ S(b(0, 1)F ). On vérifie aisément que t = η0,1,F si et seulement si ρ(t) est le type correspondant au point générique de A1F˜ . Comme A1F˜ « appartient » à ACVFstab , le type η0,1,F est contrôlé par sa trace sur ACVFstab , et est dès lors stablement dominé. En fait, on dispose dans la théorie ACVF d’un critère permettant de décider si un type définissable est stablement dominé, que nous allons maintenant énoncer ; on rappelle que Γ0 désigne le foncteur F 7→ |F |. Proposition 2.4. — Soit F un modèle de ACVF, soit D un foncteur F -définissable et soit t un type F -définissable sur D. Le type t est stablement dominé si et seulement si il est orthogonal à Γ0 , c’est-à-dire si pour tout modèle F 0 ⊇ F et toute transformation naturelle F 0 -définissable f : DF 0 → Γ0,F 0 , le type image f (t) est simple.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

488

A. DUCROS

Remarque 2.5. — Supposons que D soit un sous-foncteur d’un F -schéma de type fini X. Le type t correspond alors à un point (x, |.|) du spectre valuatif de X, et la condition énoncée dans la proposition ci-dessus équivaut simplement à l’égalité |F (x)| = |F |. Remarque 2.6. — Soit F un modèle de ACVF, soit D un foncteur F -définissable, et soit t un type stablement dominé sur D. Il résulte immédiatement de la proposition ci-dessus que : • si f est une transformation naturelle F -définissable de D vers un foncteur F -définissable, le type f (t) est stablement dominé ; • si F 0 ∈ MF , l’extension canonique de t au modèle F 0 est stablement dominée. On a vu plus haut que η0,1,F est stablement dominé. On peut retrouver ce fait grâce à la proposition 2.4 et à la remarque 2.5 ; nous allons les utiliser pour vérifier plus généralement que ηλ,r,F est stablement dominé pour tout λ ∈ F et tout r ∈ |F |. Si r = 0 alors ηλ,r,F est le type simple induit par le point λ de A1F (F ) = F , et il est donc stablement dominé. Supposons r > 0. Le point ηλ,r,F est alors le type associé au point du spectre valuatif de A1F défini par la valuation |.| : F (u) → |F | qui envoie P ai (u − λ)i sur max |ai | · ri . Comme |F (u)| = |F |, le type ηλ,r,F est stablement dominé. Nous allons a contrario vérifier que si r > 0 alors ηλ,r− ,F n’est pas stablement dominé. En effet, il est associé au point du spectre valuatif de A1F défini par la vaP luation |.| : F (u) → |F | qui envoie ai (u − λ)i sur max |ai | · ω i ri (avec les notations de l’exemple (3) de 2.1). On a donc |F (u)| = ω Z · |F | ) |F | ; par conséquent, le type ηλ,r− ,F est stablement dominé. Il n’est pas difficile, dans ce dernier cas, d’exhiber une transformation naturelle définissable f : A1F → Γ0 telle que f (ηλ,r− ,F ) ne soit pas simple. Il suffit de remarquer que |u − λ| = ω, et de traduire ce fait. On note f la transformation F -définissable de A1F → Γ0,F donnée par la formule x 7→ |x − λ|. Sa valeur en ηλ,r− ,F est alors par la remarque qui précède le type sur Γ0,F induit par ω, qui n’est pas simple : ce type n’est autre que 1− |F | , qui est caractérisé par le fait qu’il est situé sur ]ε; 1[|F | pour tout ε < 1 dans |F |.

3. ESPACES CHAPEAUTÉS ET ÉNONCÉ DU THÉORÈME PRINCIPAL Références : la référence principale est bien entendu l’article [17] lui-même, mais le lecteur pourra consulter avec profit les transparents d’exposés de Hrushovski ([16]). On travaille dans la théorie ACVF. On fixe pour toute la suite du texte un corps valué (k, G0 ). On se donne une clôture algébrique k a de k, et l’on note simplement M la

ASTÉRISQUE 352

(1056)

LES ESPACES DE BERKOVICH SONT MODÉRÉS

489

catégorie Mka ,GQ . Si A est une sous-structure de (k a , GQ 0 ), un foncteur A-définissable 0 désignera ici la restriction à M d’un foncteur A-définissable au sens précédemment utilisé ; on note encore B et Γ0 les restrictions respectives à M des foncteurs B (qui envoie F sur {b(λ, r)F }λ∈F,r∈|F | ) et Γ0 (qui envoie F sur |F |). De même, si X est une k-variété algébrique, on note encore X le foncteur qu’elle induit sur M. 3.1. Les espaces chapeautés : définition, exemples de base, premières propriétés Soit D un foncteur (k, G0 )-définissable, soit F ∈ M et soit F 0 ∈ MF . La remarque 2.6 assure que l’ensemble des types stablement dominés sur DF se plonge, via l’opération d’extension canonique au modèle F 0 , dans celui des types stablement dominés sur DF 0 . Ainsi, la formation de l’ensemble des types stablement dominés sur DF est fonctorielle en F . “ le foncteur Définition 3.1. — Soit D un foncteur (k, G0 )-définissable. On note D qui associe à un modèle F ∈ M l’ensemble des types stablement dominés sur DF . “ est fonctorielle en D, pour les La remarque 2.6 assure que la formation de D transformations naturelles (k, G0 )-définissables. Commentaires et premiers exemples. Si F ∈ M, tout point de D(F ) définit un type simple, et partant stablement dominé, sur DF . On dispose par ce biais d’un “ plongement naturel D ,→ D. Supposons que D « vive dans la sorte Γ0 », c’est-à-dire soit de la forme ∆ ◦ Γ0 , où ∆ est un foncteur G0 -définissable dans la théorie DOAG ; c’est par exemple le cas dès que D est un sous-foncteur de Γn0 . Dans ce cas, pour tout F ∈ M, les types stablement dominés sur DF sont exactement les types simples : autrement dit, le “ est bijectif. On montre plus généralement que si D0 est un plongement D ,→ D ◊ 0 × D s’identifie naturellement à D c0 × D. foncteur (k, G0 )-définissable, le foncteur D c1 . Pour tout F ∈ M, on note ι(F ) l’applicaNous allons maintenant décrire A k

tion qui envoie une boule fermée b(λ, r)F ∈ B(F ) sur son type générique ηλ,r,F . Les types de la forme ηλ,r,F étant stablement dominés, on définit ainsi un plongement c1 , dont on démontre qu’il est bijectif. Par conséquent, A c1 ' B. Comme B ι : B ,→ A k

k

c1 . est (k, G0 )-définissable, il en va de même de A k Ce dernier fait se généralise en partie. Avant de formuler l’énoncé correspondant, donnons une définition. Soit X une k-variété algébrique, et soit U un sousfoncteur (k, G0 )-définissable de X ; cela signifie, rappelons-le, que U est défini Zariskilocalement sur X par une combinaison booléenne d’inégalités de la forme |f | o n λ|g|, où f et g sont des fonctions régulières, où λ ∈ G0 et où o n∈ {, 6, >}. Supposons que U est non vide et soit F ∈ M. Le plus grand entier n pour lequel il existe un

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

490

A. DUCROS

plongement F -définissable de b(0, 1)nF dans UF ne dépend pas de F , et est appelé la dimension de U . “ est alors (k, G0 )-proProposition 3.2. — Soit U comme ci-dessus. Le foncteur U définissable ; il est (k, G0 )-définissable si et seulement si il est de dimension inférieure ou égale à 1. Faisons quelques commentaires. Dire qu’un foncteur est (k, G0 )-prodéfinissable signifie qu’il est isomorphe à une limite projective de foncteurs (k, G0 )-définissables – on demande de surcroît que l’ensemble d’indices ne soit pas trop gros, dans un sens que nous ne préciserons pas ici. Bien entendu, pour que la limite projective en question soit canonique, il faut, à l’instar de ce qu’on a vu dans le cas définissable, se donner un peu plus qu’un foncteur sur M : le foncteur en question doit se mettre en familles “ — on dispose d’une définition de façon évidente. C’est le cas en ce qui concerne U naturelle de famille définissable de types stablement dominés. Une bonne partie de ce qu’on a vu à propos des foncteurs définissables s’étend au cadre des foncteurs prodéfinissables, comme la notion de transformation définissable, celle de type, ou celle de type définissable. Si D est un foncteur (k, G0 )-prodéfinissable, un sous-foncteur D0 de D sera dit : – (k, G0 )-isodéfinissable s’il existe un foncteur (k, G0 )-définissable ∆, et une transformation (k, G0 )-définissable ∆ → D qui induit un isomorphisme ∆ ' D0 ; – relativement (k, G0 )-définissable s’il existe un foncteur (k, G0 )-définissable ∆, un sous-foncteur (k, G0 )-définissable ∆0 de ∆, et une transformation naturelle (k, G0 )-définissable f : D → ∆ telle que D0 = f −1 (∆0 ). “ est (k, G0 )-définissable. Son Par exemple, la transformation naturelle U ,→ U image (que l’on identifiera à U ) est donc (k, G0 )-isodéfinissable ; on montre qu’elle est aussi (k, G0 )-relativement définissable. Si V est un sous-foncteur (k, G0 )-définis“ est relativement (k, G0 )-définissable dans U “. sable de U alors V “ est stricteRemarque 3.3. — On montre plus précisément que le foncteur U ment (k, G0 )-prodéfinissable : cela signifie que pour toute transformation (k, G0 )-dé“ vers un foncteur (k, G0 )-définissable D, le foncteur image f (U “) est finissable f de U (k, G0 )-définissable. Disons maintenant quelques mots des preuves. “ est établie à l’aide d’arguments qui n’ont rien de • La pro-définissabilité de U spécifique à ACVF et s’appliquent à bien d’autres théories. Ils reposent pour l’essentiel sur une propriété très générale d’uniformité, qui dans le cas qui nous préoccupe dit en gros la chose suivante : si, avec les notations de la proposition 2.2, on fixe D0 et ∆ et fait parcourir à t l’ensemble des types définissables et orthogonaux à Γ0 sur D,

ASTÉRISQUE 352

(1056)

LES ESPACES DE BERKOVICH SONT MODÉRÉS

491

alors le sous-ensemble définissable de D0 (M ) fourni par loc. cit. évolue au sein d’une famille M -définissable. “ repose, via le fait qu’un type stablement dominé • La stricte prodéfinissabilité de U est contrôlé par sa trace sur la sorte « corps résiduel », sur une propriété de la théorie des corps algébriquement clos : si X est un foncteur définissable dans cette théorie, le foncteur des types (définissables) sur X est ind-définissable. Pour se convaincre de ce dernier point, rappelons que si X est un schéma, les types sur X correspondent bijectivement aux points du schéma X, donc aux fermés irréductibles de X — d’où un foncteur ind-définissable : on se ramène au cas affine, on fixe un « degré » et un nombre d’équations, on fait varier les coefficients de celles-ci, on ne garde que celles qui décrivent un fermé irréductible, et l’on quotiente par la relation d’équivalence qui identifie deux systèmes d’équations définissant le même fermé. “ en dimension 6 1 est quant à elle une conséquence du • La définissabilité de U résultat de finitude suivant, qui lui-même résulte du théorème de Riemann-Roch : si X est une courbe projective, irréductible et lisse de genre g sur un corps algébriquement clos F , le corps F (X) est engendré multiplicativement par les fonctions ayant au plus g + 1 pôles (avec multiplicités) ; cela généralise le fait que les polynômes de degré 1 en u engendrent multiplicativement F (u). À propos des fibres d’applications chapeautées. Soient D et D0 deux foncteurs (k, G0 )-définissables, soit f : D → D0 une transformation naturelle (k, G0 )-définis“→D c0 la transformation induite. Soit F ∈ M. Si x ∈ D c0 (F ), la fibre sable et soit fb : D −1 b “ fF (x) est un sous-foncteur bien défini de DF . Supposons que x ∈ D0 (F ), c’est-à-dire encore que x est un type simple. Il n’est alors pas difficile de voir que fb−1 (x) s’identifie naturellement à f◊ −1 (x). F

F

Par contre, on prendra garde que si x n’est pas simple, le foncteur fbF−1 (x) ne s’interprète pas en général comme un espace chapeauté. Ce phénomène qui peut sembler un peu désagréable – les fibres ne sont pas toutes des objets de la théorie — n’est pas lié à une lacune dans les définitions, mais à une « vraie pathologie » de la théorie des valuations, dont nous allons décrire une manifestation. Il est possible d’exhiber deux modèles F ⊆ F 0 de ACVF et un couple (x, y) ∈ (F 0 )2 tels que les propriétés suivantes soient satisfaites : – le type sur A1F induit par x est stablement dominé ; – le type sur A2F induit par (x, y) est stablement dominé ; – le type sur A1F (x)a induit par y n’est pas F (x)a -définissable, et a fortiori pas stablement dominé (on désigne par F (x)a la fermeture algébrique de F (x) dans F 0 ). Cela dit, ce défaut n’est pas rédhibitoire. Nous verrons qu’il n’interdit pas de raisonner par fibrations ; simplement, il contraint à un certain nombre de contorsions

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

492

A. DUCROS

techniques lorsqu’on veut le faire, puisqu’on ne sait travailler que sur les fibres en les points simples. “ 3.2. La topologie sur U Pour tout n, on munit le foncteur (k, G0 )-définissable Γn0 de la topologie définissable pour laquelle les ouverts F -définissables de Γn0,F sont, pour tout F ∈ M, les sous-foncteurs de Γn0,F qui peuvent être définis par une combinaison booléenne positive Q i Q où a et b appartiennent à |F |. Cette topod’inégalités de la forme a xni i < b xm i logie possède les propriétés intuitives attendues : si D est un sous-foncteur (k, G0 )-définissable de Γn0 , il est définissablement compact si et seulement si il est borné et peut être décrit par une combinaison booléenne positive d’inégalités larges entre monômes. Cette topologie en induit une sur tout segment généralisé, et plus généralement sur tout graphe fini (pour une définition, voir la fin de 1.4). Un graphe fini est définissablement compact. La notion de topologie définissable sur un foncteur définissable s’étend au cas des foncteurs prodéfinissables — sur un modèle donné, une telle topologie est donnée par une collection de sous-foncteurs relativement définissables. La compacité définissable se définit de façon analogue dans ce cadre. On désigne toujours par U un sous-foncteur (k, G0 )-définissable d’un k-schéma de type fini X. Soit F ∈ M, soit V un ouvert de Zariski de XF et soit f une fonction régulière sur V . On peut voir |f | comme une transformation F -définissable de V “ vers Γ b 0,F = Γ0,F , que l’on note encore |f |. Soit D un vers Γ0,F ; elle en induit une de V “F est un sous-foncteur relativeouvert F -définissable de Γ0,F ; le foncteur |f |−1 (D) ∩ U “F . On munit U “ de la topologie définissable la plus grossière ment F -définissable de U −1 “ “F pour pour laquelle |f | (D) ∩ UF est un ouvert relativement F -définissable de U tout (F, V, f, D) comme ci-dessus. Indiquons quelques propriétés de cette topologie. “(F ) est un homéomorphisme • Pour tout F ∈ M, le plongement naturel U (F ) ,→ U de U (F ) (muni de la topologie déduite de celle du corps valué F ) sur son image, laquelle est dense. “ est (k a , GQ )-connexe : il ne peut • Si X est géométriquement connexe alors X 0 s’écrire comme une union disjointe de deux ouverts (k a , GQ 0 )-définissables non “ est (k, G)-connexe. vides. Si X est connexe et si k est hensélien alors X • Supposons que X est séparé, et qu’il existe une famille finie (Xi ) d’ouverts S affines de X telle que U = Ui , où Ui est un sous-foncteur (k, G0 )-définissable de Xi possédant les propriétés suivantes : α) Ui est borné relativement à un plongement fixé de Xi dans un espace affine ;

ASTÉRISQUE 352

(1056)

LES ESPACES DE BERKOVICH SONT MODÉRÉS

493

β) Ui est « naïvement fermé », c’est-à-dire qu’il peut être défini par une combinaison booléenne positive d’inégalités de la forme |f | 6 λ|g| où f et g sont des fonctions régulières sur Xi , et où λ ∈ G0 . “ est définissablement compact. Notons que si X est Sous ces hypothèses, U projective et possède un recouvrement (Xi ) par des ouverts affines tels que U ∩Xi “ soit naïvement fermé pour tout i, les hypothèses ci-dessus sont satisfaites et U “ est définissablement compact. En particulier, X est définissablement compact dès que X est projective. c1 . Identifions A c1 au foncteur B des boules fermées (en La structure d’arbre de P k k envoyant une boule sur son type générique). Soit F ∈ M et soit λ un élément de F . ” 1 qui, sur un modèle F 0 donné On note b(λ, .)F la transformation naturelle Γ0,F → A F dans MF , envoie un élément r de |F 0 | sur b(λ, r)F 0 . Elle est F -définissable, et induit ” 1 . Soit µ un un homéomorphisme entre Γ0,F et un sous-foncteur F -définissable de A F (autre) élément de F ; posons r = |λ − µ|. Soit I le F -segment généralisé obtenu en concaténant [0; r]F et [r; 0]F . On définit alors un homéomorphisme F -définissable ” 1 en appliquant b(λ, .) sur le premier de I sur un sous-foncteur F -définissable de A F F segment, et b(µ, .)F sur le second. Ce « segment généralisé joignant λ à µ » est le seul. Plus généralement, on démontre c1 (F ), il existe un unique sous-foncteur F -définissable D que si x et y appartiennent à P k ” 1 possédant la propriété suivante : il existe un F -segment généralisé I et un de P F

homéomorphisme F -définissable I ' D envoyant l’origine de I sur x et l’extrémité de I sur y. Donnons une description informelle du foncteur D : si x et y appartiennent c1 (F ), on fait croître le rayon de la boule x jusqu’à rencontrer la boule y, puis on àA k c1 (F ) et si y = ∞, on fait croître le le diminue jusqu’à obtenir exactement y. Si x ∈ A k

rayon de la boule x jusqu’à l’infini (et on paramètre par l’inverse du rayon, le point correspondant à 0 étant alors y). On dira que D est le segment généralisé joignant x à y. On dispose d’une notion naturelle d’enveloppe convexe C d’une famille finie de c1 (F ) : c’est la réunion des segments généralisés les joignant deux à deux. points de P k Il existe un homéomorphisme F -définissable d’un arbre fini sur C. Terminons cette section en mentionnant que si U est comme ci-dessus et si D est un sous-foncteur (k, G0 )-définissable de Γn0 , ou un segment généralisé et plus généra“ × D de la topologie définissable produit. lement un graphe fini, on munit U 3.3. Liens avec les espaces de Berkovich On suppose dans cette section que G0 ⊂ R+ et que k est complet. Le corps k est donc un corps ultramétrique complet. On désigne toujours par X un k-schéma de type

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

494

A. DUCROS

fini, et par U un sous-foncteur (k, G0 )-définissable de X. Les inégalités qui décrivent U définissent sans ambiguïté une partie semi-algébrique U an de X an . “(F ) ⊂ X(F “ ). Le point x est Soit F ∈ M un corps ultramétrique et soit x ∈ U un type sur XF , c’est-à-dire un couple formé d’un point ξ du schéma XF et d’une valuation sur F (ξ), prolongeant celle de F . Comme x est stablement dominé, il est orthogonal à Γ0 , ce qui veut dire que |F (ξ)| ⊂ |F | ⊂ R+ . Soit ξ0 l’image de ξ sur le schéma X. La valuation sur k(ξ0 ) induite par celle de F (ξ) est à valeurs réelles ; “(K) elle définit donc un point θ(x) de X an supporté par ξ0 . L’appartenance de x à U an implique immédiatement que θ(x) ∈ U . Avant d’énoncer les propriétés fondamentales de l’application θ, rappelons qu’un corps ultramétrique F est dit maximalement complet si toute famille décroissante de boules fermées de F a une intersection non vide. Cela équivaut à demander que F n’admette pas d’extension immédiate non triviale (une extension valuée de F est dite immédiate si elle a même corps résiduel et même groupe des valeurs que F ). Tout corps ultramétrique F admet une extension maximalement complète F 0 qui est algébriquement close, vérifie l’égalité |F 0 | = R+ , et a pour corps résiduel une clôture algébrique de F˜ ; une telle extension est essentiellement unique. Notons qu’un corps maximalement complet est complet (considérer une famille décroissante de boules dont le rayon tend vers 0). Proposition 3.4. — Soit F ∈ M un corps ultramétrique. “(F ) → U an est continue ; si F = k, c’est un homéomorphisme 1) L’application θ : U sur son image. 2) Supposons que F soit maximalement complet et que |F | = R+ . L’application θ est alors une surjection topologiquement propre, et un homéomorphisme si F = k. Faisons quelques commentaires. L’assertion 1) résulte immédiatement de la dé“(F ) et sur U an . Disons à titre d’illustration quelques finition des topologies sur U mots de l’image de θ lorsque F = k (ce qui implique que k est algébriquement clos, que sa valuation n’est pas triviale, et que |k| = G0 ) et lorsque U = X = A1k . c1 (k) sur la semi-norme L’application θ envoie par construction le point ηλ,r,k ∈ A k P ai (u − λ)i 7→ max|ai |ri . On voit donc que son image consiste exactement en l’ensemble des points de type 1 ou 2 de A1,an . Ce fait s’étend à toute courbe algébrique k an “ X : l’image de θ : X(k) → X est l’ensemble de points de type 1 ou 2 de X an . Du point de vue de la définissabilité, qui préside à l’ensemble de la construction de Hrushovski et Loeser, cela n’a rien de choquant : l’expérience montre que, tant qu’on s’intéresse à des problèmes de nature algébrique ne faisant pas intervenir d’autres nombres réels que ceux de |k|, les points de type 1 ou 2 sont précisément les seuls points en lesquels « il peut se passer quelque chose ». Les autres servent à garantir de bonnes propriétés topologiques (compacité, connexité par arcs), mais ne détectent

ASTÉRISQUE 352

(1056)

LES ESPACES DE BERKOVICH SONT MODÉRÉS

495

rien d’intéressant. Se limiter aux points de type 1 ou 2 ne fait donc perdre pour l’essentiel aucune information — simplement, il faut compenser les désagréments topologiques inhérents à cette approche en remplaçant les propriétés classiques par leurs avatars modèles-théoriques : compacité définissable, existence de segments généralisés définissables joignant deux points, etc. En ce qui concerne l’assertion 2), sa preuve repose essentiellement sur le fait suivant (qui garantit la surjectivité, la propreté découlant ensuite du théorème de Tychonoff convenablement utilisé). Soit F un corps maximalement complet, algébriquement clos et tel que |F | = R+ , soit X un F -schéma de type fini et soit x un type sur X. Il correspond à un couple (ξ, |.|) où ξ est un point de X et |.| une valuation sur F (ξ). Le type x est alors stablement dominé si et seulement si |F (ξ)| = R+ . Notons la différence absolument cruciale avec la proposition 2.4 : nous n’avons pas supposé a priori que x est F -définissable. Cette application θ peut être utilisée pour transférer certaines applications chapeautées en géométrie de Berkovich, comme le montre le théorème ci-dessous. Théorème 3.5. — Soit U comme ci-dessus, et soit D un foncteur (k, G0 )-définissable vivant dans la sorte Γ0 ; on suppose plus précisément que D est muni d’une topologie définissable, et qu’il admet un plongement topologique (k, G0 )-définissable dans Γn0 pour un certain n (c’est par exemple le cas si D est un segment généralisé). Soit V un sous-foncteur (k, G0 )-définissable d’une k-variété algébrique et soit “×D → V “ une transformation naturelle (k, G0 )-définissable et continue. Soit F f :U une extension ultramétrique complète de k. On suppose que F est algébriquement clos, maximalement complet, et que |F | = R+ . Il existe alors une unique application continue f an : U an × D(R+ ) → V an telle que “(F ) × D(R+ ) U

f

“(F ) /V

(θ,Id)

 U an × D(R+ )

θ f an



/ V an

commute. Remarque 3.6. — L’unicité et la continuité de f an proviennent immédiatement du caractère surjectif et propre de θ. L’existence demande un peu plus de travail : le diagramme commutatif indique comment la construire, mais il y a des choix d’antécédents à faire et il faut vérifier que le résultat n’en dépend pas. La définissabilité et la continuité de f sont utilisées pour cette étape.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2013

496

A. DUCROS

3.4. Énoncé du théorème principal Commençons par quelques conventions. Soit D un sous-foncteur (k, G0 )-définissable de Γn0 . On fixe un modèle F ∈ M ; le plus grand entier m tel qu’il existe un Q plongement définissable 16i6m [ai ; bi ]F ,→ DF , où les ai et les bi appartiennent à |F | et où ai < bi pour tout i, ne dépend pas de F ; on l’appelle la dimension de D (on la prend égale à −∞ si D est vide). Si U est un foncteur (k, G0 )-définissable et f : U → D une transformation naturelle (k, G0 )-définissable, nous nous permettrons souvent de noter encore f la transforma“→D “ ' D induite par f . tion naturelle U Nous allons maintenant énoncer le théorème principal de Hrushovski et Loeser, qui porte sur la géométrie chapeautée ; les résultats annoncés de modération des espaces de Berkovich en découlent grâce au théorème 3.5 ci-dessus. Théorème 3.7. — Soit (k, G0 ) un corps valué, soit X une k-variété algébrique quasi-projective et soit U un sous-foncteur (k, G0 )-définissable de X. Soit F une famille finie de transformations naturelles (k, G0 )-définissables de U vers Γ0 , et soit G un groupe fini agissant sur X (par automorphismes de k-schéma) et stabilisant U . Il existe : • un segment généralisé (k, G0 )-définissable I, d’origine o et d’extrémité e ; “→U “; • une transformation naturelle (k, G0 )-définissable et continue h : I × U “; • un sous-foncteur (k, G0 )-isodéfinissable S de U • un sous-foncteur (k, G0 )-définissable P de Γn0 (pour un certain n), de dimension majorée par celle de X ; • une extension finie L de k contenue dans k a et un homéomorphisme (L, G0 )-définissable P ' S (nous résumerons l’existence de L, de P et de l’homéomorphisme évoqué en disant simplement que S est un polytope), tels que les propriétés suivantes soient satisfaites pour tout modèle F ∈ M, tout “(F ) et tout t ∈ I(F ). x∈U 1) On a h(e, x) ∈ S(F ), et h(t, x) = x dès que x ∈ S(F ). On a aussi les égalités h(e, h(t, x)) = h(e, x) et h(o, x) = x. Nous dirons plus brièvement que h est une homotopie d’image S. 2) Si f ∈ F alors f (h(t, x)) = f (x). 3) Pour tout g ∈ G on a g(h(t, x)) = h(t, g(x)). Remarque 3.8. — Ce n’est pas seulement par souci de généralité