Seminaire Bourbaki, Exposes 860-883, 894-903,909-956, 959, 962-966 (publ. par la SMF, collection Asterisque) [PDF]

151 78 14MB

English,French Pages 2305

Table of contents :
860......Page 1
861......Page 33
862......Page 53
863......Page 78
864......Page 86
865......Page 101
866......Page 125
867......Page 148
868......Page 168
869......Page 198
870......Page 228
871......Page 251
872......Page 279
873......Page 297
874......Page 357
875......Page 387
876......Page 428
877......Page 456
878......Page 476
879......Page 499
880......Page 520
881......Page 556
882......Page 578
883......Page 598
894......Page 623
895......Page 640
896......Page 658
897......Page 674
898......Page 721
899......Page 735
900......Page 770
901......Page 787
902......Page 816
903......Page 830
909......Page 848
910......Page 874
911......Page 909
912......Page 922
913......Page 940
914......Page 970
915......Page 994
916......Page 1018
917......Page 1048
918......Page 1074
919......Page 1093
920......Page 1156
921......Page 1169
922......Page 1195
923......Page 1233
924......Page 1261
925......Page 1275
926......Page 1289
927......Page 1318
928......Page 1353
929......Page 1372
930......Page 1404
931......Page 1422
932......Page 1452
933......Page 1475
934......Page 1505
935......Page 1522
936......Page 1554
937......Page 1582
938......Page 1604
939......Page 1634
940......Page 1669
941......Page 1709
942......Page 1759
943......Page 1791
944......Page 1820
945......Page 1837
946......Page 1870
947......Page 1894
948......Page 1932
949......Page 1961
950......Page 1995
951......Page 2043
952......Page 2055
953......Page 2085
954......Page 2106
955......Page 2125
956......Page 2148
959......Page 2171
962......Page 2204
963......Page 2229
964......Page 2248
965......Page 2270
966......Page 2289

0 0 0
Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden

Datei wird geladen, bitte warten...

Zitiervorschau

S´eminaire BOURBAKI 51`eme ann´ee, 1998-99, no 860

Juin 1999

´ ´ ES ´ p-ADIQUES INTEGRATION SUR LES VARIET [d’apr` es Coleman, Colmez] par Christophe BREUIL

Table des mati` eres Introduction Conventions et notations 1. Construction de l’int´egration p-adique 1.1. La construction de Colmez ´ 1.1.1. Enonc´ e du th´eor`eme 1.1.2. Description de la preuve 1.1.3. Le point de vue de Zarhin 1.2. La construction de Coleman 1.2.1. Quelques mots d’introduction sur la g´eom´etrie rigide 1.2.2. Int´egration des formes de seconde esp`ece 2. Applications 2.1. L’accouplement des p´eriodes p-adiques + 2.1.1. Quelques rappels sur BdR 2.1.2. Accouplement des p´eriodes p-adiques : ´enonc´e du th´eor`eme 2.1.3. Esquisse de preuve et relations de Riemann p-adiques 2.2. Les polylogarithmes p-adiques 2.2.1. It´eration de l’int´egration sur les courbes 2.2.2. Construction des polylogarithmes p-adiques 2.3. Autres applications ´ ERENCES ´ REF

1 3 3 3 3 5 9 9 9 10 15 15 15 16 18 21 21 24 27 29

Introduction Soit X une vari´et´e alg´ebrique lisse sur le corps R des nombres r´eels. Les points de X `a valeurs dans R ou dans C, que l’on note X(R) et X(C), forment une vari´et´e analytique

860-02 r´eelle ou complexe, sur laquelle on dispose de tout l’arsenal de la th´eorie classique de l’int´egration, d´evelopp´e principalement avant le d´ebut du XX e si`ecle. Depuis l’introduction par Hensel des nombres p-adiques et de la topologie p-adique dans les ann´ees 1900, les math´ematiciens n’ont eu de cesse d’´etendre `a Q p ce qu’ils savaient faire sur R. Ainsi peut-on se demander s’il existe une th´eorie de l’int´egration sur X(Q p ) lorsque X est une vari´et´e alg´ebrique lisse sur Q p . Or, la topologie p-adique est tr`es diff´erente de la topologie classique car elle est totalement discontinue, c’est-`a-dire que tout point poss`ede une base de voisinages `a la fois ouverts et ferm´es ou encore qu’il n’y a pas d’obstruction `a passer du local au global ! Comme tout le charme r´eside essentiellement dans cette obstruction, cette tˆache a longtemps sembl´e vou´ee `a des sorites sans grand int´erˆet. Pourtant, l’existence du logarithme p-adique, connue d`es les tout d´ebuts, fournissait un exemple tout `a fait non trivial d’une fonction p-adique qui avait bien l’air d’une “primitive p-adique”...

La situation change au d´ebut des ann´ees soixante avec l’introduction par Tate des espaces analytiques rigides ([Ta2]). L’id´ee en soi est naturelle : puisque la topologie p-adique a trop d’ouverts, on va en s´electionner certains plus “jolis” que les autres. On connaˆıt depuis l’essor de cette th´eorie, dont l’un des aboutissements fut les th´eor`emes d’uniformisation p-adique de Mumford et Raynaud ([Mu2], [Ra3]). Coleman le premier, dans les ann´ees 80, r´eussit a` utiliser la “topologie rigide” pour d´efinir dans [Cole3] une th´eorie de l’int´egration des 1-formes diff´erentielles alg´ebriques de seconde esp`ece sur les vari´et´es alg´ebriques projectives (ou propres) et lisses sur Qp avec bonne r´eduction. Motiv´e par les applications aux fonctions L p-adiques, il ´etend dans le cas des courbes son int´egration `a toutes les 1-formes rationnelles, et mˆeme `a des formes non n´ecessairement alg´ebriques ou rigides, ce qui lui permet par exemple de d´efinir des polylogarithmes p-adiques. Enfin, au d´ebut des ann´ees 90, Colmez dans [Colm1], et ind´ependamment Zarhin dans [Za1], parviennent `a rendre possible l’impossible en int´egrant sur du totalement discontinu : non seulement ils ´etendent l’int´egrale de Coleman au cas de vari´et´es alg´ebriques suppos´ees seulement lisses sur Qp et `a toutes les 1-formes rationnelles ferm´ees, mais ils le font sans passer par la g´eom´etrie rigide. Cependant, leurs m´ethodes ne s’appliquent pour l’instant qu’aux 1-formes alg´ebriques et ne permettent pas de retrouver les polylogarithmes p-adiques par exemple. Une fois d´ebarrass´e des hypoth`eses de propret´e et de bonne r´eduction, Colmez g´en´eralise alors de fa¸con syst´ematique dans [Colm2] beaucoup des th´eor`emes de Coleman, et obtient en outre une preuve originale et particuli`erement ´el´egante, car plus proche de son analogue complexe, de l’accouplement des p´eriodes p-adiques des vari´et´es ab´eliennes. Derni`erement, Besser a donn´e dans [Bes] une g´en´eralisation de l’int´egrale de Coleman (sur les vari´et´es propres lisses avec bonne r´eduction) au cas de n-formes ferm´ees avec n > 1.

860-03 L’objectif de cet expos´e est de pr´esenter dans une premi`ere partie l’int´egration de Colmez et l’int´egration de Coleman, puis dans une seconde partie certaines de leurs applications. Il a ´et´e con¸cu plutˆot comme une introduction au sujet et non comme un “survey”. Ainsi, j’ai pris le parti d’exposer de fa¸con assez compl`ete les deux constructions de l’int´egration, puis de d´evelopper avec quelques d´etails deux applications particuli`eres (essentiellement une par auteur), enfin de mentionner tr`es bri`evement quelques autres. L’expos´e n’est donc pas exhaustif (certains aspects ne sont pas du tout abord´es) et je prie le lecteur - ou l’auteur - averti de me pardonner s’il ne trouve pas d´evelopp´ee ici son application favorite. Durant la pr´eparation de cet expos´e, j’ai b´en´efici´e de conversations orales ou “´electroniques” avec plusieurs personnes dont : Amnon Besser, Jean-Benoˆıt Bost, Robert Coleman, Pierre Colmez, Jean-Louis Colliot-Th´el`ene, Philippe Gille, Bernard Le Stum, William Messing et Michel Raynaud. Qu’ils soient tous chaleureusement remerci´es pour leur aide. Je suis reconnaissant `a Amnon Besser, Robert Coleman et Glenn Stevens de m’avoir envoy´e respectivement les r´ef´erences [Bes], [CI] et [St] (parmi d’autres ; la lecture de [St] en particulier m’a facilit´e la r´edaction de la partie 2.2). Enfin, je remercie Jean-Benoˆıt Bost, Laurent Clozel, Jean-Marc Fontaine, Michel Raynaud et surtout Pierre Colmez pour leurs remarques sur des versions pr´eliminaires de ce texte.

Conventions et notations Dans tout cet article, on fixe un nombre premier p et une clˆoture alg´ebrique Q p de Qp . On note Cp la compl´etion p-adique de Q p , OCp l’anneau des entiers de Cp et | · | la valeur 1 absolue p-adique sur Cp donn´ee par |x| = pval(x) o` u val est la valuation p-adique normalis´ee par val(p) = 1. Le logarithme d’Iwasawa est l’unique fonction log : C p − {0} → Cp telle que : log(1 − x) = −

+∞ n X x n=1

n

si |x| < 1

log(xy) = log(x) + log(y) log(p) = 0. Le choix log(p) = 0 est arbitraire (on peut mˆeme d´ecider que log(p) est une ind´etermin´ee, cf. [Colm2]) mais naturel du point de vue de la th´eorie des nombres. Une vari´et´e est un sch´ema X s´epar´e de type fini et g´eom´etriquement int`egre sur un corps K. Nous ne consid´ererons en fait que des vari´et´es lisses, c’est-`a-dire telles que X → Spec(K) est un morphisme lisse. Une vari´et´e ab´elienne sur K est une vari´et´e X sur K munie d’une structure de K-sch´ema en groupes et telle que X → Spec(K) est propre. Cela entraˆıne X → Spec(K) lisse. Une fonction rationnelle (resp. une 1-forme rationnelle) sur une

860-04 vari´et´e X est un ´el´ement du corps des fonctions K(X) (resp. des diff´erentielles de K¨ahler Ω1K(X)/K ) qu’on peut voir comme une fonction (resp. une 1-forme) r´eguli`ere sur un ouvert de Zariski U de X. Si X est une vari´et´e sur K, on supposera toujours X(K) 6= ∅.

´ 1. CONSTRUCTION DE L’INTEGRATION p-ADIQUE 1.1. La construction de Colmez Dans cette partie, K d´esigne soit C p , soit une extension finie de Qp dans Cp . ´ 1.1.1. Enonc´ e du th´eor`eme. Soit X une vari´et´e lisse sur K de dimension d. On a suppos´e X(K) 6= ∅. Pour tout ouvert de Zariski affine U de X, il existe une immersion ferm´ee U ֒→ Am pour m ≫ 0 et on d´efinit la topologie p-adique sur U(K) comme la topologie induite par la topologie p-adique sur A m (K) = K m . C’est ind´ependant de l’immersion choisie. Par recollement, on obtient la topologie p-adique sur X(K). On appelle ouverts p-adiques les ouverts pour cette topologie. Tout point de X(K) admet pour la topologie p-adique une base de voisinages ouverts et ferm´es puisque tel est le cas sur K m : cette topologie est donc totalement discontinue. Comme X est lisse, pour tout x ∈ X(K), il existe un ouvert de Zariski Ux = Spec(K[x1 , ..., xn , z1 , ..., zd ]/(f1 , ..., fn )) contenant x o` u ∂fi ( ∂xj )1≤i,j≤n est de d´eterminant inversible et tel que x ∈ U x (K) correspond `a (xi = 0, zj = 0). Pour d´efinir la structure analytique p-adique sur X(K), rappelons le : Lemme 1.1.1.1. — La projection sur les d derni`eres composantes z1 , ..., zd induit un hom´eomorphisme entre un ouvert p-adique V de Ux (K) ⊂ X(K) contenant x et la boule ouverte B(0, δ− )d = {(z1 , ..., zd ) ∈ K d | |zi | < δ, 1 ≤ i ≤ d} pour un δ suffisamment petit dans R+ − {0}. Cela r´esulte d’un algorithme ´el´ementaire (th´eor`eme des fonctions implicites !), voir par exemple ([Colm2],A.3.4). Remarquons que tout ouvert p-adique peut s’´ecrire comme une r´eunion disjointe de boules ouvertes comme en (1.1.1.1) (car si B 1d et B2d sont deux telles boules, on a soit B1d ∩ B2d = ∅, soit B1d ⊂ B2d , soit B2d ⊂ B1d ). D´ efinition 1.1.1.2. — Une fonction localement analytique sur un ouvert p-adique W de X(K) est une fonction f de W dans K telle que, pour tout x ∈ W et pour un choix (donc tout choix) de param`etres locaux zi autour de x comme en (1.1.1.1), il existe S ∈ K[[z1 , ..., zd ]] et r ∈ R+ − {0} (r ≤ δ) tels que S(z1 , ..., zd ) converge si |zi | < r et co¨ıncide avec f sur ce voisinage. Exemple 1.1.1.3. — Toute fonction rationnelle f r´eguli`ere sur un ouvert de Zariski U est une fonction localement analytique sur U(K). Soit log(f ) la fonction d´efinie comme f

log

la compos´ee U(K) − {x | f (x) = 0} −→ K × −→ K : log(f ) est une fonction localement analytique sur W = U(K) − {x | f (x) = 0}.

860-05 On d´efinit l’espace analytique p-adique X an associ´e `a X comme l’espace annel´e X(K) muni de la topologie p-adique et du faisceau O X an des fonctions localement analytiques. Si OX est le faisceau structural sur X, OX an restreint `a la topologie de Zariski est un faisceau de OX -modules et, en utilisant (1.1.1.1), on peut d´efinir une diff´erentielle d : OX an → OX an ⊗OX Ω1X/K o` u Ω1X/K est le faisceau des diff´erentielles de K¨ahler. Si f est une fonction rationnelle, on a d log(f ) = dff . On note K(X)log = K(X)[log(f ), f ∈ K(X)× ] o` u les ´el´ements de K(X) sont vus comme des fonctions localement analytiques. Les fonctions f de K(X)log sont toutes localement analytiques sur un ouvert de Zariski U f (K) de X(K). Le lemme suivant sera utilis´e plusieurs fois : Lemme 1.1.1.4. — Soient f ∈ K(X)log et W ⊂ X(K) un ouvert p-adique. Si f |W = 0 alors f = 0. Voir ([Colm2],II.1.7) pour la preuve. Inutile de dire que cet ´enonc´e est faux pour des fonctions localement analytiques quelconques. Notre objectif est de d´efinir une th´eorie de l’int´egration pour les 1-formes rationnelles ` cause du lemme de Poincar´e, toute 1-forme ferm´ee s’int`egre localement ferm´ees sur X. A pour la topologie p-adique sur une boule suffisamment petite, donc s’int`egre globalement. Le probl`eme est qu’il y a une multitude de constantes locales d’int´egration : une sur chaque boule ! Et pourtant, parmi cette infinit´e de primitives, il en existe miraculeusement une plus jolie que les autres : Th´ eor` eme 1.1.1.5. — ([Colm2], [Za2]) Il existe une unique fa¸con d’associer ` a une vari´et´e X lisse sur K et une 1-forme rationnelle ferm´ee ω sur X une fonction fω bien d´efinie ` a addition pr`es d’une constante et localement analytique sur X(K) \ {pˆ oles de ω}, de sorte que : (i) dfω = ω (ii) fλω+λ′ ω′ = λfω + λ′ fω′ (λ, λ′ ∈ K) (iii) fω = f si ω = df o` u f ∈ K(X)log ′ (iv) si g : X → X est un morphisme de vari´et´es lisses sur Spec(K), fg∗ ω = g ∗ fω (= fω ◦ g). 1.1.2. Description de la preuve. Nous donnons ici la preuve de Colmez (voir 1.1.3 pour Zarhin). Elle se coupe en deux : 1) en utilisant les morphismes d’Albanese on montre qu’il suffit de d´efinir une int´egration sur les vari´et´es ab´eliennes, 2) on construit effectivement cette int´egration sur les vari´et´es ab´eliennes. Commen¸cons par 1). Rappelons qu’`a toute vari´et´e X lisse sur K, on peut associer de mani`ere fonctorielle sa vari´et´e d’Albanese Alb(X) (= une vari´et´e ab´elienne) encore d´efinie sur K (lorsque X est propre et lisse sur C, Alb(X) est isomorphe en tant que tore 1 complexe `a HdR (X)∗ /H1 (X(C), Z)). Tout point P ∈ X(K) donne lieu `a un morphisme

860-06 unique ιP : X → Alb(X) d´efini sur K tel que ιP (P ) = 0. Un tel morphisme s’appelle un morphisme d’Albanese (pour tout cela, voir [Se1] ou [La] ou ([Colm2],I.5)). De plus, si X ∼ 1 1 est propre, ιP induit un isomorphisme H dR (Alb(X)) → HdR (X). Lemme 1.1.2.1. — Soient ιP : X → Alb(X) un morphisme d’Albanese et ω une 1-forme rationnelle ferm´ee sur X, alors il existe une 1-forme rationnelle ferm´ee η sur Alb(X), des fonctions rationnelles f, f1 , ..., fn sur X et des constantes λ1 , ..., λn dans K telles que : n X dfi ∗ ω = ιP η + df + λi . fi i=1 ˜ 1 (X) (resp. H ˜ 1 (Alb(X)) le quotient des 1-formes rationIndication de preuve. — Soit H nelles ferm´ees par dK(X) log (resp. dK(Alb(X))log ), il suffit de montrer que ιP induit un ∼ ˜1 ˜ 1 (Alb(X)) → isomorphisme H H (X) et il suffit pour cela d’´etendre les scalaires `a une clˆoture alg´ebrique K de K. En remarquant qu’alors, si X est une compactification lisse ˜ 1 (X) ≃ H ˜ 1 (X) (car de X (qui existe par la r´esolution des singularit´es d’Hironaka), on a H ˜ 1 (X) ne d´epend que du corps des fractions de X) et Alb(X) ≃ Alb(X), on est ramen´e H au cas d’une vari´et´e X propre et lisse sur K. On a dans ce cas un diagramme commutatif de suites exactes avec des isomorphismes `a gauche et `a droite ([Colm2],I.1.16) : 1 ˜ 1 (X) HdR (X) → H → K ⊗Z P ic0 (X) → 0 ≀↑ ↑ ↑≀ 1 1 ˜ 0 → HdR (Alb(X)) → H (Alb(X)) → K ⊗Z P ic0 (Alb(X)) → 0

0 →

o` u les fl`eches horizontales de droite sont les applications qui `a une forme diff´erentielle associe son r´esidu, un diviseur alg´ebriquement ´equivalent `a 0 (voir [BLR] pour P ic 0 ). On en d´eduit le r´esultat. Proposition 1.1.2.2. — Supposons que l’´enonc´e (1.1.1.5) soit vrai pour les vari´et´es ab´eliennes sur K (i.e. en ne consid´erant en (iv) que des morphismes entre vari´et´es ab´eliennes), alors il est vrai pour toutes les vari´et´es alg´ebriques lisses sur K. Preuve. — Pour toute 1-forme rationnelle ferm´ee η sur une vari´et´e ab´elienne, on a donc une primitive f η bien d´efinie `a une constante pr`es. Soit ω une 1-forme rationnelle ferm´ee sur une vari´et´e X lisse sur K, ιP : X → Alb(X) un morphisme d’Albanese et η, f , f i , λi comme P en (1.1.2.1). Si fω comme en (1.1.1.5) existe, alors f ω = ι∗p fη +f + λi log(fi ). Si ω = ι∗P η ′ + P df ′ u η−η ′ ∈ dK(Alb(X))log df ′ + λ′i f ′i est une autre ´ecriture, on a ι∗P (η−η ′ ) ∈ dK(X)log , d’o` i ˜ 1 (X) ≃ H ˜ 1 (Alb(X)) (cf. preuve de 1.1.2.1), et fη − fη′ ∈ K(Alb(X))log d’apr`es puisque H P la propri´et´e (iii). Soit f ω′ = ι∗p fη′ + f ′ + λ′i log(fi′ ) : fω − fω′ ∈ K(X)log et d(fω − fω′ ) = 0, donc fω −fω′ est constante sur un ouvert p-adique, donc partout (1.1.1.4). La primitive f ω modulo les constantes est donc ind´ependante des choix. Quitte `a changer les ´ecritures de ω, on v´erifie qu’elle s’´etend bien en une fonction localement analytique sur X(K) \ {pˆoles de ω}. Il reste `a montrer la propri´et´e (iv), mais si g : X ′ → X est un morphisme d´efini sur

860-07 K, P ∈ X(K), Q ∈ X ′ (K), il existe un (unique) morphisme Alb(g) : Alb(X ′ ) → Alb(X) tel que le diagramme : g X′ −→ X ιP ↓ ↓ ιQ Alb(X ′ )

Alb(g)

−→

Alb(X)

soit commutatif (cela r´esulte de la propri´et´e universelle de la vari´et´e d’Albanese [Se1]). La propri´et´e (iv) d´ecoule facilement de la construction de f ω ci-dessus et du fait que fη ◦ Alb(g) = fAlb(g)∗ η si η est une 1-forme rationnelle ferm´ee sur Alb(X). Il faut maintenant d´efinir ces primitives sur les vari´et´es ab´eliennes. Si X est une vari´et´e ab´elienne, on note, pour I ⊂ {1, 2}, mI : X 3 → X l’application qui `a (x, h 1 , h2 ) ∈ X 3 associe x ⊕ (⊕i∈I hi ) o` u ⊕ est la loi d’addition sur X (plus exactement sur le faisceau en groupes repr´esent´e). Si α est une fonction, ou une 1-forme, rationnelle sur X, on pose ∆[2] α = m∗{1,2} α − m∗{1} α − m∗{2} α + m∗∅ α. Les deux r´esultats suivants vont jouer un rˆole clef : Th´ eor` eme 1.1.2.3. — Soit ω une 1-forme rationnelle ferm´ee sur X, alors ∆[2] ω ∈ dK(X 3 )log . Th´ eor` eme 1.1.2.4. — (i) Les sous-groupes ouverts de X(K) forment un syst`eme fondamental de voisinages de l’origine pour la topologie p-adique. (ii) Si V est un sous-groupe ouvert de X(K), alors X(K)/V est un groupe de torsion. Le th´eor`eme (1.1.2.3) est une des incarnations du th´eor`eme du carr´e ([Mu1],6 cor.4). C’est un ´enonc´e alg´ebrique qui n’a rien de sp´ecifique `a la topologie p-adique. Pour une preuve sur K sous cette forme via le principe de Lefschetz, voir ([Colm2],I.3.6), le r´esultat sur K s’en d´eduisant en prenant les invariants sous Gal(K/K). Le th´eor`eme (1.1.2.4) est lui par contre tout `a fait particulier `a la topologie p-adique. Un des arguments clef de sa preuve est que les boules ouvertes comme en (1.1.1.1) sont des groupes pour l’addition sur K d , ce qui est rarement le cas des boules ouvertes de C d ! Voir ([Colm2],II.1.9) ou ([Cole4],4.1) pour des preuves de (1.1.2.4). Si une primitive f ω de ω satisfaisant les conditions du th´eor`eme existe, on doit avoir f∆[2] ω ∈ K(X 3 )log et ∆[2] fω = f∆[2] ω d’apr`es les conditions (iii) et (iv) en (1.1.1.5), ce qui entraˆıne ∆[2] fω ∈ K(X 3 )log . Th´ eor` eme 1.1.2.5. — Soient ω une 1-forme rationnelle ferm´ee sur X et Uω l’ouvert de Zariski de X compl´ementaire des pˆ oles de ω, il existe ` a addition pr`es d’une constante une unique fonction fω localement analytique sur Uω (K) telle que : 1) dfω = ω 2) ∆[2] fω ∈ K(X 3 )log .

860-08 ∗ Preuve. — En utilisant ∆[2] Ta∗ = T(a,0,0) ∆[2] (o` u a ∈ X(K) et Ta est la translation par a sur X(K)), on se ram`ene au cas o` u ω est d´efinie en 0.

Unicit´e : S’il y a deux primitives, leur diff´erence D ω satisfait dDω = 0, donc Dω est localement constant et on a aussi d(∆[2] Dω ) = 0. Mais ∆[2] Dω ∈ K(X 3 )log , d’o` u ∆[2] Dω = 0 par (1.1.1.4) car ∆[2] Dω |X×{0}×{0} = 0. Pour h1 , h2 ∈ Uω (K) tels que h1 ⊕ h2 ∈ Uω (K), on a donc, quitte `a remplacer D ω par Dω − Dω (0), Dω (h1 ⊕ h2 ) = Dω (h1 ) + Dω (h2 ). Cela entraˆıne que Dω se prolonge par continuit´e en un morphisme de groupes sur tout X(K) : si V est un sous-groupe ouvert de Uω (K) sur lequel Dω est d´efini et x ∈ X(K), d’apr`es (1.1.2.4,ii) il existe n x ∈ N tel que [nx ]x = x ⊕ ... ⊕ x (nx fois) est dans V et on pose Dω (x) = n1x Dω ([nx ]x). Comme Dω est localement constant, on peut choisir un tel V sur lequel Dω est constant. Mais Dω |V est alors nul puisque c’est un homomorphisme de groupes, donc Dω est nul partout par la formule ci-dessus. Existence : D’apr`es (1.1.2.3), il existe g ∈ K(X 3 )log tel que ∆[2] ω = dg et on peut supposer g nulle sur X(K) × {0} × {0} puisque ∆[2] ω|X×{0}×{0} = 0. Premi` ere ´ etape : Soit V un sous-groupe ouvert de X(K) contenu dans Uω (K) sur lequel ω est analytique. On peut prendre V isomorphe `a une boule ouverte B(0, δ − )d comme en (1.1.1.1). Soit fω l’unique primitive analytique de ω sur V nulle en 0. On a d(∆[2] fω − g|V 3 ) = ∆[2] ω − ∆[2] ω = 0 donc ∆[2] fω = g|V 3 car ces deux fonctions sont analytiques sur V 3 et nulles sur V × {0} × {0}. Deuxi` eme ´ etape : On prolonge fω `a Uω (K). Notons Vn l’ouvert p-adique de X(K) form´e des x tels que [n]x ∈ V et [k]x n’est pas un pˆole de ω pour tout k ∈ {1, ..., n}. On ´etend fω `a Vn en posant : n−1 X 1 fω (x) = fω ([n]x) − g(0, [k]x, x) . n k=1 En utilisant fω (x ⊕ y) − fω (x) − fω (y) = g(0, x, y) sur V , on v´erifie que cette ´equation est en particulier satisfaite sur V . De plus, f ω (x) est ind´ependant de n tel que x ∈ Vn et on a ∆[2] fω = g l`a o` u les deux termes sont d´efinis. En effet, ces assertions se ram`enent facilement `a des ´egalit´es fonctionnelles sur g seulement, qui sont automatiquement satisfaites sur V et on peut utiliser (1.1.1.4) puisque g ∈ K(X 3 )log pour en d´eduire qu’elles sont vraies partout. On obtient une fonction f ω localement analytique sur ∪n Vn qui est un ouvert p-adique dense de X(K) contenu dans Uω (K) et telle que ∆[2] fω = g partout o` u ¸ca a un sens. Quitte `a translater 0 en un point a ∈ Uω (K) et `a ∗ utiliser T(⊖a,0,0) ∆[2] Ta∗ = ∆[2] , le mˆeme raisonnement appliqu´e `a T a∗ ω fournit une autre fonction fω,a localement analytique sur un ouvert p-adique dense contenant 0 et telle que ∗ ∗ ∆[2] (fω − T⊖a fω,a ) = 0. Soit b un point o` u les deux fonctions f ω et T⊖a fω,a sont d´efinies, la ∗ ∗ fonction h(x) = (fω − T⊖a fω,a )(b ⊕ x) − T⊖a fω,a (b) + fω (b) satisfait h(x ⊕ y) = h(x) + h(y) partout o` u elle est d´efinie, et cela entraˆıne qu’elle se prolonge par continuit´e `a X(K) tout

860-09 entier (cf. la partie sur l’unicit´e). Donc f ω se prolonge par continuit´e en a, c’est-`a-dire finalement a` tout Uω (K). Troisi` eme ´ etape : Soit f ω comme dans la deuxi`eme ´etape et η = df ω − ω, on a ∆[2] η = 0, d’o` u (∆[2] η)|{0}×{a}×X = 0 i.e. Ta∗ η = η. Donc η est une 1-forme localement analytique invariante par translation et nulle sur V , donc nulle partout. Si P et Q sont deux points de X(K) o` u ω est d´efinie, posons

RQ P

ω = fω (Q) − fω (P ).

Corollaire 1.1.2.6. — Avec les notations pr´ec´edentes : RQ RQ RQ (i) P (λω + λ′ ω ′ ) = λ P ω + λ′ P ω ′ (λ, λ′ ∈ K) RQ (ii) P ω = f (Q) − f (P ) si ω = df o` u f ∈ K(X)log RQ ′ (iii) si g : X → X est un morphisme de vari´et´es ab´eliennes sur Spec(K), P g ∗ ω = R g(Q) ω. g(P )

Preuve. — Les ´enonc´es (i) `a (iii) r´esultent de l’unicit´e modulo cte de f ω et de g ∗ ∆[2] = ∆[2] g ∗ . Avec (1.1.2.2), cela ach`eve la preuve du th´eor`eme (1.1.1.5).

Remarque 1.1.2.7. — On peut pr´eciser le comportement des primitives f ω au voisinage des pˆoles de ω : c’est la somme d’une fonction localement m´eromorphe et d’une combinaison lin´eaire de logarithmes de fonctions localement m´eromorphes. Remarque 1.1.2.8. — Si X est une vari´et´e ab´elienne et ω ∈ H 0 (X, Ω1X/K ), ω est une 1-forme ferm´ee invariante par translation sur X ([Mu1],II.4.iii) et f ω est alors un homomorphisme de groupes de X(K) dans K. Selon la terminologie de ([Bou],III.7), une telle primitive est appel´ee un logarithme de X. 1.1.3. Le point de vue de Zarhin. Dans [Za1] et [Za2], Zarhin a construit ind´ependamment des primitives `a toutes les 1-formes rationnelles ferm´ees sur les vari´et´es lisses qui satisfont toutes les propri´et´es en (1.1.1.5), et donc co¨ıncident avec les primitives de Colmez. Les m´ethodes de Zarhin et Colmez sont assez proches. Dans un premier temps, Zarhin montre qu’il y a une mani`ere canonique d’associer une primitive f ω `a une 1-forme ω invariante sur un groupe alg´ebrique commutatif sur K. Dans un deuxi`eme temps, il utilise que toute 1forme rationnelle ferm´ee sur une vari´et´e lisse, vue sur son ouvert de d´efinition, est l’image inverse d’une 1-forme invariante sur un groupe alg´ebrique et il prend l’image inverse de la primitive d´efinie sur ce groupe. 1.2. La construction de Coleman Dans cette partie, on suppose pour simplifier K = C p .

860-10 1.2.1. Quelques mots d’introduction sur la g´eom´etrie rigide. On renvoie `a [Ber], [Ga] ou [Ra1] pour des introductions efficaces et concises `a la g´eom´etrie rigide. Mais d’abord, pourquoi la g´eom´etrie rigide pour d´efinir une int´egration p-adique ? Essentiellement pour deux raisons. La premi`ere est que les fonctions rigides localement constantes sur un espace analytique rigide connexe sont automatiquement constantes. Ceci joue un rˆole clef dans les d´emontrations ci-dessous. La deuxi`eme est que les morphismes de Frobenius sur les sch´emas en caract´eristique p se rel`event localement sur les compl´et´es p-adiques des mod`eles lisses en caract´eristique 0 (lorsque de tels mod`eles existent), mais pas sur les mod`eles eux-mˆemes. On obtient ainsi des morphismes de Frobenius sur les fibres g´en´eriques au sens de Raynaud de ces compl´et´es ([Ber],0.1.2), qui sont seulement des espaces rigides. Or, dans la th´eorie de Coleman, ces morphismes de Frobenius jouent un rˆole analogue au th´eor`eme du carr´e dans l’int´egrale de Colmez. Rappelons qu’une alg`ebre de Tate (sur Cp ) est un quotient de Cp {z1 , ..., zd } = P { α=(α1 ,...,αd ) aα z1α1 ...zdαd , aα → 0 si |α| → +∞} pour un d convenable. Si A est une alg`ebre de Tate, on note Spm(A) = Spec(A)(Cp ) l’ensemble des id´eaux maximaux de A : les Spm(A) jouent en g´eom´etrie rigide le rˆole que jouent les sch´emas affines en g´eom´etrie alg´ebrique. On veut les munir d’une “topologie” plus fine que la topologie de Zariski, mais pour laquelle les seules fonctions localement constantes sont les constantes (du moins si Spec(A) est connexe). Il n’est pas difficile de trouver des sous-ensembles de Spm(A) dont on a envie qu’ils soient des ouverts, par exemple Spm A{z}/(zf − c) o` u f ∈ A et c ∈ C∗p , mais la topologie engendr´ee par ces ouverts redonne en g´en´eral la topologie p-adique totalement discontinue, dont on ne veut pas. L’id´ee est alors de “s´electionner” certains ouverts et certains recouvrements, que l’on appelle admissibles, et remplacer la notion de topologie par la notion plus g´en´erale de topologie de Grothendieck. En munissant l’ensemble Spm(A) de cette topologie de Grothendieck et du faisceau structural rigide (dont les sections globales sur Spm(A) ne sont autres que A), on obtient l’espace analytique rigide affino¨ıde associ´e `a Spm(A) (voir [Ber],0.1). Les espaces analytiques rigides g´en´eraux sont ensuite d´efinis comme les ensembles munis d’une topologie de Grothendieck et d’un faisceau de Cp -alg`ebres qui sont localement isomorphes `a un espace rigide affino¨ıde. On d´efinit des morphismes d’espaces rigides, des diff´erentielles rigides (en particulier des 1-formes), etc... : voir ([Ber],0). Exemple 1.2.1.1. — Si A = C p {z}, Spm(A) ≃ {z ∈ Cp | |z| ≤ 1}, si A = Cp {z1 , z2 }/ (z1 z2 − p), Spm(A) ≃ {z ∈ Cp | p1 ≤ |z| ≤ 1}. Si X est un sch´ema sur Spec(Cp ), disons localement de type fini, on peut lui associer un espace analytique rigide X rig dont l’ensemble sous-jacent est form´e des points ferm´es X(Cp ) de X. Tout ouvert de Zariski U dans X fournit par exemple un ouvert admissible U(Cp ) pour la topologie de Grothendieck sur X(C p ). Mais d’autres ouverts jouent un rˆole crucial : les tubes. Supposons pour simplifier X propre et soit X un mod`ele propre et plat

860-11 sur Spec(OCp ) de fibre sp´eciale Y sur Spec(Fp ). Le crit`ere valuatif de propret´e nous dit X(Cp ) ≃ X (OCp ), on a donc une fl`eche de sp´ecialisation sp : X(C p ) → Y (Fp ). Soient Z un sous-sch´ema de Y , et ]Z[= sp−1 (Z(Fp )) : on peut montrer que ]Z[ est un ouvert admissible de X rig = X(Cp ), qu’on appelle le tube de Z dans X rig ([Ber],1.1.1). Exemple 1.2.1.2. — Si Z est un ouvert de Zariski affine de Y , ]Z[ est un ouvert affino¨ıde de X rig ([Ber],0.2.2.1). Si Z = {y} est un point ferm´e de Y et si de plus X est lisse, ]Z[ est isomorphe `a la boule ouverte B(0, 1 − )d = {(z1 , ..., zd ) ∈ K d | |zi | < 1, 1 ≤ i ≤ d} o` u d est la dimension de Y (mˆeme genre d’arguments que pour (1.1.1.1)). Si X est un sch´ema sur Cp , on note X rig l’espace analytique rigide associ´e. Si X est un espace rigide sur Cp , on note OX le faisceau des fonctions rigides sur X. 1.2.2. Int´egration des formes de seconde esp`ece. Soit X une vari´et´e alg´ebrique sur Spec(C p ) admettant un mod`ele propre et lisse X sur Spec(O Cp ) et notons Y sa fibre sp´eciale sur Fp . Comme Y est de type fini sur Fp , Y provient d’un mod`ele d´efini sur une extension finie (non unique) Fpr de Fp . On appelle morphisme de Frobenius sur Y tout morphisme de Fp -sch´emas Y → Y provenant par extension des scalaires pour un certain r de la puissance r i`eme du Frobenius absolu sur un tel mod`ele. Si φ et φ ′ sont deux morphismes de Frobenius sur Y , il est clair qu’on a φ s = φ′ t pour des entiers s, t convenables. Par ailleurs, il r´esulte de [BO] qu’on a un isomorphisme : 1 1 HdR (X) ≃ Cp ⊗ Hcris (Y /W (Fp )) 1 le H 1 cristallin. Tout o` u W (Fp ) d´esigne les vecteurs de Witt `a coefficients dans F p et Hcris morphisme de Frobenius φ sur Y induit donc par fonctorialit´e un morphisme C p -lin´eaire 1 1 φ∗ : HdR (X) → HdR (X) dont on note Pφ le polynˆome caract´eristique. C’est une cons´equence du th´eor`eme de puret´e de Deligne qu’aucune des racines de P φ n’est une racine de l’unit´e (voir [KM]).

Avant d’´enoncer (et de d´emontrer) le th´eor`eme principal de Coleman, disons quelques mots sur la m´ethode. On se rappelle que, dans le cas o` u X est une vari´et´e ab´elienne, la ∗ strat´egie de Colmez ´etait de remarquer que puisque m {1,2} ω −m∗{1} ω −m∗{2} ω + m∗∅ ω = dgω o` u ω est une 1-forme de seconde esp`ece quelconque sur X et gω une fonction rationnelle sur X 3 (cf. 1.1.2.3), il est naturel de chercher une primitive localement analytique f ω telle que m∗{1,2} fω − m∗{1} fω − m∗{2} fω + m∗∅ fω soit une fonction rationnelle sur X 3 . Revenons `a la situation pr´ec´edente et supposons pour simplifier qu’il existe un morphisme φ : X rig → X rig qui rel`eve un morphisme de Frobenius sur Y (via la fl`eche de sp´ecialisa1 1 tion) et induit φ ∗ sur HdR (X rig ) = HdR (X). Pour toute 1-forme de seconde esp`ece ω sur rig ∗ X, vue sur X , on a donc Pφ (φ )(ω) = dgω o` u gω est une fonction rigide d´efinie sur un rig ouvert de Zariski de X . La strat´egie de Coleman (ant´erieure) consiste alors `a chercher une primitive localement analytique f ω telle que Pφ (φ∗ )(fω ) soit une fonction rigide. Bien

860-12 sˆ ur, en g´en´eral, φ n’est d´efini que localement sur X rig et il faut recoller... Si U est un ouvert de Zariski dans Y , on note comme pr´ec´edemment ]U[⊂ X(C p ) l’ensemble des points ferm´es de X qui se sp´ecialisent sur Y en des points ferm´es de U. Un r´esultat de Coleman ([Cole3],1.1) nous dit que si U est affine, tout morphisme de Frobenius φU : U → U se rel`eve (de fa¸con non unique) en un morphisme d’espaces rigides φ]U [ :]U[→]U[. Fixons ω une 1-forme rationnelle de seconde esp`ece sur X. On peut montrer qu’il existe un recouvrement affine fini Y i de Y tel que ω|]Yi[ = ωi + dfi|]Yi [ o` u ωi ∈ Ω1]Yi [/Cp est une 1-forme rigide ferm´ee et f i ∈ Cp (X). Faisons le choix : 1) d’un tel recouvrement, 2) d’une ´ecriture ω i + dfi |]Yi [ sur chaque ]Yi [, 3) d’un morphisme de Frobenius φ sur Y qui pr´eserve les Y i , 4) de relev´es φi de φ sur les affino¨ıdes ]Yi [. Rappelons que O]Yi [ d´esigne le faisceau structural rigide sur ]Y i [. Th´ eor` eme 1.2.2.1. — Avec les notations ci-dessus, soit Uω l’ouvert de Zariski de X compl´ementaire des pˆoles de ω ; il existe ` a addition pr`es d’une constante une unique fonction fω localement analytique sur Uω (Cp ) telle que : 1) dfω = ω 2) pour tout i, (fω − fi )|]Yi[ se prolonge en une fonction localement analytique sur ]Yi [ et Pφ (φ∗i )((fω − fi )|]Yi [ ) ∈ Γ(]Yi [, O]Yi [ ). De plus, fω est ind´ependante des choix 1) ` a 4) ci-dessus. Preuve. — Notons pour all´eger O(]Yi [) = Γ(]Yi [, O]Yi [ ). Le sch´ema de preuve est le suivant : dans une premi`ere ´etape, on montre que les conditions dg i = ωi et Pφ (φ∗i )(gi ) ∈ O(]Yi[) d´eterminent une unique fonction g i =“(fω − fi )|]Yi[ ” localement analytique sur ]Y i [ modulo une constante ; dans une seconde ´etape, on montre que g i + fi et gj + fj co¨ıncident sur ]Yi [∩]Yj [ modulo une constante et dans la derni`ere ´etape, on montre que l’on peut ajuster les constantes pour vraiment recoller les g i + fi . Premi` ere ´ etape : d´etermination de (f ω − fi )|]Yi[ . 1 1 La fl`eche de fonctorialit´e H dR (X) → HdR (]Yi [) envoie Pφ (φ∗ )(classe de ω) sur la classe de Pφ (φ∗i )(ωi ). Cette classe est donc nulle par choix de P φ , i.e., Pφ (φ∗i )(ωi ) ∈ dO(]Yi [). Montrons qu’il existe une unique fonction g i localement analytique sur ]Y i [ (`a addition pr`es d’une constante) telle que : dgi = ωi Pφ (φ∗i )(gi ) ∈ O(]Yi [). Quitte `a multiplier P φ par une constante, on a Pφ (T ) = a0 + a1 T + ... + an−1 T n−1 + P n−1 ∗ k ∗ T n ∈ Cp [T ] et Pφ (φ∗i )(gi ) = ) ωi ), on voit k ak (gi ◦ φi ). Si Ωi = (ωi , φi ωi , ..., (φi n−1 en posant Gi = (gi , gi ◦ φi , ..., gi ◦ φi ) qu’il suffit de montrer qu’il existe une unique fonction (`a constante pr`es) localement analytique G i :]Yi [→ Cnp telle que dGi = Ωi et

860-13 Gi ◦ φi − MGi ∈ O(]Yi [)n o` u: 

 0 1 0 ... 0  .. ..  .. .. ..  . . . . .    . .. .. .. . . M = . . . . 0      0 ... ... 0 1  −a0 −a1 . . . . . . −an−1 Unicit´e : S’il y en a deux, leur diff´erence D i v´erifie dDi = 0, donc est localement constante, et Di ◦ φi − MDi aussi. Mais Di ◦ φi − MDi ∈ O(]Yi [)n et comme ]Yi [ est connexe (i.e. ne peut s’´ecrire ]Yi[= U ∪U ′ o` u U et U ′ sont deux ouverts admissibles non vides d’intersection vide), Di ◦ φi − MDi est constant de valeur Ci . Par ailleurs, comme 1 n’est pas racine de Pφ , 1 − M ∈ GLn (Cp ) et un calcul donnent, pour k ≥ 1 : (1)

Di ◦ φki − M k Di = (1 − M k )(1 − M)−1 Ci .

Soient yi ∈ Yi (Fp ) et ]yi [= sp−1 (yi ) ⊂]Yi [ le tube correspondant, isomorphe (en tant qu’espace rigide) `a une boule ouverte (cf. 1.2.1.2). Comme y i est d´efini sur une extension ml finie de Fp , il existe m ∈ N tel que φ m i (]yi [) ⊂]yi [. De plus, pour tout x ∈]yi [, φi (x) converge dans ]yi [ quand l tend vers +∞ vers un ǫyi ind´ependant de x ([Dw], lemme 3.0) et on a φm e au point ǫ yi , on obtient : i (ǫyi ) = ǫyi . En faisant m = k dans (1) appliqu´ Di (ǫyi ) = (1 − M)−1 Ci .

(2)

x Par ailleurs, comme D i est localement constante, D i (φml (x)) = Di (ǫyi ) pour lx ≫ 0. En i faisant k = mlx dans (1) appliqu´e au point x, on obtient en utilisant (2) :

(3)

M mlx (Di (x) − (1 − M)−1 Ci ) = 0.

Comme Cp est alg´ebriquement clos, φ m i :]yi [→]yi [ est en fait surjectif et tout x ∈]y i [ ml est dans l’image de φ i pour tout l. En faisant k = ml dans (1), un calcul donne Di (x) − (1 − M)−1 Ci ∈ M ml (Cnp ) pour tout l. Donc Di (x) − (1 − M)−1 Ci ∈ Ker(M mlx ) ∩ \ Im(M ml ) = {0} (alg`ebre lin´eaire ´el´ementaire), ce qui montre que D i est bien une l∈N

fonction constante.

Existence : Puisque Pφ (φ∗i )(ωi ) ∈ dO(]Yi [), on a Hi ∈ O(]Yi [)n tel que φ∗i Ωi − MΩi = dHi . Soient yi ∈ Yi(Fp ) et ǫyi ∈]yi [ comme pr´ec´edemment, comme Ω i est ferm´ee et ]yi [n est une boule ouverte, il existe une unique fonction G yi analytique sur ]yi [n telle que dGyi = Ωi |]yi[ m−1 X m −1 et Gyi (ǫyi ) = (1 − M ) M l Hi (φim−l−1 (ǫyi )) (i.e. on fixe cette valeur en ǫyi ). Soit Gi l=0

l’unique fonction localement analytique sur ]Y i [ telle que Gi |]yi [ = Gyi pour yi ∈ Yi (Fp )

860-14 (les ]yi [ sont disjoints deux `a deux). On a dGi = Ωi et un calcul montre que : (Gi ◦ φi − MGi )(ǫyi ) = Hi (ǫyi ) d(Gi ◦ φi − MGi ) = dHi . La premi`ere ´egalit´e ayant lieu pour tout y i ∈ Yi(Fp ), on en d´eduit Gi ◦ φi − MGi = Hi ∈ O(]Yi [)n . Deuxi` eme ´ etape : Comparaison des fonctions sur ]Y i [ ∩ ]Yj [. Montrons que pour tous i, j, (fi + gi )|]Yi [∩]Yj [ = (fj + gj )|]Yj [∩]Yi[ + cij o` u cij ∈ Cp . En remarquant que φi et φj laissent stable ]Y i [ ∩ ]Yj [ = ]Yi ×Y Yj [, on voit qu’il suffit de montrer que 1) fi + gi est ind´ependant (modulo cte) de l’´ecriture ω| ]Yi[ = ωi + dfi et 2) fi + gi est ind´ependant (modulo cte) du relev´e φ i choisi. Pour 1), soit ω| ]Yi[ = ωi′ + dfi′ une autre ´ecriture et gi′ la primitive de ω i′ construite comme dans la premi`ere ´etape. Alors ωi − ωi′ = d(gi − gi′ ) et Pφ (φ∗i )(gi − gi′ ) ∈ O(]Yi [). Mais on a aussi ωi − ωi′ = d(fi′ − fi ), donc fi′ − fi est d´efini sur tout ]Yi [ et Pφ (φ∗i )(fi′ − fi ) ∈ O(]Yi [), d’o` u fi′ − fi = gi − gi′ modulo constante par l’unicit´e dans la premi`ere ´etape appliqu´ee `a la forme ω i − ωi′ . Pour 2), Coleman montre ([Cole3],1.2a) que si φ i et φ′i sont deux relev´es du mˆeme φ, alors Pφ (φ∗i )(gi)−Pφ (φ′i∗ )(gi ) ∈ O(]Yi [) d’o` u Pφ (φ′i∗ )(gi ) ∈ O(]Yi [) ce qui entraˆıne 2) par unicit´e. Troisi` eme ´ etape : recollement. Reste donc `a recoller les fi + gi , i.e. `a trouver des constantes ci ∈ Cp telles que ci − cj = cij pour tout i, j, et on d´efinit alors fω comme l’unique fonction telle que f ω |]Yi[ = fi + gi + ci . Mais puisque le sch´ema Y est connexe, ∩ i Yi 6= ∅, donc ∩i ]Yi [6= ∅ et il est alors ´el´ementaire que l’on peut ajuster les constantes ci . Montrons enfin que fω ne d´epend pas du choix du morphisme φ sur Y . Il suffit pour cela de montrer que remplacer φ par φ s ne change pas fω . Comme fω ne d´epend pas des autres choix, on garde le mˆeme recouvrement, la mˆeme ´ecriture et on remplace juste φ i par φsi sur ]Yi [. On v´erifie que Pφs (T s ) = Πζ s =1 Pφ (ζT ). Donc Pφ (φ∗i )(gi) ∈ O(]Yi [) entraˆıne Pφs ((φsi )∗ )(gi) ∈ O(]Yi [) et le r´esultat d´ecoule encore de l’unicit´e de g i dans la premi`ere ´etape. Comme dans la premi`ere partie, on pose, si P et Q sont deux points de X(C p ) o` uω RQ est d´efinie : P ω = fω (Q) − fω (P ).

Corollaire 1.2.2.2. — Avec les notations pr´ec´edentes : RQ RQ RQ (i) P (λω + λ′ ω ′ ) = λ P ω + λ′ P ω ′ (λ, λ′ ∈ Cp ) RQ (ii) P ω = f (Q) − f (P ) si ω = df o` u f ∈ Cp (X) (iii) si g : X ′ → X est un morphisme de vari´et´es propres sur Spec(Cp ) ayant bonne RQ R g(Q) r´eduction, P g ∗ ω = g(P ) ω.

860-15 Preuve. — Les ´enonc´es (i) et (ii) r´esultent de l’unicit´e modulo cte de f ω . L’´enonc´e (iii) est facile si g provient d’un morphisme X → X ′ entre des mod`eles propres et lisses. Sinon, soient Alb(X ) et Alb(X ′ ) les mod`eles de N´eron des vari´et´es d’Albanese Alb(X) et Alb(X ′ ) associ´ees `a X et X ′ ([BLR]). Des propri´et´es du mod`ele de N´eron on d´eduit un diagramme commutatif : g X′ −→ X ↓ ↓ ′ X X ↓ ↓ Alb(X ′ ) −→ Alb(X ) d’o` u (iii) en remarquant que toute 1-forme de seconde esp`ece sur X provient, modulo une 1 1 forme exacte, d’une 1-forme de seconde esp`ece sur Alb(X) (car HdR (X) ≃ HdR (Alb(X))). Corollaire 1.2.2.3. — L’int´egrale avec l’int´egrale d´efinie par Colmez.

RQ P

ω ne d´epend pas du mod`ele choisi et co¨ıncide

Preuve. — Utiliser (ii) et (iii) dans (1.2.2.2), le fait que les vari´et´es auxiliaires utilis´ees par Colmez pour d´efinir son int´egrale (i.e. Alb(X) et Alb(X) 3 ) ont toutes bonne r´eduction lorsque X a bonne r´eduction et l’unicit´e en (1.1.2.5). Remarque 1.2.2.4. — Si σ est un automorphisme continu de C p , de l’unicit´e de fω RQ R σ(Q) r´esulte aussi le fait que σ( P ω) = σ(P ) σ ∗ ω o` u σ : Cp ⊗σ X → X. En particulier, si X provient d’une vari´et´e d´efinie sur une extension finie K de Q p , si σ ∈ Gal(Qp /K), RQ P, Q ∈ X(K) et ω est d´efini sur K, on a bien P ω ∈ K. 2. APPLICATIONS 2.1. L’accouplement des p´ eriodes p-adiques Dans cette partie, K est une extension finie de Qp . Nous allons appliquer ce qui pr´ec`ede, en suivant Colmez, aux p´eriodes p-adiques des vari´et´es ab´eliennes. Voir [Il] et la remarque (2.1.3.4) pour l’historique de ce sujet, cas particulier des conjectures de Fontaine. C’est Coleman qui le premier a eu l’id´ee dans [Cole2] d’utiliser l’int´egration p-adique pour red´efinir les p´eriodes p-adiques des vari´et´es ab´eliennes avec bonne r´eduction, ou plutˆot leur image dans C p . Comme les int´egrales p-adiques ne sont pas multivalu´ees, on s’attendrait normalement `a ce qu’il n’existe pas de p´eriodes en p-adique ! Et effectivement, si on veut des p´eriodes `a valeurs dans Cp associ´ees aux 1-formes de H 0 (X, Ω1X/K ) (comme sur les complexes), on

860-16 les trouve a posteriori toutes nulles (cf. 2.1.2.2). Le miracle est qu’il existe n´eanmoins des + p´eriodes mais `a un niveau “sup´erieur”, c’est-`a-dire `a valeurs dans une Q p -alg`ebre BdR , introduite par Fontaine, qui se surjecte seulement sur C p . + + 2.1.1. Quelques rappels sur BdR . L’anneau BdR a d´ej`a ´et´e introduit dans ce s´eminaire ([Il]), mais nous aurons besoin des d´etails de sa construction. Les r´ef´erences pour ce qui suit sont [Fo1], [Fo2].

Soit R l’ensemble des suites x = (x (0) , x(1) , ..., x(n) , ...) d’´el´ements de OCp telles que (x(n+1) )p = x(n) . On munit R des lois · et + en posant x · y = (x (n) y (n) )n∈N et x + y = (s(n) )n∈N o` u: s(n) = lim (x(n+m) + y (n+m) )p

m

m→+∞

les hypoth`eses faisant que cela converge bien dans O Cp . On montre que ces lois font de R un anneau commutatif int`egre d’´el´ement unit´e 1 = (1, 1, ...). De plus : m

p · 1 = lim (1| + {z ... + 1})p = 0 m→+∞ p fois

donc R est un anneau de caract´eristique p et le Frobenius x = (x (n) ) 7→ xp = ((x(n) )p ) sur R est clairement un isomorphisme, i.e., R est parfait. Il est de plus muni d’une action naturelle de Gal(Qp /Qp ) via l’action sur OCp et d’une valuation val(x) = val(x (0) ) pour laquelle il est s´epar´e et complet de corps r´esiduel R/{x|val(x) > 0} ≃ F p . Comme R est parfait, il est tentant de consid´erer les vecteurs de Witt W (R) `a +∞ X coefficients dans R ([Se2]) : tout ´el´ement de W (R) s’´ecrit de fa¸con unique pn [xn ] n=0

o` u xn ∈ R et [xn ] est son repr´esentant multiplicatif dans W (R). On montre alors qu’on a une surjection d’anneaux : θ

:

W (R) +∞ X n=0

→

pn [xn ] 7→

OCp +∞ X

pn x(0) n

n=0

dont le noyau est un id´eal principal engendr´e par p − [p] o` u p = (p (n) ) ∈ R est un ´el´ement tel que p(0) = p. On remarque que W (R) est complet pour la topologie (p, Ker(θ))-adique = (p, [p])-adique. + D´ efinition 2.1.1.1. — L’anneau BdR est le compl´et´e de W (R)[ 1p ] par rapport ` a l’id´eal Ker(θ) = (p − [p]). + + La surjection θ se prolonge en une surjection encore not´ee θ : BdR → Cp . L’anneau BdR + est de valuation discr`ete complet d’id´eal maximal Ker(θ) = (p−[p])B dR et de corps r´esiduel + BdR /Ker(θ) ≃ Cp , c’est-`a-dire qu’il s’identifie non canoniquement `a C p [[T ]]. On peut

860-17 + + consid´erer plusieurs topologies sur B dR . Nous munissons ici B dR de celle pour laquelle les m k p W (R)+(Ker(θ)) forment une base de voisinage de 0 quand m et k d´ecrivent N, c’est-`adire que (xn )n tend vers 0 si et seulement si, pour tout M ∈ N, x n ∈ pM W (R)+(Ker(θ))M + pour n ≫ 0. Pour cette topologie, BdR est s´epar´e et complet. Il existe une action naturelle + et continue de Gal(Qp /Qp ) sur BdR via l’action sur R, qui commute `a θ. Il n’existe pas de + section Cp ֒→ BdR de θ qui soit compatible `a l’action de Galois, mais on peut montrer que + Qp s’identifie canoniquement `a la clˆoture alg´ebrique de Q p dans BdR et que le diagramme : + Qp ֒→ BdR ↓θ k Qp ֒→ Cp

est commutatif et compatible `a Gal(Q p /Qp ). En fait, si on munit Q p de la topologie + + induite par celle de BdR (qui n’est pas la topologie p-adique), Colmez a montr´e que B dR n’est autre que le compl´et´e de Q p pour cette topologie. Autrement dit, Q p est dense dans + BdR (cf. appendice de [Fo2]). 2.1.2. Accouplement des p´eriodes p-adiques : ´enonc´e du th´eor`eme. Soit X une vari´et´e lisse + sur K de dimension d. On note encore θ : X(BdR ) → X(Cp ) l’application induite par + + θ : BdR → Cp et on remarque qu’elle est surjective (choisir une section C p ֒→ BdR de θ). + + Par ailleurs, comme Q p ֒→ BdR , X(Qp ) ֒→ X(BdR ). Lemme 2.1.2.1. — Soit f une fonction localement analytique sur X(Qp ) qui se prolonge en une fonction localement analytique sur X(Qp ), alors f se prolonge aussi cano+ niquement ` a X(BdR ). + Preuve. — Soit x ∈ X(BdR ), on peut trouver un ouvert de Zariski Ux = Spec(Qp [x1 , ..., xn , z1 , ..., zd ]/(f1 , ..., fn )) de X⊗K Qp tel que la projection sur z1 , ..., zd induit un isomorphisme + + d entre un sous-ensemble V de Ux (BdR ) contenant x et {(z1 , ..., zd ) ∈ (BdR ) | |θ(zi )| < + δ, 1 ≤ i ≤ d} pour un δ suffisamment petit dans R − {0}. Comme X(Qp ) ∩ V ≃ d

{(z1 , ..., zd ) ∈ Qp | |zi | < δ, 1 ≤ i ≤ d}, et comme f se prolonge en une fonction analytique au voisinage de θ(x) ∈ X(C p ), on peut supposer f analytique sur X(Qp ) ∩ V + quitte `a se restreindre `a un ouvert de V contenant x. En remarquant que si x ∈ B dR , + (xn )n∈N converge dans BdR si et seulement si (θ(x) n )n∈N converge dans Cp , on voit que + la s´erie formelle en z 1 , ..., zd d´efinissant f sur X(Qp )∩V converge dans BdR sur tout V . Si ω est une 1-forme rationnelle ferm´ee sur X et f ω une des primitives construites en + + (1.1.1.5), on note encore fω la prolong´ee `a X(BdR ) (`a valeurs maintenant dans BdR ) et RQ + ω = fω (Q) − fω (P ) si P, Q ∈ X(BdR ). Avant d’´enoncer le th´eor`eme sur l’accouplement P des p´eriodes p-adiques des vari´et´es ab´eliennes, donnons un exemple simple (mais sortant stricto sensu du cadre des vari´et´es ab´eliennes).

860-18 Exemple 2.1.2.2. — Supposons X = Spec(C[z, z1 ]) = Gm . Soient γ un g´en´erateur de n H1 (X(C), Z) = H1 (C∗ , Z), ω = dz ∈ H 0 (X, Ω1X/C ) et εn = e2iπ/p ∈ X(C). On sait que : z Z Z εn Z 2πn iθ p de n n ω=p ω=p = 2iπ. eiθ γ 1 0 C’est la p´eriode classique. Supposons maintenant X = Spec(K[z, 1z ]) et soient γ = (εn )n ∈ H 0 (X, Ω1X/K ). On a fω = log et, par un g´en´erateur de Tp (X) = ←− lim µpn (Qp ) et ω = dz z d´efinition : Z εn n n p ω = pn log(εn ) = log(εpn ) = 0 ! 1

+ Consid´erons maintenant ε˜n = [(εm+n )m∈N ] ∈ X(BdR ) et soit t = log(˜ ε0 ) = − + BdR − {0}. Bien sˆ ur, ε˜n 6= εn mais θ(˜ εn ) = εn . De plus : Z ε˜n pn ω = pn log(˜ εn ) = log(˜ ε0 ) = t.

+∞ X (1−˜ ε )n 0

n

∈

n=1

1

+ B dR ,

Plus g´en´eralement, si x ∈ soit mk (x) le plus grand entier de Z tel que x ∈ p mk (x) W (R)+ + (Ker(θ))k+1 et disons qu’une suite (xn )n de points de BdR est born´ee si la suite (mk (xn ))n + est born´ee pour tout k. On peut voir que la suite (ε n )n ci-dessus vue dans BdR n’est pas une suite born´ee, par contre la suite (˜ ε n )n est ´evidemment born´ee (tous les m k (˜ εn ) sont + ′ nuls). Soit (˜ εn )n une autre suite born´ee quelconque de BdR v´erifiant seulement θ(˜ ε ′n ) = εn , R ′ ε ˜ + alors on peut montrer que la suite p n 1 n ω = pn log(˜ ε′n ) converge toujours vers t dans BdR . Cet ´el´ement t, introduit par Fontaine, peut ˆetre vu comme l’analogue p-adique de 2iπ. Ce qui suit va consister `a transposer l’exemple ci-dessus au cadre des vari´et´es ab´eliennes. Rappelons qu’une 1-forme de seconde esp`ece sur X est par d´efinition une 1-forme rationnelle ferm´ee sur X dont le r´esidu est nul, i.e. qui ne contient pas de termes en df 1 dans une de ses ´ecritures, et que HdR (X) s’identifie au quotient des 1-formes de sef conde esp`ece sur X par les diff´erentielles des fonctions rationnelles. On suppose maintenant que X est une vari´et´e ab´elienne. Soient ω une 1-forme de seconde esp`ece sur X et γ = (γn )n ∈ Tp (X) = ←− lim X[pn ](Qp ) o` u X[pn ](Qp ) = {x ∈ X(Qp ) | [pn ]x = 0}. En vertu R γ˜ de l’exemple pr´ec´edent, on a envie de consid´erer lim pn 0 n ω pour des “bons” relev´es γ˜n de γn dans

+ X(BdR )

n→+∞

par θ.

D´ efinition 2.1.2.3. — Si Y est une vari´et´e lisse sur K, une suite (˜ γn )n de points de + + Y (BdR ) est dite born´ee dans Y (BdR ) si pour tout recouvrement fini (Ui )i∈I de Y par des + ouverts de Zariski, il existe une d´ecomposition N = ∪i∈I Ii telle que {˜ γn , n ∈ Ii } ⊂ Ui (BdR ) et telle que pour toute fonction fi ∈ Γ(Ui , OUi ), la suite {f (˜ γn ), n ∈ Ii } est born´ee dans + BdR (cf. 2.1.2.2). + Si U est un ouvert de Zariski de X, une suite born´ee dans U(B dR ) est born´ee dans + X(BdR ) mais la r´eciproque est fausse (prendre une suite qui s’accumule autour du ferm´e

860-19 compl´ementaire de U dans X). On peut maintenant ´enoncer le th´eor`eme. On choisit une R γ˜ suite born´ee (˜ γn )n de relev´es de (γn )n et on esp`ere que la suite pn 0 n ω converge dans + BdR vers une limite qui n’est pas trop souvent nulle... Mais il faut modifier 0 et γ˜ n pour + ˆetre sˆ ur qu’ils ne s’approchent pas trop des pˆoles de ω dans X(BdR ). Th´ eor` eme 2.1.2.4. — Soient X une vari´et´e ab´elienne sur K, ω une 1-forme rationnelle de seconde esp`ece sur X, Uω l’ouvert de Zariski de X compl´ementaire des pˆ oles de ω et γ = (γn )n ∈ Tp (X). + + (i) Il existe une suite (˜ γn )n born´ee dans X(BdR ) et une suite (δn )n born´ee dans Uω (BdR ) + telles que θ(˜ γn ) = γn et la suite (δn ⊕ γ˜n )n est born´ee dans Uω (BdR ). R δ ⊕˜γ + (ii) Si (˜ γn )n et (δn )n sont de telles suites, la suite pn δnn n ω converge dans BdR vers R 1 un ´el´ement γ ω qui ne d´epend que de γ et de la classe de ω dans HdR (X). R + 1 (iii) L’application de H dR (X) × Tp (X) dans BdR qui ` a (ω, γ) associe γ ω est bilin´eaire, + = Ker(θ). commute ` a l’action de Galois et envoie H 0 (X, Ω1X/K ) × Tp (X) dans (p − [p])BdR (iv) L’accouplement “p´eriode” ci-dessus est non d´eg´en´er´e, i.e. si (ω1 , ..., ω2d ) fournit une R 1 base de HdR (X) et (γ1 , ..., γ2d ) une base de Tp (X), la matrice ( γj ωi )1≤i,j≤2d appartient `a + GL2d (BdR ) o` u BdR = F rac(BdR ). 2.1.3. Esquisse de preuve et relations de Riemann p-adiques. Nous ne disons rien sur la preuve de (i) qui est purement technique (voir [Colm2],II.3.1). + Passons `a (ii). Remarquons d’abord que si (x n )n est une suite de BdR telle que (pxn − + n−1 xn−1 )n est born´ee, alors p (pxn − xn−1 ) tend vers 0 dans BdR quand n → +∞ et donc + pn xn converge dans BdR . Oublions dans un premier temps les δ n et supposons [p]˜ γn = γ˜n−1 . R γ˜n R γ˜n−1 Pour la convergence, il suffit de voir que la suite y n = p 0 ω − 0 ω est born´ee dans + ∗ ∗ BdR . Mais yn = (pfω − [p] fω )(˜ γn )+cte et pfω − [p] fω ∈ K(X) (car [p] sur X induit la 1 multiplication par p sur H dR (X)). Si la suite γ˜n est born´ee dans l’ouvert o` u pfω − [p]∗ fω + est d´efini, alors par d´efinition, (y n )n est born´ee dans BdR . Si elle n’est pas born´ee dans ′ cet ouvert, il faut la modifier avec des δ n pour qu’elle le devienne. Dans le cas g´en´eral, on Z δn ⊕˜γn Z δn−1 ⊕˜γn−1 d´ecompose yn = p ω− ω sous la forme yn = y1,n + y2,n + y3,n + y4,n o` u: δn

y3,n y4,n

δn ⊕˜ γn

δn−1

Z

′ ⊕˜ δn γn

p ω−p ω ′ δn δn Z δn′ ⊕˜γn Z [p]δn′ ⊕[p]˜γn = p ω− ω ′ ′ δn [p]δn Z [p]δn′ ⊕[p]˜γn Z δn−1 ⊕[p]˜γn = ω− ω ′ [p]δn δn−1 Z δn−1 ⊕[p]˜γn Z δn−1 ⊕˜γn−1 = ω− ω

y1,n = y2,n

Z

δn−1

=

p(∆[2] fω )(δn′ , δn ⊖ δn′ , γ˜n )

= (pfω − [p]∗ fω )(δn′ ⊕ γ˜n ) − (pfω − [p]∗ fω )(˜ γn ) =

(∆[2] fω )(δn−1 , [p]δn′ ⊖ δn−1 , [p]˜ γn )

=

fω (δn−1 ⊕ [p]˜ γn ) − fω (δn−1 ⊕ γ˜n−1)

δn−1

+ + ) telle que δn′ ⊕ γ˜n est born´ee ) ∩ ([p]∗ Uω )(BdR et o` u δn′ est une suite born´ee dans Uω (BdR dans ce mˆeme ouvert (il en existe). On peut d´eduire que les suites (y 1,n )n , (y2,n )n et (y3,n )n

860-20 sont born´ees du fait que les fonctions ∆[2] fω et pfω − [p]∗ fω sont rationnelles. Quant `a (y4,n )n , on montre qu’elle est born´ee en utilisant θ(δ n−1 ⊕ [p]˜ γn ) = θ(δn−1 ⊕ γ˜n−1 ). Donc R γn + n δn ⊕˜ ′′ p δn ω converge dans BdR . Si (δn )n est remplac´e par (δn )n satisfaisant les propri´et´es (i) en (1.1.1.5) (sans changer γ˜n ), alors la suite (δn′′′ )n d´efinie par δn′′′ = δn si n est pair et δn′′′ = δn′′ si n est impair v´erifie encore ces propri´et´es, d’o` u on d´eduit que la limite est ind´ependante de (δn )n . Si on choisit un autre relev´e born´e (˜ γ n′ )n , la suite (δn ⊕ γ˜n′ )n est + encore born´ee dans Uω (BdR ) ([Colm2],II.3.1) et le mˆeme raisonnement en “m´elangeant” ′ les suites (˜ γn )n et (˜ γn )n montre que la limite est ind´ependante du relev´e born´e de (γ n )n R δ ⊕˜γ choisi. Enfin, si ω = dfω avec fω ∈ K(X), la suite δnn n ω = fω (δn ⊕ γ˜n ) − fω (δn ) est par R δ ⊕˜γ + d´efinition born´ee ce qui entraˆıne que p n δnn n ω converge vers 0 dans BdR . Ceci ach`eve (ii). Passons au (iii). La lin´earit´e par rapport `a ω vient de la lin´earit´e de l’int´egrale. Si ((γn )n , (γn′ )n ) ∈ Tp (X) × Tp (X), on prend γ˜n ⊕ γ˜n′ comme relev´e de γ n ⊕ γn′ , qui forme + + encore une suite born´ee dans X(BdR ). On peut trouver (δn )n born´ee dans Uω (BdR ) telle ′ ′ que les trois suites (δn ⊕ γ˜n )n , (δn ⊕ γ˜n )n et (δn ⊕ γ˜n ⊕ γ˜n )n y sont encore born´ees. On ´ecrit : Z δn ⊕˜γn ⊕˜γn′ Z δn ⊕˜γn Z δn ⊕˜γn ⊕˜γn′ n n n p ω=p ω+p ω δn

δn

δn ⊕˜ γn

et on remarque que la suite (δn ⊕ γ˜n )n v´erifie les propri´et´es (i) par rapport `a (˜ γ n′ )n . Par R R ′ δ ⊕˜ γ ⊕˜ γ + vers γ ′ ω, d’o` u la lin´earit´e par (ii), cela entraˆıne que p n δnn⊕˜γnn n ω converge dans BdR 0 1 rapport `a γ. Enfin, si ω ∈ H (X, ΩX/K ), la primitive f ω en (1.1.1.5) nulle en 0 est un R δ ⊕˜γ homomorphisme de groupes (cf. 1.1.2.8) donc p n δnn n ω = pn fω (˜ γn ) = fω ([p]n γ˜n ). Or R δ ⊕˜ γ θ(fω ([p]n γ˜n )) = fω ([p]n γn ) = fω (0) = 0, d’o` u pn δnn n ω ∈ Ker(θ). Le plus d´elicat est (iv), qui d´ecoule de l’analogue p-adique des relations de Riemann entre les p´eriodes. Rappelons que si U est un ouvert de Zariski de X, on a un isomor∼ phisme Γ(U, OU ) ⊗K H 0 (X, Ω1X/K ) → H 0 (U, Ω1U/K ) (car X est ab´elienne). Soit (ω 1 , ..., ωd ) une base sur K de H 0 (X, Ω1X/K ), en passant `a U an = U(K), on voit que si G est une P fonction localement analytique sur U(K), on a dG = di=1 Gi ωi o` u les Gi sont localement analytiques sur U(K).

Proposition 2.1.3.1. — ([Colm2],II.1.19) Soit D un diviseur de X. Il existe une fonction GD localement analytique sur X(K) − D(K) et ayant une singularit´e logarithmique le long de D telle que ∆∗ GD = GD (x ⊕ y ⊕ z) − GD (x ⊕ y) − GD (x ⊕ z) − GD (y ⊕ z) + GD (x) + GD (y) + GD (z) soit le logarithme d’une fonction rationnelle sur X 3 . De plus, si P dGD = di=1 GD,iωi , ωD,i = dGD,i est une 1-forme de seconde esp`ece sur X pour tout i. ` la base de cette proposition est le th´eor`eme du cube qui dit que l’image inverse ∆ ∗ D A de D sur X 3 par ∆ : X 3 → X est le diviseur d’une fonction rationnelle. D’autre part, rappelons qu’`a D est associ´e l’accouplement de Weil ε D : Tp (X) × Tp (X) → Tp (Gm ) (cf.

860-21 ([Mu1],IV.20) par exemple). Si (γ, γ ′ ) ∈ Tp (X) × Tp (X), log[εD (γ, γ ′ )] ∈ Zp t (voir 2.1.2.2 pour t) et l’accouplement : log[εD ] : Tp (X) × Tp (X) → Zp t est bilin´eaire et antisym´etrique. Th´ eor` eme 2.1.3.2. — (Relations de Riemann p-adiques) Soit (γ, γ ′ ) ∈ Tp (X)×Tp (X), alors : Z Z Z d Z X ′ log[εD (γ, γ )] = ωi ωD,i − ωi ωD,i . i=1

γ

γ′

γ′

γ

Voir ([Colm2],II.3.5) pour la preuve. En cons´equence, on voit que si γ 1 , ..., γ2d est une base de Tp (X) et si on note ωd+i = ωD,i (i ∈ {1, ..., d}), on a l’´egalit´e matricielle : Z 0 I Z d t log[εD (γi, γj )] 1≤i,j≤2d = ωi · · ωi 1≤i,j≤2d 1≤i,j≤2d −Id 0 γj γj

o` u i est le num´ero de la ligne et j celui de la colonne. Comme on peut toujours choisir D tel que l’accouplement de Weil soit non d´eg´en´er´e, i.e. tel que : × det log[εD (γi , γj )] ∈ Q× p t ⊂ BdR 1≤i,j≤2d

1 cela montre que, pour un tel D, (ω 1 , ..., ω2d ) fournit une base de HdR (X) et

∈ GL2d (BdR ).

R

ω γj i

1≤i,j≤2d

Remarque 2.1.3.3. — Les fonctions GD m´eritent le nom de fonctions de Green padiques. Les 1-formes ωD,i sont d´ej`a d´efinies dans [Cole2]. De (2.1.2.4), on peut d´eduire ∼ i u H i (X) = des isomorphismes B dR ⊗K HdR (X) → BdR ⊗Qp He´it (XK , Qp ) pour tout i (o` Vi 1 H (X)) et les relations de Riemann p-adiques sont une autre fa¸con de dire que pour 2 i = 2 l’isomorphisme envoie la classe du diviseur D dans H dR (X) sur sa classe dans 2 He´t (XK , Qp ). 1 Remarque 2.1.3.4. — Les premiers th´eor`emes de comparaison entre H dR (X) et 1 He´t (XK , Qp ) pour une vari´et´e ab´elienne X sur K sont dus `a Tate dans le cas de bonne r´eduction ([Ta1]) et Raynaud dans le cas g´en´eral ([Bog]), qui d´emontrent la c´el`ebre d´ecomposition de Hodge-Tate : Cp ⊗Qp He´1t (XK , Qp ) ≃ Cp (−1) ⊗K H 0 (X, Ω1X/K ) ⊕ Cp ⊗K H 1 (X, OX ) .

Cette d´ecomposition a ensuite ´et´e red´emontr´ee par Fontaine dans le cas g´en´eral ([Fo3]), puis par Coleman dans le cas de bonne r´eduction ([Cole2]) via son int´egration p-adique + expos´ee au (1.2). L’´enonc´e avec BdR comme en (2.1.2.4) est plus fort (la d´ecomposition ci-dessus s’en d´eduit facilement) et a d’abord ´et´e obtenu par Fontaine et Messing (cf. [Wi]). C’est un cas particulier de conjectures en tout degr´e de cohomologie dues `a Fontaine (appendice de [Fo1]) qui sont maintenant d´emontr´ees en toute g´en´eralit´e (travaux

860-22 de Fontaine-Messing, Faltings, Kato, Tsuji, etc...) : voir l’expos´e d’Illusie [Il] dans ce s´eminaire et [Ts] pour plus de d´etails. Mais les preuves, o` u il n’est pas du tout question d’int´egrer des formes diff´erentielles, sont souvent longues et techniques. La preuve de Colmez pour le H 1 , fid`ele `a la strat´egie classique sur les complexes, n’en est que plus ´el´egante. 2.2. Les polylogarithmes p-adiques Dans cette partie, K = Cp . Dans le cas des courbes avec bonne r´eduction, Coleman a d´evelopp´e une variante de sa construction en (1.2) (les “basic wide open spaces” en anglais) qui lui permet d’int´egrer toutes les formes diff´erentielles rationnelles, mais aussi les formes rigides et mˆeme, par it´eration, des formes localement analytiques pas forc´ement alg´ebriques ou rigides, ce que ne permet pas l’int´egrale de Colmez. Nous pr´esentons ci-dessous un cas particulier de cette construction que nous utilisons ensuite pour d´efinir les polylogarithmes p-adiques. 2.2.1. It´eration de l’int´egration sur les courbes. Soient donc X une courbe propre et lisse sur Spec(Cp ) qui admet un mod`ele X propre et lisse sur Spec(O Cp ) et Y la fibre sp´eciale sur Spec(Fp ). Soient S ⊂ X(Cp ) un ensemble fini de points ferm´es, U = X − S et S l’image de S dans Y (Fp ). Soient U rig = U(Cp ) (= espace analytique rigide associ´e `a U) et W = u sp est la fl`eche de sp´ecialisation. On suppose que l’application sp−1 (Y (Fp ) − S) ⊂ U rig o` S → S est injective. L’ouvert U rig est alors un cas particulier de ce que Coleman appelle un “basic wide open space” ([CS],2.1) et W est un “affino¨ıde sous-jacent” (cf. 1.2.1.2). On a dans ce cas : U rig − W = ∪s∈S Cs o` u Cs est une couronne ouverte autour de s ∈ S isomorphe `a {z ∈ Cp | 0 < |z| < 1}. Via cet isomorphisme, on pose pour r ∈ ]0, 1[ : [ Ur = W ∪ Cs,r ⊂ U s∈S

o` u Cs,r ⊂ Cs correspond `a {z ∈ Cp | r < |z| < 1} ⊂ {z ∈ Cp | 0 < |z| < 1}. Quand r tend vers 1, les Ur forment une famille d´ecroissante de voisinages de W . Ils d´ependent des isomorphismes choisis, mais si (U r′ ′ )r′ est une famille obtenue `a partir d’autres choix de coordonn´ees locales sur les C s , et si r ′ ∈ ]0, 1[, il existe r suffisamment proche de 1 tel que Ur ⊂ Ur′ , et r´eciproquement. Cela suffit pour que les r´esultats ci-dessous soient ind´ependants de la famille (U r )r . Fixons un morphisme de Frobenius sur Y (cf. 1.2.2) qui envoie S dans S.

860-23 Proposition 2.2.1.1. — (i) Pour r suffisamment proche de 1, il existe un morphisme rigide φ : Ur → U rig tel que φ(W ) ⊂ W , φ(Cs ∩ Ur ) ⊂ Cs (s ∈ S) et qui commute via la fl`eche de sp´ecialisation avec le morphisme de Frobenius fix´e sur Y (Fp ). (ii) Si N est un entier fix´e et n ∈ {0, ..., N}, il existe r suffisamment proche de 1 tel que φn = φ ◦ ... ◦ φ (n fois) est encore bien d´efini de Ur dans U rig . Voir ([CS],2.2) pour la preuve. Si n est un entier fix´e et si 1 − r est suffisamment petit, on peut donc d´efinir par fonctorialit´e : (φ ∗ )n = (φn )∗ : Ω1U rig /Cp → Ω1Ur /Cp o` u Ω1U rig /Cp d´esigne les 1-formes (rigides) sur U rig (resp. avec Ur ). Proposition 2.2.1.2. — Il existe un polynˆ ome P1 (T ) ∈ Cp [T ] dont aucune des racines n’est une racine de l’unit´e tel que, pour tout ω ∈ Ω1U rig /Cp , tout φ comme en (2.2.1.1) et tout r suffisamment proche de 1, P1 (φ∗ )(ω) ∈ dΓ(Ur , OUr ). Indication de preuve. — L’inclusion d’espaces rigides U r ֒→ U rig induit un isomor∼ 1 1 1 phisme HdR (U rig ) → HdR (Ur ) o` u HdR (U rig ) = Ω1U rig /Cp /dΓ(U rig , OU rig ) (resp. avec Ur ). 1 1 Le morphisme φ : Ur → U rig donne donc un morphisme φ ∗ : HdR (U rig ) → HdR (U rig ). Le r´esultat vient du fait que le polynˆome caract´eristique de φ ∗ s’identifie au num´erateur de la fonction ζ de la courbe affine Y − S, dont les racines sont des nombres de Weil, i.e. de valeur absolue complexe (pour tout plongement dans C) une puissance non nulle de p. Pour tout s ∈ S, soit Γ(Cs , OCs )log = Γ(Cs , OCs )[log(f ), f ∈ Γ(Cs , OCs )× ]. Th´ eor` eme 2.2.1.3. — Soient φ, P1 et r comme ci-dessus et ω dans Ω1U rig /Cp , il existe a addition pr`es d’une constante une unique fonction fω localement analytique sur U rig = ` U(Cp ) telle que : 1) dfω = ω 2) P1 (φ∗ )(fω ) ∈ Γ(Ur , OUr ) 3) pour tout s ∈ S, fω |Cs ∈ Γ(Cs , OCs )log . De plus fω est ind´ependant de r, φ, P1 et du morphisme de Frobenius sur Y . Preuve. — Soit g ∈ Γ(Ur , OUr ) tel que P1 (φ∗ )(ω) = dg. En proc´edant comme dans la premi`ere ´etape de (1.2.2.1), mais avec l’affino¨ıde W au lieu de l’affino¨ıde ]Y i [, on a une unique (`a cte pr`es) fonction fW localement analytique sur W telle que df W = ω|W et P1 (φ∗ )(fW ) = g|W ∈ Γ(W, OW ). Sur Cs , il est facile de voir que tout 1-forme de Ω 1Cs /Cp s’int`egre de fa¸con unique (mod. cte) dans Γ(Cs , OCs )log : soit fs une telle primitive de ω| Cs . Soit f l’unique fonction localement analytique sur U rig telle que f |W = fW et f |Cs = fs pour tout s ∈ S : il faut ajuster les constantes d’int´egration pour avoir P 1 (φ∗ )(f ) ∈ Γ(Ur , OUr ). Soit cs = (P1 (φ∗ )(fs ) − g)|Cs∩Ur ∈ Γ(Cs ∩ Ur , OCs ∩Ur )log (on utilise ici φ(C s ∩ Ur ) ⊂ Cs ), on a dcs = 0 sur Cs ∩ Ur = Cs,r qui est connexe, donc cs est constant. Soit fω tel que s : on v´erifie que P1 (φ∗ )(fω ) = g ∈ Γ(Ur , OUr ), et que fω |W = fW et fω |Cs = fs − P1c(1)

860-24 g d´etermine fω de fa¸con unique. On renvoie `a ([CS],2.3,2.4) pour l’ind´ependance par rapport `a P1 et au relev´e φ (mˆeme m´ethode pour ce dernier qu’en (1.2.2.1)). L’ind´ependance par rapport au morphisme de Frobenius sur Y se prouve comme dans (1.2.2.1). Remarquons que si ω est une forme rationnelle quelconque sur X (i.e. pas forc´ement de seconde esp`ece), S ⊂ X(Cp ) l’ensemble des points o` u ω a un pˆole, et si de plus l’application de sp´ecialisation est injective sur S, (2.2.1.3) fournit une primitive de ω bien d´efinie modulo constante. On peut montrer que cette primitive co¨ıncide avec celle en (1.1.1.5), en particulier fω = log(f ) si ω = dff avec f non nul sur U ([CS],2.5.1). Nous allons it´erer ce processus. Notons O0 (U rig ) = Γ(U rig , OU rig ) et O0 (Ur ) = Γ(Ur , OUr ) pour 0 < r < 1. On d´efinit les sous-espaces suivants des fonctions localement analytiques sur U rig ou Ur : X O1 (U rig ) = O0 (U rig ) + O0 (U rig )fω ω∈Ω1 rig U

O1 (Ur ) = O0 (Ur ) +

X

/Cp

O0 (Ur )fω |Ur

ω∈Ω1 rig U /Cp

o` u fω est “la” primitive en (2.2.1.3) et r est suffisamment proche de 1. Proposition 2.2.1.4. — (i) Soit f ∈ O1 (Ur ) (resp. O1 (U rig )) tel que df = 0, alors f est constante sur Ur (resp. U rig ). (ii) Il existe un polynˆome P2 (T ) ∈ Cp [T ] dont aucune des racines n’est une racine de l’unit´e tel que, pour tout ω ∈ O1 (U rig ) ⊗O0 (U rig ) Ω1U rig /Cp , tout φ comme en (2.2.1.1) et tout r suffisamment proche de 1, P2 (φ∗ )(ω) ∈ dO1 (Ur ). 1 Indication de preuve. — On renvoie `a ([CS],2.4.4) pour (i). Pour (ii), soit H dR (O1 (U rig )) = (O1 (U rig ) ⊗ Ω1U rig /Cp )/dO1 (U rig ), l’application : 1 Ω1U rig /Cp × Ω1U rig /Cp → HdR (O1 (U rig )) (ω, ω ′) 7→ fω ω ′ mod. dO1 (U rig )

est bien d´efinie et Coleman et de Shalit montrent ([CS],2.4.6) qu’elle induit un isomorphisme compatible `a φ ∗ : ∼

1 1 1 HdR (U rig ) ⊗Cp HdR (U rig ) −→ HdR (O1 (U rig )). 1 Les valeurs propres de φ∗ sur HdR (O1 (U rig )) sont donc des produits de nombres de Weil (cf. preuve de (2.2.1.2)) : ce ne sont en particulier jamais des racines de l’unit´e et on peut 1 prendre pour P2 le polynˆome caract´eristique de φ ∗ sur HdR (O1 (U rig )).

Il est alors formel `a partir de (2.2.1.4) de g´en´eraliser la preuve de (2.2.1.3) (et ce qu’elle utilise de (1.2.2.1)) au cas o` u ω ∈ O1 (U rig ) ⊗ Ω1U rig /Cp en rempla¸cant P1 (φ∗ ) par P2 (φ∗ )

860-25 et Γ(Ur , OUr ) = O0 (Ur ) par O1 (Ur ). On d´efinit de mani`ere analogue O 2 (U rig ) comme le O1 (U rig )-module engendr´e par les constantes et les primitives qu’on vient d’obtenir des 1-formes de O1 (U rig ) ⊗ Ω1U rig /Cp , et O2 (Ur ) comme le O1 (Ur )-module engendr´e par les constantes et les restrictions `a Ur de ces primitives. La proposition (2.2.1.4) est encore valable avec O2 (Ur ) ou O2 (U rig ) et ainsi de suite... Par r´ecurrence, on obtient finalement des suites croissantes canoniques d’espaces de fonctions localement analytiques : Ok (U rig ) ⊂ Ok+1 (U rig ) et Ok (Ur ) ⊂ Ok+1 (Ur ) et des polynˆomes Pk (T ) (non uniques mais dont les racines ne sont pas des racines de l’unit´e) tels qu’on ait, si r est suffisamment proche de 1 : Th´ eor` eme 2.2.1.5. — Soient k ∈ N et ω ∈ Ok (U rig ) ⊗O0 (U rig ) Ω1U rig /Cp , il existe `a addition pr`es d’une constante une unique fonction fω ∈ Ok+1 (U rig ) telle que : 1) dfω = ω 2) Pk+1 (φ∗ )(fω ) ∈ Ok (Ur ) 3) pour tout s ∈ S, fω |Cs ∈ Γ(Cs , OCs )log . Bien sˆ ur, la r´ecurrence ci-dessus peut se formaliser et se g´en´eraliser en d´egageant les propri´et´es des Ok (U rig ) : c’est ce qui est fait dans [Cole1] et [CS] o` u sont introduits des “F -cristaux logarithmiques”.

2.2.2. Construction des polylogarithmes p-adiques. Pour une introduction aux polylogarithmes complexes, on renvoie `a l’expos´e d’Oesterl´e dans ce s´eminaire ([Oe]). Soit k un entier, rappelons que les polylogarithmes classiques ℓ k (z) (plus exactement leur d´etermination principale) sont les fonctions holomorphes sur C − [1, +∞[ donn´ees sur la boule unit´e ouverte par la formule :

ℓk (z) =

+∞ n X z n=1

nk

.

z On a ℓ0 (z) = z−1 , ℓ1 (z) = − log(1 − z) et dℓk (z) = ℓk−1 (z) dz . Nous allons d´efinir leurs z analogues p-adiques, que nous noterons encore ℓk , vu qu’il ne sera (presque) plus question des polylogarithmes complexes dans la suite.

Avec les notations de la partie pr´ec´edente, consid´erons : X = P1 S = {1, ∞} ⊂ P1 (Cp ).

860-26 On a : U rig = X(Cp ) − S = Cp − {1} W = {z ∈ Cp | |z| ≤ 1, |z − 1| ≥ 1} C1 = {z ∈ Cp | 0 < |z − 1| < 1} C∞ = {z ∈ Cp | |z| > 1} 1 Ur = {z ∈ Cp | |z| < , |z − 1| > r} (0 < r < 1). r Remarquons que O0 (U

rig

) = O0 (Cp − {1}) est l’ensemble des s´eries de Laurent

+∞ X

n=−∞

an (z − 1)n qui convergent sur Cp − {1} et Ω1U rig /Cp = O0 (U rig )dz. On choisit comme morphisme de Frobenius φ(z) = z p qui pr´eserve bien S et envoie Ur dans U rig et Ur ∩ Cs dans Cs (s ∈ S) lorsque 11 < r < 1 (car {ζ | ζ p = 1} ∩ Ur = ∅ pour de tels r). D’apr`es p p−1

le paragraphe pr´ec´edent, on dispose des espaces de fonctions localement analytiques Ok (Cp − {1}) pour k ∈ N. Corollaire 2.2.2.1. — Il existe une unique suite de fonctions ℓ k (z) ∈ Ok (Cp − {1}) telle que : z ℓ0 (z) = z−1 ℓk (0) = 0 ℓk−1 (z) dℓk (z) = dz. z De plus, ℓ1 (z) = − log(1 − z) et, si |z| < 1, ℓk (z) =

+∞ n X z n=1

nk

.

Preuve. — L’existence et l’unicit´e sont cons´equences de (2.2.1.5). Un examen des preuves de (1.2.2.1) et (2.2.1.3) montre que les fonctions de Ok (Cp − {1}) sont toutes analytiques +∞ n X z sur la boule unit´e ouverte {z ∈ C p | |z| < 1} ⊂ W . Or, la fonction est aussi nk n=1 +∞ n X z analytique sur cette boule et satisfait les propri´et´es de l’´enonc´e. On a donc ℓ k (z) = nk n=1 pour |z| < 1 par unicit´e (mod. cte) de la primitive analytique des 1-formes analytiques sur la boule ouverte. V´erifions que P 1 (T ) = p − T satisfait P1 (φ∗ )(ω) ∈ dO0 (Ur ) pour tout dz ω ∈ O0 (U rig )dz et tout r ∈ ] 11 , 1[. On voit qu’il suffit de v´erifier P 1 (φ∗ )( z−1 ) ∈ dO0 (Ur ). Mais on a :

p p−1

dz 1 z p−1 =p − p Big)dz z−1 z−1 z −1 et un calcul montre que cette 1-forme se prolonge au point ∞ (faire z ↔ 1/z), donc `a P1 (Cp ) − {z ∈ Cp | |z − 1| ≤ r} qui contient Ur et est isomorphe `a une boule ouverte. Or, P1 (φ∗ )

860-27 sur une boule ouverte, toute 1-forme analytique ferm´ee s’int`egre, et donc en particulier dz dz P1 (φ∗ )( z−1 ), i.e. P1 (φ∗ )( z−1 ) ∈ dO0 (Ur ). Pour montrer que ℓ1 (z) = − log(1 − z), il suffit ∗ d’avoir P1 (φ )(− log(1 − z)) ∈ O0 (Ur ). Mais : ! p 1 − z P1 (φ∗ )(− log(1 − z)) = log 1 − 1 − (1 − z)p 1−z p 1 et pour 1 < r < |z − 1|, on v´erifie que 1 − (1−z)p < 1, donc : p p−1 n 1−z p 1 − X (1−z)p P1 (φ∗ )(− log(1 − z)) = − ∈ O0 (Ur ). n n≥1

Remarque 2.2.2.2. — On peut prendre pour Pk (T ) les polynˆomes p k − T pour tout k ([Cole1],5.2). Voici une application des polylogarithmes p-adiques. Soient χ un caract`ere de Dirichlet non trivial et Lp (s, χ) la fonction L p-adique de Kubota-Leopoldt, obtenue par interpolation des valeurs aux entiers n´egatifs de la fonction L(s, χ) complexe de Dirichlet ([Iw],3). Il est naturel de se demander quelles sont alors les valeurs de L p (s, χ) aux entiers positifs. La r´eponse est fournie par le th´eor`eme suivant, dˆ u `a Coleman ([Cole1]) :

Th´ eor` eme 2.2.2.3. — Supposons p 6= 2. Soient χ : (Z/dZ)× → C× ere de p un caract` Dirichlet de conducteur d > 1 et ω le caract`ere de Dirichlet “repr´esentant de Teichm¨ uller” : × × (Z/pZ) → Cp . Pour tout k ≥ 1, on a : Lp (k, χω

1−k

d−1 χ(p) g(χ, ζ) X χ(a)ℓk (ζ −a ) )= 1− p d a=1

o` u χω 1−k est le caract`ere de Dirichlet produit des caract`eres χ et ω 1−k , ζ une racine prid−1 X i` eme mitive d quelconque de 1 et g(χ, ζ) la somme de Gauss d´efinie par g(χ, ζ) = χ(a)ζ a . a=1

On a suppos´e p 6= 2 seulement pour simplifier l’exposition. Le cas k = 1, qui n’utilise que le logarithme p-adique, est dˆ u `a Leopoldt ([Iw],5). On remarquera l’analogie avec la formule classique : d−1 g(χ, ζ) X L(k, χ) = χ(a)ℓk (ζ −a ) d a=1 X (qui d´ecoule simplement de l’identit´e pour tout n : dχ(n) = χ(a)χ(b)ζ a−bn ) o` u ℓk 1≤a,b≤d−1

d´esigne ici bien sˆ ur le polylogarithme complexe.

Remarque 2.2.2.4. — Si l’on ne s’int´eresse qu’aux polylogarithmes p-adiques, il existe une fa¸con plus directe de les obtenir (voir [St]). Mais la m´ethode pr´ec´edente (qui est celle originelle de Coleman) a l’avantage de s’´etendre `a des situations plus g´en´erales (voir R´egulateurs p-adiques ci-dessous).

860-28 2.3. Autres applications Nous passons en revue tr`es rapidement certaines des autres applications de l’int´egration p-adique. Points de torsion sur les courbes Dans [Cole3] et [Cole5], Coleman d´emontre, en utilisant l’int´egration p-adique, la conjecture de Manin-Mumford, pr´ec´edemment montr´ee par Raynaud ([Ra2]), qui dit que toute courbe de genre ≥ 2 contenue dans une vari´et´e ab´elienne sur un corps de caract´eristique 0 n’a qu’un nombre fini de points de torsion. On se ram`ene au cas d’un corps de nombres et le point de d´epart de la preuve de Coleman est que si X est une courbe sur une extension finie K de Qp avec bonne r´eduction et ι : X → J un morphisme d’Albanese, ι(Q) − ι(P ) RQ est de torsion dans J si et seulement si P ι∗ ω = 0 sur X pour tout ω ∈ H 0 (J, Ω1J/Cp ).

R´egulateurs p-adiques Dans [CS], Coleman et de Shalit g´en´eralisent l’int´egration en (2.2.1) `a des ouverts rigides un peu plus g´en´eraux que U rig appel´es “basic wide open spaces”. Par une m´ethode tout `a fait analogue `a celle d´ecrite en (2.2.1), cela leur permet d’int´egrer sans restriction les logarithmes de toutes les fonctions rationnelles sur les courbes avec bonne r´eduction (et mˆeme sur certaines courbes `a r´eduction semi-stable) et de d´efinir ainsi des r´egulateurs p-adiques, g´en´eralisations des dilogarithmes p-adiques. Comme en (2.2.2.3), ils les utilisent pour calculer des valeurs sp´eciales de la fonction L p-adique associ´ee `a une courbe elliptique sur Q avec multiplication complexe et bonne r´eduction en p.

Loi de r´eciprocit´e et hauteurs p-adiques Soit X une courbe alg´ebrique propre et lisse sur C p . Rappelons qu’une forme de troisi`eme esp`ece sur X est une forme rationnelle ayant au plus des pˆoles simples et tels que les r´esidus en Xces pˆoles soient des entiers. Si ω est une telle forme, le diviseur des r´esidusPRes(ω) = nP P o` u P parcourt X(Cp ) et nP est le r´esidu en P est de degr´e 0 (i.e. nP = 0). P X R nP fω′ (P ) Pour toute forme rationnelle ω ′ dont les pˆoles ´evitent Res(ω), Res(ω) ω ′ = P

ne d´epend donc pas de la primitive f ω′ choisie en (1.1.1.5). Si η et η ′ sont deux formes de seconde esp`ece sur X, notons η ∪ η ′ la somme des r´esidus de f η η ′ o` u fη est une primitive en (1.1.1.5) et o` u on calcule le r´esidu en un point `a partir des d´eveloppements analytiques ′ de fη et η dans un voisinage p-adique de ce point (c’est ind´ependant des choix car η ′ a tous ses r´esidus nuls). Soit J la jacobienne de X et J˜ l’extension universelle de J par un groupe additif ([Me]). ˜ p ) repr´esentent les formes de troisi`eme esp`ece sur X modulo les diff´erenLes points de J(C tielles logarithmiques des fonctions rationnelles et l’alg`ebre de Lie de J˜ est isomorphe `a 1 1 HdR (X). On a en particulier une application logarithme Log J˜ : J˜(Cp ) → HdR (X).

860-29 Th´ eor` eme 2.3.1. — (Loi de r´eciprocit´e) Si ω et ω ′ sont deux formes diff´erentielles de troisi`eme esp`ece dont les diviseurs des r´esidus sont ´etrangers, alors : Z Z ′ ω − ω = LogJ˜(ω) ∪ LogJ˜(ω ′ ). Res(ω)

Res(ω ′ )

Ce th´eor`eme a d’abord ´et´e d´emontr´e par Coleman dans le cas o` u X a bonne r´eduction ([Cole4]), puis par Colmez dans le cas g´en´eral ([Colm2]). Soit maintenant X une courbe propre et lisse sur un corps de nombres et J sa jacobienne. ` partir des fonctions de Green p-adiques (cf. 2.1.3.1) Colmez d´efinit un accouplement A de hauteur bilin´eaire et sym´etrique : J(Q) × J(Q) → Π p≤∞ Qp . La sym´etrie d´ecoule de (2.3.1). Projet´e sur R, cet accouplement co¨ıncide avec l’accouplement de N´eron-Tate. Projet´e sur Qp aux places p o` u X a bonne r´eduction, il avait d´ej`a ´et´e d´efini par Coleman ` et Gross ([CG]). A noter que le fait de pouvoir consid´erer log(p) comme une variable est important dans la d´efinition de l’accouplement ci-dessus. Cohomologie de de Rham et r´eduction semi-stable Si X est une courbe propre et lisse sur une extension finie K de Q p ayant r´eduction semi-stable (au sens o` u elle admet un mod`ele X propre, plat et r´egulier sur les entiers de K dont la fibre sp´eciale est un diviseur `a croisements normaux dans X ), et si de plus les composantes irr´eductibles de la fibre sp´eciale sont lisses, leurs tubes dans X rig (cf. 1.2.1) sont des “basic wide open spaces” sur lesquels on peut int´egrer les formes diff´erentielles. En utilisant l’int´egration sur ces tubes, Coleman et Iovita donnent dans [CI] une construction purement g´eom´etrique de la K 0 -structure de Fontaine-Jannsen D d´efinie par Hyodo-Kato 1 1 ([HK]) sur HdR (X) (i.e. HdR (X) = K ⊗K0 D) o` u K0 est l’extension maximale de Q p non ramifi´ee dans K, ainsi que des op´erateurs φ et N d´efinis sur D (Frobenius et monodromie). Voir aussi les r´esultats de Le Stum `a ce sujet ([Le]).

´ ERENCES ´ REF

[Ber] Berthelot P. – Cohomologie rigide et cohomologie rigide ` a supports propres, premi`ere partie, pr´epublication de l’Institut de Recherche Math´ematique de Rennes, 1996. [Bes] Besser A. – A generalization of Coleman’s p-adic integration theory, pr´epublication du Mathematische Institut der Universit¨at M¨ unster, 1999. [BO] Berthelot P. – Ogus A., F -isocristals and de Rham cohomology I, Inv. Math. 72, 1983, 159-199. [Bog] Bogomolov F. – Sur l’alg´ebricit´e des repr´esentations l-adiques, C.R.A.S. 290, 1980, 701-703.

860-30 [BLR] Bosch S. – L¨ utkebohmert W., Raynaud M., N´eron models, Ergebnisse der Mathematik und ihrer Grenzgebiete 21, Springer-Verlag, 1990. [Bou] Bourbaki N. – Groupes et alg`ebres de Lie, Chapitres 2 et 3, Hermann, 1972. [Colm1] Colmez P. – P´eriodes p-adiques des vari´et´es ab´eliennes, Math. Ann. 292, 1992, 629-644. [Colm2] Colmez P. – Int´egration sur les vari´et´es p-adiques, Ast´erisque 248, Soc. Math. de France, 1998. [Cole1] Coleman R. – Dilogarithms, regulators and p-adic L-functions, Inv. Math. 69, 1982, 171-208. [Cole2] Coleman R. – Hodge-Tate periods and p-adic abelian integrals, Inv. Math. 78, 1984, 351-379. [Cole3] Coleman R. – Torsion points on curves and p-adic abelian integrals, Annals of Math. 121, 1985, 111-168. [Cole4] Coleman R. – Reciprocity laws on curves, Comp. Math. 72, 1989, 205-235. [Cole5] Coleman R. – Ramified torsion points, Duke Math. J. 54, 1987, 615-640. [CG] Coleman R., Gross B. – p-adic heights on curves, Adv. Math. 17, 1989, 73-81. [CI] Coleman R., Iovita A. – The Frobenius and Monodromy operators for Curves and Abelian Varieties, Duke Math. J. 97, 1999, 171-215. [CS] Coleman R., de Shalit E. – p-adic regulators on curves and special values of p-adic L-functions, Inv. Math. 93, 1988, 239-266. [Dw] Dwork B. – Normalized period matrices I, Annals of Math. 94, 1971, 337-388. [Fo1] Fontaine J.-M. – Sur certains types de repr´esentations p-adiques du groupe de Galois d’un corps local ; construction d’un anneau de Barsotti-Tate, Annals of maths 115, 1982, 529-577. [Fo2] Fontaine J.-M. – Le corps des p´eriodes p-adiques, Ast´erisque 223, Soc. Math. de France, 1994, 59-111. [Fo3] Fontaine J.-M. – Formes diff´erentielles et modules de Tate des vari´et´es ab´eliennes sur les corps locaux, Inv. Math. 65, 1982, 379-409. [Ga] Garuti M. – G´eom´etrie rigide et g´eom´etrie formelle, `a paraˆıtre aux Proceedings de la conf´erence de Luminy sur le groupe fondamental des courbes en caract´eristique p > 0, d´ecembre 1998. [Il] Illusie L. – Cohomologie de de Rham et cohomologie ´etale p-adique (d’apr`es G. Faltings, J.-M. Fontaine et al.), S´em. Bourbaki, Expos´e n◦ 726, Ast´erisque 189-190, 1990, 325-374.

860-31 [Iw] Iwasawa K. – Lectures on p-adic L-functions, Annals of Math. Studies 74, Princeton University Press, 1972. [KM] Katz N., Messing W. – Some consequences of the Riemann hypothesis for varieties over finite fields, Inv. Math. 23, 1974, 73-77. [La] Lang S. – Abelian varieties, Interscience, New-York, 1959. [Le] Le Stum B. – La structure de Hyodo-Kato pour les courbes, Rend. Sem. Mat. Univ. Padova 94, 1995, 279-301. [Me] Messing W. – The universal extension of an abelian variety by a vector group, Symp. Math. XI (Rome 1972), Academic Press, 1973, 359-372. [Mu1] Mumford D. – Abelian varieties, Oxford University Press, 1970. [Mu2] Mumford D. – Analytic construction of degenerating curves over complete local fields, Compos. Math. 24, 1972, 129-174. [Oe] Oesterl´e J. – Polylogarithmes, S´em. Bourbaki, Expos´e n◦ 762, Ast´erisque 216, 1993, 49-67. [Ra1] Raynaud M. – G´eom´etrie analytique rigide, d’apr`es Tate, Kiehl,..., M´emoire de la S.M.F. 39-40, 1974, 319-327. [Ra2] Raynaud M. – Courbes sur une vari´et´e ab´elienne et points de torsion, Inv. Math. 71, 1983, 207-233. [Ra3] Raynaud M. – Vari´et´es ab´eliennes et g´eom´etrie rigide, Proceedings du Congr`es International de Nice, 1970, 473-477. [Se1] Serre J.-P. – Morphismes universels et vari´et´es d’Albanese, S´eminaire Chevalley 1958/1959, expos´e 10. [Se2] Serre J.-P. – Corps locaux, 3i`eme ´edition, Hermann, 1968. [St] Stevens G. – p-adic polylogarithms, notes d’une conf´erence `a Schloss Ringberg am Tegernsee, 4 septembre 1998. [Ta1] Tate J. – p-divisible groups, Proc. of a conf. on local fields, Driebergen, 1967, 158-183. [Ta2] Tate J. – Rigid analytic spaces, Inv. Math. 12, 1971, 257-289. [Ts] Tsuji T. – p-adic-´etale cohomology and crystalline cohomology in the semi-stable reduction case, `a paraˆıtre `a Inv. Math. [Wi] Wintenberger J.-P. – Th´eor`eme de comparaison p-adique pour les sch´emas ab´eliens I : construction de l’accouplement de p´eriodes, Ast´erisque 223, Soc. Math. de France, 1994, 349-397. [Za1] Zarhin Y. – Local heights and abelian varieties, Groupe d’´etude sur les probl`emes diophantiens 1988/1989, Publ. math. n o 90 de l’universit´e Pierre et Marie Curie.

860-32 [Za2] Zarhin Y. – p-adic abelian integrals and commutative Lie groups, Algebraic geometry 4, J. Math. Sci. 81, 1996, 2744-2750. Christophe BREUIL Math´ematiques, Bˆat. 425 U.R.A. 752 du C.N.R.S. Universit´e Paris-Sud Bˆatiment 425 F-91405 ORSAY cedex E-mail : [email protected]

S´eminaire BOURBAKI 51`eme ann´ee, 1998-99, no 861

Juin 1999

RECENT ADVANCES IN THE THEORY OF HOLONOMY by Robert BRYANT

1. INTRODUCTION 1.0. Outline. This report is organized as follows: 1. Introduction 2. Riemannian Holonomy 3. Torsion-free non-metric connections: the irreducible case In a short lecture of this nature, it is impossible to describe the history of the subject in any depth, but the reader can find more information on the Riemannian (and pseudo-Riemannian) case by consulting [Bes], [Sa], and the forthcoming, muchanticipated [Jo3], especially for the exceptional cases. For the non-metric case, aside from the survey [Br3], the expository papers [MS2] and [Schw] provide a valuable account of both the representation theoretic and twistor theoretic approaches to the study of holonomy. 1.1. Historical Remarks. According to the Oxford English Dictionary, it was Heinrich Hertz in 1899 who introduced the words holonomic and nonholonomic to describe a property of velocity constraints in mechanical systems. Velocity constraints are holonomic if they force a curve in state space to stay in a proper subspace. As an example, the condition p · dp = 0 for a vector particle p ∈ R n forces p to have constant length, while the constraint p ∧ dp = 0 forces p to move on a line. Nonholonomic constraints, on the other hand, imply no such ‘finite’ constraints. A classical example is that of a ball rolling on a table without slipping or twisting. The state space is B = SO(3)×R 2 , where the SO(3) records the orientation of the ball and the R 2 records its contact point on the plane. The rolling constraint is expressed as the set of differential equations

(0.1)



0 0 α := a−1 da + a−1  0 0 dx dy

 −dx −dy  a = 0 0

for a curve a(t); x(t), y(t) in B. The curves in B satisfying this constraint are those tangent to the 2-plane field D = ker α that is transverse to the fibers of the 1

projection SO(3) × R 2 → R 2 . It is not difficult to show that any two points of B can be joined by a curve tangent to D. Such constraints and their geometry have long been of considerable interest in the calculus of variations and control theory. For recent results, see the foundational work on Carnot-Carath´eodory geometries by Gromov [Gr]. ´ Cartan [Ca2] introduced the holonomy group in 1.2. The holonomy group. Elie the context of differential geometry. It measures the failure of the parallel translation associated to a connection to be holonomic. The data are a connected manifold M , a Lie group H with Lie algebra h, a principal right H-bundle π : B → M , and a connection θ on B, i.e., θ is an h-valued 1-form on B that pulls back to each π-fiber to be the canonical left invariant 1-form on H and that satisfies the equivariance relation Rh∗ (θ) = Ad(h−1 )(θ). (The nonholo nomic example described above with (M, H, B, θ) = R 2 , SO(3), SO(3)×R 2 , α is an example.) A piecewise C 1 curve γ : [0, 1] → B is said to be θ-horizontal or θ-parallel if γ ∗(θ) = 0. The θ-holonomy Buθ ⊂ B of u ∈ B is defined to be the set of values of γ(1) as γ : [0, 1] → B ranges over the θ-horizontal curves with γ(0) = u. The Ad(H)-equivariance of θ (coupled with the connectedness of M ) implies that there is a subgroup Huθ ⊂ H so that Buθ is an Huθ -subbundle of B and that Huθ·h = h−1 Huθ h for h ∈ H. Consequently, the conjugacy class of Huθ ⊂ H depends only on θ. The group Huθ (or, more informally, its conjugacy class in H) is called the holonomy of θ. It is a theorem of Borel and Lichnerowicz [BL] that Huθ is a Lie subgroup of H. By a theorem of Ambrose and Singer [AS], the Lie algebra hθu of Huθ is spanned by the set { Θ(x, y) x, y ∈ Tv B , v ∈ Buθ } where Θ = dθ + 12 [θ, θ] is the curvature of θ. The identity component (Huθ )0 ⊂ Huθ is known as the restricted holonomy of θ. There is a well-defined homomor surjective θ θ θ 0 θ θ 0 phism ρ : π1 M, π(u) → Hu /(Hu ) that satisfies ρ [π◦γ] = γ(1)(Hu ) for every θ-horizontal curve γ with γ(0) = u and γ(1) ∈ u·H. Using these results, it can be shown [KNo] that, when dim M > 1, a Lie subgroup G ⊂ H can be the holonomy group of a connection on B if and only if B admits a structural reduction to a G-bundle. Thus, the set of possible holonomies of connections on B is determined topologically. 1.3. H-structures and torsion. A common source of connections in geometry is that of H-structures on manifolds. Suppose dim M = n and let m be a reference vector space of dimension n. An (m-valued) coframe at x ∈ M is a linear isomorphism u : TxM → m. The set F (M, m) of m-valued coframes at the points of M is naturally a principal right GL(m)-bundle over M , with basepoint projection π : F (M, m) → M . There is a tautological m-valued 1-form ω on F (M, m) defined by the formula ω(v) = u π ′(v) for all v ∈ Tu F (M, m). Let H ⊂ GL(m) be a subgroup. An H-structure on M is an H-subbundle B such that B ⊂ F (M, m). When H is a closed subgroup of GL(m) (the only case I will consider today), the set of H-structures on M is the set of sections of the 2

bundle F (M, m)/H → M . The problem of determining whether there exists an Hstructure on M is a purely topological one. Most of the familiar geometric structures on M can be described as H-structures. For example, when H = O(Q) ⊂ GL(m) is the group of linear transformations preserving a quadratic form Q of type (p, q) on m, a choice of H-structure on M is equivalent to a choice of pseudo-Riemannian metric of type (p, q) on M . When H = Sp(S) ⊂ GL(m) is the group of linear transformations preserving a nondegenerate skewsymmetric bilinear form S on m, a choice of H-structure on M is equivalent to a choice of a nondegenerate 2-form σ on M , i.e., an almost symplectic structure. If π : B → M is an H-structure on M , the tautological form ω pulled back to B will also be denoted ω when there is no chance of confusion. If θ is a connection on B, then the first structure equationof Cartan says that there exists an H-equivariant function T : B → Hom Λ2 (m), m ≃ m ⊗ Λ2 (m∗) so that (0.2)

dω + θ ∧ ω =

1 2

T (ω ∧ ω).

The function T is the torsion function of θ, and θ is torsion-free if T = 0. Any connection θ ′ on B is θ + p(ω) where p : B → Hom(m, h) is an H-equivariant function. Its torsion function is T ′ = T + δ(p), where δ : h ⊗ m∗ → m⊗Λ2 (m∗) is defined via the inclusion h ⊂ m ⊗ m∗ and the skewsymmetrizing map m⊗m∗⊗m∗ → m⊗Λ2 (m∗). Evidently, the reduced map T¯ : B → coker(δ) is independent of the choice of θ and is the obstruction to choosing a torsion-free connection on B. For example, when H = Sp(S) as above, it is not difficult to see that coker(δ) ≃ Λ3 (m∗) and that the reduced torsion represents the exterior derivative dσ of the associated almost symplectic form σ ∈ Ω2 (M ). Thus, an Sp(S)-structure admits a torsion-free connection if and only if the almost symplectic structure on M is actually symplectic. Furthermore, ker(δ) ≃ S3 (m∗), so that the torsion function T does not determine a unique connection θ. By contrast, when H = O(Q), the map δ is an isomorphism, which is merely the fundamental lemma of Riemannian geometry: Every pseudo-Riemannian metric on M possesses a unique compatible, torsion-free connection. The reduced torsion is the first order local invariant for H-structures on M and H-structures satisfying T¯ = 0 are usually referred to as torsion-free or 1-flat. Many (but not all) of the H-structures that have received the most attention in differential geometry are 1-flat. All pseudo-Riemannian metric structures are 1-flat, an almost symplectic structure is 1-flat if and only if it is symplectic (Darboux’ Theorem), an almost complex structure is 1-flat if and only if it is complex (Newlander-Nirenberg Theorem), an Hermitian structure is 1-flat if and only if it is K¨ ahler. Contact structures and Carnot-Carath´eodory structures, on the other hand, are definitely not 1-flat, as the nondegeneracy of the reduced torsion is an essential part of the geometry. 1.4. Criteria for holonomy in the torsion-free case. The condition T¯ = 0 is a Diff(M )-invariant, first order equation for H-structures on M . Given a torsion-free H-structure B ⊂ F (M, m), one can ask about the possibilities for the holonomy group of a torsion-free connection θ on B. When ker(δ) = 0, a very common situation, the torsion-free connection, if it exists, will be unique, so that it makes sense to speak of the holonomy of B itself. 3

The vanishing of the torsion implies nontrivial restrictions on the holonomy. Assuming T = 0 and differentiating (0.2) yields Θ∧ω = 0. Thus, the curvature function R : B → h ⊗ Λ2 (m∗) of θ, for which the second structure equation of Cartan (0.3)

Θ = dθ +

1 2

[θ, θ] = 12 R(ω ∧ ω)

holds, takes values in the kernel K(h) of the map δ : h ⊗ Λ2 (m∗) → m ⊗ Λ3 (m∗) defined by the same methods1 as the previous δ. In particular, if there is a proper subalgebra g ⊂ h so that K(h) ⊆ g ⊗ Λ2 (m∗), then, by the Ambrose-Singer holonomy theorem, the (restricted) holonomy of θ must lie in the connected Lie group G ⊂ H whose Lie algebra is g. The intersection of the subspaces s ⊂ h that satisfy K(h) ⊆ s ⊗ Λ 2 (m∗) is an ideal g ⊂ h. Thus, a necessary condition that there exist a torsion-free connection with holonomy H ⊂ GL(m) is that K(h) 6= K(g) for any proper ideal g ⊂ h. This is usually referred to as Berger’s first criterion [Ber, Br3]. This criterion is very restrictive: If h is semi-simple, there are, up to equivalence, only a finite number of representations h ֒→ gl(m) without trivial summands satisfying it. As a simple example, if h ≃ sl(2, R), and V k ≃ Sk (V1 ) denotes the irreducible sl(2, R)-representation of dimension k+1, then the sl(2, R)-representations m without V0 -summands that satisfy Berger’s first criterion are V1 , V1 ⊕V1 , V2 , V3 , and V4 . Symmetric examples. One large class of examples where Berger’s first criterion is satisfied is provided by the following construction: Suppose that there is a surjective skewsymmetric pairing m × m → h so that, together with the Lie algebra bracket on h and the h-module pairing h × m → m, it defines a Lie algebra on g = h⊕m. Then the pair (g, h) is a symmetric pair of Lie algebras [KN]. Let G be the simply connected ˜ ⊂ G be the (necessarily closed) connected Lie group with Lie algebra g and let H ˜ ⊂ GL(m) subgroup corresponding to the subalgebra h ⊂ g and let H = Adm (H) ˜ is an affine symmetric space in a be its almost faithful image. Then M = G/H canonical way, and the coset projection G → M covers a torsion-free H-structure on M with connection whose holonomy is H (by the assumption [m, m] = h and the Ambrose-Singer holonomy theorem.) The classification of the symmetric Lie algebra pairs (g, h) is a (rather involved) algebra problem. It was solved by Berger [Ber2] in the case that g is semi-simple or when h acts irreducibly on m ≃ g/h. The case where θ is a locally symmetric connection with holonomy H is characterized on the H-structure B by the condition that R : B → K(h) be constant. In fact, differentiating (0.3) yields 0 = (dR+θ.R)(ω ∧ω) (where θ.R is the result of the h-module pairing h×K(h) → K(h)). Equivalently, dR = −θ.R + R ′(ω) where R′ : B → K(h) ⊗ m∗ must take values in the kernel K 1 (h) of the natural map δ : K(h) ⊗ m∗ → h ⊗ Λ3 (m∗). Now, R′ vanishes identically exactly when R is parallel, which is exactly when the pair (B, θ) defines a locally symmetric affine 1

The maps I am denoting by δ (as well as the ones to follow) are part of the Spencer complex associated to the inclusion h ⊂ m ⊗ m∗ , see [Br3]. These maps are h-module maps and so the various kernels and cokernels to be introduced are h-modules as well.

4

structure on M . Thus, if H can be the holonomy of a torsion-free affine connection that is not locally symmetric, then K 1 (h) 6= 0. This is Berger’s second criterion. For example, when h = sl(2, R) and m = V 4 , one has K 1 (h) = 0. Thus, this 5-dimensional representation of SL(2, R) could occur as holonomy of a torsion-free connection on M 5 only when that connection is locally symmetric. In fact, it occurs as the holonomy of the symmetric spaces SL(3, R)/SO(2, 1) and SU(2, 1)/SO(2, 1) and in no other way. The other four cases with h = sl(2, R) satisfying Berger’s first criterion also satisfy Berger’s second criterion. Moreover, each does occur as the holonomy of a torsion-free connection that is not locally symmetric. 1.5. Classification. In the case where m is an irreducible h-module (implying that h is reductive), Berger’s fundamental works [Ber1, Ber2] went a long way towards classifying the subalgebras h ⊂ gl(m) that satisfy his first and second criteria. The methods involved heavy use of representation theory and ultimately reduced to a painstaking, elaborate case analysis. This list was refined and completed by the combined work of several people: Alekseevskii [Al1], myself, and most recently and importantly, the combined work of Chi, Merkulov, and Schwachh¨ ofer. I will discuss this further in §3. Berger’s work provided a (partial) list of candidates for the irreducibly acting holonomy groups of torsion-free connections that are not locally symmetric. He divided the list into two parts: The first part consists of h ⊂ gl(m) that lie in some so(Q) for some nondegenerate quadratic form Q on m, so that the associated H-structure defines a pseudo-Riemannian structure on M . For these cases, the injectivity of the map δ : h ⊗ m∗ → m ⊗ Λ2 (m∗) implies that the torsion-free connection is unique, so that it makes sense to speak of the holonomy of the underlying H-structure itself. I will refer to this part as the metric list. The second part consists of h ⊂ gl(m) that do not lie in any so(Q) and hence will be referred to as the nonmetric list. For many of the subalgebras on the nonmetric list, the map δ is not injective, so that the associated H-structure does not determine the torsion-free connection. These two lists are Tables I and II, essentially. I have taken the liberty of modifying Berger’s lists slightly, dropping the entries in the original list that did not actually satisfy Berger’s two criteria (SO∗(2n) ≃ SO(n, H ), which does not satisfy the first criterion2 , and the Spin(9, C )-type entries, which do not satisfy the second criterion3 ) and including Sp(p, R)·SL(2, R), the inadvertently omitted ‘split form’ of the quaternionic K¨ ahler case. In the nonmetric case, I have amplified the list somewhat by making explicit the various real forms as well as the fact that, except for CO(p, q), each of the entries on Berger’s nonmetric list represents only the semi-simple part of H, to which one can add an arbitrary subgroup of the (abelian) commuting subgroup to make the full group H. Exotic Holonomies. The nonmetric list supplied by Berger was never claimed to be a complete list, though it was supposed to have omitted at most a finite number of possibilities. The full list of omissions, comprising Tables III and IV and nowadays 2 3

An observation due to R. McLean. Observed independently by Alekseevskii [Al1] and Brown and Gray [BG].

5

I. Pseudo-Riemannian, Irreducible Holonomies in R n n H Local Generality* 1 n(n−1) 2

p+q ≥ 2 2p

SO(p, q) SO(p, C )

2(p+q) ≥ 4 2(p+q) ≥ 4

U(p, q) SU(p, q)

1 of n 2 of n−1

4(p+q) ≥ 8

Sp(p, q)

2(p+q) of (2p+2q+1)

4(p+q) ≥ 8 4p ≥ 8 8p ≥ 16

Sp(p, q)·Sp(1) Sp(p, R)·SL(2, R) Sp(p, C )·SL(2, C )

2(p+q) of (2p+2q+1) 2p of (2p+1) 2pC of (2p+1)C

7 7 14

G2 G′2 GC2

6 of 6 6 of 6 C 6 of 6C

8 8 16

Spin(7) Spin(4, 3) Spin(7, C )

12 of 7 12 of 7 12C of 7C

1 p(p−1)C 2

of n of pC

*Counted modulo diffeomorphism. The notation “d of ℓ” means “d functions of ℓ variables” and a superscript C means ‘holomorphic’.

referred to as the exotic list, was recently compiled by a combination of the efforts of Chi, Merkulov, Schwachh¨ofer, and myself. This will be reported on in §3, along with the reasons for the division into two lists. 1.6. Local Existence. Berger’s lists (suitably modified) provide possibilities for irreducibly acting holonomy groups, but to verify that these possibilities actually can occur requires methods beyond representation theory. Most of the methods that have been employed can be grouped into a small number of categories: Explicit construction. This is the simplest method, when it is available. For the metric list, there are locally symmetric examples with every holonomy except the special K¨ ahler cases, where the holonomy is SU(p, q) ⊂ GL(C p+q ); the hyper-K¨ ahler p +q cases, where the holonomy is Sp(p, q) ⊂ GL(H ); and the ‘exceptional’ holonomies, C 7 which comprise the groups G2 ⊂ GL(C ) and Spin(7, C ) ⊂ GL(C 8 ) and certain of their real forms. Of course, one would like to know that the locally symmetric examples are not the only ones. Sometimes constructing examples is easy: The generic pseudo-Riemannian metric has holonomy is SO(p, q). In other cases, simple underlying geometric structures can be used as a starting point. For example, all complex structures are flat, and the general (pseudo-)K¨ ahler metric can be described in the standard background complex structure by means of a (pseudo-)K¨ahler potential. For the generic choice of such a potential, the holonomy will be U(p, q) ⊂ SO(2p, 2q). Another example is the special K¨ ahler case, where one 6

II. The ‘Classical’ Non-Metric, Irreducible Holonomies H±

m

RestrictionsO

GR ·SL(n, R) GC ·SL(n, C ) GR ·SL(n, H )

Rn Cn Hn

n≥2 n≥1 n≥1

Sp(n, R) Sp(n, C )

R 2n C 2n

n≥2 n≥2

R + ·Sp(2, R) C ∗ ·Sp(2, C )

R4 C4

CO(p, q) GC ·SO(n, C )

R p+q Cn

p+q ≥3 n≥3

GR ·SL(p, R)·SL(q, R) GC ·SL(p, C )·SL(q, C ) GR ·SL(p, H )·SL(q, H )

p ≥ q ≥ 2, (p, q) 6= (2, 2) p ≥ q ≥ 2, (p, q) 6= (2, 2) p ≥ q ≥ 1, (p, q) 6= (1, 1)

GR ·SL(p, R) GC ·SL(p, C ) GR ·SL(p, H )

R pq ≃ R p ⊗R R q Cpq ≃ C p ⊗C C q R 4pq ≃ H p ⊗H H q R  R p ≃ C p ⊗C C p

R p(p+1)/2 ≃ S2R (R p ) C p(p+1)/2 ≃ S2C (C p ) R p(2p+1) ≃ S2H (H p )

p≥3 p≥3 p≥2

GR ·SL(p, R) GC ·SL(p, C ) GR ·SL(p, H )

R p(p−1)/2 ≃ Λ2R (R p ) C p(p−1)/2 ≃ Λ2C (C p ) R p(2p−1) ≃ Λ2H (H p )

p≥5 p≥5 p≥3

GR ·SL(p, C )

±

GF is any connected subgroup of F ∗ .

O

p≥3

To avoid repetition or reducibility.

can start with a background complex structure with a specified holomorphic volume form and then find a K¨ahler metric preserving this volume form by requiring that the K¨ ahler potential satisfy a single second order, elliptic equation. One can also find examples by looking for those with a large symmetry group. For the hyper-K¨ahler case, one can start with the complex symplectic structure on the cotangent bundle of certain Hermitian symmetric spaces and look for a K¨ ahler potential compatible with this complex symplectic structure that is invariant under the action of the isometry group, thereby reducing the problem to solving an ordinary differential equation. This was Calabi’s method for constructing a hyper-K¨ ahler ∗ n metric on T C P , the first known example in general dimensions. In the quaternionic K¨ ahler case, where the holonomy is Sp(p, q)·Sp(1) ⊂ GL(R 4(p+q) ), Alekseevskii found homogeneous nonsymmetric examples on certain solvable Lie groups. Even for the exceptional holonomies, there are explicit examples of cohomogeneity one [Br1], [BS]. Examples in the hyper-K¨ahler and quaternionic K¨ ahler cases can also be constructed by the method of reduction, which takes advantage of descriptions of these 7

III. Exotic Conformal Holonomies H

±

IV. Exotic Symplectic Holonomies

m

H

m

R + ·SL(2, R) C ∗ ·SL(2, C )

R 4 ≃ S3 (R 2 ) C 4 ≃ S3 (C 2 )

SL(2, R) SL(2, C )

R 4 ≃ S3 (R 2 ) C 4 ≃ S3 (C 2 )

GC ·SL(2, R) a GC ·Sp(1) b

C 2 ≃ C ⊗R R 2 C 2 ≃ C ⊗C H

GR ·Spin(5, 5) GR ·Spin(1, 9) GC ·Spin(10, C )

R 16 R 16 C 16

SL(2, R)·SO(p, q) c SL(2, C )·SO(n, C ) d Sp(1)·SO(n, H ) e

R 2 ⊗ R p+q C2 ⊗ Cn Hn

Sp(3, R) Sp(3, C )

R 14 ≃ Λ30 (R 6 ) C 14 ≃ Λ30 (C 6 )

GR ·E16 GR ·E46 GC ·EC6

R 27 R 27 C 27

SL(6, R) SU(1, 5) SU(3, 3) SL(6, C )

R 20 R 20 R 20 C 20

GF is any connected subgroup of F ∗ Restrictions: a G 6⊆ R ∗ (for irreducibility). C b G 6⊆ S 1 (to be nonmetric). C c p + q ≥ 3 (for irreducibility). d n ≥ 3 (for irreducibility). e n ≥ 2 (to be nonmetric). ±

≃ Λ3 (R 6 ) ≃ Λ3 (C 6 )R ≃ Λ3 (C 6 )R ≃ Λ3 (C 6 )

Spin(2, 10) Spin(6, 6) Spin(12, C )

R 32 R 32 C 32

E57 E77 EC7

R 56 R 56 C 56

structures in terms of multi-symplectic geometry, generalizing the well-known method of Marsden-Weinstein reduction in symplectic geometry so as to handle the multisymplectic case. For an account, see [Bes, Addendum E]. Twistor Methods. After Penrose’s description of the self-dual metrics in dimension 4, Hitchin and Salamon [Sa], among others, were able to generalize this method to describe the hyper-K¨ahler and quaternionic K¨ ahler metrics in terms of natural holomorphic geometric structures on the moduli space of rational curves with certain simple normal bundles in a complex manifold. In fact, it was the study [Br2] of the moduli space of rational curves on a complex surface with normal bundle O(3) that turned up the first known examples (the first two entries in each of Tables III and IV) of omissions4 from Berger’s nonmetric list. Moreover, in the holomorphic category, it was shown that any connection with one of these holonomies could be constructed as the natural connection on the fourdimensional component of the moduli space of Legendrian rational curves in a complex contact three-fold. Following this, Merkulov [Me1] showed that this approach could be generalized to cover the geometry of the moduli space of Legendrian deformations of certain 4

These examples were referred to as ‘exotic’ in [Br2] and the term has been adopted to describe any nonmetric subgroup H ⊂ GL(m) that satisfies Berger’s criteria but that does not appear on Berger’s original nonmetric list.

8

complex homogeneous spaces and began to discover more exotic examples. This and its further developments will be reported on in §3. Exterior differential systems. Another approach is to treat the equation T¯ = 0 directly as a system of PDE for sections of the bundle F (M, m)/H → M . In nearly all cases, this method leads to the study of an overdetermined system of PDE, so that Cartan-K¨ahler machinery must be brought to bear. For definitions and results regarding Cartan-K¨ahler theory, the reader can consult [BCG]. The general approach can be summarized as follows: Consider the structure equations derived so far for a torsion-free connection θ on an H-structure B ⊂ F (M, m), dω = −θ ∧ ω (0.4)

dθ = − 12 [θ, θ] + 12 R(ω ∧ ω) dR = −θ.R + R′(ω)

where R : B → K(h) and R′ : B → K 1 (h) ⊂ K(h) ⊗ m∗ are as defined before. There are two things that need to be checked in order to be able to apply Cartan’s general existence theorem for coframings at this level: First, the inclusion K 1 (h) ⊂ K(h)⊗m∗ should be an involutive tableau in Cartan’s sense. Second, there should be a quadratic map Q : K(h) → K 1 (h) ⊗ m∗ so that the exterior derivative of the third structure ′ ′ equation in (0.4) can be written in the form dR + θ.R − Q(R)(ω) (ω) = 0. (This is the familiar ‘vanishing torsion’ condition in exterior differential systems.) When these two conditions are satisfied, Cartan’s existence theorem asserts that, up to local diffeomorphism, the real analytic torsion-free connections with holonomy lying in H ⊂ GL(m) depend on sq functions of q variables, where sq is the last nonzero Cartan character of K 1 (h) ⊂ K(h) ⊗ m∗. Moreover, for any (R0 , R0′ ) ∈ K(h) × K 1 (h), there exists a torsion-free connection θ on an H-structure B ⊂ F (m, m) and a u0 ∈ B for which the curvature functions R and R′ satisfy R(u0 ) = R0 and R′(u0 ) = R0′ . When one can choose the element R0 ∈ K(h) ⊂ h⊗Λ2 (m∗) so that it is surjective5 as a map R0 : Λ2 (m) → h, it will then follow from the Ambrose-Singer holonomy theorem that the holonomy of θ contains the identity component of H. If, moreover, one can choose R0′ to be nonzero, such a connection θ will not be locally symmetric. This analysis applies successfully to each of the entries of Tables I, II, and III. By contrast, for each of the entries of Table IV, the tableau K 1 (h) ⊂ K(h) ⊗ m∗ is not involutive. Further discussion of this point will be given in §3. Generally, this method is good only for local analysis, but it has the distinct advantage that it not only proves existence of connections with a given holonomy, but provides their ‘degree of generality’ in Cartan’s sense. For example, Table I gives the degree of generality of each of the possible pseudo-Riemannian, irreducible holonomies. For a similar discussion of the nonmetric list, see the survey [Br3], where various simplifications of the general argument are introduced to shorten the exposition. 5

Actually, one only needs that the image R 0 Λ2 (m) ⊂ h generates h as an algebra.

9

This method was first used to prove the existence of metrics with holonomy G2 and Spin(7) and is still the only method that constructs the general local solution and describes its degree of generality. This is also the only known method for analyzing Entries 3 and 4 of Table III. Poisson Constructions. The examples H in Table IV are subgroups of Sp(S) ⊂ GL(m) for a nondegenerate skewsymmetric bilinear form S on m. Hence the corresponding H-structures (when they exist) have an underlying symplectic structure. For the first two examples from Table IV, each torsion-free connection (M, B, θ) of these types was analyzed and reconstructed in [Br2] from its derived curvature map J = (R, R′) : B → K(h) ⊕ K 1 (h). This reconstruction involved a number of seemingly miraculous identities, but since only these two examples were known, it did not seem worthwhile to look for an interpretation of these identities. However, when Chi, Merkulov, and Schwachh¨ofer [CMS] found other exotic symplectic examples, they noticed that this reconstruction technique generalized and they were able to explain it in the context of Poisson geometry in a very beautiful way. This, too, will be reported on in §3. 1.7. Compact Riemannian Examples. The history of compact Riemannian manifolds with reduced holonomy groups is long and complex, so I will not attempt a full account here. For more details on the cases I only mention, the reader can consult the relevant chapters of [Bes] and the references cited therein. K¨ ahler manifolds. This subject has the longest history, predating even Berger’s classification. Every smooth algebraic variety carries a K¨ ahler structure and this accounts for their importance in algebraic geometry. Special K¨ ahler manifolds. The major milestone here is, of course, Yau’s solution in the mid 1970s of the Calabi conjecture, showing that every compact K¨ ahler manifold with trivial canonical bundle carries a special K¨ ahler structure. For this reason, compact manifolds endowed with such a structure are usually referred to as Calabi-Yau manifolds. Hyper-K¨ ahler manifolds. In the early 1980s, Beauville and Mukai were each able to construct compact, simply connected K¨ ahler manifolds M 4p that carried a nondegenerate complex symplectic form (Fujiki had constructed examples for p = 2 slightly earlier). These necessarily had trivial canonical bundle, so by Yau’s solution of the Calabi conjecture, these carried special K¨ ahler structures. By an argument of Bochner, the complex symplectic form had to be parallel with respect to this special K¨ ahler structure, which forced the holonomy to lie in Sp(p). Further arguments showed that these examples were not products of lower dimensional complex manifolds and this implied that the holonomy had to actually be Sp(p). These were the first known compact examples. Quaternion K¨ ahler manifolds. In this case, all known compact examples are locally symmetric, but we know of no reason why this should be true, except for dimension 8 [PoS]. Of course, a great deal is known about the possible geometry of such examples, see [Sa]. 10

G2 and Spin(7) manifolds. The remarkable recent work of Joyce [Jo1,2] establishes the existence of compact manifolds with these holonomies. This will be reported on in §2.

2. RIEMANNIAN HOLONOMY In this section, g will denote a smooth Riemannian metric on a connected, smooth manifold M n . The reference space m will be taken to be R n with its standard inner product, and O(m) ⊂ GL(m) will denote its orthogonal group. The O(m)structure B ⊂ F (M, m) consisting of the coframes u : Tx M → m that are isometries of vector spaces is the orthonormal coframe bundle and the Levi-Civita connection on B will be denoted θ. This is, of course, the unique torsion-free O(m)-connection on B. When there is no danger of confusion, I will simply write Hu and Bu instead of Huθ and Buθ . One thing that makes the Riemannian case simpler to deal with than others is the de Rham Splitting Theorem [Bes, KNo], which occurs in a local form and a global form. The local form asserts that if (Hu )0 acts reducibly on m, say, preserving irreducible orthogonal subspaces mi ⊂ m for 1 ≤ i ≤ k, then (Hu )0 is the direct product of its subgroups (Hu )0i , where (Hu )0i is the subgroup that acts trivially on mj for j 6= i. Moreover, the metric g locally splits as a product in a corresponding way6 . The global form asserts that if, in addition, M is simply connected and the metric g is complete, then M globally splits as a Riemannian product (M, g) = (M1 , g1 ) × · · · × (Mk , gk ). so that (Hu )0i = (Hu )i is the holonomy of (Mi , gi ). 2.1. Non-closed holonomy. While the remainder of this report deals only with connected holonomy groups, I cannot pass up the opportunity to mention a recent result of particular interest in Riemannian holonomy. It had been a question for some time whether the holonomy of a compact Riemannian manifold must necessarily be compact. Using the de Rham Splitting Theorem and Berger’s holonomy classification in the irreducible Riemannian case, one sees that this is so if M is simply connected. Thus, for any Riemannian manifold, the restricted holonomy group is compact, so it becomes a question of whether the fundamental group can cause the holonomy group to have an infinite number of components even when M is compact. Very recently, B. Wilking [Wi] has shown that this can indeed occur. He has produced an example of a compact manifold whose holonomy group does have an infinite number of components. His example is of the form M 5 = Γ\(R 2 ×N 3 ) where Γ is a subgroup of the isometry group of R 2 ×N 3 that acts properly discontinuously and cocompactly. 6

What is also true, but not obvious, is that each of the groups (H u )0i ⊂ SO(mi ) is the holonomy of some Riemannian metric, even when it is not the holonomy of the corresponding local factor of g . See [Bes, Theorem 10.108]

11

2.2. Compact manifolds with exceptional holonomy. The most remarkable development in Riemannian holonomy in recent years has been the spectacular construction by Dominic Joyce of compact 7-manifolds with holonomy G 2 and compact 8-manifolds with holonomy Spin(7). His constructions are full of new ideas and, while it is not difficult to outline these ideas, their successful execution turns out to require very careful, subtle estimates. I will not attempt to explain these, but refer the reader to the original sources [Jo1,2] and to the forthcoming book [Jo3]. Also, I will concentrate on the G2 case, as the Spin(7) case follows the same spirit, but the details are different. The fundamental 3-form. Let m = R 7 . It has been known for some time [Br1] that there is an open GL(m)-orbit Λ3+(m∗) in the 3-forms on m so that the stabilizer of any element φ ∈ Λ3+(m∗) is a compact connected simple Lie group of dimension 14 and which is therefore isomorphic to G2 . Consequently, for any 7-manifold M , there is an open subbundle Λ3+ (T ∗M ) ⊂ Λ3 (T ∗M ) so that the G2 -structures on M are in one-to-one correspondence with the sections Ω3+(T M ) of this bundle. Such a section will exist if and only if M is orientable and spinnable [LM], so I assume this from now on. Associated to any section σ ∈ Ω3+(M ), there is a canonical metric gσ and orientation, inducing a well-defined Hodge star operator ∗σ : Ωp (M ) → Ω7−p(M ). If σ is parallel with respect to the Levi-Civita connection of gσ then the holonomy of gσ will be a subgroup of G2 and the G2 -structure associated to σ will be torsion-free. By a result of Gray, this G2 -structure is torsion-free if and only if both σ and ∗σ σ are closed. Conversely, if a Riemannian metric g on M 7 has holonomy a subgroup of G2 , then there will be a g-parallel section σ ∈ Ω3+(M ) for which g = gσ . A metric with holonomy a subgroup of G2 is known to be Ricci flat [Bes, 10.64], so if M is compact, Bochner vanishing shows that its harmonic 1-forms and its Killing fields must be parallel. Thus, in the compact case, b1 (M ) = 0 if the holonomy actually equals all of G2 . Combining this information with the Cheeger-Gromoll splitting theorem [Bes, 6.67], one finds that a compact manifold with holonomy G 2 must have finite fundamental group, so one can, without loss of generality, assume that M is simply connected, which I do from now on. Conversely, a compact simply connected Riemannian 7-manifold whose holonomy is a subgroup of G2 must actually equal G2 since any proper subgroup of G2 that can be a holonomy group fixes a nontrivial subspace. One can now consider the moduli space M consisting of the sections σ ∈ Ω3+(M ) satisfying dσ = d ∗σ σ = 0 modulo diffeomorphisms of M isotopic to the identity. 3 (M ) defined by τ [σ] = [σ]dR. There is an obvious ‘Torelli’ map τ : M → HdR Joyce’s first striking result [Jo1] is the analog of the local Torelli theorem, namely that τ is locally one-to-one and onto, in fact, a local diffeomorphism in the natural smooth structure on M. Thus, the moduli space is said to be ‘unobstructed’. Next, Joyce proves a remarkable existence theorem: If σ ∈ Ω3+ (M ) is closed, then there is a constant C that depends on the norm of the curvature of the metric gσ , its volume, and its injectivity radius, so that, if d(∗σ σ) σ < C, then there exists an exact 3-form φ so that σ +φ lies in Ω3+(M ) and is closed and coclosed. In other words, a closed 3-form in Ω3+(M ) that is ‘close enough’ to being coclosed can be perturbed 12

to a cohomologous 3-form in Ω3+(M ) that is both closed and coclosed. Thus, to prove the existence of a compact Riemannian 7-manifold with holonomy G2 , it suffices to construct a simply connected 7-manifold endowed with a closed 3-form that satisfies such a ‘close enough’ estimate. Joyce’s idea for doing this is extremely clever: He starts with the flat G2 structure σ0 on the 7-torus T 7 = R 7 /Z 7 and passes to a simply connected quotient orbifold X = Γ\T where Γ is a finite group of σ0 -symmetries. This provides a flat G2 -orbifold whose singular locus is a finite number of 3-tori T 3 , each of which has a neighborhood of the form T 3 × B 4 /{±} where B 4 /{±} is the standard 4-ball around the origin in R 4 = C 2 divided by the equivalence relation v ∼ −v. Now, it has been known for a long time that R 4 /{±} is metrically the scaling limit of the SU(2)-holonomy metric on T ∗C P1 constructed by Eguchi and Hanson as one scales the metric to contract the zero section to a point. Because I3 ×SU(2) ⊂ SO(7) is a subgroup of G2 , it follows that one can regard the flat G2 -structure on X in each singular locus neighborhood T 3 × B 4 /{±} as the limit of a scaling of a G2 -structure on T 3 ×T ∗C P1 . Joyce cuts out these singular neighborhoods and glues back in T 3 ×N where N is a neighborhood of the zero section in T ∗C P1 , smoothly joining the flat 3form with the Eguchi-Hanson-derived (closed) 3-form on the overlaps. This ‘surgery’ ˆ but does not disturb the fundamental group, which produces a smooth manifold X, remains trivial. By being very careful (here is where Joyce’s estimates are extremely delicate), he ˆ shows that he can do this in such a way that the resulting closed 3-form σ ∈ Ω3+(X) satisfies his estimate. I.e., it is close enough to being coclosed that it can be perturbed ˆ that is both closed and coclosed. Of course, since X is simply to a σ ˜ ∈ Ω3+(X) connected, it follows that the resulting torsion-free G2 -structure has holonomy equal to G2 . By applying this idea to a number of different finite groups Γ, Joyce has been able to construct G2 -metrics on a number of different 7-manifolds. A similar set of ideas allows Joyce to construct compact 8-manifolds with holonomy Spin(7), once one realizes that Spin(7) can be defined in GL(8, R) as the stabilizer of a certain 4-form in eight variables. The interested reader should consult [Jo1,2].

3. IRREDUCIBLE TORSION-FREE NON-METRIC CONNECTIONS 3.1. Twistor constructions. As previously mentioned, I found the first examples of ‘exotic’ holonomy groups by studying the geometry of the moduli space M of rational curves (i.e., complex curves of genus 0) in a complex surface S with normal bundle O(3). Following the examples of Hitchin’s study of rational curves in a surface S with normal bundle O(k) for k = 1 and 2, I knew that M would have dimension 4 and would have a natural G3 -structure, where G3 ⊂ GL(4, C ) is the image of GL(2, C ) acting by linear substitutions on the 4-dimensional space V3 of cubic polynomials in two variables. I also knew that there would be a canonical G3 -connection from general principles, but I was very surprised to find that this connection was 13

torsion-free. In the examples Hitchin had analyzed, the geometry on the moduli space allowed one to reconstruct the surface S and so I fully expected to be able to do the same in this case. However, it turned out that the story was more subtle than that. In the standard double fibration picture: λ ւ

I

M

ρ ց S

where I ⊂ M × S is the set of pairs (C, p) where p ∈ S is a point of the rational curve C ∈ M and λ and ρ are just the projections onto the factors, each p ∈ S would −1 correspond to a hypersurface Hp = λ ρ (p) in M (since it is only one condition for a curve in S to pass through a given point p). The members of this 2-parameter family of hypersurfaces in M would be expected to be the solutions of some differential geometric problem in M , but I was not able to find a geometrically defined 2-parameter family of hypersurfaces in the general 4-manifold carrying a torsion-free G3 -structure. However, a 3-parameter family Y of 2-dimensional surfaces did present itself. This can be described as follows: By the defining property of a G3 -structure B on M 4 , each tangent space TxM can be thought of as the space of homogeneous cubic polynomials in two variables. This defines a distinguished P 1 of lines, namely the perfect cubes, and a distinguished P 1 of 2-planes, namely the multiples of a perfect square. I called such lines and 2-planes null. It was not difficult to show that, when B had a torsion-free connection, each null 2-plane was tangent to a unique totally geodesic 2-surface in M all of whose tangent planes were null. This family Y then fit into a double fibration7 N5 λ ρ ւ ց M4 Y3 where the fibers of λ are P 1 ’s. Moreover, I was able to show that Y carried a natural structure as a contact manifold, that the family of P 1 ’s given by Cx = ρ λ−1 (x) for x ∈ M were all Legendrian curves for this contact structure, and that, moreover, this family was an open set in the space of Legendrian rational curves in Y . (In the surface case that I had started out with, Y turned out to be the projectivized tangent bundle of S.) I then showed that the picture could be reversed: Starting with a holomorphic contact 3-manifold Y , one could look at the moduli space M of rational Legendrian curves C in Y to which the contact bundle L ⊂ T ∗Y restricts to be isomorphic to O(−3) and show that it was a smooth moduli space of dimension 4 on which there was a canonical torsion-free G3 -structure. 7

Assuming Y to be Hausdorff in its natural topology, which can always be arranged by replacing M by a θ -convex open set in M .

14

Merkulov’s generalization. In a remarkable series of papers, Merkulov [Me1,2,3] showed that this moduli space and double fibration construction obtains in a very general setting, starting from the data of an irreducibly acting (and therefore reductive) complex subgroup H ⊂ GL(n, C ), a complex n-manifold M , and a holomorphic H-structure B ⊂ F (M, C n ) endowed with a holomorphic torsion-free connection θ. The semi-simple part Hs ⊂ H acts irreducibly on C n . With respect to a Cartan subalgebra of Hs and an ordering of its roots, there will be a unique line E ⊂ (C n )∗ spanned by a vector of highest weight. The Hs -orbit F ⊂ P (C n )∗ of E is a minimal Hs -orbit in P (C n )∗ , a generalized flag variety of Hs of some dimension k ≤ n−1, endowed with the hyperplane section bundle L. (In the original case I treated, F is the projectivization of the set of perfect cubes and hence is a P 1 . The bundle L is O(−3).) The H-structure B provides identifications TxM ≃ C n unique up to an action of H, so there is a subbundle N ⊂ P(T ∗ M ) whose fiber Nx ⊂ P(T x∗ M ) over x n ∗ corresponds to F ⊂ P (C ) via any B-identification. The projectivized cotangent bundle of any manifold is canonically a contact manifold, and the torsion-free condition on θ immediately implies that N is an involutive submanifold of P(T ∗ M ), i.e., the restriction of the contact structure to N is degenerate, with Cauchy leaves of the largest possible dimension, namely n−k−1, the codimension of N in P(T ∗ M ). When it is Hausdorff 8 , the leaf space Y of this Cauchy foliation is canonically a contact manifold, yielding the double fibration

Mn

λւ

N n+k

ցρ Y 2k+1

where the manifolds Fx = ρ λ−1 (x) are Legendrian k-dimensional submanifolds of Y . Merkulov then goes on to prove that, nearly always, one can recover M as the complete moduli space of the Legendrian immersions F ⊂ Y that pull back the contact bundle L ⊂ T ∗Y to be L. Moreover, when Hs acts as the full biholomorphism group of F (which, again, is nearly always) one can recover the original H-structure on M up to conformal scaling from the family of submanifolds S y = λ ρ−1 (y) for y ∈ Y . Finally, Merkulov gives representation theoretic criteria on an irreducibly acting subgroup H ⊂ GL(m) with associated generalized flag variety F ⊂ P(m∗ ) of dimension k and hyperplane bundle L, which guarantee that taking a (2k+1)-dimensional contact manifold Y and considering the moduli space M (Y ) of Legendrian embeddings F ⊂ Y that pull back the contact bundle L to be L yields a smooth moduli space endowed with an H-structure and a torsion-free connection. This last step is extremely important, for it provides a way to determine which irreducibly acting subgroups H ⊂ GL(m) can occur as torsion-free holonomy in terms of representation theory, specifically, in terms of the vanishing of certain Hrepresentations constructed functorially from m. This provides a different approach to solving the torsion-free holonomy problem, one that was carried out successfully by a combination of efforts of Chi, Merkulov, and Schwachh¨ ofer. In particular, this 8

This can always be arranged by replacing M by a suitably θ -convex open set in M .

15

approach led to the discovery of the remaining groups in Table IV and, finally, the proof that Tables I, II, III, and IV exhaust the possibilities for irreducibly acting torsion-free holonomy. 3.2. Poisson constructions. The straightforward application of exterior differential systems to the holonomy problem outlined in §0.6 does not work for the entries of Table IV, at least at the level described so far. To see where the problem is, recall the structure equations derived so far for a torsion-free connection with holonomy H ⊂ GL(m). They are dω = −θ ∧ ω (3.1)

dθ = − 12 [θ, θ] + 12 R(ω ∧ ω) dR = −θ.R + R′(ω)

where R : B → K(h) and R′ : B → K 1 (h) ⊂ K(h) ⊗ m∗ are as already defined. When one considers the first entry of Table IV, where H = SL(2, R) and m ≃ V3 = S3 (V1 ), it is not difficult to see that K(h) ≃ V2 = S2 (V1 ) has dimension 3 and that K 1 (h) ≃ V3 has dimension 4. Its Cartan characters are (s1 , s2 , s3, s4 ) = (3, 1, 0, 0) but, as is easily computed, the prolongation K 2 (h) ⊂ K 1 (h) ⊗ m∗ has dimension 1, so the tableau is not involutive and Cartan’s existence theorem cannot be applied at this level. However, there is a quadratic map Q : K(h) → K 1 (h) ⊗ m∗ so that the exterior derivative of the third equation in (3.1) is dR′ + θ.R′ − Q(R)(ω) (ω) = 0, implying that there is a function R′′ : B → K 2 (h) so that the equation (3.2) dR′ = −θ.R′ + R′′ + Q(R) (ω) holds. Moreover, it is possible to choose the quadratic map Q in a unique way so that differentiating this last equation yields dR′′(ω) = 0. Now the second prolongation of K 1 (h) vanishes, so this forces the structure equation dR′′ = 0.

(3.3)

Obviously, differentiating this equation will yield no new information. At this point, Cartan’s general existence theorem for coframings satisfying prescribed differential identities (a generalization of Lie’s third fundamental theorem) can be applied to the entire ensemble dω = −θ ∧ ω, dθ = − 12 [θ, θ] + (3.4)

1 2

R(ω ∧ ω),

dR = −θ.R + R′(ω), dR′ = −θ.R′ + R′′ + Q(R) (ω),

dR′′ = 0.

His theorem implies that for every (R0 , R0′ , R0′′) ∈ K(h)×K 1 (h)×K 2 (h), there is a torsion-free H-structure B ⊂ F (m, m), unique up to local diffeomorphism, so that, at 16

a point u0 ∈ B one has R(u0 ) = R0 , R′(u0 ) = R0′ , and R′′(u0 ) = R0′′. Consequently, the space of diffeomorphism classes of germs of such torsion-free H-structures is finite dimensional. What Chi, Merkulov, and Schwachh¨ ofer show in [CMS] is that this exact same picture holds for each entry in Table IV. Namely, K(h) ≃ h, K 1 (h) ≃ m, K 2 (h) ≃ F (= R or C ), and there is a quadratic map Q : h → m ⊗ m∗ so that the above analysis of the structure equations goes through exactly the same as for the original two cases (with the obvious interpretations of the pairings). Cartan’s theorem then applies and yields not only the existence of torsion-free connections with these prescribed holonomies, but that the space of germs of such H-structures, modulo diffeomorphism, is finite dimensional. In the original two cases that I treated, the finer understanding of the moduli space of solutions entailed understanding how the images (R, R′, R′′)(B) ⊂ h×m×F partition h×m×F into subsets. This analysis would have been hopeless were it not for several (at the time) amazing identities that I found by brute force calculation. They even allowed me to prove existence without using Cartan’s existence theorem. What is shown in [CMS], however, is that these mysterious identities can be explained in terms of a natural Poisson structure on the space h×m×F (actually, they regard the last factor as a parameter and consider Poisson structures on h×m). The images (R, R′, R′′)(B) turn out to be the symplectic leaves of this Poisson structure and this point of view simplifies the reconstruction of the H-structure from the leaf image (though it does not entirely remove some of the global difficulties having to do with the symplectic realizations necessary in their construction). 3.3. Algebraic classification. Once the full list of the irreducible torsion-free holonomies was known, there arose the question of whether this list could be derived through Berger’s original approach, i.e., representation theory. Schwachh¨ ofer [Schw] has shown that this can indeed be done. (As is so often the case, knowing the answer in advance helps to organize the proof.) His fully algebraic classification of the irreducibly acting subgroups H ⊂ GL(m) that satisfy Berger’s first criterion and the subset of those that also satisfy Berger’s second criterion still involves quite a bit of case checking, but the general outline of the argument is clear. What is particularly intriguing is Ziller’s observation (reported in [Schw]) that this list can be constructed by a simple Ansatz starting from the list of Hermitian and quaternionic symmetric spaces. A direct proof of Ziller’s Ansatz would be highly desirable. 3.4. Two leftover cases. As of this writing, each entry in the four Tables, save two, Entries 3 and 4 in Table III, has been treated in the literature and shown to occur as holonomy, either by twistor methods or exterior differential systems methods. Existence proofs by twistor methods have some difficulty when m is a complex vector space and the group H ⊂ GL(m) is of the form H = GC ·Hs where Hs is the semisimple part and GC ⊂ C ∗ is a one-dimensional subgroup of C ∗ , acting as scalar multiplication on m. The method of exterior differential systems does not have this problem, but each case does require a separate treatment. 17

In my survey article [Br3], I left these two entries unsettled in the case where GC had dimension 1 because, at the time, they did not seem that interesting. Now that they are the last unsettled cases, it seems to be a good idea to resolve them, so I will do that here, though, for lack of space, I will not provide details, just give the results of the Cartan-K¨ahler analysis. For the first case, H = GC ·SL(2, R) ⊂ GL(2, C ), one must assume that G C 6⊆ R ∗ , otherwise H will not act irreducibly on m ≃ C 2 . This leaves a one parameter family of possibilities Hλ = {e(i+λ)t t ∈ R} ⊂ C ∗ where λ is any real number. By conjugation, one can assume that λ ≥ 0, so I will do this. It turns out that there are two cases: If λ = 0, so that H0 = S 1 , it is not difficult to compute that K(h) ≃ V4 ⊕V2 ⊕V0 , while K 1 (h) ≃ 2V5 ⊕2V3 ⊕2V1 and is involutive, with characters (s1 , s2 , s3 , s4) = (9, 9, 5, 1). Moreover, the torsion is absorbable. By Cartan’s theorem, solutions exist and depend on one function of four variables. However, if λ > 0, so that Hλ ≃ R + , one computes that K(h) ≃ V4 ⊕V2 while K 1 (h) ≃ 2V5 ⊕2V3 and is involutive, with characters (s1 , s2 , s3 , s4) = (8, 8, 4, 0). Moreover, the torsion is absorbable. By Cartan’s theorem, solutions exist and depend on four functions of three variables. For the second case, H = GC ·SU(2) ⊂ GL(2, C ), one must assume that GC 6⊆ S 1 , otherwise H = U(2) will preserve a metric on m ≃ C 2 . This leaves a one parameter family of possibilities Jλ = {e(1+iλ)t t ∈ R} ⊂ C ∗ where λ is any real number. By conjugation, one can assume that λ ≥ 0, though I won’t need to do this. Here there is only one case: One computes that K(h) ≃ V4R ⊕V2R ≃ R 8 while K 1 (h) ≃ V5 ⊕V3 ≃ C 10 ≃ R 20 . The tableau is involutive, with characters (s1 , s2 , s3 , s4) = (8, 8, 4, 0). Moreover, the torsion is absorbable. By Cartan’s theorem, solutions exist and depend on four functions of three variables.

18

REFERENCES [Al1] D. Alekseevskii - Riemannian spaces with unusual holonomy groups, Funct. Anal. Appl. 2 (1968), 97–105. [Al2] D. Alekseevskii - Classification of quaternionic spaces with a transitive solvable group of motions, Math. USSR-Izv 9 (1975), 297–339. [AS] A. Ambrose and I. Singer - A theorem on holonomy, Trans. Amer. Math. Soc. 75 (1953), 428–443. [BB] L. B´ erard-Bergery - On the holonomy of Lorentzian manifolds, Proc. Symp. Pure Math. 54 (1993), 27–40. [BI] L. B´ erard-Bergery and A. Ikemakhen - Sur l’holonomie des vari´et´es pseudo-riemanniennes de signature (n, n), Bull. Soc. Math. France 125 (1997), 93–114. [Ber1] M. Berger, Sur les groupes d’holonomie des vari´et´es ` a connexion affine et des vari´et´es riemanniennes, Bull. Soc. Math. France 83 (1955), 279–330. ´ [Ber2] M. Berger - Les espaces sym´etriques non compacts, Ann. Sci. Ecole Norm. Sup. 74 (1957), 85–177. [Bes] A. Besse - Einstein Manifolds, Ergebnisse der Mathematik und ihrer Grenzgebiete, 3. Folge, Band 10, Springer-Verlag, Berlin, 1987. [BL] A. Borel and A. Lichnerowicz - Groupes d’holonomie des vari´et´es riemanniennes, C.R. Acad. Sci. Paris 234 (1952), 1835–1837. [BG] R. Brown and A. Gray - Riemannian manifolds with holonomy group Spin(9), in Differential Geometry (in honor of Kentaro Yano), Kinokuniya, Tokyo, 1972, 41–59. [Br1] R. Bryant - Metrics with exceptional holonomy, Ann. Math. 126 (1987), 525– 576. [Br2] R. Bryant - Two exotic holonomies in dimension four, path geometries, and twistor theory, Amer. Math. Soc. Proc. Symp. Pure Math. 53 (1991), 33–88. [Br3] R. Bryant - Classical, exceptional, and exotic holonomies: a status report, in Actes de la Table Ronde de G´eom´etrie Diff´erentielle en l’Honneur de Marcel Berger, Soc. Math. France, 1996, 93–166. [BCG] R. Bryant, et al - Exterior Differential Systems, MSRI Series 18, SpringerVerlag, 1991. [BS] R. Bryant and S. Salamon - On the construction of some complete metrics with exceptional holonomy, Duke Math. J. 58 (1989), 829–850. ´ Cartan - La G´eometrie des Espaces de Riemann, M´emorial des Sciences [Ca1] E. Math´ematiques, Fasc. IX (1925). (Especially, Chapitre VII, Section II.) ´ Cartan - Les groupes d’holonomie des espaces g´en´eralis´es, Acta. Math. 48 [Ca2] E. (1926), 1–42. ¨ fer - On the existence of infinite [CMS] Q.-S. Chi, S. Merkulov, and L. Schwachho series of exotic holonomies. Inventiones Math. 126 (1996), 391–411. ¨ fer - Exotic holonomy on moduli spaces of ra[ChS] Q.-S. Chi and L. Schwachho tional curves, Differential Geom. App. 8 (1998), 105–134. [Gr] M. Gromov - Carnot-Carath´eodory spaces seen from within, in Sub-Riemannian geometry, Progr. Math. 144, Birkh¨ auser, Basel, 1996, 79–323. 19

[Jo1] D. Joyce - Compact Riemannian 7-manifolds with holonomy G2 : I & II, J. Differential Geom. 43 (1996), 291–328, 329–375. [Jo2] D. Joyce - Compact 8-manifolds with holonomy Spin(7), Inventiones Math. 123 (1996), 507–552. [Jo3] D. Joyce - Compact manifolds with special holonomy, Oxford University Press, Oxford, 2000 (projected). [KNa] S. Kobayashi and K. Nagano - On filtered Lie algebras and geometric structures, II, J. Math. Mech. 14 (1965), 513–521. [KNo] S. Kobayashi and K. Nomizu - Foundations of Differential Geometry, Vols. 1 & 2, Wiley-Interscience, New York, 1963. [LM] H. B. Lawson, Jr. and M. L. Michelsohn - Spin geometry, Princeton Math. Series 38, Princeton Univ. Press, Princeton, NJ, 1989. [Me1] S. Merkulov - Moduli spaces of compact complex submanifolds of complex fibered manifolds, Math. Proc. Camb. Phil. Soc. 118 (1995), 71–91. [Me2] S. Merkulov - Geometry of Kodaira moduli spaces, Proc. Amer. Math. Soc. 124 (1996), 1499–1506. [Me3] S. Merkulov - Existence and geometry of Legendre moduli spaces, Math. Z. 226 (1997), 211–265. ¨ fer - Classification of irreducible holonomies [MS1] S. Merkulov and L. Schwachho of torsion-free affine connections, Ann. Math. (to appear). ¨ fer - Twistor solution of the holonomy prob[MS2] S. Merkulov and L. Schwachho lem, 395–402, The Geometric Universe, Science, Geometry and the work of Roger Penrose, S.A. Hugget (ed.), Oxford Univ. Press, 1998. [PoS] Y. S. Poon and S. Salamon - Quaternionic K¨ ahler 8-manifolds with positive scalar curvature, J. Differential Geom. 33 (1991), 363–378. [Sa] S. Salamon - Riemannian geometry and holonomy groups, Pitman Research Notes in Math., no. 201, Longman Scientific & Technical, Essex, 1989. [Scho] J. Schouten - On the number of degrees of freedom of the geodetically moving systems, Proc. Kon. Acad. Wet. Amsterdam 21 (1918), 607–613. ¨ fer - On the classification of holonomy representations, Habili[Schw] L. Schwachho tationsschrift, Universit¨at Leipzig, 1998. [Wi] B. Wilking - On compact Riemannian manifolds with noncompact holonomy groups, 1999 preprint. URL: http://wwwmath.uni-muenster.de/math/inst/sfb/about/publ/wilking.ps

Robert BRYANT Duke University Department of Mathematics P.O. Box 90320 DURHAM, NC 27708-0320 USA E–mail : [email protected]

20

S´eminaire BOURBAKI 51`eme ann´ee, 1998-99, no 862

Juin 1999

CLASSICAL COMPUTING, QUANTUM COMPUTING, AND SHOR’S FACTORING ALGORITHM by Yuri I. MANIN

0. WHY QUANTUM COMPUTING ?

Information processing (computing) is the dynamical evolution of a highly organized physical system produced by technology (computer) or nature (brain). The initial state of this system is (determined by) its input; its final state is the output. Physics describes nature in two complementary modes: classical and quantum. Up to the nineties, the basic mathematical models of computing, Turing machines, were classical objects, although the first suggestions for studying quantum models date back at least to 1980. Roughly speaking, the motivation to study quantum computing comes from several sources: physics and technology, cognitive science, and mathematics. We will briefly discuss them in turn. (i) Physically, the quantum mode of description is more fundamental than the classical one. In the seventies and eighties it was remarked that, because of the superposition principle, it is computationally unfeasible to simulate quantum processes on classical computers ([Po], [Fe1]). Roughly speaking, quantizing a classical system with N states we obtain a quantum system whose state space is an (N − 1)–dimensional complex projective space whose volume grows exponentially with N . One can argue that the main preoccupation of quantum chemistry is the struggle with resulting difficulties. Reversing this argument, one might expect that quantum computers, if they can be built at all, will be considerably more powerful than classical ones ([Fe1], [Ma2]). Progress in the microfabrication techniques of modern computers has already led us to the level where quantum noise becomes an essential hindrance to the error–free functioning of microchips. It is only logical to start exploiting the essential quantum mechanical behavior of small objects in devising computers, instead of neutralizing it. (ii) As another motivation, one can invoke highly speculative, but intriguing, conjectures that our brain is in fact a quantum computer. For example, the recent progress in writing efficient chess playing software (Deep Blue) shows that to simulate the world championship level using only classical algorithms, one has to be able to analyze about 106 positions/sec and use about 1010 memory bytes. Since the characteristic time of neuronal processing is about 10−3 sec, it is very difficult to explain

862-02 how the classical brain could possibly do the job and play chess as successfully as Kasparov does. A less spectacular, but not less resource consuming task, is speech generation and perception, which is routinely done by billions of human brains, but still presents a formidable challenge for modern computers using classical algorithms. Computational complexity of cognitive tasks has several sources: basic variables can be fields; a restricted amount of small blocks can combine into exponentially growing trees of alternatives; databases of incompressible information have to be stored and searched. Two paradigms have been developed to cope with these difficulties: logic–like languages and combinatorial algorithms, and statistical matching of observed data to an unobserved model (see D. Mumford’s paper [Mu] for a lucid discussion of the second paradigm.) In many cases, the second strategy efficiently supports an acceptable performance, but usually cannot achieve excellency of the Deep Blue level. Both paradigms require huge computational resources, and it is not clear, how they can be organized, unless hardware allows massive parallel computing. The idea of “quantum parallelism” (see sec. 2 below) is an appealing theoretical alternative. However, it is not at all clear that it can be made compatible with the available experimental evidence, which depicts the central nervous system as a distinctly classical device. The following way out might be worth exploring. The implementation of efficient quantum algorithms which have been studied so far can be provided by one, or several, quantum chips (registers) controlled by a classical computer. A very considerable part of the overall computing job, besides controlling quantum chips, is also assigned to the classical computer. Analyzing a physical device of such architecture, we would have direct access to its classical component (electrical or neuronal network), whereas locating its quantum components might constitute a considerable challenge. For example, quantum chips in the brain might be represented by macromolecules of the type that were considered in some theoretical models for high temperature superconductivity. The difficulties are seemingly increased by the fact that quantum measurements produce non–deterministic outcomes. Actually, one could try to use this to one’s advantage, because there exist situations where we can distinguish the quantum randomness from the classical one by analyzing the probability distributions and using the Bell–type inequalities. With hindsight, one recognizes in Bell’s setup the first example of the game–like situation where quantum players can behave demonstrably more efficiently that the classical ones (cf. the description of this setup in [Ts], pp. 52–54). It would be extremely interesting to devise an experimental setting purporting to show that some fragments of the central nervous system relevant for information processing can in fact be in a quantum superposition of classical states. (iii) Finally, we turn to mathematics. One can argue that nowadays one does not even need additional motivation, given the predominant mood prescribing the quantization of “everything that moves”. Quantum groups, quantum cohomology, quantum invariants of knots etc come to mind. This actually seemed to be the primary

862-03 motivation before 1994, when P. Shor ([Sh]) devised the first quantum algorithm showing that prime factorization can be done on quantum computers in polynomial time, that is, considerably faster than by any known classical algorithm. (P. Shor’s work was inspired by the earlier work [Si] of D. Simon). Shor’s paper gave a new boost to the subject. Another beautiful result due √ to L. Grover ([Gro]) is that a quantum search among N objects can be done in c N steps. A. Kitaev [Ki1] devised new quantum algorithms for computing stabilizers of abelian group actions; his work was preceded by that of D. Boneh and R. Lipton [BoL], who treated the more general problem by a modification of Shor’s method (cf. also [Gri]). At least as important as the results themselves, are the tools invented by Shor, Grover, and Kitaev. Shor’s work is the central subject of this lecture. It is explained in sec. 4. This explanation follows the discussion of the general principles of quantum computing and massive quantum parallelism in sec. 2, and of four quantum subroutines, including Grover’s searching algorithm, in sec. 3. The second of these subroutines involving quantum computations of classical computable functions shows how to cope with the basic issue of quantum reversibility vs classical irreversibility. For more on this, see [Ben1] and [Ben2]. The opening sec. 1 contains a brief report on the classical theory of computability. I made some effort to express certain notions of computer science, including P/NP, in the language of mainstream mathematics. The last section 5 discusses Kolmogorov complexity in the context of classical and quantum computations. Last, but not least, the hardware for quantum computing does not exist as yet: see 3.3 below for a brief discussion of the first attempts to engineer it. The quantum algorithms invented and studied up to now will stimulate the search of technological implementation which – if successful – will certainly correct our present understanding of quantum computing and quantum complexity. Acknowledgements. I am grateful to Alesha Kitaev, David Mumford, and Dimitri Manin for their interest and remarks on the earlier version of this report. Many of their suggestions are incorporated in the text.

1. CLASSICAL THEORY OF COMPUTATION

1.1. Constructive universe. In this section I deal only with deterministic computations, which can be modelled by classical discrete time dynamical systems and subsequently quantized. Alan Turing undertook the microscopic analysis of the intuitive idea of algorithmic computation. In a sense, he found its genetic code. The atom of information is one bit, the atomary operators can be chosen to act upon one/two bits and to produce the outputs of the same small size. Finally, the sequence of operations is strictly determined by the local environment of bounded size, again several bits. For a change, I proceed in the reverse direction, and start this section with a presentation of the macrocosm of the classical theory of computation. Categorical language is appropriate to this end. Let C be a category whose objects are countable or finite sets U . Elements x of

862-04 these sets will generally be finite sets with additional structure. Without waiting for all the necessary axioms to be introduced, we will call x ∈ U a constructive object of type U (an integer, a finite graph, a word in a given alphabet, a Boolean expression, an instance of a mass problem . . .) The set U itself will be called the constructive world of objects of fixed type, and C the constructive universe. The category C, which will be made more concrete below, will contain all finite products and finite unions of its objects, and also finite sets U of all cardinalities. Morphisms U → V in C are certain partial maps of the underlying sets. More precisely, such a morphism is a pair (D(f ), f ) where D(f ) ⊂ U and f : D(f ) → V is a set–theoretic map. Composition is defined by (D(g), g) ◦ (D(f ), f ) = (g −1D(f ), g ◦ f ). We will omit D(f ) when it does not lead to a confusion. The morphisms f that we will be considering are (semi)computable functions U → V. An intuitive meaning of this notion, which has a very strong heuristic potential, can be explained as follows: there should exist an algorithm ϕ such that if one takes as input the constructive object u ∈ U, one of the three alternatives holds: (i) u ∈ D(f ), ϕ produces in a finite number of steps the output f (u) ∈ V. (ii) u ∈ / D(f ), ϕ produces in a finite number of steps the standard output meaning NO. (iii) u ∈ / D(f ), ϕ works for an infinitely long time without producing any output. The necessity of including the alternative (iii) in the definition of (semi–)computability was an important and non–trivial discovery of the classical theory. The set of all morphisms U → V is denoted C(U, V ). The sets of the form D(f ) ⊂ U are called enumerable subsets of U. If both E ⊂ U and U \ E are enumerable, E is called decidable. The classical computation theory makes all of this more precise in the following way. 1.2. Definition. A category C as above is called a constructive universe if it contains the constructive world N of all integers ≥ 1, finite sets ∅, {1}, . . ., {1, . . . , n}, . . . and satisfies the following conditions (a)–(d). (a) C(N, N) is defined as the set of all partially recursive functions (see e.g. [Ma1], Chapter V, or [Sa]). (b) Any infinite object of C is isomorphic to N. (c) If U is finite, C(U, V ) consists of all partial maps U → V. If V is finite, C(U, V ) consists of such f that inverse image of any element of V is enumerable. Before stating the last condition (d), we make some comments. Statement (b) is a part of the famous Church Thesis. Any isomorphism (computable bijection) N → U in C is called a numbering. Thus, two different numberings of the same constructive world differ by a recursive permutation of N. We will call such numberings equivalent ones. Notice that because of (c) two finite constructive worlds are isomorphic iff they have the same cardinality, and the automorphism group of any finite U consists of all permutations of U.

862-05 As a matter of principle, we always consider C as an open category, and at any moment allow ourselves to add to it new constructive worlds. If some infinite V is added to C, it must come together with a class of equivalent numberings. Thus, any finite union of constructive worlds can be naturally turned into the constructive world, so that the embeddings become computable morphisms, and their images are decidable. As another example, the world N∗ of finite sequences of numbers from N (“words in alphabet N”) is endowed with G¨ odel’s numbering (1)

k −1 (n1 , n2, . . . , nk, . . .) 7→ 2q 3n −1 . . . pn k+1 − 1

where pk is the k–th prime number, q = max{i | n k = . . . = nk−i+1 = 1}. Hence we may assume that C is closed with respect to the construction U 7→ U ∗. All natural functions, such as length of the word U ∗ → N, or the i–th letter of the word U ∗ → U are computable. Similarly, C can be made closed with respect to the finite direct products by using the (inverse) numbering of N2 : (2)

(m, n) 7→ m +

1 (m + n − 1)(m + n − 2). 2

Projections, diagonal maps, fiber maps V → U × V, v 7→ (u0 , v) are all computable. Decidable subsets of constructive worlds are again constructive. Church Thesis is often invoked as a substitute for an explicit construction of a numbering, and it says that the category C is defined uniquely up to equivalence. We now turn to the computability properties of the sets of morphisms C(U, V ). Again, it is a matter of principle that C(U, V ) itself is not a constructive world if U is infinite. To describe the situation axiomatically, consider first any diagram (3)

ev : P × U → V

in C. It defines a partial map P → C(U, V ), p 7→ p, where p(u) := ev (p, u). We will say that the constructive world P = P (U, V ) together with the evaluation map ev is a programming method (for computing some maps U → V ). It is called universal, if the following two conditions are satisfied. First, the map P → C(U, V ) must be surjective. Second, for any programming method Q = Q(U, V ) with the same source U and target V, C(Q, P ) contains translation morphisms (4)

trans : Q(U, V ) → P (U, V )

which are, by definition, everywhere defined, computable maps Q → P such that if q 7→ p, then q = p. We now complete the Definition 1.2 by adding the last axiom forming part of the Church Thesis: (d) For every two constructive worlds U, V, there exist universal programming methods.

862-06 The standard examples of P for U = V = N are (formalized descriptions of) Turing machines, or recursive functions. From (d) it follows that the composition of morphisms can be lifted to a computable function on the level of programming methods. To be more precise, if Q (resp. P ) is a programming method for U, V (resp. V, W ), and R is a universal programming method for U, W, there exist computable composition maps (5)

comp : P (V, W ) × Q(U, V ) → R(U, W ), (p, q) 7→ r

such that r = p ◦ q. Concrete P (U, V ) are furnished by the choice of what is called the “model of computations” in computer science. This last notion comes with a detailed description not only of programs but also of all steps of the computational process. At this stage the models of kinematics and dynamics of the process first emerge, and the discussion of quantization can start. A formalized description of the first n steps will be called a history of computation or, for short, a protocol (of length n.) For a fixed model, protocols (of all lenghts) form a constructive world as well. We will give two formalized versions of this notion, for functions with infinite and finite domains respectively. The first will be well suited for the discussion of polynomial time computability, the second is the base for quantum computing. 1.3. Models of computations I: normal models. Let U be an infinite constructive world. In this subsection we will be considering partial functions U`→ U. The more general case U → V can be reduced to this one by working with U V. A normal model of computations is the structure (P, U, I, F, s, ) consisting of four sets and a map: (6)

I ⊂ U, F ⊂ P × U, s : P × U → P × U .

Here s is an everywhere defined function such that s(p, u) = (p, sp(u)) for any (p, u) ∈ P × U. Intuitively, p is a program, u is a configuration of the deterministic discrete time computing device, and sp(u) is the new configuration obtained from u after one unit of time (clock tick). Two additional subsets I ⊂ U (initial configurations, or inputs) and F ⊂ P × U (final configurations) must be given, such that if (p, u) ∈ F, then s(p, u) = (p, u) i.e., u is a fixed point of sp. In this setting, we denote by fp the partial function fp : I → U such that we have (7)

n u ∈ D(fp) and fp(u) = v iff for some n ≥ 0, (p, sn p (u)) ∈ F and sp (u) = v.

The minimal such n will be called the time (number of clock ticks) needed to calculate fp(u) using the program p. Any finite sequence (8)

(p, u, sp(u), . . . , sm p (u)), u ∈ I,

862-07 will be called a protocol of computation of length m. We now add the constructivity conditions. We require P, U to be constructive worlds, s computable. In addition, we assume that I, F are decidable subsets of U, P × U respectively. Then fp are computable, and protocols of given length (resp. of arbitrary length, resp. or those stopping at F ), form constructive worlds. If we denote by Q the world of protocols stopping at F and by ev : Q × U → U the map (p, u) 7→ smax (u), we get a programming method. p Such a model is called universal, if the respective programming method is universal. The notion of normal model of computations generalizes both normal algorithms and Turing machines. For their common treatment see e.g. [Sa], Chapter 4. In broad terms, p ∈ P is the list of Markov substitutions, or the table defining the operation of a Turing machine. The remaining worlds U, I, F consist of various words over the working alphabet. 1.3.1. Claim. For any U , universal normal models of computations exist, and can be effectively constructed. For U = N, this follows from the existence of universal Turing machines, and generally, from the Church Thesis. It is well known that the universal machine for calculating functions of k arguments is obtained by taking an appropriate function of k + 1 arguments and making the first argument the variable part of the program. Hence P, in this case, consists of pairs (q, m), where q is the fixed program of the (k + 1)–variable universal function (hardware) and m is a word written on the tape (software). 1.4. Models of computations II: Boolean circuits. Boolean circuits are classical models of computation well suited for studying maps between the finite sets whose elements are encoded by sequences of 0’s and 1’s. Consider the Boolean algebra B generated over F2 by a countable sequence of independent variables, say x1 , x2 , x3 , . . . This is the quotient algebra of F2 [x1 , x2 , . . .] with∞respect to the relations x2i = xi. Each Boolean polynomial determines a function on ⊕ F2 with values in F2 = {0, 1}. i=1 We start with the following simple fact. n 1.4.1. Claim. Any map f : Fm 2 → F2 can be represented by a unique vector of Boolean polynomials.

Proof. It suffices to consider the case n = 1. Then f is represented by (9)

F (x1 , . . . , xn) :=

X

f (y)

y=(yi )∈F

m

Y

(xi + yi + 1)

i

because the product in (9) is the delta function in x supported by y. Moreover, the spaces of maps and of Boolean polynomials have the common dimension 2 m over F2 . Now we can calculate any vector of Boolean polynomials iterating operations from a small finite list, which is chosen and fixed, e.g. B := {x, 1, x + y, xy, (x, x)}. Such operators are called classical gates. A sequence of such operators, together with

862-08 indication of their arguments from the previously computed bits, is called a Boolean circuit. The number of steps in such a circuit is considered as (a measure of) the time of computation. When the relevant finite sets are not Fm 2 and perhaps have a wrong cardinality, we encode their elements by finite sequences of bits and consider the restriction of the Boolean polynomial to the relevant subset. As above, a protocol of computation in this model can be represented as the finite table consisting of rows (generally of variable length) which accommodate sequences of 0’s and 1’s. The initial line of the table is the input. Each subsequent line must be obtainable from the previous one by the application of one the basic functions in B to the sequence of neighboring bits (the remaining bits are copied unchanged). The last line is the output. The exact location of the bits which are changed in each row and the nature of change must be a part of the protocol. Physically, one can implement the rows as the different registers of the memory, or else as the consecutive states of the same register (then we have to make a prescription for how to cope with the variable length, e.g. using blank symbols). 1.4.2. Turing machines vs Boolean circuits. Any protocol of the Turing computation of a function can be treated as such a protocol of an appropriate Boolean circuit, and in this case we have only one register (the initial part of the tape) whose states are consecutively changed by the head/processor. We will still use the term “gate” in this context. A computable function f with infinite domain is the limit of a sequence of functions fi between finite sets whose graphs extend each other. A Turing program for f furnishes a computable sequence of Boolean circuits, which compute all fi in turn. Such a sequence is sometimes called uniform. 1.5. Size, complexity, and polynomial time computability. The quantitative theory of computational models deals simultaneously with the space and time dimensions of protocols. The preceding subsection focused on time, here we introduce space. For Boolean (and Turing machine) protocols this is easy: the length of each row of the protocol is the space required at that moment (plus several more bits for specifying the next gate). The maximum of these lengths is the total space required. The case of normal models and infinite constructive worlds is more interesting. Generally we will call a size function U → N : u → |u| any function such that for every B ∈ N, there are only finitely many objects with |u| ≤ B. Thus the number of bits |n| = [log2 n] + 1 and the identical function knk = n are both size functions. Using a numbering, we can transfer them to any constructive world. In these two examples, the number of constructive objects of size ≤ H grows as exp cH, resp. cH. Such a count in more general cases allows one to make a distinction between the bit size, measuring the length of a description of the object, and the volume of the object. In most cases we require computability of size functions. However, there are exceptions: for example, Kolmogorov complexity is a non–computable size function with very important properties: see below and sec. 5. Given a size function (on all relevant worlds) and a normal model of computations S, we can consider the following complexity problems.

862-09 (A) For a given morphism (computable map) f : U → V , estimate the smallest size KS (f ) of the program p such that f = fp. Kolmogorov, Solomonoff and Chaitin proved that there exists an optimal universal model of computations U such that, with P = N and the bit size function, for any other model S there exists a constant c such that for any f KU (f ) ≤ KS (f ) + c. When U is chosen, KU (f ) is called Kolmogorov’s complexity of f. With a different choice of U we will get the same complexity function up to O(1)–summand. This complexity measure is highly non–trivial (and especially interesting) for an one–element world U and infinite V. It measures then the size of the most compressed description of a variable constructive object in V. This complexity is quite “objective” being almost independent of any arbitrary choices. Being uncomputable, it cannot be directly used in computer science. However, it furnishes some basic restrictions on various complexity measures, somewhat similar to those provided by the conservation laws in physics. On N we have KU (n) ≤ |n| + O(1) = log2 knk + O(1). The first inequality “generically” can be replaced by equality, but infinitely often KU (n) becomes much smaller that |n|. (B) For a given morphism (recursive map) f : U → V , estimate the time needed to calculate f (u), u ∈ D(f ) using the program p and compare the results for different p and different models of computations. (C) The same for the function “maximal size of intermediate configurations in the protocol of the computation of f (u) using the program p” (space, or memory). In the last two problems, we have to compare functions rather than numbers: time and space depend on the size of input. Here a cruder polynomial scale appears naturally. Let us show how this happens. Fix a computational model S with the transition function s computing functions U → U , and choose a bit size function on U satisfying the following crucial assumption: (•) |u| − c ≤ |sp(u)| ≤ |u| + c where the constant c may depend on p but not on u. In this case we have |sm p (u)| ≤ |u| + cpm: the required space grows no more than linearly with time. Let now (S ′ , s′) be another model such that sp = s′q for some q. For example, such q always exists if S ′ is universal. Assume that s′ satisfies (•) as well, and additionally (••) s can be computed in the model S ′ in time bounded by a polynomial F in the size of input. This requirement is certainly satisfied for Turing and Markov models, and is generally reasonable, because an elementary step of an algorithm deserves its name only if it is computationally tractable. Then we can replace one application of sp to sm p (u) by ≤ F (|u|+cm) applications ′ of sq . And if we needed T (u) steps in order to calculate fp(u) using S, we will need

862-10 T (u)

no more than ≤

X

F (|u| + cm) steps to calculate the same function using S ′ and q.

m=1

In a detailed model, there might be a small additional cost of merging two protocols. This is an example of the translation morphism (4) lifted to the worlds of protocols. Thus, from (•) and (••) it follows that functions computable in polynomial time by S have the same property for all reasonable models. Notice also that for such functions, |f (u)| ≤ G(|u|) for some polynomial G and that the domain D(f ) of such a function is decidable: if after T (|u|) sp–steps we are not in a final state, then u ∈ / D(f ). Thus we can define the class P F of functions, say, Nk → N computable in polynomial time by using a fixed universal Turing machine and arguing as above that this definition is model–independent. If we want to extend it to a constructive universe C however, we will have to postulate additionally that any constructive world U comes together with a natural class of numberings which, together with their inverses, are computable in polynomial time. This seems to be a part of the content of the “polynomial Church thesis” invoked by M. Freedman in [Fr1]. If we take this strengthening of the Church thesis for granted, then we can define also the bit size of an arbitrary constructive object as the bit size of its number with respect to one of these numberings. The quotient of two such size functions is bounded from above and from zero. Below we will be considering only the universes C and worlds U with these properties, and |u| will always denote one of the bit size norms. G¨ odel’s numbering (2) for N × N shows that such C is still closed with respect to finite products. (Notice however that the beautiful numbering (3) of N∗ using primes is not polynomial time computable; it may be replaced by another one which is in P F ). 1.6. P/N P problem. By definition, a subset E ⊂ U belongs to the class P iff its characteristic function χE (equal to 1 on E and 0 outside) belongs to the class P F. Furthermore, E ∈ U belongs to the class N P iff there exists a subset E ′ ⊂ U × V belonging to P and a polynomial G such that u ∈ E ⇐⇒ ∃ (u, v) ∈ E ′ with |v| ≤ G(|u|). Here V is another world (which may coincide with U ). We will say that E is obtained from E ′ by a polynomially truncated projection. The discussion above establishes in what sense this definition is model independent. Clearly, P ⊂ N P. The inverse inclusion is highly problematic. A naive algorithm calculating χE from χE′ by searching for v with |v| ≤ G(|u|) and χE′ (u, v) = 1 will take exponential time e.g. when there is no such v (because |u| is a bit size function). Of course, if one can treat all such v in parallell, the required time will be polynomial. Or else, if an oracle tells you that u ∈ E and supplies an appropriate v, you can convince yourself that this is indeed so in polynomial time, by computing χE′ (u, v) = 1. Notice that the enumerable sets can be alternatively described as projections of decidable ones, and that in this context projection does create undecidable sets. Nobody was able to translate the diagonalization argument used to establish this to

862-11 the P/N P domain. M. Freedman ([Fr2]) suggested an exciting new approach to the problem P 6= N P (?), based upon a modification of Gromov’s strategy for describing groups of polynomial growth. It has long been known that this problem can be reduced to checking whether some very particular sets – N P –complete ones – belong to P. The set E ⊂ U is called N P –complete if, for any other set D ⊂ V, D ∈ N P, there exists a function f : V → U, f ∈ P F, such that D = f −1 (E), that is, χD(v) = χE (f (v)). We will sketch the classical argument (due to S. Cooke, L. Levin, R. Karp) showing the existence of N P –complete sets. In fact, the reasoning is constructive: it furnishes a polynomially computable map producing f from the descriptions of χ E′ and of the truncating polynomial G. In order to describe one NP–complete problem, we will define an infinite family of Boolean polynomials bu indexed by the following data, constituting objects u of the constructive world U . One u is a collection (10)

m ∈ N; (S1 , T1 ), . . . , (SN , TN ),

where Si, Ti ⊂ {1, . . . , m}, and bu is defined as (11)

N Y Y Y bu(x1 , . . . , xm) = 1+ (1 + xk ) xj . i=1

k∈Si

j∈Ti

The size of (10) is by definition |u| = mN. Put E = {u ∈ U | ∃v ∈ Fm 2 , bu(v) = 1}. Using the language of Boolean truth values, one says that v satisfies bu if bu(v) = 1, and E is called the satisfiability problem, or SAT. 1.6.1. Claim. E ∈ N P. In fact, let (12)

E ′ = {(u, v) | bu(v) = 1} ⊂ U ×

⊕ F2 .

∞

i=1

Clearly, E is the full projection of E ′. A contemplation will convince the reader that E ′ ∈ P. In fact, we can calculate bu(v) performing O(N m) Boolean multiplications and additions. The projection to E can be replaced by a polynomially truncated projection, because we have to check only v of size |v| ≤ m. 1.6.2. Claim. E is N P –complete. In fact, let D ∈ N P , D ⊂ A where A is some universe. Take a representation of D as a polynomially truncated projection of some set D ′ ⊂ A × B, D′ ∈ P. Choose a normal, say Turing, model of computation and consider the Turing protocols of computation of χD′ (a, b) with fixed a and variable polynomially bounded b. As we have explained above, for a given a, any such protocol can be imagined as a table of a fixed polynomially bounded size whose rows are the consecutive states of the

862-12 computation. In the “microscopic” description, the positions in this table can be filled only by 0 or 1. In addition, each row is supplied by the specification of the position and the inner state of the head/processor. Some of the arrangements are valid protocols, others are not, but the local nature of the Turing computation allows one to produce a Boolean polynomial bu in appropriate variables such that the valid protocols are recognized by the fact that this polynomial takes value 1. For detailed explanations see e.g. [GaJ], sec. 2.6. This defines the function f reducing D to E. The construction is so direct that the polynomial time computability of f is straightforward. Many natural problems are known to be N P –complete, in particular 3–SAT. It is defined as the subset of SAT consisting of those u for which card (Si ∪ Ti) = 3 for all i. 1.6.3. Remark. Most of Boolean functions are not computable in polynomial time. Several versions of this statement can be proved by simple counting. First of all, fix a finite basis B of Boolean operations as in 1.4.1, each acting upon ≤ a bits. Then sequences of these operations of length t generate O((bna)t) Boolean n functions Fn 2 → F2 where b = card B. On the other hand, the number of all functions n2n 2 grows as a double exponential of n and for large n cannot be obtained in time t polynomially bounded in n. The same conclusion holds if we consider not all functions but only permutations: Stirling’s formula for card S2n = 2n! involves a double exponential. Here is one more variation of this problem: define the time complexity of a conjugacy class in S2n as the minimal number of steps needed to calculate some permutation in this class. This notion arises if we are interested in calculating automorphisms of a finite universe of cardinality 2n, which is not supplied with a specific encoding by binary words. Then it can happen that a judicious choice of encoding will drastically simplify the calculation of a given function. However, for most functions we still will not be able to achieve polynomial type computability, because the asymptotical formula for the number of conjugacy classes (partitions) q 1 exp (π 23 (2n − 24 )) n √ p(2 ) ∼ 1 4 3(2n − 24 ) again displays the double exponential growth.

2. QUANTUM PARALLELISM

In this section we will discuss the basics: how to use the superposition principle in order to accelerate (certain) classical computations. 2.1. Description of the problem. Let N be a large number, F : {0, . . . , N − 1} → {0, . . . , N − 1} a function such that the computation of each particular value F (x) is tractable, that is, can be done in time polynomial in log x. We want to compute (to recognize) some property of the graph (x, F (x)), for example : (i) Find the least period r of F , i.e., the least residue r mod N such that F (x + r mod N ) = F (x) for all x (the key step in the Factorization Problem).

862-13 (ii) Find some x such that F (x) = 1 or establish that such x does not exist (Search Problem). As we already mentioned, the direct attack on such a problem consists in compiling the complete list of pairs (x, F (x)) and then applying to it an algorithm recognizing the property in question. Such a strategy requires at least exponential time (as a function of the bit size of N ) since already the length of the list is N. Barring a theoretical breakthrough in understanding such problems (for example a proof that P = N P ), a practical response might be in exploiting the possibility of parallel computing, i.e., calculating simultaneously many – or even all – values of F (x). This takes less time but uses (dis)proportionally more hardware. A remarkable suggestion due to D. Deutsch (see [DeuJ], [Deu]) consists in using a quantum superposition of the classical states |xi as the replacement of the union of N classical registers, each in one of the initial states |xi. To be more precise, here is a mathematical model formulated as the definition. 2.2. Quantum parallel processing: version I. Keeping the notation above, assume moreover that N = 2n and that F is a bijective map (the set of all outputs is a permutation of the set of all inputs). (i) The quantum space of inputs/outputs is the 2n–dimensional complex Hilbert space Hn with the orthonormal basis |xi, 0 ≤ x ≤ N − 1. Vectors |xi are called classical states. (ii) The quantum version of F is the unique unitary operator UF : Hn → Hn such that UF |xi = |F (x)i. Quantum parallel computing of F is (a physical realization of ) a system with the state space Hn and the evolution operator UF . Naively speaking, if we apply UF to the initial state which is a superposition of all classical states with, say, equal amplitudes, we will get simultaneously all classical values of F (i.e., their superposition): 1 X 1 X (14) UF √ |xi = √ |F (x)i. N N We will now discuss various issues related to this definition, before passing to its more realistic modification. (A) We put N = 2n above because we are imagining the respective classical system as an n–bit register: cf. the discussion of BooleanX circuits. Every number 0 ≤ x ≤ N − 1 is written in the binary notation x = ǫi2i and is identified i

with the pure (classical) state |ǫn−1, . . . , ǫ0 i where ǫi = 0 or 1 is the state of the i–th register. The quantum system H1 is called qubit. We have Hn = H1⊗n, |ǫn−1, . . . , ǫ0 i = |ǫn−1i ⊗ . . . ⊗ |ǫ0 i. This conforms to the general principles of quantum mechanics. The Hilbert space of the union of systems can be identified with the tensor product of the Hilbert spaces of the subsystems. Accordingly, decomposable vectors correspond to the states of the compound for which one can say that the individual subsystems are in definite states.

862-14 (B) Pure quantum states, strictly speaking, are points of the projective space P (Hn) that is, complex lines in Hn. Traditionally, one considers instead vectors of norm one. This leaves undetermined an overall phase factor exp iϕ. If we have two state vectors, individual phase factors have no objective meaning, but their quotient, that is the difference of their phases, does have one. This difference can be measured by observing effects of interference. This possibility is used for implementing efficient quantum algorithms. (C) If a quantum system S is isolated, its dynamical evolution is described by the unitary operator U (t) = exp iHt where H is the Hamiltonian, t is time. Therefore one option for implementing UF physically is to design a device for which UF would be a fixed time evolution operator. However, this seemingly contradicts many deeply rooted notions of the algorithm theory. For example, calculating F (x) for different inputs x takes different times, and it would be highly artificial to try to equalize them already in the design. Instead, one can try to implement UF as the result of a sequence of brief interactions, carefully controlled by a classical computer, of S with environment (say, laser pulses). Mathematically speaking, UF is represented as a product of some standard unitary operators Um . . . U1 each of which acts only on a small subset (two, three) of classical bits. These operators are called quantum gates. The complexity of the respective quantum computation is determined by its length (the number m of the gates) and by the complexity of each of them. The latter point is a subtle one: continuous parameters, e.g. phase shifts, on which Ui may depend, makes the information content of each Ui potentially infinite and leads to a suspicion that a quantum computer will in fact perform an analog computation, only implemented in a fancy way. A very interesting discussion in [Ts], Lecture 9, convincingly refutes this viewpoint, by displaying those features of quantum computation which distinguish it from both analog and digital classical information processing. This discussion is based on the technique of fault tolerant computing using quantum codes for producing continuous variables highly protected from external noise. (D) From the classical viewpoint, the requirement that F must be a permutation looks highly restrictive (for instance, in the search problem F takes only two values). Physically, the reason for this requirement is that only such F extend to unitary operators (“quantum reversibility”). The standard way out consists of introducing two n–bit registers instead of one, for keeping the value of the argument as well as that of the function. More precisely, if F (|xi) is an arbitrary function, we can replace it by the permutation Fe (|x, yi) := |x, F (x) ⊕ yi, where ⊕ is the Boolean (bitwise) sum. This involves no more than a polynomial increase of the classical complexity, and the restriction of Fe to y = 0 produces the graph of F which we need anyway for the type of problems we are interested in. In fact, in order to process a classical algorithm (sequence of Boolean gates) for computing F into the quantum one, we replace each classical gate by the respective reversible quantum gate, i.e., by the unitary operator corresponding to it tensored by the identical operator. Besides two registers for keeping |xi and F (|xi) this trick introduces as well extra qubits in which we are not particularly interested. The corre-

862-15 sponding space and its content are sometimes referred to as “scratchpad”, “garbage”, etc. Besides ensuring reversibility, additional space and garbage can be introduced as well for considering functions F : {0, . . . , N − 1} → {0, . . . , M − 1} where N, M are not powers of two (then we extend them to the closest power of two). For more details, see the next section. Notice that the choice of gate array (Boolean circuit) as the classical model of computation is essential in the following sense: a quantum routine cannot use conditional instructions. Indeed, to implement such an instruction we must observe the memory in the midst of calculation, but the observation generally will change its current quantum state. In the same vein, we must avoid copying instructions, because the classical copying operator |xi → |xi ⊗ |xi is not linear. In particular, each output qubit from a quantum gate can be used only in one gate at the next step (if several gates are used parallelly): cloning is not allowed. These examples show that the basics of quantum code writing will have a very distinct flavor. We now pass to the problems posed by the input/output routines. Input, or initialization, in principle can be implemented in the same way as a computation: we produce an input state starting e.g. from the classical state |0i and applying a sequence of basic unitary operators: see the next section. Output, however, involves an additional quantum mechanical notion: that of observation. (E) The simplest model of observation of a quantum system with the Hilbert space H involves the choice of an orthonormal basis of H. Only elements of this basis |χii can appear as the results of observation. If our system is in some state |ψi at the moment of observation, it will be observed in the state |χii with probability |hχi| ψi|2. This means first of all that every quantum computation is inherently probabilistic. Observing (a part of) the quantum memory is not exactly the same as “printing the output”. We must plan a series of runs of the same quantum program and the subsequent classical processing of the observed results, and we can hope only to get the desired answer with probability close to one. Furthermore, this means that by implementing quantum parallelism simplemindedly as in (14), and then observing the memory as if it were the classical n–bit register, we will simply get some value F (x) with probability 1/N . This does not use the potential of the quantum parallelism. Therefore we formulate a corrected version of this notion, leaving more flexibility and stressing the additional tasks of the designer, each of which eventually contributes to the complexity estimate. 2.3. Quantum parallel processing: version II. To solve efficiently a problem involving properties of the graph of a function F , we must design: (i) An auxiliary unitary operator U carrying the relevant information about the graph of F. (ii) A computationally feasible realization of U with the help of standard quantum gates.

862-16 (iii) A computationally feasible realization of the input subroutine. (iv) A computationally feasible classical algorithm processing the results of many runs of quantum computation. All of this must be supplemented by quantum error–correcting encoding, which we will not address here. In the next section we will discuss some standard quantum subroutines.

3. SELECTED QUANTUM SUBROUTINES

3.1. Initialization. Using the same conventions as in (14) and the subsequent comments, in particular, the identification Hn = H1⊗n, we have ⊗n N−1 1 X 1 X 1 √ . |xi = √ |ǫn−1 . . . ǫ0 i = √ (|0i + |1i) 2 N x=0 N ǫi =0,1

(15)

In other words, N−1 1 X (n−1) (0) √ |xi = U1 . . . U1 |0 . . . 0i N x=0

(16)

where U1 : H1 → H1 is the unitary operator 1 1 |0i 7→ √ (|0i + |1i), |1i 7→ √ (|0i − |1i) , 2 2 (i)

and U1 = id ⊗ . . . ⊗ U1 ⊗ . . . ⊗ id acts only on the i–th qubit. Thus making the quantum gate U1 act on each memory bit, one can in n steps initialize our register in the state which is the superposition of all 2n classical states with equal weights. 3.2. Quantum computations of classical functions. Let B be a finite basis of classical gates containing one–bit identity and generating all Boolean circuits, and n F : Fm 2 → F2 a function. We will describe how to turn a Boolean circuit of length L calculating F into another Boolean circuit of comparable length consisting only of reversible gates, and calculating a modified function, which however contains all information about the graph of F. Reversibility means that each step is a bijection (actually, an involution) and hence can be extended to a unitary operator, that is, a quantum gate. For a gate f, define fe(|x, yi) = |x, f (x) + yi as in 2.2(D) above.

3.2.1. Claim. A Boolean circuit S of length L in the basis B can be processed into the reversible Boolean circuit Se of length O((L + m + n)2 ) calculating a permutation H : Fm+n+L → Fm+n+L with the following property: 2 2 H(x, y, 0) = (x, F (x) + y, 0) = (Fe (x, y), 0).

862-17 Here x, y, z have sizes m, n, L respectively. Proof. We will understand L here as the sum of sizes of the outputs of all gates involved in the description of S. We first replace in S each gate f by its reversible counterpart fe. This involves inserting extra bits which we put side by side into a new register of total length L. The resulting subcircuit will calculate a permutation K : Fm+L → Fm+L such that K(x, 0) = (F (x), G(x)) for some function G (garbage). 2 2 Now add to the memory one more register of size n keeping the variable y. Extend K to the permutation K : F2m+L+n → Fm+L+n keeping y intact: K : (x, 0, y) 7→ 2 (F (x), G(x), y). Clearly, K is calculated by the same Boolean circuit as K, but with extended register. Extend this circuit by the one adding the contents of the first and the third register: (F (x), G(x), y) 7→ (F (x), G(x), F (x) + y). Finally, build the last extension ¯ −1 and consists of reversed gates calculating K in reverse order. which calculates K This clears the middle register (scratchpad) and produces (x, 0, F (x) + y). The whole circuit requires O(L+m+n) gates if we allow the application of them to not necessarily neighboring bits. Otherwise we must insert gates for local permutations which will replace this estimate by O((L + m + n)2 ). 3.3. Fast Fourier transform. Finding the least period of a function of one real variable can be done by calculating its Fourier transforms and looking at its maxima. The same strategy is applied by Shor in his solution of the factorization problem. We will show now that the discrete Fourier transform Φn is computationally easy (quantum polynomial time). We define Φn : Hn → Hn by (17)

N−1 1 X Φn(|xi) = √ |ci exp (2πicx/N ) N c=0

In fact, it is slightly easier to implement directly the operator (18)

Φtn(|xi)

N−1 1 X t =√ |c i exp (2πicx/N ) . N c=0

where ct is c read from the right to the left. The effects of the bit reversal can be then compensated at a later stage without difficulty. (kj) Let U2 : Hn → Hn, k < j, be the quantum gate which acts on the pair of the k–th and j–th qubits in the following way: it multiplies |11i by exp (iπ/2j−k) and leaves the remaining classical states |00i, |01i, |10i intact. 3.3.1. Lemma We have (19)

Φtn

=

n−1 Y

(k) U1

k=0

n−1 Y

j=k+1

(kj) U2

.

By our rules of the game, (19) has polynomial length in the sense that it involves (kj) only O(n2 ) gates. However, implementation of U2 requires controlling variable

862-18 phase factors which tend to 1 as k − j grows. Moreover, arbitrary pairs of qubits must allow quantum mechanical coupling so that for large n the interaction between qubits must be non–local. The contribution of these complications to the notion of complexity cannot be estimated without going into the details of physical arrangement. Therefore I will add a few words to this effect. The implementation of quantum register suggested in [CZ] consists of a collection of ions (charged atoms) in a linear harmonic trap (optical cavity). Two of the electronic states of each ion are denoted |0i and |1i and represent a qubit. Laser pulses transmitted to the cavity through the optical fibers and controlled by the classical computer are used to implement gates and read out. The Coulomb repulsion keeps ions apart (spatial selectivity) which allows the preparation of each ion separately in any superposition of |0i and |1i by timing the laser pulse properly and preparing its phase carefully. The same Coulomb repulsion allows for collective excitations of the whole cluster whose quanta are called phonons. Such excitations are produced by laser pulses as well under appropriate resonance conditions. The resulting resonance selectivity combined with the spatial selectivity implements a controlled entanglement of the ions that can be used in order to simulate two and three bit gates. For a detailed and lucid mathematical explanation, see [Ts], Lecture 8. Another recent suggestion ([GeC]) is to use a single molecule as a quantum register, representing qubits by nuclear spins of individual atoms, and using interactions through chemical bonds in order to perform multiple bit logic. The classical technique of nuclear magnetic resonance developed since the 1940’s, which allows one to work with many molecules simultaneously, provides the start up technology for this project. 3.4. Quantum search. All the subroutines described up to now boiled down to some identities in the unitary groups involving products of not too many operators acting on subspaces of small dimension. They did not involve output subroutines and therefore did not “compute” anything in the traditional sense of the word. We will now describe the beautiful quantum search algorithm due to L. Grover which produces a new identity of this type, but also demonstrates the effect of observation and the way one can use quantum entanglement in order to exploit the potential of quantum parallelism. We will treat only the simplest version. Let F : Fn 2 → {0, 1} be a function taking the value 1 at exactly one point x0 . We want to compute x0 . We assume that F is computable in polynomial time, or else that its values are given by an oracle. Classical search for x0 requires on the average about N/2 evaluations of F where N = 2n. In the quantum version, we will assume that we have a quantum Boolean circuit (or quantum oracle) calculating the unitary operator Hn → Hn IF : |xi 7→ eπiF (x) |xi. In other words, IF is the reflection inverting the sign of |x0 i and leaving the remaining classical states intact. Moreover, we put J = −Iδ , where δ : Fn 2 → {0, 1} takes the value 1 only at 0, (n−1) (0) and V = U1 . . . U1 , as in (16).

862-19 3.4.1. Claim. (i) The real plane in Hn spanned by the uniform superposition ξ of all classical states (15) and by |x0 i is invariant with respect to T := V JV IF . (ii) T restricted to this plane is the rotation (from ξ to |x0 i) by the angle ϕN where √ 2 N −1 cos ϕN = 1 − , sin ϕN = 2 . N N The check is straightforward. 2 Now, ϕN is close to √ , and for the initial angle ϕ between ξ and |x0 i we have N 1 cos ϕ = − √ . N √ π N Hence in [ϕ/ϕN ] ≈ applications of T to ξ we will get the state very close to 4 |x0 i. Stopping the iteration of T after as many steps and measuring the outcome in the basis of classical states, we will obtain |x0 i with probability very close to one. One application of T replaces in the quantum search one evaluation of F. Thus, thanks to quantum parallelism, we achieve a polynomial speed–up in comparison with the classical search. The case when F takes value 1 at several points and we only want to find one of them, can be treated by an p extension of this method. If there are n such points, the algorithm requires about N/n steps, and n needs not be known a priori: see [BoyBHT]. 4. SHOR’S FACTORING ALGORITHM

4.1. Notation. Let M be a number to be factored. We will assume that it is odd and is not a power of a prime number. Denote by N the size of the basic memory register we will be using (not counting scratchpad). Its bit size n will be about twice that of M . More precisely, choose M 2 < N = 2n < 2M 2 . Finally, let 1 < t < M be a random parameter with gcd (t, M ) = 1. This condition can be checked classically in time polynomial in n. Below we will describe one run of Shor’s algorithm, in which t (and of course, M , N ) is fixed. Generally, polynomially many runs will be required, in which the value of t can remain the same or be chosen anew. This is needed in order to gather statistics. Shor’s algorithm is a probabilistic one, with two sources of randomness that must be clearly distinguished. One is built into the classical probabilistic reduction of factoring to the finding of the period of a function. Another stems from the necessity of observing quantum memory, which, too, produces random results. More precise estimates than those given here show that a quantum computer which can store about 3n qubits can find a factor of M in time of order n3 with probability close to 1 : see [BCDP]. On the other hand, it is widely believed that no recursive function of the type M 7→ a proper factor of M belongs to P F. This is why the most popular public key encryption schemes rely upon the difficulty of the factoring problem.

862-20 4.2. Classical algorithm. Put r := min {ρ | tρ ≡ 1 mod M } which is the least period of F : a 7→ ta mod M. 4.2.1. Claim. If one can efficiently calculate r as a function of t, one can find a proper divisor of M in polynomial in log2 M time with probability ≥ 1 − M −m for any fixed m. Assume that for a given t the period r satisfies r ≡ 0 mod 2, tr/2 6= −1 mod M. Then gcd (tr/2 + 1, M ) is a proper divisor of M. Notice that gcd is computable in polynomial time. 1 The probability that this condition holds is ≥ 1 − k−1 where k is the number 2 1 of different odd prime divisors of M , hence ≥ in our case. Therefore we will find 2 a good t with probability ≥ 1 − M −m in O(log M ) tries. The longest calculation in one try is that of tr/2. The usual squaring method takes polynomial time as well. 4.3. Quantum algorithm calculating r. Here we describe one run of the quantum algorithm which purports to compute r, given M, N, t. We will use the working register that can keep a pair consisting of a variable 0 ≤ a ≤ N − 1 and the respective value of the function ta mod M. One more register will serve as the scratchpad needed to compute |a, ta mod M i reversibly. When this calculation is completed, the content of the scratchpad will be reversibly erased: cf. 3.2.1. In the remaining part of the computation the scratchpad will not be used anymore, we can decouple it, and forget about it. The quantum computation consists of four steps, three of which were described in sec. 3: (i) Partial initialization produces from |0, 0i the superposition N−1 1 X √ |a, 0i. N a=0

(ii) Reversible calculation of F processes this state into N−1 1 X √ |a, ta mod M i. N a=0

(iii) Partial Fourier transform then furnishes N−1 N−1 1 X X exp (2πiac/N ) |c, ta mod M i. N a=0 c=0

862-21 (iv) The last step is the observation of this state with respect to the system of classical states |c, m mod M i. This step produces some concrete output |c, tk mod M i

(20) with probability 1 N

(21)

X

a: ta ≡tk mod M

2 exp (2πiac/N ) .

The remaining part of the run is assigned to the classical computer and consists of the following steps. c with denominator (A) Find the best approximation (in lowest terms) to N √ r′ < M < N : ′ c d − < 1 . (22) N r ′ 2N

As we will see below, we may hope that r ′ will coincide with r in at least one run among at most polynomially many. Hence we try r ′ in the role of r right away: ′ (B) If r ′ ≡ 0 mod 2, calculate gcd (tr /2 ± 1, M ). If r ′ is odd, or if r ′ is even, but we did not get a proper divisor of M , repeat the run O(log log M ) times with the same t. In case of failure, change t and start a new run. 4.3.1. Justification. We will now show that, given t, from the observed values of |c, tk mod M i in O(log log M ) runs we can find the correct value of r with probability close to 1. Let us call the observed value of c good, if h r ri ∃l ∈ − , , rc ≡ l mod N. 2 2 In this case there exists such d that −

so that

r r ≤ rc − dN = l ≤ 2 2 c − d < 1 . N r 2N

Hence if c is good, then r ′ found from (22) in fact divides r. Now call c very good if r ′ = r. Estimating the exponential sum (21), we can easily check that the probability of 1 observing a good c is ≥ 2 . On the other hand, there are rϕ(r) states |c, tk mod M i 3r

862-22 with very good c. Thus to find a very good c with high probability, O(r 2 log r) runs will suffice.

5. KOLMOGOROV COMPLEXITY AND GROWTH OF RECURSIVE FUNCTIONS

Consider general functions f : N → N. Computability theory uses several growth scales for such functions, of which two are most useful: f may be majorized by some recursive function (e.g. when it is itself recursive), or by a polynomial (e.g. when it is computable in polynomial time). Linear growth does not seem particularly relevant in this context. However, this impression is quite misleading, at least if one allows re–ordering N. In fact, we have: 5.1. Claim. There exists a permutation K : N → N such that for any partially recursive function f : N → N there exists a constant c with the property (23)

K ◦ f ◦ K−1 (n) ≤ c n for all n ∈ K(D(f )).

Moreover, K is bounded by a linear function, but K−1 is not bounded by any recursive function. Proof. We will use the Kolmogorov complexity measure. For a recursive function u : N → N, x ∈ N, put Cu(x) := min {k | f(k) = x}, or ∞ if such k does not exist. Call such a function u optimal if, for any other recursive function v, there exists a constant cu,v such that Cu(x) ≤ cu,vCv (x) for all x. Optimal functions do exist (see e.g. [Ma1], Theorem VI.9.2); in particular, they take all positive integer values (however they certainly are not everywhere defined). Fix one such u and call Cu(x) the (exponential) complexity of x. By definition, K = Ku rearranges N in the order of increasing complexity. In other words, (24)

K(x) := 1 + card {y | Cu(y) < Cu (x)}.

We first show that (25)

K(x) = exp (O(1)) Cu(x).

Since Cu takes each value at most once, it follows from (24) that K(n) ≤ Cu(n). In order to show that Cu(x) ≤ c K(x) for some c it suffices to check that card {k ≤ N | ∃ x, Cu(x) = k} ≥ b N with some b > 0. In fact, at least half of the numbers x ≤ N have the complexity which is no less than x/2. Now, VI.9.7(b) in [Ma1] implies that, for any recursive function f and all x ∈ D(f ), we have Cu(f (x)) ≤ const Cu(x). Since Cu(x) and K(x) have the same order of growth up to a bounded factor, our claim follows. rec 5.2. Corollary. Denote by S∞ the group of recursive permutations of N. Then rec −1 K S∞ K is a subgroup of permutations of no more than linear growth.

862-23 Actually, appealing to the Proposition VI.9.6 of [Ma1], one can considerably strengthen this result. For example, let σ be a recursive permutation, σ K = KσK−1. Then σ K (x) ≤ cx so that (σ K )n(x) ≤ cnx for n > 0. But actually the last inequality can be replaced by (σ K )n(x) ≤ c′n for a fixed x and variable n. With both x and n variable one gets the estimate O(xn log (xn)). In the same way as finite permutations appear in the quantum versions of Boolean circuits, infinite (computable) permutations are natural for treating quantum Turing machines ([Deu]) and our normal computation models. In fact, if one assumes that the transition function s is a permutation, and then extends it to the unitary operator Us in the infinite–dimensional Hilbert space, one might be interested in studying the spectral properties of such operators. But the latter depend only on the conjugacy class. Perhaps the universal conjugation UK might be a useful theoretical tool in this context. In the purely classical situation, (23) may play a role in studying the limiting behavior of polynomial time algorithms, as suggested in [Fr1] and [Fr2]. Finally, I would like to comment upon the hidden role of Kolmogorov complexity in the real life of classical computing. The point is that in a sense (which is difficult to formalize), we are interested only in the calculation of sufficiently nice functions, because a random Boolean function will have (super)exponential complexity anyway. A nice function, at the very least, has a short description and, therefore, a small Kolmogorov complexity. Thus, dealing with practical problems, we actually work not with small numbers, graphs, circuits, . . . , but rather with an initial segment of the respective constructive world reordered with the help of K. We systematically replace a large object by its short description, and then try to overcome the computational difficulties generated by this replacement.

APPENDIX The following text is a contribution to the prehistory of quantum computing. It is the translation from Russian of the last three paragraphs of the Introduction to [Ma2] (1980). For this reference I am grateful to A. Kitaev [Ki]. “Perhaps, for better understanding of this phenomenon [DNA replication], we need a mathematical theory of quantum automata. Such a theory would provide us with mathematical models of deterministic processes with quite unusual properties. One reason for this is that the quantum state space has far greater capacity than the classical one: for a classical system with N states, its quantum version allowing superposition accommodates cN states. When we join two classical systems, their number of states N1 and N2 are multiplied, and in the quantum case we get exponential growth cN N . These crude estimates show that the quantum behavior of the system might be much more complex than its classical simulation. In particular, since there is no

862-24 unique decomposition of a quantum system into its constituent parts, a state of the quantum automaton can be considered in many ways as a state of various virtual classical automata. Cf. the following instructive comment at the end of the article [Po]: ‘The quantum–mechanical computation of one molecule of methane requires 1042 grid points. Assuming that at each point we have to perform only 10 elementary operations, and that the computation is performed at the extremely low temperature T = 3.10−3K, we would still have to use all the energy produced on Earth during the last century.’ The first difficulty we must overcome is the choice of the correct balance between the mathematical and the physical principles. The quantum automaton has to be an abstract one: its mathematical model must appeal only to the general principles of quantum physics, without prescribing a physical implementation. Then the model of evolution is the unitary rotation in a finite dimensional Hilbert space, and the decomposition of the system into its virtual parts corresponds to the tensor product decomposition of the state space. Somewhere in this picture we must accommodate interaction, which is described by density matrices and probabilities.”

BIBLIOGRAPHY [BCDP] D. Beckman, A. N. Chari, Sr. Devabhaktuni, J. Preskill - Efficient networks for quantum computing. Phys. Rev. A, 54:2 (1996), 1034–1063. [Ben1] P. Benioff - The computer as a physical system: A microscopic quantum mechanical Hamiltonian model of computers as represented by Turing machines, J. Stat. Phys., 22 (1980), 563–591. [Ben2] P. Benioff - Quantum mechanical Hamiltonian models of Turing machines that dissipate no energy, Phys. Rev. Lett., 48 (1980), 1581–1585. [BoL] D. Boneh, R. Lipton - Quantum cryptoanalysis of hidden linear functions, Proc. of Advances in Cryptology — CRYPTO ’95, Springer LN in Computer Science, vol. 963 (1995), 424–437. [BoyBHT] M. Boyer, G. Brassard, P. Høyer, A. Tapp - Tight bounds on quantum searching, Preprint, 1996. [CZ] J. Cirac, P. Zoller - Quantum computation with cold trapped ions, Phys. Rev. Lett., 74:20 (1995), 4091–4094. [Deu] D. Deutsch - Quantum theory, the Church–Turing principle and the universal quantum computer, Proc. R. Soc. Lond. A 400 (1985), 97–117. [DeuJ] D. Deutsch, R. Jozsa - Rapid solutions of problems by quantum computation, Proc. Roy. Soc. London, Ser. A, 449 (1992), 553–558. [Fe1] R. Feynman - Simulating physics with computers, Int. J. of Theor. Phys., 21 (1982), 467–488. [Fe2] R. Feynman. Quantum mechanical computers, Found. Phys., 16 (1986), 507–531. [Fr1] M. Freedman - Topological views on computational complexity, In Proc. ICM Berlin 1998, vol. II, 453–464. [Fr2] M. Freedman - Limit, logic, and computation, Proc. Nat. Ac. Sci. USA, 95 (1998), 95–97.

862-25 [Fr3] M. Freedman - P/NP, and the quantum field computer, Proc. Nat. Ac. Sci. USA, 95 (1998), 98–101. [GaJ] M. Garey, D. Johnson - Computers and Intractability: A Guide to the Theory of NP–Completeness, W. H. Freeman and Co., San–Francisco, 1979. [GeC] N. Gershenfield, I. Chuang - Bulk spin–resonance quantum computation, Science 275 (1997), 350–355. [Gri] D. Grigoriev - Testing the shift–equivalence of polynomials using quantum mechanics, In: Manin’s Festschrift, Journ. of Math. Sci., 82:1 (1996), 3184–3193. [Gro] L. K. Grover - Quantum mechanics helps in searching for a needle in a haystack, Phys. Rev. Lett. 79 (1997), 325–328. [Ki1] A. Kitaev - Quantum computations: algorithms and error correction, Russian Math. Surveys, 52:6 (1997), 53–112. [Ki2] A. Kitaev - Classical and quantum computations, Lecture notes, Independent University, Moscow, 1998. [Ma1] Yu. Manin - A Course in Mathematical Logic, Springer Verlag, 1977, pp. xiii+286. [Ma2] Yu. Manin - Computable and uncomputable (in Russian), Moscow, Sovetskoye Radio, 1980. [Mu] D. Mumford - The statistical description of visual signals, Preprint. [Po] R. P. Poplavskii - Thermodynamical models of information processing (in Russian), Uspekhi Fizicheskikh Nauk, 115:3 (1975), 465–501. [Sa] A. Salomaa - Computation and Automata, Cambridge UP, 1985. [Sh] P. W. Shor - Polynomial–time algorithms for prime factorization and discrete logarithms on a quantum computer, SIAM J. Comput., 26:5 (1997), 1484–1509. [Si] D. Simon - On the power of quantum computation, Proc. of the 35th Ann. Symp. on Foundations of Comp. Sci. (1994), 116–123. [Ts] B. Tsirelson - Quantum information processing, Lecture notes, Tel–Aviv University, 1997. Yu. I. MANIN Max–Planck–Institut f¨ ur Mathematik Vivatgasse 7 D-53111 BONN (Germany) E-mail : [email protected]

S´ eminaire BOURBAKI 51` eme ann´ ee, 1998-99, no 863

Juin 1999

´ MAXIMALE DENSIT E ` DES EMPILEMENTS DE SPH ERES EN DIMENSION 3 [d’apr`es Thomas C. HALES et Samuel P. FERGUSON] ´ (*) par Joseph OESTERL E

Au nouvel an 1610, Johannes Kepler offre ` a son protecteur et ami Johannes Mattha¨ us Wackher von Wackenfels un opuscule d’une vingtaine de pages ([14]), intitul´ e Strena seu de nive sexangula (l’´ etrenne ou la neige sexangulaire). Il y m´ edite sur l’origine de la forme des flocons de neige en ´ etoile ` a six branches, ce qui l’am` ene ` a s’int´ eresser entre autres ` a la forme des alv´ eoles des abeilles, au dod´ eca` edre rhombo´ edrique, ` a la forme des grains de grenades et ` a l’empilement de sph` eres que nous appelons aujourd’hui cubique ` a faces centr´ ees, et qui est par exemple celui suivant lequel les artilleurs empilent les boulets de canon. Kepler affirme qu’il n’est pas possible de trouver un empilement de sph` eres (toutes de mˆ eme rayon) plus serr´ e, assertion qui est devenue la fameuse conjecture de Kepler. En 1997, T. Hales publie une strat´ egie pour d´ emontrer la conjecture de Kepler, en la ramenant ` a un probl` eme d’optimisation non lin´ eaire en dimension finie. Il m` ene ce programme ` a bien, en collaboration avec son ´ etudiant S. Ferguson, et l’ach` eve en juillet 1998. Tant le choix du probl` eme d’optimisation consid´ er´ e que sa r´ esolution s’appuient sur un usage intensif de l’ordinateur. Mais pr` es de 4 si` ecles apr` es avoir ´ et´ e formul´ ee, la conjecture de Kepler est enfin d´ emontr´ ee :

´or e `me 1 (Hales – Ferguson). — Tout empilement de sph` Th e eres dans l’espace eucliπ dien de dimension 3 a une densit´ e au plus ´ egale ` a la densit´ e √

3 2

de l’empilement

cubique ` a faces centr´ ees. Pr´ ecisons le vocabulaire utilis´ e : Le mot sph` ere signifie ici sph` ere pleine, i.e. est synonyme de boule ferm´ ee. Un empilement de sph` eres est une famille de boules ferm´ ees, toutes de mˆ eme rayon, d’int´ erieurs mutuellement disjoints. Soit B la r´ eunion de ces boules ; la densit´ e de l’empilement est la limite sup´ erieure de vol(B∩Ω)/vol(Ω) , pour Ω un cube dont le cˆ ot´ e tend vers l’infini. On peut donner du th. 1 la formulation ´ equivalente suivante, qui ne fait intervenir que des empilements finis :

´or e `me 1 ′ . — Une famille de boules disjointes, toutes de mˆ Th e eme rayon et contenues dans un parall´ el´ epip` ede Ω de l’espace euclidien de dimension 3 , occupe une fraction (*)

e ses notes personnelles sur le sujet. L’auteur remercie J. C. Lagarias de lui avoir communiqu´

π du volume de Ω au plus ´ egale ` a √ .

3 2

Le fait que le th. 1′ implique le th. 1 r´ esulte de la d´ efinition de la densit´ e d’un empilement de sph` eres ; l’implication r´ eciproque se d´ eduit de ce que l’on peut paver l’espace par des translat´ es d’un parall´ el´ epip` ede. L’empilement cubique ` a faces centr´ ees est ainsi nomm´ e car on l’obtient en pla¸ cant les centres des sph` eres aux sommets et aux centres des faces des mailles d’un r´ eseau cubique (le rayon des sph` eres ´ etant choisi de fa¸con ` a ce qu’elles soient tangentes ` a leurs plus proches voisines). En prenant pour verticale la direction soit d’un cˆ ot´ e, soit d’une diagonale de la maille cubique, on peut voir cet empilement comme une superposition de couches horizontales de sph` eres r´ eparties soit en r´ eseau carr´ e (chaque sph` ere ´ etant tangente ` a 4 autres de la mˆ eme couche), soit en r´ eseau hexagonal (chaque sph` ere ´ etant tangente ` a 6 autres de la mˆ eme couche) ; chaque couche s’ins` ere dans les trous les plus profonds de la pr´ ec´ edente. Remarque 1. — Lorsqu’on superpose des couches de sph` eres r´ eparties comme ci-dessus en r´ eseau hexagonal, chaque couche peut ˆ etre pos´ ee de deux fa¸cons distinctes dans les trous les plus profonds de la pr´ ec´ edente. Cela conduit ` a une infinit´ e (non d´ enombrable) π d’empilements de sph` eres diff´ erents, tous de mˆ eme densit´ e √ que l’empilement 3 2

cubique ` a faces centr´ ees.

1. Quelques mots sur l’histoire de la conjecture de Kepler En 1831, dans son ´ etude des formes quadratiques ternaires, C. F. Gauss ([6]) d´ emontre le cas particulier suivant de la conjecture de Kepler : si les centres des π sph` eres d’un empilement forment un r´ eseau, la densit´ e de l’empilement est ≤ √ , 3 2

avec ´ egalit´ e si et seulement si l’empilement est cubique ` a faces centr´ ees. Ce r´ esultat sera largement g´ en´ eralis´ e en dimension sup´ erieure (cf. [1], [15]). `eme La conjecture de Kepler est reprise et g´ en´ eralis´ ee par Hilbert dans son 18 probl` eme. En 1910, A. Thue ([18]) d´ emontre l’analogue en dimension 2 de la conjecture de Kepler : tout empilement de cercles dans le plan euclidien a une densit´ e au plus ´ egale π ` a la densit´ e √ de l’empilement hexagonal. 2 3

En 1953, L. Fejes T´ oth ([3]) propose un programme pour d´ emontrer la conjecture de Kepler en la ramenant ` a un probl` eme d’optimisation non lin´ eaire en dimension finie. Ce probl` eme, toujours ouvert, semble trop complexe pour ˆ etre r´ esolu avec les moyens de calcul actuels. Mais Fejes T´ oth est le premier ` a deviner l’importance que le d´ eveloppement rapide des ordinateurs aura pour ce type de strat´ egie. En 1958, C. A. Rogers ([16]) d´ emontre que la densit´ e sup´ erieure d’un empilement de sph` eres dans un espace euclidien de dimension n est au plus ´ egale ` a σn , portion du volume d’un simplexe r´ egulier de cˆ ot´ e 2 recouverte par les sph` eres unit´ e centr´ ees en ses sommets. Pour n = 2 , cela fournit une nouvelle d´ emonstration du th´ eor` eme de Thue, car on peut paver le plan euclidien par des triangles ´ equilat´ eraux. L’espace euclidien de dimension 3 ne peut ˆ etre pav´ e par des t´ etra` edres r´ eguliers. La borne de Rogers, σ3 = 0, 7796... , est de ce fait moins bonne que celle pr´ edite π √ el` ebre de Rogers : Many par la conjecture de Kepler, = 0, 7404... . La phrase c´ 3 2

π mathematicians believe, and all physicists know, that the density cannot exceed √ ,

3 2

exprime mieux que toute autre la redoutable subtilit´ e de la conjecture de Kepler, malgr´ e son apparente simplicit´ e. La borne de Rogers pour la densit´ e des empilements de sph` eres en dimension 3 sera am´ elior´ ee par divers auteurs ; avant les travaux de Hales et Ferguson, la meilleure borne connue ´ etait 0,7731 (obtenue par D. J. Muder en 1993). Hales mentionne que les travaux de Muder ont influenc´ e les siens. Dans un article publi´ e en 1993, Wu-yi Hsiang ([13]) affirme d´ emontrer la conjecture de Kepler. Les sp´ ecialistes s’accordent ` a consid´ erer que les preuves de nombreuses assertions n’y sont pas pr´ esent´ ees avec suffisamment de d´ etails pour ˆ etre qualifi´ ees de compl` etes. De ce fait, l’article de Hsiang est au mieux vu comme un plan d’attaque de la conjecture de Kepler. Je partage cette opinion. Les textes ult´ erieurs de Hsiang qui m’ont ´ et´ e communiqu´ es, en particulier le manuscrit d’un livre en pr´ eparation, ne me semblent pas pour l’instant de nature ` a modifier ce point de vue.

2. La conjecture du dod´eca`edre et le probl`eme des 13 sph`eres Consid´ erons un empilement de sph` eres de rayon 1 dans un espace euclidien E . Soit S l’ensemble des centres des sph` eres. La cellule de Voronoi de s , not´ ee V(s) se compose des points de E qui sont plus proches de s que des autres points de S . C’est un ensemble convexe ferm´ e, localement poly´ edrique. Les cellules de Voronoi des points de S pavent l’espace E : autrement dit, elles recouvrent E et leurs int´ erieurs sont mutuellement disjoints. Chacune de ces cellules contient une unique sph` ere de l’empilement ; on en d´ eduit facilement que si leur volume est minor´ e par v , la densit´ e de l’empilement est major´ ee par b/v , o` u b est le volume de la boule unit´ e. Cette observation conduit naturellement au probl` eme suivant : quel est le volume minimal des cellules de Voronoi des empilements de sph` eres de rayon 1 ? En dimension 2 , le probl` eme a ´ et´ e r´ esolu par Fejes T´ oth en 1943 ([2]) √ : l’aire d’une cellule de Voronoi d’un empilement de cercles de rayon 1 est ≥ 2 3 , avec ´ egalit´ e si et seulement si la cellule est un hexagone r´ egulier circonscrit ` a un cercle de rayon 1 . Cet ´ enonc´ e implique le th´ eor` eme de Thue relatif ` a la densit´ e des empilements de cercles. En dimension 3 , le probl` eme a ´ et´ e r´ esolu par Hales et Mc Laughlin en novembre 1998, par des techniques analogues ` a celles utilis´ ees pour prouver la conjecture de Kepler. Ils d´ emontrent ainsi la conjecture du dod´ eca` edre, formul´ ee par Fejes T´ oth en 1943 (et d´ emontr´ ee par lui dans le cas particulier o` u les cellules de Voronoi n’ont que 12 faces au plus) :

´or e `me 2 (Hales – Mc Laughlin). — Le volume d’une cellule de Voronoi d’un Th e empilement de √sph` eres de rayon 1 dans l’espace euclidien de dimension 3 est p

≥ 10 130 − 58 5 , avec ´ egalit´ e si et seulement si la cellule est un dod´ eca` edre r´ egulier circonscrit ` a une sph` ere de rayon 1 . Notons que ce th´ eor` eme implique que la densit´ e d’un empilement de sph` eres en dimension 3 est major´ ee par 0,7547, une borne nettement meilleure que celles obtenues avant que ne soit d´ emontr´ ee la conjecture de Kepler.

Remarque 2. — Pour d´ emontrer le th´ eor` eme 2, on peut supposer que l’empilement consid´ er´ e est satur´ e (i.e. maximal). Dans ce cas, pour tout s ∈ S , la cellule de Voronoi V(s) est contenue dans la boule de centre s et de rayon 2 . Sa forme, et donc son volume, ne d´ ependent que des points de S dont la distance ` a s est ≤ 4 , et le nombre de ces points est major´ e par une constante absolue. La conjecture du dod´ eca` edre est donc un probl` eme d’optimisation non lin´ eaire : il s’agit de trouver le maximum de la fonction volume sur un espace de configurations qui est une partie compacte d’un espace vectoriel de dimension finie. Une des difficult´ es vient du fait que cette dimension est de l’ordre de 150 : en effet, on sait seulement que le nombre de faces de V(s) est ≤ 49 et on connait des exemples o` u il est 44. En 1694, une controverse oppose Isaac Newton et l’abb´ e Gregory. Newton pense qu’on ne peut placer qu’au plus 12 sph` eres identiques (ne s’interp´ en´ etrant pas) au contact d’une sph` ere centrale de mˆ eme rayon, Gregory pense qu’il est possible d’en placer 13. Cette alternative, le probl` eme des 13 sph` eres, ne sera tranch´ ee qu’en 1953, par Sch¨ utte et Van der Waerden ([17]) : ils donnent raison ` a Newton. Ils exhibent par ailleurs un arrangement de 13 sph` eres de rayon 1 tangentes ` a une sph` ere centrale de rayon r = 1, 0911... . On pense que ce rayon est le plus petit possible, mais cela n’a pour l’instant ´ et´ e d´ emontr´ e. Peut-ˆ etre les techniques de Hales et Ferguson permettront-elles de le faire.

3. Principe d’attaque de la conjecture de Kepler Pour majorer la densit´ e des empilements de sph` eres dans un espace euclidien E de dimension 3 , il suffit de consid´ erer les empilements de sph` eres de rayon 1 qui sont satur´ es (i.e. maximaux). Choisissons donc un tel empilement. Notons B la r´ eunion des boules qui le composent, et S l’ensemble de leurs centres : les distances mutuelles des points de S sont ≥ 2 , et tout point de E est ` a une distance < 2 de S . Si A est une partie de E , notons χA sa fonction caract´ eristique. Supposons que, pour des nombres r´ eels a , b , c tels que a > 43πc , on puisse ´ ecrire (1)

aχB − bχE =

P

s∈S

φs

(presque partout) ,

o` u φs est une fonction int´ egrable dont la norme L1 est major´ ee par une constante ind´ ependante de s , dont le support est contenu dans une boule de centre s et de rayon ind´ ependant de s , et dont l’int´ egrale satisfait la relation (2)

Z

φs ≤ c.

D´ emontrons que la densit´ e δ de l’empilement satisfait alors l’in´ egalit´ e (3)

(a −

3c 4π

)δ ≤ b

En int´ egrant (1) sur un cube Ω de cˆ ot´ e r , on obtient lorsque r tend vers l’infini avol(B ∩ Ω) − bvol(Ω) ≤ c Card(S ∩ Ω) + O(r2 ) ≤

3c 4π

vol(B ∩ Ω) + O(r2 ) .

vol(B∩Ω)

d’o` u (a − 43πc ) vol(Ω) sup´ erieure.

≤ b + O(r−1 ) ; l’in´ egalit´ e (3) s’en d´ eduit par passage ` a la limite

Exemples. — 1) La relation (1) est satisfaite lorsque l’on prend a = 0 , b = −1 et φs = −χV(s) , o` u V(s) est la cellule de Voronoi de s ; cette cellule est contenue dans la boule de centre s et de rayon 2 , puisque l’empilement est suppos´ e satur´ e. La relation (2) est satisfaite en prenant c = −v , o` u v est un minorant du volume des cellules de Voronoi. La relation (3) donne l’in´ egalit´ e δ ≤ 43π que nous avions rencontr´ ee au v o n 2. 2) Soit r un nombre r´ eel > 2 . Disons que deux points distincts de S sont voisins si leur distance est ≤ r . Fejes T´ oth propose pour d´ emontrer la conjecture de Kepler de prendre le plus grand r qui garantisse que tout point de S a au plus 12 voisins m 1 Pχ (probablement 2, 0534... ), et de poser φs = − 12− χ − u t parcourt V( s ) V(t) , o` 12 12 les voisins de s et m est leur nombre. La relation (1) est dans ce cas satisfaite avec a = 0 et b = −1 , mais la d´ etermination de la constante c optimale dans (2) apparaˆıt totalement hors d’atteinte. 3) On appelle d´ ecomposition de Delaunay associ´ ee ` a l’empilement une d´ ecomposition de l’espace E en t´ etra` edres, dont les sommets appartiennent ` a S , et dont les boules circonscrites n’ont pas de point int´ erieur dans S . Il existe au moins une telle d´ ecomposition ; celle-ci est unique lorsqu’aucun point de E n’appartient ` a plus de 4 cellules de Voronoi (ce qui est le cas g´ en´ erique), et est dans ce cas duale de celle de Voronoi. Fixons une d´ ecomposition de Delaunay associ´ ee ` a l’empilement et appelons ´ etoile de s la r´ eunion D(s) des simplexes de la d´ ecomposition contenant s . Posons φs = χB∩D(s) − δoct χD(s) , o` u δoct est la portion du volume d’un octa` edre r´ egulier de cˆ ot´ e 2 recouverte par les boules unit´ es centr´ ees en ses sommets. La premi` ere tentative de Hales pour d´ emontrer en 1992 la conjecture de Kepler revenait ` a utiliser ces fonctions φs , avec a = 4 et b = 4δoct . Mais il s’aper¸cut que pour certaines ´ etoiles (les prismes pentagonaux), l’int´ egrale de φs ´ etait trop grande pour conclure.

4. Articulation de la d´emonstration de Hales et Ferguson La d´ emonstration de Hales et Ferguson de la conjecture de Kepler se compose de 8 articles, totalisant environ 300 pages, dont l’ordre logique est le suivant : An overview of the Kepler conjecture, de T.C. Hales ([7]). A formulation of the Kepler conjecture, de S. Ferguson et T.C. Hales ([5]). Sphere packings I, de T.C. Hales ([8]). Sphere packings II, de T.C. Hales ([9]). Sphere packings III, de T.C. Hales ([10]). Sphere packings IV, de T.C. Hales ([11]). Sphere packings V, de S. Ferguson ([4]). The Kepler conjecture (Sphere packings VI), de T.C. Hales ([12]). Les premiers articles r´ edig´ es furent Sphere packings I et Sphere packings II. Ils ont ´ et´ e publi´ es en 1997. Les autres articles sont pour l’instant des pr´ epublications ´ electroniques, disponibles sur la page personnelle de T. Hales. Dans Sphere packings I, Hales d´ ecrit sa strat´ egie pour d´ emontrer la conjecture de Kepler. Le probl` eme d’optimisation qu’il consid` ere est de mˆ eme nature que celui

consid´ er´ e dans l’exemple 3 du no 3 , mais s’appuie sur une d´ ecomposition de l’espace ` l’´ hybride entre la d´ ecomposition de Voronoi et celle de Delaunay.A etoile D(s) d’un point s pour cette d´ ecomposition, Hales associe un nombre r´ eel qu’il appelle le score de D(s) et qui est l’int´ egrale de la fonction φs dans l’approche du no 3 . L’ensemble D des ´ etoiles possibles, pour s = 0 , a une structure naturelle d’espace compact et le score est une fonction continue sur D . Les ´ etoiles qui proviennent de l’empilement cubique faces centr´ ee et de ses variantes d´ ecrites dans la remarque 1 forment deux orbites D0 et D0′ sous l’action du groupe orthogonal. Pour d´ emontrer la conjecture de Kepler, il suffit de d´ emontrer que le maximum du score est atteint ′ sur D0 ∪ D0 . Pour des raisons de commodit´ e, Hales note 8pt la valeur prise par le score sur cet ensemble. Chaque ´ etoile poss` ede une structure combinatoire, d´ ecrite par une carte sph´ erique. Dans Sphere packings II, Hales d´ emontre une propri´ et´ e forte de maximum ′ local : les ´ etoiles ayant mˆ eme structure combinatoire que celles de D 0 ∪ D0 ont un ′ score ≤ 8pt , avec ´ egalit´ e si et seulement si elles appartiennent ` a D 0 ∪ D0 . La strat´ egie consiste alors ` a d´ emontrer que pour les autres structures combinatoires, le score est < 8pt . Les difficult´ es techniques rencontr´ ees, en particulier dans l’´ etude des prismes pentagonaux, conduisent Ferguson et Hales ` a modifier le probl` eme d’optimisation initial, en proposant une nouvelle d´ ecomposition de l’espace et une nouvelle fonction score, plus compliqu´ ees apparemment mais mieux adapt´ ees ` a l’´ etude num´ erique envisag´ ee. C’est ce qu’ils font dans A formulation of the Kepler conjecture, en prenant soin de v´ erifier que les r´ esultats de Sphere packings I et Sphere packings II restent valables dans ce nouveau cadre. Dans Sphere packings III, Hales d´ emontre que le score (nouvelle version) de D est < 8pt si la carte associ´ ee n’a que des faces triangulaires ou quadrilat´ erales, et ne provient pas d’un prisme pentagonal (ni de D0 et D0′ ) ; le cas des prismes pentagonaux est trait´ e par Ferguson dans Sphere packings V, celui des cartes poss´ edant des faces ` a 5 cˆ ot´ es ou plus par Hales dans Sphere packings IV et Sphere packings VI. Au total, ce sont environ 5000 cartes, recens´ ees par ordinateur, qui interviennent dans le probl` eme. Des m´ ethodes g´ en´ erales de programmation lin´ eaire permettent de se ramener ` a n’examiner qu’une centaine de cas ; ceux-ci sont trait´ es un ` a un. Beaucoup des probl` emes d’optimisation non lin´ eaires rencontr´ es sont remplac´ es par des probl` emes d’optimisation lin´ eaires qui les dominent, que l’on sait r´ esoudre par les m´ ethodes de programmation lin´ eaire. Au total, ce sont pr` es de 100000 probl` emes lin´ eaires, en 100 ` a 200 variables, avec 1000 ` a 2000 contraintes, qu’il a fallu traiter pour achever la d´ emonstration. Les calculs ont ´ et´ e effectu´ es en utilisant une arithm´ etique des intervalles : chaque nombre r´ eel r est repr´ esent´ e par un couple (a, b) de nombres rationnels qui l’encadrent, de mani` ere ` a garantir que les erreurs d’arrondis cumul´ ees n’entachent pas la validit´ e des r´ esultats obtenus.

5. La conjecture de Kepler est-elle d´emontr´ee ? La situation n’est pas sans rappeler celle du th´ eor` eme des 4 couleurs, dont la d´ emonstration par K. Appel et W. Haken en 1977 avait n´ ecessit´ e l’examen de quelques milliers de configurations par ordinateur.

Je ne pr´ etends pas avoir v´ erifi´ e l’int´ egralit´ e de la d´ emonstration de Hales et Ferguson, et encore moins les programmes informatiques utilis´ es. Je ne pense pas que quiconque ` a part les auteurs l’ait fait. Ma conviction personnelle que les travaux de Hales et Ferguson fournissent effectivement une preuve de la conjecture de Kepler repose sur les arguments suivants : — Ni erreurs substantielles, ni points obscurs n’ont ´ et´ e relev´ es jusqu’` a pr´ esent par les sp´ ecialistes ayant examin´ e ces travaux. — Dans toutes les parties du travail que j’ai pris la peine de lire en d´ etail, j’ai trouv´ e des d´ emonstrations claires et compl` etes. — Le recours ` a l’intuition g´ eom´ etrique, dangereux dans ce type de probl` eme, est r´ eduit au minimum et remplac´ e par des in´ egalit´ es pr´ ecises. — Les algorithmes employ´ es sont d´ ecrits avec soin, et les codes r´ edig´ es sont disponibles pour v´ erification. L’arithm´ etique des intervalles tient compte des erreurs commises dans l’approximation des nombres r´ eels. — Si d’aventure, on s’apercevait ult´ erieurement qu’un cas ` a examiner a ´ echapp´ e ` a la sagacit´ e des auteurs, il est vraisemblable que leurs techniques permettraient de le traiter sans devoir introduire d’id´ ees nouvelles.

BIBLIOGRAPHIE [1] J. H. CONWAY, N. J. A. SLOANE – Sphere packings, lattices and groups, Grundlehren der mathematischen Wissenschaften 290, Springer Verlag, 1988. ´ ¨ [2] L. FEJES T OTH – Uber die dichteste Kugellagerung, Math. Z. 48 (1943), 676684. ´ [3] L. FEJES T OTH – Lagerungen in der Ebene, auf der Kugel und im Raum, Springer, Berlin, 1953. [4] S. P. FERGUSON – Sphere packings V, th` ese, Universit´ e du Michigan, 1997. [5] S. P. FERGUSON, T. C. HALES – A formulation of the Kepler conjecture, pr´ epublication. [6] C. F. GAUSS – Untersuchungen ¨ uber die Eigenschaften der positiven tern¨ aren quadratischen Formen von Ludwig August Seber, G¨ ottingische gelehrte Anzeigen, 1831, Juli 9 (= Werke, vol 2, K¨ oniglische Gesellschaft der Wissenschaften, G¨ ottingen, 1876, 188-196). [7] T. C. HALES – An overview of the Kepler conjecture, pr´ epublication. [8] T. C. HALES – Sphere packings I, Disc. Comp. Geom. 17 (1997), 1-51. [9] T. C. HALES – Sphere packings II, Disc. Comp. Geom. 18 (1997), 135-149. [10] T. C. HALES – Sphere packings III, pr´ epublication. [11] T. C. HALES – Sphere packings IV, pr´ epublication. [12] T. C. HALES – The Kepler conjecture (Sphere packings VI), pr´ epublication. [13] W-Y. HSIANG – On the sphere packing problem and the proof of Kepler’s conjecture, Intern. J. Math. 93 (1993), 739-831. [14] J. KEPLER – Strena seu de nive sexangula, Frankfurt, Tampach, 1611, 24 pages. (Traduction allemande de F. Rossmann, Neujahrsgabe, Berlin, 1943 ; traduction anglaise de C. Hardie, The six-cornered snowflake, Oxford, 1966 ; traduction

[15] [16] [17] [18]

fran¸ caise de R. Halleux, L’´ etrenne ou la neige sexangulaire, librairie J. Vrin et ´ editions du CNRS, Paris, 1975.) ´ – Empilements de sph` J. OESTERL E eres, S´ eminaire Bourbaki 1989-90, expos´ e o n 7 27, Ast´ erisque 189-190 (1990), 375-397. C. A. ROGERS – The packing of equal spheres, Proc. London Math. Soc. 8 (1958), 609-620. ¨ K. SCHUTTE, B. L. VAN DER WAERDEN – Das Problem der dreizehn Kugeln, Proc. London Math. Ann. 125 (1953), 325-334. ¨ A. THUE – Uber die dichteste Zusammenstellung von kongruenten Kreisen in einer Ebene, Norske Vid. Selsk. Skr.1 (1910), 1-9. ´ Joseph OESTERLE Institut Henri Poincar´ e 11, rue Pierre et Marie Curie F-75005 PARIS Adresse ´ electronique : [email protected]

S´eminaire BOURBAKI 51`eme ann´ee, 1998-99, no 864

Juin 1999

SOUS-GROUPES FINIS DES GROUPES DE LIE par Jean–Pierre SERRE

INTRODUCTION

Les sous-groupes finis du groupe des rotations SO3 (R) sont bien connus. Ce sont : les groupes cycliques Cn d’ordre n = 1, 2, . . . ; les groupes di´edraux Dn d’ordre 2n, n = 2, 3, . . . ; le groupe altern´e Alt4 d’ordre 12 ; le groupe sym´etrique Sym4 d’ordre 24 ; le groupe altern´e Alt5 d’ordre 60. On aimerait avoir une liste analogue pour d’autres groupes de Lie compacts, ou d’autres groupes alg´ebriques (en caract´eristique z´ero, et mˆeme en caract´eristique > 0). Ce serait utile pour beaucoup de questions (repr´esentations ℓ-adiques, par exemple). Bien sˆ ur, c’est trop demander, vu que tout groupe fini se plonge dans un groupe unitaire convenable ! On va voir que l’on peut tout de mˆeme dire pas mal de choses si l’on se borne `a des groupes finis qui sont, soit ab´eliens, soit simples. ` HYPOTH ESES ET NOTATIONS

Plutˆ ot que de travailler dans la cat´egorie des groupes de Lie compacts, on pr´ef`ere se placer dans celle des groupes r´eductifs complexes. Cela ne change rien : on sait que, si K est un groupe de Lie compact, il poss`ede un complexifi´e G qui est un groupe r´eductif sur C ; le groupe K est un sous-groupe compact maximal de G(C). Tout sous-groupe fini de G(C) est conjugu´e ` a un sous-groupe de K ; de plus, K “contrˆ ole la fusion de K dans G(C)” au sens suivant : si A, B sont deux sous-groupes de K, et si g ∈ G(C) est tel que gAg −1 = B, il existe un ´el´ement g0 de K tel que g0 ag0−1 = gag −1 pour tout a ∈ A (cela se d´eduit de la d´ecomposition de Cartan de G(C)). (Dans le cas particulier K = SO3 (R), on a G = PGL2 , de sorte que les groupes Cn, Dn, . . . , Alt5 s’interpr`etent comme des sous-groupes finis de PGL2 (C), c’est-` a-dire comme des groupes finis d’automorphismes de la droite projective.) Dans ce qui suit, on adoptera le point de vue des groupes alg´ebriques (qui a, entre autres avantages, celui de permettre des r´eductions modulo p). On fixe un corps k alg´ebriquement clos de caract´eristique z´ero, ainsi qu’un groupe r´eductif connexe G d´efini sur k ; on se permet d’identifier G ` a G(k). Le cas le plus int´eressant est celui o` u G est “presque simple”, i.e. semi-simple ` a syst`eme de racines irr´eductible ; le groupe adjoint Gad est alors un groupe simple, au sens usuel du terme.

863-02 ´ 1. LE CAS (PRESQUE) AB ELIEN

Lorsque G = PGL2 les sous-groupes ab´eliens finis de G sont les groupes cycliques Cn et le groupe di´edral D2 qui est ab´elien ´el´ementaire de type (2, 2). Les Cn sont contenus dans un tore maximal, alors que D2 ne l’est pas ; le nombre premier p = 2 joue donc un rˆole particulier pour PGL2 . Nous allons trouver une situation analogue dans le cas g´en´eral. 1.1. Sous-groupes toraux Un sous-groupe fini A de G est dit toral s’il est contenu dans un tore maximal T de G. La structure d’un tel sous-groupe est ´evidente : si r = dim T est le rang de G, A peut ˆetre engendr´e par r ´el´ements ; inversement, tout groupe ab´elien ayant cette propri´et´e est isomorphe `a un sous-groupe toral de G. Soit N = NG(T ) le normalisateur de T dans G. Le quotient W = N/T est le groupe de Weyl de G (plus correctement : du couple (G, T )). Ce groupe op`ere sur T par conjugaison, et il contrˆole la fusion de T dans G : 1.1.1. Si A et B sont des sous-groupes de T , et si g ∈ G est tel que gAg −1 = B, il existe w ∈ W tel que w(a) = gag −1 pour tout a ∈ A. Cet ´enonc´e est l’exact analogue d’un th´eor`eme de Burnside sur les sous-groupes du centre d’un p-groupe de Sylow. Il se d´emontre de la mˆeme mani`ere : on remarque que T et g −1T g sont des tores maximaux du centralisateur ZG(A) de A, donc sont conjugu´es par ZG(A). Cela permet de remplacer g par un ´el´ement de N ; d’o` u le r´esultat cherch´e. Les groupes ab´eliens ayant tr`es peu de g´en´erateurs sont toraux : 1.1.2. Soit A un sous-groupe ab´elien fini de G. Alors A est toral dans chacun des deux cas suivants : a) A est cyclique ; b) G est simplement connexe, et A est engendr´e par deux ´el´ements. Le cas a) est imm´ediat : tout ´el´ement d’ordre fini est semi-simple, donc contenu dans un tore maximal. Dans le cas b), supposons A engendr´e par x, y. Du fait que G est simplement connexe, le centralisateur ZG(x) est connexe. Le mˆeme argument que dans a) montre qu’il existe un tore maximal T de ZG(x) qui contient y. Ce tore est un tore maximal de G et il contient x, donc A. 1.2. Plongements dans N ` d´efaut de pouvoir plonger un groupe ab´elien fini dans un tore maximal, on peut A essayer de le plonger dans le normalisateur d’un tel tore. C’est toujours possible. Plus g´en´eralement (cf. Borel-Serre [6], Borel-Mostow [5] et Springer-Steinberg [33], II.5.6) : 1.2.1. Soit A un sous-groupe fini hyper-r´esoluble de G. Il existe un tore maximal T de G dont le normalisateur N contient A. Rappelons qu’un groupe A est dit hyper-r´esoluble (“supersolvable”) s’il admet une suite de composition : 1 = A0 ⊂ A1 ⊂ . . . ⊂ An = A,

863-03 o` u les Ai sont normaux dans A, et Ai/Ai−1 est cyclique pour tout i ≥ 1. On a les implications : ab´elien =⇒ nilpotent =⇒ hyper-r´esoluble =⇒ r´esoluble. Voici une application simple de 1.2.1 : 1.2.2. Soit p un nombre premier ne divisant pas l’ordre du groupe de Weyl W . Si A est un p-groupe contenu dans G, A est ab´elien et toral. En effet, on peut supposer, d’apr`es 1.2.1, que A est contenu dans N . Vu l’hypoth`ese faite sur p, son image dans W = N/T est triviale. Il est donc contenu dans T . Remarque : Le groupe N est une extension, en g´en´eral non triviale, de W par T . On trouvera dans Tits ([35],[36]) une description de cette extension, en termes d’un certain groupe fini NZ d´efini explicitement par g´en´erateurs et relations ; voir aussi Bourbaki, LIE IX, p. 115, exerc. 12. 1.3. Nombres premiers de torsion (R´ef´erences : Borel [4], Steinberg [34] et Bourbaki, LIE IX, p. 120-121, exerc. 7 ` a 12.) Un nombre premier p est dit de torsion (pour G) s’il v´erifie les conditions ´equivalentes suivantes : a) Il existe un p-sous-groupe ab´elien de G qui n’est pas toral. a′) Il existe un p-sous-groupe ab´elien ´el´ementaire de G, de rang ≤ 3, qui n’est pas toral. On note Tors(G) l’ensemble de ces nombres premiers ; d’apr`es 1.2.2, c’est un sous-ensemble de l’ensemble des diviseurs premiers de l’ordre de W . Dans le cas particulier o` u G = PGL2 , on a Tors(G) = {2}. Le terme de “torsion” provient du r´esultat suivant, dans lequel je suppose que k = C (sinon il faut faire intervenir la cohomologie ´etale) : 1.3.1. (cf. [4],[34]) Pour que p appartienne ` a Tors(G), il faut et il suffit que l’un des groupes d’homologie Hi(G, Z) contienne un ´el´ement d’ordre p. (Noter qu’il revient au mˆeme de consid´erer l’homologie de G = G(C) ou celle d’un compact maximal K, car G(C) et K ont mˆeme type d’homotopie.) On trouvera dans [4] et [34] une longue liste de propri´et´es caract´erisant les ´el´ements de Tors(G). En voici quelques-unes : 1.3.2. On a Tors(G) = Tors(G′), o` u G′ est le groupe d´eriv´e de G. ′ Comme G est semi-simple, cela ram`ene l’´etude de Tors(G) au cas o` u G est semisimple. Dans ce cas, notons G le revˆetement universel de G, notons π1 (G) le noyau de G → G et soit Tors(π1 (G)) l’ensemble des nombres premiers qui divisent l’ordre du groupe fini π1 (G). Alors : 1.3.3. On a Tors(G) = ∪H Tors(π1 (H ′)), o` u H parcourt les sous-groupes r´eductifs connexes de G ayant mˆeme rang que G. 1.3.4. On a Tors(G) = Tors(G) ∪ Tors(π1 (G)).

863-04 Cet ´enonc´e ram`ene la d´etermination de Tors(G) au cas o` u G est simplement connexe. En utilisant 1.3.3, on en d´eduit (cf. [4],[34]) : 1.3.5. Supposons G simplement connexe et presque simple. Soit (αi) une base de son syst`eme de racines, soit β la plus grande racine, et ´ecrivons la racine duale β ∨ de β sous la forme : P β∨ = ni α∨ i ,

o` u les ni sont des entiers > 0. Alors, pour que p soit de torsion pour G, il faut et il suffit qu’on ait p ≤ sup(ni). D’o` u: 1.3.6. Supposons G simplement connexe et presque simple. Alors : Tors(G) = ∅ si G est de type An ou Cn ; Tors(G) = {2} si G est de type Bn (n ≥ 3), Dn (n ≥ 4) ou G2 ; Tors(G) = {2, 3} si G est de type F4 , E6 ou E7 ; Tors(G) = {2, 3, 5} si G est de type E8 .

863-05 1.4. Exemples de groupes ab´ eliens ´ el´ ementaires non toraux (R´ef´erences : Adams [1], Borel [4], Borel–Serre [6], Cohen-Seitz [10], Steinberg [34] et (surtout) Griess [17).) Je me borne `a deux exemples, l’un relatif ` a p = 2 et l’autre ` a p = 5. 1.4.1. Supposons que −1 appartienne au groupe de Weyl W ; c’est le cas pour les groupes de type A1 , Bn, Cn, Dn (n pair), G2 , F4 , E7 , E8 . Soit g ∈ N un repr´esentant de l’´el´ement −1 de W . On peut montrer que g 2 est d’ordre 1 ou 2, et appartient au centre de G. Supposons que g 2 = 1 (c’est le cas si G est de type adjoint). Soit A le groupe engendr´e par g et par les ´el´ements d’ordre 2 de T ; c’est un groupe ab´elien ´el´ementaire d’ordre 2n+1, o` u n est le rang de G, i.e. la dimension de T . Ce groupe n’est pas toral ; on peut mˆeme montrer que son centralisateur ZG(A) est fini. Lorsque G est PGL2 , le groupe A est le groupe di´edral D2 . Lorsque G est de type G2 , F4 ou E8 , A est d’ordre 23 , 25 , 29 ; de tels sous-groupes jouent un grand rˆ ole dans la cohomologie (usuelle – ou galoisienne) du groupe G. Noter que, dans ces trois cas, A est un sous-groupe ´el´ementaire maximal de G : de fa¸con g´en´erale, si G est simplement connexe, les p-sous-groupes ab´eliens de G sont de rang ≤ n + 1 si p = 2, et de rang ≤ n si p > 2, cf. Borel [4] et Cohen-Seitz [10]. 1.4.2. Le groupe G = E8 contient un ´el´ement z d’ordre 5 dont le centralisateur ZG(z) est de la forme G1 · G2 , o` u G1 et G2 sont isomorphes ` a SL5 , commutent, et ont pour intersection hzi (cela se d´eduit du diagramme de Dynkin compl´et´e de E 8 en remarquant que, si l’on en retranche la racine simple qui a le coefficient 5 dans la plus grande racine, on trouve deux diagrammes de type A4 ). Dans G1 = SL5 , il est −1 eme, il facile de trouver des ´el´ements x1 , y1 d’ordre 5 tels que x1 y1 x−1 1 y1 = z ; de mˆ −1 −1 −1 existe dans G2 des ´el´ements x2 , y2 d’ordre 5 tels que x2 y2 x2 y2 = z . Si l’on pose x = x1 x2 et y = y1 y2 , on constate que le groupe A = hx, y, zi est ab´elien ´el´ementaire d’ordre 53 . Ce groupe n’est pas toral ; on peut mˆeme montrer que ZG(A) est ´egal ` a A. 1.5. Relations entre cohomologie galoisienne et sous-groupes non toraux Qu’il existe de telles relations est connu depuis longtemps. Voici deux exemples : 1.5.1 (Grothendieck [23]). Les deux propri´et´es suivantes sont ´equivalentes : a) Tors(G) = ∅ (cela ´equivaut `a dire que tout sous-groupe ab´elien de G est toral). b) H 1 (K, G) = 0 pour toute extension K de k. (Pour la d´efinition de H 1 (K, G), voir par exemple [30].) Lorsque G est semi-simple, ces propri´et´es sont satisfaites si et seulement si G est un produit de groupes simplement connexes de type A ou C, cf. § 1.3. Un tel groupe est parfois dit “sp´ecial”. 1.5.2. Supposons que G soit ´egal ` a PGL2 , ou soit de type G2 . Soit A le 2-sousgroupe ´el´ementaire non toral de G d´efini dans 1.4.1. Alors, pour toute extension K de k, l’application H 1 (K, A) → H 1 (K, G) est surjective. Noter que H 1 (K, A) n’est autre que Hom(Gal(K/K), A). Dans le cas de PGL2 , les ´el´ements de H 1 (K, A) peuvent donc s’interpr´eter comme des couples (λ, µ) d’´el´ements

863-06 de K ∗/K ∗2 et l’´el´ement correspondant de H 1 (K, PGL2 ) est l’alg`ebre de quaternions d´efinie par deux g´en´erateurs i et j soumis aux relations i2 = λ ,

j2 = µ ,

ij = −ji.

Mˆeme chose pour G2 , les quaternions ´etant remplac´es par les octonions. L’´enonc´e 1.5.2, pour agr´eable qu’il soit, ne donne pas de moyen de prouver la non trivialit´e des ´el´ements de H 1 (K, G) ainsi obtenus ; il faut le compl´eter par la construction d’invariants cohomologiques, cf. [30], §§ 6,7 et n et Youssin [29] ont obtenu un r´esultat bien plus satisfaisant. Pour le formuler, il faut d’abord d´efinir la dimension essentielle ed(x) d’un ´el´ement x de H 1 (K, G) : c’est la borne inf´erieure des degr´es de transcendance sur k des sous-extensions K ′ de K telles que x appartienne a l’image de H 1 (K ′, G) → H 1 (K, G). (En termes plus g´eom´etriques – et plus vagues ` – c’est le nombre minimum de param`etres dont on a besoin pour ´ecrire le G-torseur x.) La borne sup´erieure des ed(x), quand K et x varient, est la dimension essentielle de G ; elle est not´ee ed(G). Nous pouvons maintenant ´enoncer le th´eor`eme principal de [29] : 1.5.3. Si G contient un p-sous-groupe ab´elien ´el´ementaire A dont le centralisateur est fini, on a ed(G) ≥ rang(A). En combinant cet ´enonc´e avec 1.4.1, on obtient : 1.5.4. On a ed(E7ad) ≥ 8 et ed(E8 ) ≥ 9. Ainsi, il existe des E8 -torseurs dont la construction exige au moins 9 param`etres ! Remarques 1) L’hypoth`ese faite sur A dans 1.5.3 est ´equivalente ` a dire que A n’appartient ` a aucun sous-groupe parabolique propre de G. Elle entraˆıne que A n’est pas toral. 2) L’´enonc´e d´emontr´e dans [29] est plus pr´ecis que 1.5.3 ; c’est : ed(G; p) ≥ rang(A), o` u ed(G; p) est la dimension essentielle de G “en p” (i.e. en consid´erant comme n´egligeables les extensions de corps de degr´e premier ` a p). 3) Les d´emonstrations de [29] utilisent la r´esolution des singularit´es (sous forme ´equivariante). Elles ne s’´etendent pas, pour l’instant, aux corps de caract´eristique 6= 0. 2. LE CAS (PRESQUE) SIMPLE On va maintenant s’int´eresser aux plongements d’un groupe simple (fini, non ab´elien) dans G. Il est commode de consid´erer, plus g´en´eralement, les plongements des groupes S qui sont des extensions centrales de S (on peut imposer ` a S d’ˆetre ´egal ` a son groupe d´eriv´e, cela ne change rien). Exemple typique : S = L2 (q) = PSL2 (Fq ) et

S = 2 · L2 (q) = SL2 (Fq) ,

q impair.

863-07 (Les notations L2 (q) et 2 · L2 (q) sont celles de l’ATLAS [15].) Un plongement d’un tel groupe S dans G est appel´e un plongement projectif de S. Le principal avantage de cette notion est la propri´et´e d’invariance suivante : si G′ → G est une isog´enie, S a un plongement projectif dans G si et seulement si il a un plongement projectif dans G′. Lorsque S et G sont donn´es, et que G est un groupe classique, l’examen de la table des caract`eres de S (et de ses extensions centrales) permet de d´ecider si S a un plongement (ou un plongement projectif) dans G ; c’est clair lorsque G est de type An, et c’est facile pour les types Bn, Cn, Dn. Une m´ethode analogue s’applique ` a G2 (en utilisant sa repr´esentation irr´eductible de degr´e 7 et la forme trilin´eaire altern´ee correspondante), cf. Aschbacher [2] et Cohen–Wales [11]. Les types F4 , E6 , E7 , E8 sont plus difficiles ; ce n’est que r´ecemment (Griess–Ryba [22]) que la liste des S possibles a ´et´e compl´et´ee. Avant de donner cette liste (que l’on trouvera au § 2.4), je vais parler du cas S = L2 (q), qui est le seul o` u l’on ait des ´enonc´es g´en´eraux, i.e. valables aussi bien pour les groupes classiques que pour les groupes exceptionnels. 2.1. Plongements projectifs de L2 (q) dans G ; ´ enonc´ e du r´ esultat On suppose q > 2. Le groupe S = L2 (q) = PSL2 (Fq ) est alors un groupe simple (sauf si q = 3, o` u c’est le groupe Alt4 ), et toute extension centrale S de S, ´egale a` son groupe d´eriv´e, est isomorphe, soit ` a 2 · S = SL2 (Fq ), soit ` a S (sauf si q = 4 ou 9). On va donc s’int´eresser aux homomorphismes f : SL2 (Fq ) −→ G de noyau ´egal `a 1 ou `a (±1). Un tel homomorphisme sera dit non d´eg´en´er´e. e ´ Ecrivons q sous la forme p , avec p premier, e ≥ 1. Le p-groupe de Sylow 1 ∗ U = de SL2 (Fq ) est isomorphe ` a Fq . Le groupe A = f (U ) est un p-groupe 0 1 ab´elien ´el´ementaire de G de rang e. Nous dirons que f est de type toral si A est toral au sens du § 1.1. C’est le cas si e = 1, ou si e = 2 et G est simplement connexe (1.1.2), ou si p n’est pas un nombre premier de torsion pour G. Nous allons donner un crit`ere pour l’existence d’un f non d´eg´en´er´e de type toral. Supposons G presque simple, de rang r ; soient ki (i = 1, . . . , r) les exposants de son groupe de Weyl et soient di = ki + 1 les degr´es correspondants (Bourbaki, LIE V, § 6, prop. 3). L’´enonc´e suivant r´esume une s´erie de r´esultats dus ` a divers auteurs ([2], [8], [9], [11], [12], [14], [19], [20], [24], [28], [31]) : 2.1.1. Pour qu’il existe un homomorphisme non d´eg´en´er´e de type toral de SL2 (Fq ) dans G, il faut et il suffit que q − 1 divise l’un des entiers 2d1 , . . . , 2dr. Remarque.— Lorsque p = 2 ou 3, il existe quelques plongements de L2 (pe) qui ne sont pas de type toral, par exemple : L2 (4) −→ PGL2 , L2 (8) −→ G2 , L2 (16) −→ D8 , L2(32) −→ E8 ; L2 (9) −→ PGL3 , L2 (27) −→ F4 .

863-08 Je ne sais pas en donner de description syst´ematique. Exemples 1) Si G = SL2 , on a r = 1 et d1 = 2 ; la condition dit alors que q − 1 divise 4, d’o` u q = 3 et q = 5, ce qui donne des plongements de SL2 (F3 ) et SL2 (F5 ) dans SL2 ; d’o` u des plongements de PSL2 (F3 ) = Alt4 et de PSL2 (F5 ) = Alt5 dans PGL2 . On retrouve ainsi les groupes du t´etra`edre et de l’icosa`edre (quant au groupe du cube, Sym4 , il s’interpr`ete aussi comme PGL2 (F3 ) , et c’est le normalisateur du groupe Alt4 ). 2) Si G = G2 , on a r = 2, d1 = 2, d2 = 6 ; la condition dit que q − 1 divise 12, ce qui donne des plongements projectifs pour q = 3, 5, 7, 13. En fait, si q = 7 ou 13, ces plongements projectifs sont de vrais plongements de L2 (q), car sinon leurs images seraient contenues dans le centralisateur d’un ´el´ement d’ordre 2, qui est de type A1 · A1 , et cela contredirait l’exemple 1. (Ce genre d’argument s’applique ` a beaucoup d’autres cas : les plongements projectifs int´eressants sont de vrais plongements.) 3) Si G = E8 , on a (d1 , . . . , d8 ) = (2, 8, 12, 14, 18, 20, 24, 30) et l’on en d´eduit notamment des plongements de L 2 (q) pour q = 16, 31, 41, 49, 61. 4) Le plus grand des entiers di est le nombre de Coxeter h, ´egal ` a (dim G)/r − 1. L’´enonc´e 2.1.1 contient donc comme cas particulier la conjecture de Kostant : si q = 2h + 1 est une puissance d’un nombre premier, le groupe Gad contient un sousgroupe isomorphe ` a L2 (q). 5) On a un ´enonc´e analogue `a celui de Kostant lorsque h + 1 est une puissance d’un nombre premier, d’o` u par exemple L 2 (19) → E7ad et L2 (31) → E8 . Lorsque h+1 est ´egal ` a un nombre premier p, on a un r´esultat plus pr´ecis (cf. [31]) : le groupe PGL2 (Fp) (qui est “deux fois plus grand” que PSL2 (Fp)) est, lui aussi, plongeable dans Gad . Lorsque G = PGL2 , on retrouve le groupe du cube PGL2 (F3 ), cf. exemple 1. De ce point de vue, on peut dire que “les analogues” pour E8 des groupes Alt4 , Sym4 , et Alt5 du d´ebut de l’expos´e sont respectivement PSL2 (F31), PGL2 (F31) et PSL2 (F61). 2.2. Le crit` ere 2.1.1 : d´ emonstration de la n´ ecessit´ e Il s’agit de prouver que, si f : SL2 (Fq ) → G est un homomorphisme non d´eg´en´er´e de type toral, alors q − 1 divise l’un des entiers 2di. On utilise : 2.2.1. Soit A un p-sous-groupe ´el´ementaire toral de G, et soit g ∈ NG(A). Soit Ig ∈ GL(A) l’automorphisme de A (vu comme espace vectoriel sur Fp) d´efini par la conjugaison par g. Soit λ une valeur propre de Ig dans Fp et soit m l’ordre de λ ∗ (dans Fp). Alors m divise l’un des di. (On peut supposer que A est contenu dans T ; d’apr`es 1.1.1, il existe w ∈ W qui induit Ig sur A. L’une des valeurs propres de w en caract´eristique 0 a pour r´eduction λ en caract´eristique p. Son ordre est donc de la forme mpa, avec a ≥ 0. D’apr`es un th´eor`eme de Springer ([32], th. 3.4 (i)), mpa divise l’un des di. Il en est donc de mˆeme de m.)

863-09

1 ∗ . Soit A = f (U ), et soit g = f (h), 0 1

Revenons `a f , et au p-Sylow U = c 0 o` u h = est un g´en´erateur du sous-groupe diagonal de SL2 (Fq ). Si l’on 0 c−1 identifie U `a Fq , l’action de h sur ce groupe est l’homoth´etie de rapport c2 ; ses valeurs propres (dans Fp) sont les conjugu´es de c2 , qui sont d’ordre m = (q − 1)/2 si p > 2 et m = q − 1 si p = 2. En appliquant 2.2.1 ` a A et g, on voit que m divise l’un des entiers di ; donc q − 1 divise l’un des entiers 2di. Remarque.— Le mˆeme argument montre que, si f est un homomorphisme de GL 2 (Fq ) dans G, qui est non d´eg´en´er´e et de type toral (en un sens ´evident), alors q − 1 divise l’un des di. 2.3. Le crit` ere 2.1.1 : v´ erification de la suffisance On doit montrer que, si q −1 divise l’un des entiers 2di, il existe f : SL2 (Fq ) → G qui est non d´eg´en´er´e de type toral. On ne connaˆıt pas de d´emonstration g´en´erale de cet ´enonc´e. On proc`ede cas par cas : 1) Le cas o` u G est de type classique se traite facilement, grˆ ace ` a la connaissance de la table des caract`eres de SL2 (Fq ) ; les caract`eres irr´eductibles de degr´e (q ± 1)/2 sont particuli`erement utiles. La condition de toralit´e est trivialement satisfaite si p 6= 2 ; dans le cas o` u p = 2, et o` u G est un groupe orthogonal, il faut faire un peu attention. La mˆeme m´ethode s’applique ` a G2 (voir aussi [2], [11], [28]). 2) Pour les groupes exceptionnels, les inclusions des groupes classiques dans ceuxci, et les plongements G2 −→ F4 −→ E6 −→ E7 −→ E8 , montrent qu’il suffit de traiter les cas suivants : F4 (q = 25) ;

E6 (q = 19) ;

E7 (q = 29, 37) ;

E8 (q = 16, 31, 41, 49, 61).

Le cas (E8 ; 16) se traite en remarquant que L2 (16) se plonge dans un groupe de type D8 , donc dans un groupe de type E8 ; ce plongement n’est pas de type toral dans D8 , mais il le devient dans E8 comme on le voit en appliquant [8], prop. 3.8. Le cas (F4 ; 25) se d´eduit de ce que L2 (25) se plonge dans le groupe de Tits 2 F4 (2)′, qui lui-mˆeme se plonge dans E6 , cf. 2.4.2, b) ci-apr`es. On v´erifie par un calcul de caract`eres que le sous-groupe de E6 ainsi obtenu est contenu dans un conjugu´e de F4 , cf. Cohen–Wales [14]. Les cas (E6 ; 19), (E7 ; 37), (E8 ; 31), (E8 ; 41), (E8 ; 49), (E8 ; 61) ont ´et´e v´erifi´es par des calculs sur ordinateur, cf. Cohen–Wales [14], Kleidman–Ryba [24], Griess– Ryba [19] et [20], Cohen–Griess–Lisser [9]. Les cas (E7 ; 37), (E8 ; 31) et (E8 ; 61) sont trait´es dans [31] par une m´ethode p-adique qui consiste `a relever un plongement (bien choisi) de la caract´eristique p ` a la caract´eristique 0. Une variante non encore publi´ee de cette m´ethode permet de traiter

863-10 aussi (E6 ; 19), (E7 ; 29) et (E8 ; 41). Ainsi, tous les cas o` u q est premier peuvent ˆetre obtenus sans ordinateur. Remarque.— Les calculs sur ordinateur ont un inconv´enient ´evident : ils ne sont pas v´erifiables pas `a pas, comme une d´emonstration doit l’ˆetre. Ils ont toutefois un avantage : dans certains cas, ils montrent l’unicit´e du plongement consid´er´e (` a conjugaison pr`es), cf. [19], [20]. C’est l` a un r´esultat que la m´ethode p-adique ne donne pas, au moins pour le moment. 2.4. Plongements projectifs des groupes finis simples dans les groupes de type exceptionnel La table suivante est extraite de Griess-Ryba [22] (avec une petite correction relative ` a F4 ). Elle donne la liste des groupes simples ayant un plongement projectif dans G2 , . . . , E8 . Je renvoie `a [22] et [27] pour divers renseignements suppl´ementaires sur ces plongements, ainsi que pour des r´ef´erences. Table G2 – Altn, n = 5, 6 ; L2 (q), q = 7, 8, 13 ; SU3 (3) = G2 (2)′. F4 – ceux de G2 et : Altn, n = 7, 8, 9, 10 ; L2 (q), q = 17, 25, 27 ; L3 (3) ; SU4 (2) ; Sp6 (2) = O7 (2) ; O8+(2) ; 3 D4 (2). E6 – ceux de F4 et : Alt11 ; L2 (q), q = 11, 19 ; L3 (4) ; PSU4 (3) ; 2 F4 (2)′ ; M11 ; HJ = J2 . E7 – ceux de E6 et : Altn, n = 12, 13 ; L2 (q), q = 29, 37 ; PSU3 (8) ; M12. E8 – ceux de E7 et : Altn, n = 14, 15, 16, 17 ; L2 (q), q = 16, 31, 32, 41, 49, 61 ; L3 (5) ; PSp4 (5) ; G2 (3) ; 2 B2 (8) = Sz(8). (Les notations sont celles de l’ATLAS [15]. En particulier Ln(q) d´esigne le groupe PSLn(Fq). Vu que Alt5 = L2 (4) = L2 (5) et Alt6 = L2 (9), la liste pour G2 pourrait aussi ˆetre ´ecrite : G2 – L2 (q), q = 4, 5, 7, 8, 9, 13 ; SU3 (3) = G2 (2)′. De mˆeme, pour F4 , on peut remplacer Alt8 par L4 (2).) La v´erification de l’exactitude de cette table comporte deux parties. Tout d’abord : 2.4.1. Un groupe simple qui ne figure pas dans la table n’a pas de plongement projectif dans G. Comme on peut s’y attendre, le point de d´epart est la classification des groupes simples finis, qui est admise (le lecteur curieux de savoir quelle partie de cette classification reste `a d´emontrer pourra consulter Aschbacher [3]). Cela permet de passer en revue les diff´erents cas possibles : groupes altern´es, groupes de type alg´ebrique, groupes sporadiques. Pour ´eliminer un groupe S, on utilise des arguments vari´es, par exemple 1.2.2 ou 2.2.1 (qui suffisent si le groupe est tr`es gros), ou (dans les cas difficiles) la table des caract`eres du groupe. C’est un travail d´elicat. La moindre erreur peut conduire `a ´eliminer `a tort le groupe en question. C’est ce qui s’´etait pass´e

863-11 dans une liste pr´ec´edente [8] pour les groupes L2 (41), L2 (49) et Sz(8) qui avaient ´et´e d´eclar´es non plongeables dans E8 . 2.4.2. Tout groupe figurant dans la table a au moins un plongement projectif dans G. On utilise diff´erentes m´ethodes. Par exemple : a) Le cas le plus facile est celui o` u l’on connaˆıt un sous-groupe de G dans lequel S a un plongement projectif. Ainsi, pour traiter le cas de Alt10 et F4 , il suffit de remarquer que Alt10 a une repr´esentation orthogonale ´evidente de degr´e 9, autrement dit se plonge dans un groupe de type B4 , et l’on utilise le plongement de B4 dans F4 . b) Certains cas peuvent se traiter ` a partir de la table des caract`eres de S (et de ses extensions centrales). Outre G = G2 , d´ej` a signal´e, il faut mentionner le cas o` u 2 ′ G = E6 et o` u S est le groupe de Tits F4 (2) (Cohen–Wales [14]). On part du fait que le groupe S · 2 = 2 F4 (2) a une repr´esentation irr´eductible V de dimension 78 (cf. [15], p. 75). Un calcul de caract`eres montre que ∧2 V contient V ; il existe donc un homomorphisme non nul ∧2 V → V compatible avec l’action de S · 2, et un autre calcul de caract`eres montre que l’identit´e de Jacobi est satisfaite. D’o` u une structure d’alg`ebre de Lie sur V . Il est clair que cette alg`ebre de Lie est simple ; puisqu’elle est de dimension 78, elle est de type B6 , C6 ou E6 . On ´elimine les types B6 et C6 qui conduiraient `a des repr´esentations de S · 2 de degr´e trop petit. L’alg`ebre de Lie V est donc de type E6 , ce qui fournit un plongement de S · 2 dans E6ad, donc a fortiori un plongement de S. (On aimerait avoir davantage d’exemples de ce genre !) c) La plupart des autres plongements ont ´et´e construits au moyen de calculs sur ordinateur. Je renvoie `a [22] pour une description des m´ethodes employ´ees. Je signale seulement que les calculs ne se font pas sur le corps k, mais sur un corps fini Fℓ , o` u ℓ est un nombre premier ne divisant pas l’ordre de S et tel que Fℓ contienne les racines de l’unit´e intervenant dans la construction : ainsi, pour plonger L2 (61) dans E8 , Cohen–Griess–Lisser [9] choisissent ℓ = 1831. Le rel`evement de Fℓ ` a Zℓ (donc a` la caract´eristique 0) ne pr´esente aucune difficult´e vu que ℓ ne divise pas |S|. Il semble que, dans chaque cas, le calcul comporte suffisamment de v´erifications internes pour qu’on puisse lui faire confiance.

863-12 2.5. Compl´ ements 2.5.1. Classification en caract´eristique > 0 L’analogue de 2.4 en caract´eristique p a ´et´e fait par Liebeck–Seitz [27]. Tout groupe S intervenant en caract´eristique 0 intervient aussi en caract´eristique p (quel que soit p) ; c’est l`a une cons´equence simple de la th´eorie de Bruhat–Tits, cf. [31], § 5. Outre ces groupes, et ceux qui sont “de caract´eristique p”, Liebeck–Seitz donnent la liste suivante : G2 – p = 2 : J2 ; p = 5 : Alt7 ; p = 11 : J1 . F4 – ceux de G2 et p = 2 : L4 (3) ; p = 3 : L3 (4) ; p = 5 : Sz(8) ; p = 11 : M11, Alt11 . E6 – ceux de F4 et p = 2 : M12, Alt12, G2 (3), O7 (3), M22, J3 , F i22 ; p = 3 : M12, Alt12 ; p = 5 : M12 ; p = 7 : M22. E7 – ceux de E6 et p = 5 : M22, Ru, HS ; p = 7 : Alt14. E8 – ceux de E7 et p = 2 : L4 (5) ; p = 3 : Alt18, T h ; p = 5 : Sz(32). Noter en particulier le groupe de Janko J1 dans G2 (F11) et le groupe de Thompson T h dans E8 (F3 ). 2.5.2. Classes de conjugaison de plongements On aimerait pouvoir compl´eter la table 2.4 en d´ecrivant les plongements ` a conjugaison pr`es. Cela a ´et´e fait dans certains cas, mais pas dans tous, cf. [22]. Le cas des plongements de Alt5 dans E8 est particuli`erement int´eressant (cf. Frey [16]) ; on peut d´eterminer les triplets (x, y, z) de classes de conjugaison de E8 d’ordres (2, 3, 5) qui sont repr´esentables dans un mˆeme sous-groupe Alt5 . Pour tous ces triplets, sauf un (celui appel´e “844” dans [16]), Frey d´etermine le nombre de classes de conjugaison correspondantes (une ou deux). Par contre, pour le cas “844” (qui est le seul o` u le centralisateur du sous-groupe Alt5 soit fini), on ne sait pas combien il y a de classes de conjugaison ; on dispose de plusieurs tels sous-groupes (par exemple un sous-groupe du groupe de Borovik [7], ou un sous-groupe de L2 (41), ou de L2 (61),...), mais il n’est pas facile de voir s’ils sont ou non conjugu´es. Comme Alt5 admet la pr´esentation : (x, y, z | x2 = y 3 = z 5 = 1 , xyz = 1), c’est l` a un probl`eme analogue `a celui de la “rigidit´e” intervenant pour la classification des revˆetements galoisiens de la droite projective ramifi´es en 3 points.

863-13 2.5.3. Rationalit´e On sait que G provient par extension des scalaires d’un groupe d´eploy´e Gdep d´efini sur Q. Si S (ou S) est plongeable dans G(k), on peut se demander quels sont les sous-corps k ′ de k tels que S soit plongeable dans Gdep(k ′). Cette question est ´etroitement li´ee `a la pr´ec´edente (celle des classes de conjugaison) : voir l` a-dessus [19], App. 2. Voici un exemple typique : D’apr`es Aschbacher [2], le groupe S · 2 = G2 (2) admet un plongement dans G2 (k), et un seul, `a conjugaison pr`es. Or, ` a la fois S · 2 et G2 ont un centre trivial, et pas d’automorphisme externe. De plus, le centralisateur de 2 · S est trivial. Soit P l’ensemble de ces plongements ; c’est un G2 -torseur qui est d´efini de fa¸con naturelle sur Q. Il d´efinit donc une Q-forme G02 de G2 , et l’on peut plonger S · 2 dans G02 (Q) par d´efinition mˆeme de G02 . Or, il n’y a que deux formes de G2 sur Q, que l’on distingue par leurs points r´eels ; la forme d´eploy´ee ne peut pas contenir 2 · S : son compact maximal est trop petit. Ainsi, G02 est la forme non d´eploy´ee de G2 , celle qui correspond aux octonions usuels. On conclut de l` a que le plongement cherch´e de S · 2 dans Gdep(k ′) existe si et seulement si Gdep et G02 sont k ′-isomorphes, i.e. si et seulement si −1 est somme de 4 carr´es dans k ′. Un argument analogue montre √ ′ ′ que L2 (13) est plongeable dans Gdep(k ) si et seulement √ si k contient 13 et −1 est somme de 4 carr´es dans k ′ ; mˆeme chose pour L2 (8), avec 13 remplac´e par z9 +z 9 , o` u z9 est une racine primitive 9-`eme de l’unit´e. (Noter l’analogie de ces ´enonc´es avec le ′ suivant, connu depuis longtemps : Alt4 , Sym4 et Alt5 sont plongeables dans PGL 2 (k ) √ si et seulement si −1 est somme de 2 carr´es dans k ′ et (pour Alt5 ) k ′ contient 5.) BIBLIOGRAPHIE [1] J.F. ADAMS - 2-tori in E8 , Math. Ann. 287 (1987), 29-39 (= Selected Works, vol. II, 264-274). [2] M. ASCHBACHER - Chevalley groups of type G2 as the group of a trilinear form, J. Alg. 109 (1987), 193-259. [3] M. ASCHBACHER - Quasithin groups, in Algebraic Groups and their Representations (R. Carter and J. Saxl edit.), NATO AS series, vol. 517, 321-340, Kluwer, 1998. [4] A. BOREL - Sous-groupes commutatifs et torsion des groupes de Lie compacts connexes, Tˆohoku Math. J. 13 (1961), 216-240 (= Oe. II, n◦ 53 et Commentaires, 775-777). [5] A. BOREL and G.D. MOSTOW - On semi-simple automorphisms of Lie algebras, Ann. Math. 61 (1955), 389-405 (= A. Borel, Oe. I, n◦ 36). [6] A. BOREL et J.-P. SERRE - Sur certains sous-groupes des groupes de Lie compacts, Comm. Math. Helv. 27 (1953), 128-139 (= A. Borel, Oe. I, n◦ 24). [7] A.V. BOROVIK - A maximal subgroup in the simple finite group E8 (q), Contemp. Math. A.M.S. 131 (1992), vol. I, 67-79. [8] A.M. COHEN and R.L. GRIESS, Jr - On finite simple subgroups of the complex Lie groups of type E8 , AMS Proc. Symp. Pure Math. 47 (1987), vol. II, 367-405. [9] A.M. COHEN, R.L. GRIESS, Jr and B. LISSER - The group L(2, 61) embeds in the Lie group of type E8 , Comm. Alg. 21 (1993), 1889-1907.

863-14 [10] A.M. COHEN and G.M. SEITZ - The r-rank of the groups of exceptional Lie type, Indag. Math. 49 (1987), 251-259. [11] A.M. COHEN and D.B. WALES - Finite subgroups of G2 (C), Comm. Alg. 11 (1983), 441-459. [12] A.M. COHEN and D.B. WALES - Embeddings of the group L(2, 13) in groups of Lie type E6 , Israel J. Math. 82 (1993), 45-86. [13] A.M. COHEN and D.B. WALES - Finite simple subgroups of semisimple complex Lie groups – a survey, in Groups of Lie type and their geometries, LMS Lect. Notes 207 (1995), 77-96. [14] A.M. COHEN and D.B. WALES - Finite subgroups of F4 (C) and E6 (C), Proc. London Math. Soc. 74 (1997), 105-150. [15] J.H. CONWAY, R.T. CURTIS, S.P. NORTON, R.A. PARKER and R.A. WILSON - Atlas of Finite Groups, Clarendon Press, Oxford, 1985. [16] D. FREY - Conjugacy of alternating groups of degree 5 and SL(2, 5) subgroups of the complex Lie groups of type E8 , Memoirs AMS 634 (1998). [17] R.L. GRIESS, Jr - Elementary abelian subgroups of algebraic groups, Geom. Dedicata 39 (1991), 253-305. [18] R.L. GRIESS, Jr and A.J.E. RYBA - Embeddings of U (3, 8), Sz(8) and the Rudvalis group in algebraic groups of type E7 , Invent. math. 116 (1994), 215241. [19] R.L. GRIESS, Jr and A.J.E. RYBA - Embeddings of PGL(2, 31) and SL(2, 32) in E8 (C), Duke Math. J. 94 (1998), 181-211. [20] R.L. GRIESS, Jr and A.J.E. RYBA - Embeddings of PSL(2, 41) and PSL(2, 49) in E8 (C), J. Symb. Comp. 11 (1999), 1-17. [21] R.L. GRIESS, Jr and A.J.E. RYBA - Embeddings of Sz(8) into exceptional Lie groups, soumis au J. Crelle. [22] R.L. GRIESS, Jr and A.J.E. RYBA - Finite simple groups which projectively embed in an exceptional Lie group are classified !, Bull. AMS 36 (1999), 75-93. [23] A. GROTHENDIECK - Torsion homologique et sections rationnelles, S´em. Chevalley (1958), Anneaux de Chow et Applications, expos´e 5. [24] P.B. KLEIDMAN and A.J.E. RYBA - Kostant’s conjecture holds for E7 : L2 (37) < E7 (C), J. Alg. 161 (1993), 535-540. [25] M.-A. KNUS, A. MERKURJEV, M. ROST and J.-P. TIGNOL - The Book of Involutions, AMS Colloquium Publ. 44, 1998. [26] M.W. LIEBECK - Subgroups of exceptional groups, in Algebraic Groups and their Representations (R.W. Carter and J. Saxl edit.), NATO AS series, vol. 517, 275290, Kluwer, 1998. [27] M.W. LIEBECK and G.M. SEITZ - On finite subgroups of exceptional algebraic groups, 1999, `a paraˆıtre au J. Crelle. [28] A. MEURMAN - An embedding of PSL(2, 13) in G2 (C), Lect. Notes in Math. 933 (1982), 157-162. [29] Z. REICHSTEIN and B. YOUSSIN - Essential dimensions of algebraic groups and a resolution theorem for G-varieties, 1999, ` a paraˆıtre. [30] J.-P. SERRE - Cohomologie galoisienne : progr`es et probl`emes, S´em. Bourbaki 1993-94, expos´e n◦ 783 (SMF, Ast´erisque 227 (1995), 229-257).

863-15 [31] J.-P. SERRE - Exemples de plongements des groupes PSL2 (Fp) dans des groupes de Lie simples, Invent. math. 124 (1996), 525-562. [32] T.A. SPRINGER - Regular elements of finite reflection groups, Invent. math. 25 (1974), 159-198. [33] T.A. SPRINGER and R. STEINBERG - Conjugacy classes, Lect. Notes in Math. 131 (1970), 281-312 (= R. Steinberg, C.P., 293-323). [34] R. STEINBERG - Torsion in reductive groups, Adv. in Math. 15 (1975), 63-92 (= C.P., 415-444). [35] J. TITS - Normalisateurs de tores, I. Groupes de Coxeter ´etendus, J. Alg. 4 (1966), 96-116. [36] J. TITS - Sur les constantes de structure et le th´eor`eme d’existence des alg`ebres de Lie semi-simples, Publ. Math. IHES 31 (1966), 21-58. Jean–Pierre SERRE Coll`ege de France 3, rue d’Ulm F-75005 PARIS E-mail : [email protected]

S´eminaire BOURBAKI

Novembre 1999

52`eme ann´ee, 1999–2000, no 865

L’ORDRE DE DEHORNOY SUR LES TRESSES par Christian KASSEL

Une des d´ecouvertes r´ecentes les plus int´eressantes et inattendues concernant le groupe des tresses Bn d’Artin est due ` a Dehornoy qui a d´emontr´e fin 1991 que Bn a un ordre total invariant par multiplication ` a gauche. Il en r´esulte notamment que l’anneau du groupe Bn n’a pas de diviseurs de z´ero. Dehornoy d´eduit cet ordre de l’´etude g´en´erale des syst`emes autodistributifs, d´efinis comme des ensembles munis d’une loi de composition v´erifiant l’identit´e x(yz) = (xy)(xz). Des travaux sur un axiome ind´emontrable de th´eorie des ensembles avaient mis en ´evidence un syst`eme autodistributif remarquable et sugg´er´e que l’´etude de tels syst`emes devait donner des r´esultats non triviaux. Fenn, Greene, Rolfsen, Rourke et Wiest ont donn´e en 1997 une construction g´eom´etrique de l’ordre de Dehornoy. Leurs techniques ont permis ´egalement de mettre des structures d’ordre sur des groupes de diff´eotopies de surfaces. Plus r´ecemment, Thurston a indiqu´e comment construire un ordre total sur Bn en utilisant les travaux de Nielsen sur les surfaces. Le but de cet expos´e est de pr´esenter ces travaux ainsi que le lien inattendu avec la th´eorie des ensembles. Au no 1 nous ´enon¸cons le r´esultat principal sur l’ordre des tresses et quelques propri´et´es de cet ordre. Les deux num´eros suivants sont consacr´es a une pr´esentation des techniques de Dehornoy et ` ` a sa d´emonstration du r´esultat principal ; le lien entre tresses et syst`emes autodistributifs est expos´e au no 2 tandis qu’au no 3 nous ´etudions deux syst`emes autodistributifs particuli`erement importants. Au no 4 nous indiquons comment l’´etude des grands cardinaux en th´eorie des ensembles a ´et´e a` l’origine de ces travaux. La construction g´eom´etrique de Fenn et al. ainsi que l’approche `a la Nielsen seront pr´esent´ees au no 5. Pour plus de d´etails, le lecteur pourra consulter les r´ef´erences cit´ees, et notamment la monographie [D00] en cours d’ach`evement.

865-02 Thomas Delzant m’a aid´e `a comprendre l’id´ee de Thurston et ` a mettre le no 5.2 en forme. Je le remercie tr`es chaleureusement ainsi que Patrick Dehornoy, Dale Rolfsen et Bertold Wiest qui m’ont fait profiter de leurs commentaires.

´ 1. LES RESULTATS PRINCIPAUX Dans ce num´ero nous rappelons la d´efinition des groupes de tresses et celle des groupes ordonnables avant d’´enoncer le th´eor`eme principal de Dehornoy impliquant l’existence d’un ordre sur les tresses. 1.1. Le groupe des tresses d’Artin. Soit n un entier ≥ 2. D´efinissons Bn comme le groupe engendr´e par n − 1 g´en´erateurs σ1 , . . . , σn−1 soumis aux relations (1.1)

σi σj = σj σi

si |i − j| > 1 et (1.2)

σi σj σi = σj σi σj

si |i − j| = 1. On utilisera souvent le mot tresse pour d´esigner un ´el´ement de Bn . E. Artin a introduit le groupe Bn dans les ann´ees 1920 et a r´esolu le probl`eme des mots1 pour ce groupe (voir [A26], [A47]). En 1967 Garside [Ga] r´esout ` a la fois ce probl`eme et le probl`eme de conjugaison1 (voir aussi [Mk]). D’autres solutions ont ´et´e propos´ees, fond´ees notamment sur une forme normale due ` a Adyan [Ad], et red´ecouverte un peu plus tard par ElRifai et Morton [EM] et par Thurston, ce dernier ´elaborant `a cette occasion la th´eorie des groupes automatiques et ´etablissant l’automaticit´e de Bn (les r´esultats de Thurston sont expos´es au chapitre 9 de [E+]). Rappelons aussi que les groupes de tresses jouent un rˆ ole important dans des branches des math´ematiques aussi diverses que la th´eorie des nœuds, la th´eorie de l’homotopie, la g´eom´etrie alg´ebrique, la th´eorie des groupes, celle des repr´esentations, etc. (on trouvera un reflet de cette diversit´e dans [B+] et dans [Ca]). Un mot de tresse w est un mot form´e ` a partir des g´en´erateurs σ1 , . . . , σn−1 et de leurs inverses. Il est commode de repr´esenter w par une configuration plane form´ee par n intervalles, appel´es les brins de w, plong´es de mani`ere lisse dans une bande verticale born´ee du plan. Une telle configuration s’obtient comme suit. 1

R´ esoudre le probl` eme des mots (resp. le probl` eme de conjugaison) dans un groupe, c’est trouver

un algorithme permettant de reconnaˆıtre ou de d´ ecider si deux mots donn´ es repr´ esentent ou non le mˆ eme ´ el´ ement dans le groupe (resp. la mˆ eme classe de conjugaison).

865-03 (a) On repr´esente le g´en´erateur σi et son inverse σi−1 par les configurations de la figure 1. Le croisement de la configuration de σi (resp. de σi−1 ) est dit positif (resp. n´egatif). (b) Si D est la configuration associ´ee au mot w et D′ celle du mot w′ , alors la configuration associ´ee `a ww′ est obtenue en pla¸cant D au-dessus de D′ et en joignant les extr´emit´es inf´erieures des brins de D aux extr´emit´es sup´erieures de D′ . 1

2

i

i+1 A A ··· ··· A A

n

1

2

i

i+1

n

A

A ··· ··· A A A σi−1

σi Figure 1

1.2. Groupes ordonnables. Un groupe G est dit ordonnable s’il poss`ede un ordre total < invariant par multiplication ` a gauche, c’est-` a-dire v´erifiant a < b ⇒ ca < cb pour tout a, b, c ∈ G. Si, de plus, l’ordre est invariant par multiplication ` a droite (c’est-` a-dire a < b ⇒ ac < bc), on dit que le groupe est biordonnable. Pour tout groupe ordonnable G, notons P l’ensemble {x ∈ G | x > 1} de ses ´el´ements positifs. Le caract`ere total de l’ordre se traduit par la partition G = P ∐ {1} ∐ P −1 o` u P −1 = {x ∈ G | x−1 ∈ P }. L’invariance par multiplication a` gauche se traduit par P 2 ⊂ P , o` u P 2 est form´e des produits de deux ´el´ements de P dans G. R´eciproquement, s’il existe un sous-ensemble P de G v´erifiant G = P ∐ {1} ∐ P −1

et

P 2 ⊂ P,

alors G est ordonnable pour l’ordre d´efini par x < y si x−1 y ∈ P . L’ordre en question fait de G un groupe biordonnable si et seulement si xP x−1 ⊂ P pour tout x ∈ G. L’ordonnabilit´e d’un groupe a de nombreuses cons´equences (voir [MR], chap. 7 ou [Pa], chap. 13). D’abord, tout groupe ordonnable G est sans torsion. Si, de plus, R est un anneau sans diviseurs de z´ero, alors l’alg`ebre du groupe R[G] n’a pas de diviseurs de z´ero (elle v´erifie donc une fameuse conjecture de Kaplansky). Il en r´esulte que les seuls idempotents de R[G] sont triviaux, ` a savoir 0 ou 1. En outre, les seuls ´el´ements inversibles de R[G] sont triviaux, c’est-` a-dire de la forme rx o` u r est un ´el´ement inversible de R et x ∈ G. Les groupes libres de type fini, les groupes fondamentaux de surfaces ferm´ees, les groupes ab´eliens libres de type fini sont biordonnables. Pour ce qui concerne les

865-04 tresses, les groupes Bn ne sont pas biordonnables alors que les groupes de tresses pures le sont (cf. [KR] et [RZ]). 1.3. L’ordre de Dehornoy sur Bn . Pour i ∈ {1, . . . , n − 1}, on dit qu’un mot de la forme w0 σi w1 σi . . . σi wr est σi -positif si les sous-mots w0 , w1 , . . . , wr sont des mots dans les lettres σj±1 avec j > i. En d’autres termes, dans un mot σi -positif, le g´en´erateur σi d’indice minimal n’apparaˆıt qu’avec des puissances positives. S’il n’apparaˆıt qu’avec des puissances n´egatives, on dit que le mot est σi -n´egatif (donc un mot est σi -n´egatif si son inverse est σi -positif). Une tresse est dite σi -positive (resp. σi -n´egative) si elle peut ˆetre repr´esent´ee par un mot σi -positif (resp. σi -n´egatif). Par exemple, le mot σ1 σ2 σ1−N n’est pas σ1 -positif si N est un entier ≥ 1, mais la tresse qu’il repr´esente l’est (le montrer !). Nous dirons qu’une tresse est σ-positive (resp. σ-n´egative) s’il existe un entier i tel qu’elle est σi -positive (resp. σi -n´egative). On peut alors ´enoncer le th´eor`eme de Dehornoy. Th´ eor` eme 1.— Toute tresse diff´erente de 1 est soit σ-positive, soit σ-n´egative. La d´emonstration de ce th´eor`eme occupera les num´eros 2 et 3. Celui-ci a pour cons´equence les r´esultats nouveaux suivants non connus ant´erieurement. Corollaire.— (a) Pour tout n, le groupe Bn est ordonnable. (b) Pour tout n et tout anneau R sans diviseurs de z´ero, l’alg`ebre R[Bn ] du groupe Bn n’a pas de diviseurs de z´ero, ni d’unit´es ou d’idempotents non triviaux. ´monstration.— (a) Soit P l’ensemble des tresses σ-positives de Bn . Il est clair De que P 2 est inclus dans P . Le th´eor`eme 1 implique Bn = P ∐ {1} ∐ P −1 . Il en r´esulte que Bn est ordonnable. (b) C’est une cons´equence de (a) et des remarques faites au no 1.2.

⁄

1.4. Propri´ et´ es. L’ordre de Dehornoy ainsi d´efini est l’unique ordre total de Bn invariant par multiplication `a gauche tel que β σ1 β ′ > 1 pour tous les ´el´ements β, β ′ du sous-groupe de Bn engendr´e par σ2 , . . . , σn−1 . Dans [D97b] Dehornoy a construit un algorithme de r´esolution du probl`eme des mots fond´e sur l’ordre total des tresses. En pratique, cet algorithme est beaucoup plus efficace que les algorithmes ant´erieurs (mais le probl`eme reste ouvert de montrer qu’il est quadratique). Soit Bn+ le sous-mono¨ıde de Bn constitu´e des tresses repr´esent´ees par des produits des g´en´erateurs σ1 , . . . , σn−1 , mais non de leurs inverses. Laver [L96] a montr´e que l’ordre de Dehornoy prolonge l’ordre partiel consid´er´e par ElRifai et Morton dans [EM] ; il en d´eduit le r´esultat remarquable suivant, qui distingue probablement cet ordre parmi les ordres de Bn mentionn´es au no 5.2.

865-05 Th´ eor` eme 2.— L’ordre de Dehornoy restreint ` a Bn+ est un bon ordre. Rappelons qu’un ordre total sur un ensemble E est un bon ordre si toute partie de E a un ´el´ement minimal. Dans un bon ordre, chaque ´el´ement a un rang ; par exemple, le g´en´erateur σn−1 de Bn+ est le plus petit ´el´ement > 1. Comme tout ´el´ement de Bn poss`ede une ´ecriture canonique comme fraction de deux ´el´ements de Bn+ (voir [E+]), le th´eor`eme de Laver permet de sp´ecifier une tresse ` a l’aide d’un couple d’ordinaux. Burckel [Bu] a donn´e une autre preuve du th´eor`eme 2 et montr´e u ω d´esigne le plus petit ordinal infini. que le type de l’ordre de Bn+ est ω ω , o` Voir aussi l’article de Wiest [W] bas´e sur la d´efinition g´eom´etrique de l’ordre de Bn n−2

pr´esent´ee au no 5.1.

` 2. COLORIAGE DES TRESSES ET SYSTEMES AUTODISTRIBUTIFS Le but du no 2 est d’indiquer comment Dehornoy d´emontre le th´eor`eme 1. 2.1. Comment colorier les tresses ? L’id´ee n’est pas nouvelle ; elle a notamment ´et´e utilis´ee par Joyce [Joy], Matveev [Mt] et Brieskorn [Br] dans les ann´ees 1980. Partons d’un mot de tresse w repr´esentant un ´el´ement de Bn . Colorions de gauche a droite les extr´emit´es sup´erieures des brins de la configuration plane associ´ee ` ` a w avec les ´el´ements a1 , a2 , . . . , an d’un ensemble S. Si nous propageons ces couleurs le long des brins, nous lirons au bas de la configuration une suite de couleurs qui est une permutation de la suite a1 , a2 , . . . , an de d´epart : c’est ´evidemment la permutation sous-jacente `a la tresse. Les choses deviennent plus int´eressantes si nous autorisons les couleurs ` a interagir a chaque croisement des brins. Supposons que les croisements soient exclusivement ` positifs, c’est-`a-dire que le mot w soit un produit des g´en´erateurs σi et non de leurs inverses. On dira d’un tel mot qu’il est positif. D´ecidons qu’` a chaque croisement la couleur a du brin inf´erieur reste inchang´ee tandis que la couleur b du brin sup´erieur s’amalgame avec la couleur a de l’autre brin pour former une nouvelle couleur a∗b qui d´epend de a et de b (voir la figure 2). Ceci revient ` a munir S d’une loi de composition (a, b) 7→ a∗b. Proc´edant de cette mani`ere pour tous les croisements, nous construisons ainsi une action (`a droite) du mono¨ıde des mots de tresse positifs ` a n brins sur la puissance n-i`eme S n de l’ensemble S. Si on note ε le mot vide, alors cette action est d´efinie par r´ecurrence sur la longueur des mots par (a1 , . . . , an ) ε = (a1 , . . . , an ) et (2.1)

(a1 , . . . , an ) σi w = (a1 , . . . , ai−1 , ai ∗ ai+1 , ai , ai+2 , . . . , an ) w

865-06 o` u (a1 , a2 , . . . , an ) ∈ S n , w est un mot de tresse et 1 ≤ i < n. a

b

@

@ @ @

@

a∗b

a

Figure 2 Au no 1.4 nous avons d´efini Bn+ comme le sous-mono¨ıde du groupe Bn form´e des tresses repr´esent´ees par des mots positifs. On sait que le mono¨ıde Bn+ a une pr´esentation donn´ee par les relations (1.1) et (1.2). Lemme 1.— La formule (2.1) d´efinit une action du mono¨ıde Bn+ sur S n si et seulement si, pour tout a, b, c ∈ S, on a (AD)

a ∗ (b ∗ c) = (a ∗ b) ∗ (a ∗ b).

´monstration.— On se ram`ene aux calculs suivants o` De u a, b, c, d d´esignent des ´el´ements de l’ensemble S. Le premier calcul refl`ete la relation (1.1) : (a, b, c, d) σ1 σ3 = (a ∗ b, a, c ∗ d, c) = (a, b, c, d) σ3 σ1 . La relation non triviale (1.2) montre la n´ecessit´e de l’identit´e (AD) : ¡ ¢ (a, b, c) σ1 σ2 σ1 = (a ∗ b) ∗ (a ∗ c), a ∗ b, a , ¡ ¢ (a, b, c) σ2 σ1 σ2 = a ∗ (b ∗ c), a ∗ b, a .

⁄

D´ efinition.— Un syst`eme autodistributif (ou encore un syst`eme AD) est un ensemble muni d’une loi de composition v´erifiant la relation (AD) du lemme 1. Par la suite, on utilisera les notions ´evidentes de morphisme de syst`emes AD, de sous-syst`eme AD, de partie g´en´eratrice d’un syst`eme AD. 2.2. Ensembles automorphes. Dans ce num´ero, nous donnons des exemples de syst`emes autodistributifs. Il s’agit ici de ce que Brieskorn [Br] a appel´e des ensembles automorphes, `a savoir des syst`emes autodistributifs pour lesquels les multiplications a gauche b 7→ a ∗ b sont bijectives (ces syst`emes particuliers ont ´egalement ´et´e utilis´es ` sous d’autres noms, comme “wrack” chez Conway et Wraith, “rack” chez Fenn et

865-07 Rourke [FR], “crystal” chez Kauffman [Kau] ; on trouvera dans [FR] une introduction historique aux ensembles automorphes). Si S est un ensemble automorphe, alors l’action de Bn+ sur S n , qui est ` a valeurs dans un ensemble de bijections, s’´etend en une action du groupe Bn tout entier. On obtient ainsi une m´ethode syst´ematique de construction de repr´esentations de Bn , m´ethode dont les exemples (a) et (b) ci-dessous montrent l’int´erˆet. (a) (Conjugaison) Tout groupe G est muni d’une structure de syst`eme AD dont la loi de composition ∗ est d´efinie par a ∗ b = aba−1 o` u a, b ∈ G. Si G est le groupe libre Fn sur n g´en´erateurs x1 , . . . , xn , posons (y1 , . . . , yn ) = (x1 , . . . , xn ) β pour tout β ∈ Bn La correspondance (x1 , . . . , xn ) 7→ (y1 , . . . , yn ) d´efinit un automorphisme βb de Fn . L’application β 7→ βb−1 est l’homomorphisme injectif de groupes Bn → Aut(Fn ) bien connu (voir par exemple [BZ], chap. 10).

(b) (Barycentre) L’anneau Z[t, t−1 ] des polynˆ omes de Laurent ` a coefficients en-

tiers a une structure de syst`eme AD avec a ∗ b = (1 − t)a + tb o` u a, b ∈ Z[t, t−1 ]. L’action lin´eaire de Bn+ sur Z[t, t−1 ]n s’´etend en un homomorphisme de groupes Bn → GLn (Z[t, t−1 ]) : c’est la repr´esentation de Burau. Les ensembles automorphes pour lesquels a ∗ a = a pour tout a, comme dans les exemples (a) et (b), ont ´et´e appel´es “quandles” par Joyce [Joy] et “distributive groupoids” par Matveev [Mt] (tous deux ont utilis´e ce type de syst`emes AD pour classifier les nœuds dans R3 ). Voici deux autres exemples d’ensembles automorphes. (c) (Syst`emes de racines) Les vecteurs non nuls d’un espace vectoriel euclidien forment un ensemble automorphe : si a et b sont non nuls, on d´efinit a ∗ b comme l’image de b par la sym´etrie orthogonale par rapport ` a l’hyperplan orthogonal ` a a. En particulier, tout syst`eme de racines est un ensemble automorphe. (d) Si l’on note FX le groupe libre engendr´e par les ´el´ements d’un ensemble X, on peut munir l’ensemble-produit BX = FX × X d’une loi autodistributive par (w1 , x1 ) ∗ (w2 , x2 ) = (w1 x1 w1−1 w2 , x2 ) o` u w1 , w2 ∈ FX et x1 , x2 ∈ X. Le syst`eme BX est un ensemble automorphe libre ; tout ensemble automorphe S est quotient de BX o` u X est une partie g´en´eratrice de S. 2.3. Cycles et acyclicit´ e. Si a et b sont des ´el´ements d’un syst`eme autodistributif S, nous dirons que a divise b (`a gauche) s’il existe c ∈ S tel que b = a ∗ c. Un cycle est une suite (a1 , . . . , ak ) d’´el´ements de S tels que ai divise ai+1 pour tout i < k et ak divise a1 . On dit qu’un syst`eme AD est acyclique s’il ne poss`ede pas de cycle. Un ensemble automorphe n’est pas acyclique puisque tout ´el´ement se divise lui-mˆeme.

865-08 L’observation suivante montre l’int´erˆet des syst`emes acycliques. Sur un syst`eme autodistributif S on peut d´efinir une relation binaire ≺ comme suit : a ≺ b s’il existe un entier k ≥ 1 et des ´el´ements a1 , . . . , ak de S tels que a1 = a, ak = b et ai divise ai+1 pour tout i < k. La relation ≺ est transitive, et c’est une relation d’ordre partiel si S est acyclique. Avant les travaux de th´eorie des ensembles expos´es au no 4, on ne connaissait pas d’exemple de syst`eme acyclique. Proposition 1.— Il existe des syst`emes autodistributifs acycliques. ´monstration.— Il suffit d’exhiber un exemple. Voici celui de Larue [La] qui De utilise l’image dans les automomorphismes d’un groupe libre de l’op´eration sur les tresses que nous d´ecrirons au no 3.3. Soit F∞ le groupe libre sur une infinit´e d´enombrable de lettres x1 , x2 , . . . et Aut(F∞ ) le groupe de ses automorphismes de groupe. Nous allons munir Aut(F∞ ) d’une loi autodistributive ∗. Soit α l’automorphisme de F∞ d´etermin´e par  −1   x1 x2 x1 α(xi ) = x1   xi

si i = 1, si i = 2, si i > 2,

et T0 l’endomorphisme de F∞ donn´e par T0 (xi ) = xi+1 pour tout i ≥ 0. Ce dernier permet de d´efinir l’endomorphisme T de Aut(F∞ ) par les formules T (ϕ)(x1 ) = x1 et T (ϕ)(xi ) = T0 (ϕ(xi−1 )) si i > 1 et ϕ ∈ Aut(F∞ ). Pour ϕ et ψ ∈ Aut(F∞ ), posons (2.2)

ϕ ∗ ψ = ϕ ◦ T (ψ) ◦ α ◦ T (ϕ−1 ).

On v´erifie par un calcul direct que la loi de composition ∗ est autodistributive. Nous affirmons que le syst`eme (Aut(F∞ ), ∗) est acyclique. En effet, soit E l’ensemble des ´el´ements de F∞ dont l’expression r´eduite en les g´en´erateurs x1 , x2 , . . . et leurs inverses se termine par x−1 el´ement 1 . On observe d’abord que α, ainsi que tout ´ ϕ ∈ Aut(F∞ ) qui est dans l’image du d´ecalage T , pr´eserve le sous-ensemble E. Supposons maintenant que le syst`eme Aut(F∞ ) poss`ede un cycle. Cette hypoth`ese se traduit par une ´egalit´e de la forme ϕ = ϕ◦T (ϕ0 )◦α◦T (ϕ1 )◦· · ·◦T (ϕk−1 )◦α◦T (ϕk ), o` u k ≥ 1 et ϕ, ϕ0 , . . . , ϕk−1 , ϕk sont des automorphismes de F∞ . De mani`ere ´equivalente, on a (2.3)

id = T (ϕ0 ) ◦ α ◦ T (ϕ1 ) ◦ · · · ◦ T (ϕk−1 ) ◦ α ◦ T (ϕk )

o` u id repr´esente l’automorphisme identit´e de F∞ . Appliquons les deux membres de (2.3) ` a l’´el´ement x1 de F∞ . A gauche, on obtient x1 qui n’appartient pas au sous-ensemble E. Par contre, comme (α ◦ T (ϕk ))(x1 ) = α(x1 ) = x1 x2 x−1 1 appartient a E, il r´esulte de l’observation ci-dessus que l’´el´ement de F∞ obtenu en appliquant le ` membre de droite de (2.3) `a x1 appartient ` a E. D’o` u une contradiction.

⁄

865-09 2.4. Retournement des mots. Nous avons vu au no 2.1 comment d´efinir une action du mono¨ıde Bn+ sur la puissance n-i`eme d’un syst`eme AD S et au no 2.2 que cette action s’´etend au groupe Bn tout entier si (et seulement si) S est un ensemble automorphe. Or, `a la vue des remarques faites au no 2.3 et des travaux dont nous parlerons au no 4, la question se pose d’´etendre l’action du mono¨ıde Bn+ ` a Bn lorsque S est acyclique. En d´eveloppant une m´ethode sp´ecifique, dite de retournement des mots, Dehornoy a r´eussi `a d´efinir une action partielle de Bn sur S n lorsque S est un syst`eme AD simplifiable (`a gauche), c’est-` a-dire un syst`eme pour lequel les multiplications ` a gauche sont injectives. On dit qu’un mot de tresse w se transforme par retournement (` a gauche) en le mot w′ si w′ s’obtient en rempla¸cant dans w des facteurs du type σi σj−1 par le mot vide si i = j, par σj−1 σi si |i − j| > 1, et par σj−1 σi−1 σj σi si |i − j| = 1. Par d´efinition du retournement, w et w′ repr´esentent le mˆeme ´el´ement dans Bn . Garside [Ga] avait d´emontr´e que toute tresse est le quotient de deux tresses repr´esent´ees par des mots de tresse positifs. Dehornoy reprend les ingr´edients de l’approche de Garside, mais travaille sur les mots de tresse plutˆ ot que sur les tresses, ce qui lui permet d’´etablir dans [D97a] le r´esultat plus fin suivant. Lemme 2.— Tout mot de tresse se transforme par retournement en un mot de la forme u−1 v o` u u et v sont des mots de tresse positifs. Remarquons qu’il n’est pas ´evident a priori que l’algorithme de retournement converge en un nombre fini d’´etapes car la longueur des mots peut augmenter ` a chaque −1 −1 −1 retournement ; on pourra observer ce ph´enom`ene sur le mot σ2 σ4 σ6 σ5 σ3 σ1 . Signalons que des techniques analogues de retournement des mots permettent la construction de formes normales et de structures automatiques pour d’autres groupes dont les groupes d’Artin de groupe de Coxeter fini (voir [D98], [DP]). Soit maintenant S un syst`eme AD simplifiable et n un entier ≥ 2. L’action ` a droite (~a, w) 7→ ~aw du mono¨ıde Bn+ sur le produit S n , donn´ee par la formule (2.1), se prolonge `a certains ´el´ements (~a, w) de S n × Bn de fa¸con que les r`egles de coloriage restent v´erifi´ees. C’est par exemple le cas de (~bu, u−1 ) avec b ∈ S n et u ∈ B + . Dans n

ce cas, on dira que l’´el´ement ~aw est d´efini. Lemme 3.— Soit S un syst`eme AD simplifiable et ~a ∈ S n . Si le mot de tresse w se transforme par retournement en w′ et si ~aw′ est d´efini, alors ~aw est d´efini. Les lemmes 2 et 3 impliquent la proposition suivante selon laquelle on peut toujours trouver un ensemble de couleurs dans un syst`eme AD simplifiable pour colorier une tresse donn´ee en suivant la r`egle ´enonc´ee au no 2.1.

865-10 Proposition 2.— Soit S un syst`eme AD simplifiable. Pour tout mot de tresse w, il existe ~a ∈ S n tel que ~aw soit d´efini. Si w et w′ repr´esentent la mˆeme tresse et que ~aw et ~aw′ soient d´efinis, alors ~aw = ~aw′ . ´monstration.— Contentons-nous d’´etablir la premi`ere assertion. D’apr`es le De lemme 2, w se transforme par retournement en w′ = u−1 v o` u u et v sont des mots positifs. Posons ~a = ~bu o` u ~b est n’importe quel ´el´ement de S n . Alors ~aw′ = ~bv est d´efini. On termine en appliquant le lemme 3. Pour ´etablir la seconde assertion, on utilise une version ` a droite du retournement des mots de tresse et l’hypoth`ese que le syst`eme est simplifiable. ⁄ 2.5. D´ emonstration du th´ eor` eme 1. Supposons que nous disposions d’un syst`eme autodistributif S acyclique et monog`ene (c’est-` a-dire engendr´e par un seul ´el´ement) tel que l’ordre ≺ associ´e (d´efini au no 2.3) soit total. On v´erifie que a ≺ b implique c ∗ a ≺ c ∗ b, d’o` u l’on d´eduit que S est simplifiable. Puisque S poss`ede un ordre total, on peut munir chaque puissance S n de S de l’ordre total lexicographique ≺ℓ d´efini par (a1 , . . . , an ) ≺ℓ (b1 , . . . , bn ) s’il existe i ≥ 1 tel que aj = bj pour tout j < i et ai ≺ bi . Nous utilisons l’ordre total ≺ℓ sur S n pour d´efinir une partie “positive” P de Bn comme suit. Si w est un mot de tresse, alors, d’apr`es la proposition 2, il existe ~a ∈ S n tel que ~aw soit d´efini. Nous dirons que la tresse repr´esent´ee par w est dans P si ~a ≺ℓ ~aw. Proposition 3.— Une tresse est dans P si et seulement si elle est σ-positive. La relation β < β ′ d´efinie sur Bn par β −1 β ′ ∈ P est une relation d’ordre total invariant par multiplication ` a gauche, qui co¨ıncide avec l’ordre de Dehornoy du no 1.3. ´monstration.— Montrons que, si un mot de tresse est σ-positif, alors il De repr´esente une tresse du sous-ensemble P d´efini ci-dessus. Un mot σi -positif w est de la forme w = w0 σi w1 σi . . . σi wk o` u w0 , w1 , . . . , wk sont des mots dans les lettres σj et σj−1 avec j > i. Soit ~a = (a1 , . . . , an ) ∈ S n tel que ~aw = (b1 , . . . , bn ) ∈ S n soit d´efini. La formule (2.1) implique que bj = aj pour tout j < i et que bi est de la forme bi = (· · · ((a1 ∗ c1 ) ∗ c2 ) ∗ · · ·) ∗ ck o` u c1 , c2 , . . . , ck ∈ S et k est le nombre d’occurrences de σi dans w. Par d´efinition de l’ordre ≺ de S, il en r´esulte que ai ≺ bi . Par cons´equent, ~a ≺ℓ ~aw et w ∈ P . La r´eciproque, `a savoir qu’une tresse dans P est σ-positive, utilise la notion de tresse sp´eciale que nous introduirons au no 3.3, et sera d´emontr´ee au no 3.4. Une fois l’´equivalence pr´ec´edente ´etablie, il est clair que la relation < est bien d´efinie et que c’est l’ordre total du no 1.3, dont l’existence est ainsi d´emontr´ee.

⁄

865-11 ` ´ 3. SYSTEME AUTODISTRIBUTIF LIBRE ET TRESSES SPECIALES Nous ´etudions maintenant deux syst`emes autodistributifs particuliers. Le premier est libre et fournit le type de syst`emes n´ecessaires ` a la d´emonstration du th´eor`eme 1, telle qu’elle est donn´ee au no 2.5. Le second est constitu´e de tresses. 3.1. Le syst` eme autodistributif libre sur un g´ en´ erateur. Il est caract´eris´e par la propri´et´e universelle suivante. Proposition 4.— Il existe un syst`eme autodistributif D1 engendr´e par un singleton {x} tel que, pour tout syst`eme autodistributif S et tout ´el´ement s de S, il existe un unique morphisme f : D1 → S de syst`emes AD v´erifiant f (x) = s. Le syst`eme D1 est unique ` a isomorphisme pr`es. ´monstration.— L’unicit´e est claire. Pour l’existence, on consid`ere le magma De libre M sur un g´en´erateur x (voir [Bo], I, § 7, no 1). Les ´el´ements de M sont des parenth´esages complets de puissances strictement positives de la lettre x. Notons ∗ la loi de composition du magma. Sur M on consid`ere la relation d’´equivalence ≡AD invariante par composition et engendr´ee par les paires (t1 ∗(t2 ∗t3 ), (t1 ∗t2 )∗(t1 ∗t3 )). On d´efinit D1 comme l’ensemble des classes d’´equivalence M/≡AD . On v´erifie ais´ement que D1 est un syst`eme AD satisfaisant ` a la propri´et´e universelle ci-dessus.

⁄

Rappelons la relation binaire ≺ introduite au no 2.3. Le th´eor`eme suivant, ´etabli par Dehornoy dans [D94], fournit l’exemple qui nous manquait au no 2.5 pour construire un ordre total sur les groupes de tresses. Th´ eor` eme 3.— Le syst`eme autodistributif D1 est acyclique et la relation ≺ le munit d’un ordre total. Le syst`eme libre D1 est un ensemble de classes d’´equivalence de parenth´esages pour la relation ≡AD d´efinie dans la preuve de la proposition 4. Avant de d´emontrer le th´eor`eme 3, ´etablissons quelques propri´et´es de ces parenth´esages. Pour tout entier n ≥ 1 d´efinissons les puissances droites x[k] de x par x[1] = x et x[k] = x ∗ x[k−1] si k > 1. La relation d’´equivalence ≡AD v´erifie la propri´et´e fondamentale d’absorption suivante. Lemme 4.— Pour tout parenth´esage t, on a x[k+1] ≡AD t ∗ x[k] pour tout k suffisamment grand. ´monstration.— On proc`ede par r´ecurrence sur la longueur de t. Si t = x, De alors x[k+1] = t ∗ x[k] par d´efinition des puissances droites. Si t = t1 ∗ t2 , et si

865-12 x[k+1] ≡AD t1 ∗ x[k] et x[k+1] ≡AD t2 ∗ x[k] pour tout k suffisamment grand, alors x[k+2] ≡AD t1 ∗ x[k+1] ≡AD t1 ∗ (t2 ∗ x[k] ) ≡AD (t1 ∗ t2 ) ∗ (t1 ∗ x[k] ) ≡AD t ∗ x[k+1] . La troisi`eme ´equivalence est une cons´equence de la d´efinition de ≡AD .

⁄

Nous dirons qu’un parenth´esage t′ est une expansion d’un parenth´esage t si on l’obtient en rempla¸cant `a partir de t des sous-expressions de la forme t1 ∗ (t2 ∗ t3 ) par (t1 ∗ t2 ) ∗ (t1 ∗ t3 ), c’est-`a-dire en appliquant l’identit´e (AD), exclusivement de la gauche vers la droite. Il est clair que t′ ≡AD t si t′ est une expansion de t. On a la r´eciproque suivante. Lemme 5.— Si t1 et t2 sont des parenth´esages tels que t1 ≡AD t2 , alors ils ont une expansion commune. D´efinissons maintenant les sous-termes gauches Gk (t) d’un parenth´esage t. Si t = x, seul G0 (t) = t est d´efini. En g´en´eral, posons G0 (t) = t et, si t = t1 ∗ t2 et k ≥ 1, posons Gk (t) = Gk−1 (t1 ) si ce dernier est d´efini. On a Gℓ (Gk (t)) = Gk+ℓ (t) lorsque ces expressions sont d´efinies. Notons que l’´el´ement de D1 repr´esent´e par un sousterme gauche Gk (t), o` u k ≥ 1, est plus petit pour l’ordre ≺ que l’´el´ement repr´esent´e par t. Lemme 6.— Si t′ est une expansion de t, alors, pour tout k tel que Gk (t) soit d´efini, il existe un entier k ′ ≥ k tel que Gk′ (t′ ) soit une expansion de Gk (t). 3.2. D´ emonstration du th´ eor` eme 3. Si le syst`eme libre D1 n’´etait pas acyclique, il en serait de mˆeme de tout syst`eme AD, ce qui contredirait la proposition 1. Montrons maintenant que deux ´el´ements quelconques de D1 sont comparables pour l’ordre ≺. Plus pr´ecis´ement, soit y et z deux ´el´ements de D1 que nous repr´esentons respectivement par des parenth´esages t1 et t2 . Il s’agit d’´etablir que soit y = z, soit y ≺ z, soit z ≺ y. D’apr`es le lemme 4, il existe un entier k ≥ 1 tel que t1 ∗ x[k] ≡AD t2 ∗ x[k] . Le lemme 5 nous permet d’affirmer que les parenth´esages t1 ∗ x[k] et t2 ∗ x[k] ont une expansion commune t′ . Le lemme 6 implique l’existence d’entiers naturels p et q tels que Gp (t′ ) soit une expansion de G1 (t1 ∗ x[k] ) = t1 et que Gq (t′ ) soit une expansion de G1 (t2 ∗ x[k] ) = t2 . Les parenth´esages Gp (t′ ) et Gq (t′ ) repr´esentent respectivement les ´el´ements y et z de D1 . Trois cas se pr´esentent ` a nous : (i) si p = q, alors Gp (t′ ) = Gq (t′ ), et donc y = z ; (ii) si p > q, alors Gp (t′ ) = Gp−q (Gq (t′ )), et donc y ≺ z. (iii) si p < q, alors Gq (t′ ) = Gq−p (Gp (t′ )), et donc z ≺ y.

⁄

865-13 3.3. Une loi autodistributive sur les tresses. Pour achever la d´emonstration de la proposition 3 du no 2.5, nous allons introduire ce que Dehornoy appelle des tresses sp´eciales. Dans ce but, consid´erons la limite inductive B∞ des groupes de tresses Bn pour les inclusions ´evidentes ; une pr´esentation du groupe B∞ est obtenue en prenant une famille infinie de g´en´erateurs σi index´ee par les entiers ≥ 1 et les relations (1.1) et (1.2). Soit T l’endomorphisme injectif de B∞ d´efini par T (σi ) = σi+1 pour tout i ≥ 1. Posons (3.1)

α ∗ β = α T (β) σ1 T (α−1 ).

Proposition 5.— La formule (3.1) munit B∞ d’une structure de syst`eme AD simplifiable et acyclique. ´monstration.— Nous laissons au lecteur le soin de v´erifier que B∞ est un De syst`eme AD simplifiable. Pour ´etablir son acyclicit´e, on observe que l’homomorphisme de groupes B∞ → Aut(F∞ ) qui est la limite inductive des homomorphismes Bn → Aut(Fn ) mentionn´es au no 2.2 (a) transporte la loi (3.1) sur la loi (2.2). Comme le syst`eme (Aut(F∞ ), ∗) est acyclique, il en est de mˆeme de (B∞ , ∗).

⁄

Dans le syst`eme autodistributif B∞ , consid´erons le sous-syst`eme Bsp engendr´e par la tresse unit´e 1. Les ´el´ements de Bsp sont appel´es tresses sp´eciales. Exemples de tresses sp´eciales : 1∗1 = σ1 , 1∗(1∗1) = σ2 σ1 , (1∗1)∗1 = σ12 σ2−1 , 1∗(1∗(1∗1)) = σ3 σ2 σ1 . Proposition 6.— Le syst`eme autodistributif Bsp est acyclique et la relation ≺ le munit d’un ordre total. ´monstration.— Le syst`eme Bsp h´erite l’acyclicit´e de B∞ . La relation ≺ est De donc une relation d’ordre sur Bsp . Il reste ` a montrer que deux ´el´ements quelconques de Bsp sont comparables pour ≺. Comme Bsp est engendr´e par le singleton {1}, c’est un quotient du syst`eme libre D1 . Par le th´eor`eme 3, deux ´el´ements quelconques de D1 sont comparables pour ≺, donc, par projection, il en est de mˆeme dans Bsp .

⁄

L’argument p´ec´edent montre que, dans tout syst`eme AD acyclique et monog`ene, la relation ≺ est une relation d’ordre total. En fait, comme l’a montr´e Laver [L92], tout syst`eme AD acyclique monog`ene est isomorphe ` a D1 . En particulier, Bsp ∼ = D1 . L’int´erˆet des tresses sp´eciales vient de la possibilit´e d’exprimer toute tresse en termes de produit de tresses sp´eciales.

865-14 Lemme 7.— Pour tout β ∈ Bn , il existe 2n tresses sp´eciales α1 , . . . , αn , γ1 ,. . . , γn telles que (3.2)

β = T n−1 (αn )−1 . . . T (α2 )−1 α1−1 γ1 T (γ2 ) . . . T n−1 (γn ).

´monstration.— Comme Bsp est un syst`eme AD simplifiable, nous pouvons apDe n . En particulier, pliquer la proposition 2, qui fournit une action partielle de Bn sur Bsp n pour toute tresse β ∈ Bn , il existe des n-uples (α1 , . . . , αn ) et (γ1 , . . . , γn ) ∈ Bsp tels que (α1 , . . . , αn ) β = (γ1 , . . . , γn ). On v´erifie alors facilement l’´egalit´e des produits

α1 T (α2 ) . . . T n−1 (αn ) β = γ1 T (γ2 ) . . . T n−1 (γn ) dans le groupe B∞ , d’o` u la formule (3.2). 3.4. Fin de la preuve de la proposition 3.

⁄ Supposons que α et γ soient

deux tresses sp´eciales. On a ou bien α ≺ γ, ou bien α = γ, ou bien γ ≺ α. Revenant a` la d´efinition de la relation ≺ et de la loi (3.1), on voit que les trois relations pr´ec´edentes entraˆınent respectivement que la tresse α−1 γ est σ1 -positive, ´egale ` a 1, ou σ1 -n´egative. Si maintenant β est une tresse quelconque, on consid`ere une d´ecomposition de type (3.2) de β : si i est le plus petit indice tel que αi 6= γi , alors β est σi -positive ou σi -n´egative suivant que αi ≺ γi ou γi ≺ αi , ce qui ach`eve la preuve de la proposition 3.

⁄

´ 4. RAPPORT AVEC LA THEORIE DES ENSEMBLES Dans ce num´ero nous expliquons comment des d´eveloppements en th´eorie des ensembles ont men´e `a la construction d’un ordre total sur les tresses. 4.1. Grands cardinaux et extensions de ZF. On sait depuis le th´eor`eme d’incompl´etude de G¨odel que le syst`eme ZF d’axiomes de Zermelo-Fraenkel est incomplet, c’est-` a-dire qu’il existe des ´enonc´es qui sont ind´ecidables dans ZF. C’est le cas de l’axiome du choix et de l’hypoth`ese du continu. D`es lors, le but principal de la th´eorie des ensembles consiste `a ´etudier, voire classifier, les extensions du syst`eme ZF dans lesquels les ´enonc´es ouverts deviennent d´ecidables. G¨ odel a ´emis l’id´ee que ces extensions pourraient ˆetre classifi´ees `a l’aide d’axiomes de grands cardinaux comme celui qui postule l’existence de ℵ1 . L’un des premiers axiomes consid´er´es a ´et´e celui qui affirme

865-15 l’existence d’un cardinal inaccessible.2 Non seulement cet axiome est ind´emontrable dans ZF, mais encore — `a la diff´erence de l’axiome du choix ou de l’hypoth`ese du continu — sa coh´erence, c’est-`a-dire le fait qu’il ne soit pas contradictoire, ne peut y ˆetre ´etablie. Dans les ann´ees 1960 une hi´erarchie totalement ordonn´ee d’axiomes de grands cardinaux est apparue en th´eorie des ensembles, s’imposant comme les bonnes extensions de ZF (voir la monographie [Kan]). Nous allons nous int´eresser au no 4.2 ` a un axiome particulier de cette hi´erarchie. 4.2. Plongements ´ el´ ementaires. Un ensemble infini se caract´erise par l’existence d’une injection non bijective. Une telle injection ne pr´eserve pas n´ecessairement toutes les structures de l’ensemble consid´er´e : ainsi l’application n 7→ n + 1 de l’ensemble des entiers naturels dans lui-mˆeme pr´eserve l’ordre naturel, mais non l’addition. Pour d´efinir des notions d’infini plus fortes, il est naturel de postuler l’existence d’une injection non bijective d’un ensemble dans lui-mˆeme, pr´eservant toutes les propri´et´es d´efinissables par les op´erations ensemblistes de base. Appelons plongement ´el´ementaire une telle injection et autosimilaire un ensemble pour lequel il existe un plongement ´el´ementaire. On d´emontre assez facilement qu’un ensemble autosimilaire est forc´ement tr`es grand : son cardinal doit ˆetre inaccessible, ce qui entraˆıne que l’existence d’un tel ensemble ne peut ˆetre d´emontr´ee dans ZF. Il est usuel en th´eorie des ensembles de consid´erer des ensembles particuliers appel´es rangs, qui ont la propri´et´e technique que toute fonction d’un rang R dans lui-mˆeme est (essentiellement) un ´el´ement de R. Les axiomes affirmant l’existence de plongements ´el´ementaires d’un rang dans un autre ou d’un rang dans lui-mˆeme ont ´et´e au cœur de la th´eorie des ensembles dans les ann´ees 1980. Un des r´esultats majeurs obtenus `a l’aide de tels axiomes a ´et´e la d´emonstration en 1984 par Martin et Steel de la propri´et´e de d´etermination pour les ensembles projectifs de r´eels, un ´enonc´e technique qui, d’une certaine fa¸con, d´ecrit compl`etement la structure fine de la droite r´eelle (voir [D89]). L’axiome qui nous int´eresse est le suivant. Axiome A.— Il existe un rang autosimilaire. 4.3. Le syst` eme autodistributif d’un rang autosimilaire. Notons ER l’ensemble des plongements ´el´ementaires du rang autosimilaire R dont nous venons de postuler l’existence. L’ensemble ER est trivialement muni d’une structure de mono¨ıde pour la composition des plongements. Mais, en vertu de l’axiome A et des propri´et´es 2

α est inaccessible si tout ensemble de parties d’un ensemble de cardinalit´ e 0 (Pr−1 , O). La semi-orthogonalit´e de T = hD b (Y )−r+1 , Db (Y )−r+2 , . . . , Db (Y )−1 , Db (X)0 i s’´etablit par la mˆeme technique que dans la preuve de la proposition 4.1. Il reste `a ´etablir que ⊥ T est nul. Soit y ∈ Y . On a Ld p∗ Oy ≃ Ωdp−1 (y) (d) pour 0 ≤ d ≤ r − 1 et Ld p∗ Oy = 0 pour d ≥ r. On a H ∗ (Pr−1 , Ωd (d)) = 0 pour 1 ≤ d ≤ r − 1 et la r´esolution de la diagonale dans Pr−1 (cf. l’exemple 2.6) montre que, pour 1 ≤ d ≤ r−1, Ωd (d) est dans la sous-cat´egorie de D b (Pr−1) engendr´ee par O(−r+1), . . . , O(−1). Par cons´equent, le cˆone du morphisme canonique Lp∗ Oy → Op−1 (y) est dans T , donc finalement Op−1 (y) est dans T et on termine comme pour la proposition 4.1. Remarque 4.3. — Les arguments essentiels pour les deux r´esultats pr´ec´edents apparaissent aussi dans les travaux de Thomason [56, 57] qui s’int´eresse `a la K-th´eorie sup´erieure. 4.3. Flips et flops standard Soient X une vari´et´e projective lisse et Y une sous-vari´et´e ferm´ee isomorphe `a Pk ˜ → X l’´eclat´ee de X le long telle que NY /X ≃ OY (−1)l+1 avec 1 ≤ l ≤ k. Soit p : X de Y . Le diviseur exceptionnel Y˜ est isomorphe `a Pk × Pl et on a NY˜ /X˜ ≃ O(−1, −1). ˜ → X + la contraction de Y˜ sur Pl . On suppose que X + est une vari´et´e Soit p+ : X ¯ et f + : X + → X ¯ les contractions de Pk et Pl sur un projective. Soient f : X → X point. Ils fournissent l’exemple le plus simple de flip (et de flop lorsque k = l). On a ˜ ≃ X ×X¯ X + . X Y˜ ≃ Pk × Pl oo ooo o o o w oo o

_

j

OOO OOO OOO OOO '

˜ PP Y + ≃ _ Pl X PPP ooo o P o PPP oo PPP ooop + o PPP p o o o o ' w + X PPP nX n PPP n PPP nnn PPP nnn+ n n f PPP n f ' wnnn

Pk ≃ _ Y

¯ X

Les conjectures 1.1 et 1.2 sont connues dans ce cas (cf. [6, Theorem 3.6] et [48, Theorem 2.2.9]) :

946–16

Th´ eor` eme 4.4 (Bondal-Orlov). — Le foncteur ΦOX˜ = Rp∗ L(p+ )∗ : D b (X + ) → D b (X) est pleinement fid`ele et c’est une ´equivalence si l = k. ˜ Preuve (esquisse) — Soit A (resp. B) la sous-cat´egorie triangul´ee pleine de D b (X) engendr´ee par les j∗ O(r, s) avec r = 0 et −l ≤ s ≤ −1 (resp. −k ≤ r < 0 et −l ≤ s ≤ −1). Les d´ecompositions du th´eor`eme 4.2 et de l’exemple 2.6 donnent une d´ecomposition semi-orthogonale (Lp∗ D(X))⊥ = hB, Ai. On a B ⊂ (L(p+ )∗ D b (X + ))⊥ . Puisque (ωX˜ )|Y˜ ≃ O(−k, −l), on a aussi A ⊗ ωX˜ ⊂ (L(p+ )∗ D b (X + ))⊥ , donc A ⊂ ⊥ (L(p+ )∗ D b (X + )). Soit C ∈ D b (X + ) et soit C¯ le cˆone du morphisme canonique Lp∗ Rp∗ (L(p+ )∗ C) → L(p+ )∗ C. On a C¯ ∈ (Lp∗ D(X))⊥ ∩ ⊥ B = A. Par cons´equent, le morphisme canonique Hom(C, D) → Hom(Rp∗ L(p+ )∗ C, Rp∗L(p+ )∗ D) est un isomorphisme pour tout D ∈ D b (X + ). ! Supposons maintenant k = l. Soit p! = Lp∗ (−) ⊗ ωX/X [k]. Le foncteur Rp+ ˜ ∗p est adjoint `a droite de Rp∗ L(p+ )∗ . On montre, comme ci-dessus, que Rp+ [k] ⊗ ˜ ∗ (ωX/X ∗ + ∗ Lp (−)) est pleinement fid`ele et finalement Rp∗ L(p ) est une ´equivalence. Remarque 4.5. — Il devrait en fait ˆetre vrai que D b (X)/Rp∗ L(p+ )∗ D b (X + ) a une suite exceptionnelle compl`ete de longueur k − l. 4.4. Flop de Mukai 4.4.1. Soit X une vari´et´e projective lisse de dimension 2n ≥ 4. Soit i : Y = Pn ֒→ X une immersion ferm´ee. On suppose NY /X ≃ Ω1Y . On consid`ere comme pr´ec´edemment ˜ → X. Soit Y ∨ l’espace projectif dual. Alors, le diviseur exceptionnel l’´eclatement p : X Y˜ s’identifie `a la vari´et´e d’incidence dans Y × Y ∨ et on a NY˜ /X˜ ≃ O(−1, −1)|Y˜ . On a ˜ → X + de Y˜ sur Y ∨ et on suppose X + projective. alors une contraction p+ : X Le foncteur Rp∗ L(p+ )∗ : D b (X + ) → D b (X) n’est pas une ´equivalence (cf. [29, Proposition 5.12] et [43, Corollary 2.2]). Par contre, un autre noyau fournit une ´equivalence (cf. [29, Corollary 5.7] et [43, Theorem 4.4]). ¯ et f + : X + → X ¯ les contractions de Y et Y + sur un point (flop Soient f : X → X ˆ = X ×X¯ X + . Alors, X ˆ =X ˜ ∪ (Y × Y + ) ⊂ X × X + et l’intersection de Mukai). Soit X est `a croisements normaux.

π

ˆ B X B

BB π+ BB BB

X+

X@ @

@@ @@ f @@

¯ X

| || || + | }|| f

Th´ eor` eme 4.6 (Kawamata, Namikawa). — Le foncteur ΦOXˆ b D (X + ) → D b (X) est une ´equivalence.

=

Rπ∗ L(π + )∗

:

946–17

Preuve (esquisse) — Il suffit de traiter le cas o` u X = Spec Ω1Y et i : Y → X est la section nulle, car cela ne change pas le compl´et´e formel de X le long de Y (cf. §3.1.2). La non-projectivit´e de X ne pose pas de probl`eme nouveau. Soit X = Spec OY (−1)n+1 . La suite exacte 0 → Ω1Y → OY (−1)n+1 → OY → 0 fournit un morphisme lisse X → A1 et la fibre de 0 s’identifie `a X. On a NY /X ≃ OY (−1)n+1 et on a alors un flop standard X˜ → X + (cf. §4.3). Le foncteur ΦOX˜ : D b (X + ) → D b (X ) est une ´equivalence et il r´esulte de la proposition 3.5 que ΦOXˆ est une ´equivalence. Deux vari´et´es projectives symplectiques birationnelles de dimension 4 sont connect´ees par une suite de flops de Mukai ([63, Theorem 1.2], [20, §8] ; il faut en fait permettre la contraction simultan´ee de plusieurs P2 disjoints pour que les vari´et´es interm´ediaires restent projectives [62]). On d´eduit alors ([43, Corollary 4.5] et [29, Remark 5.13]) : Corollaire 4.7 (Kawamata, Namikawa). — Deux vari´et´es projectives symplectiques birationnelles de dimension 4 sont d´eriv´e-´equivalentes. 4.4.2. Flop de Mukai stratifi´e. — Markman [40] a ´etudi´e une g´en´eralisation du flop de Mukai. Nous suivons ici la pr´esentation de [44] et ne donnons que la version (( lin´earis´ee )). Soit V un espace vectoriel de dimension n et soit G(V, r) la grassmannienne des sous¯ la espaces de dimension r de V , o` u r est un entier ≤ n/2. Soient X = T ∗ G(V, r) et X 2 sous-vari´et´e ferm´ee de EndC (V ) des endomorphismes a tels que a = 0 et rang(a) ≤ r. On identifie T ∗ G(V, r) `a la vari´et´e des paires (W, φ) o` u W est un sous-espace de dimen¯ sion r de V et φ ∈ Hom(V /W, W ). On dispose d’une application moment f : X → X φ

qui envoie (W, φ) sur la composition a : V ։ V /W − → W ֒→ V . L’application moment est un isomorphisme au-dessus de l’ouvert des endomorphismes de rang r. On dispose ¯ de mˆeme d’une application moment f + : X + = T ∗ G(V, n − r) → X. Le noyau (( ´evident )) ne fournit pas une ´equivalence d´eriv´ee, bien que sa classe dans K0 soit ad´equate [44, Theorem 2.7 et Observation 4.9] : Th´ eor` eme 4.8 (Namikawa). — L’application [ΦOX×

¯X X

+

] : K0 (X + ) → K0 (X) est

un isomorphisme pour tous n, r mais ΦOX× X + : D b (X + ) → D b (X) n’est pas une ¯ X ´equivalence pour n = 4 et r = 2. Dans le cas n = 4 et r = 2, Kawamata construit un noyau de la forme OX×X¯ X + ⊗ L o` u L est un fibr´e en droites, qui induit une ´equivalence [32]. Voyons maintenant une construction pour n, r g´en´eraux d’un noyau support´e par X ×X¯ X + et induisant une ´equivalence d´eriv´ee.

946–18

Soit U la sous-vari´et´e ouverte de G(V, r)×G(V, n−r) des (W, W ′ ) tels que W ∩W ′ = 0 et soit ι : U → G(V, r) × G(V, n − r) l’immersion ouverte. U _ ι

G(V, r) × G(V, n − r)

G(V, r)

SSS SSS β SSS SSS SS)

ll α llll l l ll l v ll

G(V, n − r)

Il est classique [28, Exercice III.15] que la transformation de noyau ι! CU induit une ´equivalence entre cat´egories d´eriv´ees de faisceaux constructibles de C-espaces vectoriels : ∼

b b Rα! (CU ⊗ β −1 (−)) : Dcons (G(V, n − r))− →Dcons (G(V, r)).

Soit K le module de Hodge mixte correspondant `a ι! CU . C’est un noyau inversible pour les transformations entre cat´egories d´eriv´ees de modules de Hodge mixtes. Soit K = Gr(K), un faisceau coh´erent Gm -´equivariant sur T ∗ (G(V, r) × G(V, n − r)) = X × X + . Alors, l’inversibilit´e du noyau K montre que ΦK : D b (X + ) → D b (X) est une ´equivalence (c’est bien sˆ ur aussi une ´equivalence pour les cat´egories Gm -´equivariantes). Il serait int´eressant de d´ecrire explicitement le faisceau K. Kashiwara a propos´e une description pour n = 4 et r = 2, qu’il faudrait comparer avec le noyau de [32]. Cette construction se g´en´eralise `a des vari´et´es de drapeaux paraboliques pour des groupes semi-simples complexes arbitraires. Dans le cas des vari´et´es de drapeaux complets, une telle construction au niveau de la K-th´eorie a ´et´e effectu´ee par Tanisaki [55]. ∼

On peut aussi construire une ´equivalence D b (X + )− →D b (X) en regroupant les D b (T ∗ G(V, r)), 0 ≤ r ≤ dim V , et en appliquant les m´ethodes de [21]. 4.5. Dimension 3 4.5.1. On expose ici la construction de Bridgeland [12] (voir aussi [19, 29, 61]). Consid´erons un flop entre vari´et´es projectives lisses de dimension 3 : X+

X@ @

@@ @@ @@ f

¯ X

|| || | | }|| f +

Remarque 4.9. — Lorsque f ne contracte qu’une courbe irr´eductible C, alors C ≃ P1 et le fibr´e normal NC/X est O(−1) ⊕ O(−1), O ⊕ O(−2) ou O(1) ⊕ O(−3) (cf. [22, Corollary 16.3]). Le premier cas est un flop standard (§4.3) et le second cas peut se traiter par des m´ethodes similaires [6, Theorem 3.9].

946–19

Consid´erons le diagramme X ×X¯ X + π

X

uu uu uu u u zu u

KKK + KKπK KKK K%

X+

´or` The eme 4.10 (Bridgeland). — Le foncteur Rπ∗ L(π + )∗ : D b (X + ) → D b (X) est une ´equivalence. Bridgeland construit le flop f + `a partir de f : la vari´et´e X + apparaˆıt comme un espace de modules fin de certains objets de D b (X) ((( faisceaux pervers ponctuels ))) et le noyau de l’´equivalence est le fibr´e universel. La d´etermination de ce fibr´e, et donc la forme pr´ecise du th´eor`eme 4.10, sont dues `a Chen. Un flop g´en´eralis´e entre vari´et´es projectives lisses de dimension 3 se d´ecompose en une suite de flops [29, Theorem 4.6] et on en d´eduit : Corollaire 4.11. — La conjecture 1.1 est vraie en dimension 3. ¯ une vari´et´e projective connexe 4.5.2. Construction du flop et ´equivalence. — Soit X ¯ une r´esolution cr´epante dont le lieu de Gorenstein de dimension 3. Soit f : X → X exceptionnel est union d’un nombre fini de courbes et soit D un diviseur sur X tel que −D est relativement f -ample. Le th´eor`eme d’annulation de Grauert-Riemenschneider montre, via la formule de ¯ → D(X) est donc pleinement projection, que R>0 f∗ OX = 0. Le foncteur Lf ∗ : D(X) fid`ele (variante de la proposition 3.3 pour les cat´egories d´eriv´ees non born´ees que re¯ Soit B son image. On a une d´ecomposition semi-orthogonale quiert la non-lissit´e de X). D(X) = hB⊥ , Bi, o` u B⊥ = {C ∈ D(X)|Rf∗C = 0}. On construit une nouvelle t-structure sur D(X) en recollant la t-structure standard de B avec celle de B⊥ d´ecal´ee de 1 vers la gauche. Son cœur PerX/X¯ (une cat´egorie ab´elienne) consiste en les C ∈ D(X) tels que – Hi C = 0 pour i 6= 0, 1 – f∗ H−1 C = 0 – R1 f∗ H0 C = 0 et Hom(H0 C, M) = 0 pour tout M ∈ B⊥ ∩ X-coh. On a OX ∈ PerX/X¯ et on dit que E ∈ PerX/X¯ est un (( faisceau pervers ponctuel )) si – E est un quotient de OX (dans PerX/X¯ ) – la classe de Chern de E est ´egale `a celle d’un faisceau gratte-ciel. Soit S une vari´et´e. Une famille de faisceaux pervers ponctuels param´etr´ee par S est un objet E ∈ D b (S × X) tel que Ljs∗ F ∈ PerX/X¯ pour tout point (ferm´e) s ∈ S. Ici, js : s × X → S × X est l’inclusion. Deux familles qui diff`erent par le produit par un fibr´e inversible de S sont dites ´equivalentes. On consid`ere le foncteur qui `a une vari´et´e S associe l’ensemble des classes d’´equivalence de familles de faisceaux pervers ponctuels param´etr´ees par S. Bridgeland

946–20

[12, Theorem 3.8] d´emontre l’existence d’un espace de modules fin : le foncteur est ¯ repr´esentable par une vari´et´e projective M(X/X). ¯ des points au-dessus desquels f est un isomorphisme. Alors, Soit U l’ouvert de X Of −1 (u) est un faisceau pervers ponctuel pour tout u ∈ U. Ceci d´efinit une immer¯ et on note X + l’adh´erence de l’image (on montre en fait sion ouverte U → M(X/X) ¯ ¯ le morphisme canonique. Chen [19, que X + = M(X/X)). On note f + : X + → X Proposition 4.2] montre que OX×X¯ X + est un fibr´e universel. Le th´eor`eme 4.10 admet la version plus pr´ecise suivante. Th´ eor` eme 4.12 (Bridgeland). — Le foncteur Rπ∗ L(π + )∗ : D b (X + ) → D b (X) est ¯ est un flop : f + est une r´esolution cr´epante une ´equivalence. En outre, f + : X + → X et le transform´e strict de D est relativement f + -ample. La preuve est essentiellement la mˆeme que pour la correspondance de McKay [13]. L’outil-clef est un r´esultat d’alg`ebre commutative que nous rappelons maintenant (dans la version de [15, §5]). Soient Z une vari´et´e irr´eductible et C ∈ D b (Z) non nul. Soit Supp(C) l’union des supports des Hi (C). Soit ampl(C) l’ensemble des i ∈ Z tels qu’il existe z ∈ Z avec Hom(C, Oz [−i]) 6= 0. La dimension homologique de C est hd(C) = sup(ampl(C)) − inf(ampl(C)). Th´ eor` eme 4.13 ((( Nouveau th´eor`eme d’intersection ))). — On a codim Supp(C) ≤ hd(C). Soit z ∈ Z tel que Supp(C) = {z}, H0 (C) ≃ Oz et ampl(C) ⊆ [− dim Z, 0]. Alors, z est un point lisse de Z et C ≃ Oz . Preuve du th´ eor` eme 4.12 (esquisse) — Soit pX : X × X + → X la premi`ere projection. Soient P = OX×X¯ X + et Pw = ΦP (Ow ) pour w ∈ X + . Soient P ′ = P ∨ ⊗ p∗X ωX [3] et Q = P ′ ◦ P ∈ D b (X + × X + ). On v´erifie que Hom(Pw , Pw′ [i]) = 0 pour tout i, lorsque f + (w) 6= f + (w ′ ) et on montre que Hom(Pw , Pw′ ) = δw,w′ C, d’o` u Hom(Pw′ , Pw [3]) ≃ δw,w′ C par dualit´e de Serre. Soit Q′ = Q|X + ×X + −∆X + . Le support de Q′ est contenu dans X + ×X¯ X + −∆X + , donc est de codimension ≥ 2, s’il est non vide. On a Hom(Q′ , Ow,w′ [i]) ≃ Hom(Pw , Pw′ [i]), donc hd(Q′ ) ≤ 1. Le th´eor`eme 4.13 montre alors que Q′ = 0. Le morphisme canonique Hom(Ow , Ow [1]) → Hom(Pw , Pw [1]) est injectif (il s’identifie `a l’application de Kodaira-Spencer). On en d´eduit que H0 (ΦQ (Ow )) ≃ Ow . On a ampl(ΦQ (Ow )) = [−3, 0]. Le th´eor`eme 4.13 montre que ΦQ (Ow ) ≃ Ow et que X + est lisse en w. La cr´epance de f permet alors de conclure que ΦP est une ´equivalence, via la proposition 3.2. La cr´epance de f + s’obtient en utilisant la trivialit´e du foncteur de Serre de DFb (X + ) pour toute fibre F de f + [13, Lemma 3.1]. On montre que ΦP [−1] se restreint en une ´equivalence entre faisceaux coh´erents sur X + tu´es par Rf∗+ et faisceaux coh´erents sur X tu´es par Rf∗ et l’amplitude relative du transform´e strict de D s’en d´eduit [12, §4.6].

946–21

Remarque 4.14. — Il serait int´eressant de voir si la mˆeme m´ethode fournit une construction de flips (cf. [1] pour des r´esultats dans cette direction, en dimension quelconque). 4.6. Vari´ et´ es singuli` eres Les constructions pour les vari´et´es projectives lisses ont des g´en´eralisations `a une classe plus large, dans le cadre du MMP [2, 19, 29, 30, 31, 61]. Ceci est utile pour construire des ´equivalences entre vari´et´es projectives lisses, car il existe des d´ecompositions de flops g´en´eralis´es en flops qui font intervenir des vari´et´es singuli`eres. Kawamata d´emontre en particulier un th´eor`eme d’´equivalence d´eriv´ee pour des flops particuliers entre champs de Deligne-Mumford toriques. Il en d´eduit qu’un flop torique g´en´eralis´e donne lieu `a une ´equivalence d´eriv´ee [31, Corollary 4.5] : ´or` The eme 4.15 (Kawamata). — Soient f : Z → X et g : Z → Y des morphismes toriques birationnels entre vari´et´es toriques projectives lisses tels que f ∗ ωX ≃ g ∗ωY . Alors, D b (Y ) ≃ D b (X). Mentionnons pour terminer la n´ecessit´e de consid´erer des vari´et´es analytiques et d’effectuer les constructions dans le cadre de la log-g´eom´etrie.

´ ERENCES ´ REF [1] D. Abramovich and J.C. Chen, Computations with moduli of perverse point sheaves, preprint math.AG/0304353. [2] D. Abramovich and J.C. Chen, Flops, flips and perverse point sheaves on threefold stacks, preprint math.AG/0304354. [3] P. Balmer, Presheaves of triangulated categories and reconstruction of schemes, Math. Ann. 324 (2002), 557–580. [4] A.A. Beilinson, The derived category of coherent sheaves on P n , Selecta Math. Soviet. 3 (1983/84), 233–237 ou (en russe) Funktsional. Anal. i Prilozhen. 12 (1978), 68–69. [5] A. Bondal et M.M. Kapranov, Representable functors, Serre functors, and mutations, Math. USSR-Izv. 35 (1990), 519–541. [6] A. Bondal et D. Orlov, Semiorthogonal decompositions for algebraic varieties, preprint alg-geom/9506012. [7] A. Bondal et D. Orlov, Reconstruction of a variety from the derived category and groups of autoequivalences, Compositio Math. 125 (2001), 327–344. [8] A. Bondal et D. Orlov, Derived categories of coherent sheaves, Proceedings of the International Congress of Mathematicians, Vol. II (Beijing, 2002), 47–56, Higher Ed. Press, 2002. [9] A. Bondal et M. Van den Bergh, Generators and representability of functors in commutative and noncommutative geometry, Moscow Math. J. 3 (2003), 1–36.

946–22

[10] T. Bridgeland, Fourier-Mukai transforms for elliptic surfaces, J. reine angew. Math. 498 (1998), 115–133. [11] T. Bridgeland, Equivalences of triangulated categories and Fourier-Mukai transforms, Bull. London Math. Soc. 31 (1999), 25–34. [12] T. Bridgeland, Flops and derived categories, Invent. Math. 147 (2002), 613–632. [13] T. Bridgeland, A. King et M. Reid, The McKay correspondence as an equivalence of derived categories, J. Amer. Math. Soc. 14 (2001), 535–554. [14] T. Bridgeland et A. Maciocia, Complex surfaces with equivalent derived categories, Math. Z. 236 (2001), 677–697. [15] T. Bridgeland et A. Maciocia, Fourier-Mukai transforms for K3 and elliptic fibrations, J. Algebraic Geom. 11 (2002), 629–657. [16] A. C˘ald˘araru, The Mukai pairing, I: the Hochschild structure, preprint math.AG/0308079(v2). [17] A. C˘ald˘araru, The Mukai pairing, II: the Hochschild-Kostant-Rosenberg isomorphism, preprint math.AG/0308080(v3). [18] A. C˘ald˘araru, Derived categories of sheaves: a skimming, preprint math.AG/0501094. [19] J.-C. Chen, Flops and equivalences of derived categories for threefolds with only terminal Gorenstein singularities, J. Differential Geom. 61 (2002), 227–261. [20] K. Cho, Y. Miyaoka et N.I. Shepherd-Barron Characterizations of projective space and applications to complex symplectic manifolds, in “Higher dimensional birational geometry (Kyoto, 1997)”, 1–88, Math. Soc. Japan, 2002. [21] J. Chuang et R. Rouquier, Derived equivalences for symmetric groups and sl2 categorification, preprint math.RT/0407205. [22] H. Clemens, J. Koll´ar et S. Mori, Higher-dimensional complex geometry, Ast´erisque 166 (1988). [23] P. Gabriel, Des cat´egories ab´eliennes, Bull. Soc. Math. France 90 (1962), 323–448. [24] A.L. Gorodentsev et S.A. Kuleshov, Helix theory, Mosc. Math. J. 4 (2004), 377– 440, 535. [25] L. Hille et M. Van den Bergh, Fourier-Mukai transforms, preprint math.AG/0402043(v2). [26] D. Huybrechts, “Fourier-Mukai transforms in algebraic geometry”, livre en pr´eparation. [27] M.M. Kapranov, On the derived categories of coherent sheaves on some homogeneous spaces, Invent. Math. 92 (1988), 479–508. [28] M. Kashiwara et P. Schapira, “Sheaves on manifolds”, Springer-Verlag, 1990. [29] Y. Kawamata, D-equivalence and K-equivalence, J. Differential Geom. 61 (2002), 147–171. [30] Y. Kawamata, Francia’s flip and derived categories, in “Algebraic geometry”, 197– 215, de Gruyter, 2002.

946–23

[31] Y. Kawamata, Equivalences of derived categories of sheaves on smooth stacks, Amer. J. Math. 126 (2004), 1057–1083. [32] Y. Kawamata, Derived equivalence for stratified Mukai flop on G(2, 4), preprint math.AG/0503101. [33] Y. Kawamata, Derived Categories of Toric Varieties, preprint math.AG/0503102. [34] A. King, Tilting bundles on some rational surfaces, preprint (1997), http://www.maths.bath.ac.uk/∼masadk/papers/tilt.ps [35] M. Kontsevich, Homological algebra of mirror symmetry, Proceedings of the International Congress of Mathematicians, Vol. 1 (Z¨ urich, 1994), 120–139, Birkh¨auser, 1995. [36] M. Kontsevich, Deformation quantization of Poisson manifolds, Lett. Math. Phys. 66 (2003), 157–216. [37] A. Kuznetsov, Derived category of a cubic threefold and the variety V14 , Tr. Mat. Inst. Steklova 246 (2004), 183–207. [38] A. Kuznetsov, Derived category of V12 Fano threefolds, preprint math.AG/0310008. [39] E. Looijenga, Motivic measures, S´eminaire Bourbaki, expos´e 874, Ast´erisque 276 (2002), 267–297. [40] E. Markman, Brill-Noether duality for moduli spaces of sheaves on K3 surfaces, J. Algebraic Geom. 10 (2001), 623–694. ˆ with its application to Picard sheaves, [41] S. Mukai, Duality between D(X) and D(X) Nagoya Math. J. 81 (1981), 153–175. [42] S. Mukai, On the moduli space of bundles on K3 surfaces. I, in “Vector bundles on algebraic varieties (Bombay, 1984)”, 341–413, Tata Inst. Fund. Res., 1987. [43] Y. Namikawa, Mukai flops and derived categories, J. reine angew. Math. 560 (2003), 65–76. [44] Y. Namikawa, Mukai flops and derived categories. II, in “Algebraic structures and moduli spaces”, 149–175, Amer. Math. Soc., 2004. [45] D. Orlov, Projective bundles, monoidal transformations, and derived categories of coherent sheaves, Russian Acad. Sci. Izv. Math. 41 (1993), 133–141. [46] D. Orlov, Equivalences of derived categories and K3 surfaces, J. Math. Sci. (New York) 84 (1997), 1361–1381. [47] D. Orlov, Derived categories of coherent sheaves on abelian varieties and equivalences between them, Izv. Math. 66 (2002), 569–594. [48] D. Orlov, Derived categories of coherent sheaves and equivalences between them, Russian Math. Surveys 58 (2003), no. 3, 511–591. [49] A. Polishchuk, “Abelian varieties, theta functions and the Fourier transform”, Cambridge University Press, 2003. [50] M. Reid, La correspondance de McKay, S´eminaire Bourbaki, expos´e 867, Ast´erisque 276 (2002), 53–72.

946–24

[51] R. Rouquier, Cat´egories d´eriv´ees et g´eom´etrie alg´ebrique, notes d’expos´es, janvier 2004, http://www.math.jussieu.fr/∼rouquier/preprints/luminy.dvi [52] R. Rouquier, Dimensions of triangulated categories, preprint math.CT/0310134(v3). [53] A. Rudakov, Rigid and exceptional vector bundles and sheaves on a Fano variety, Proceedings of the International Congress of Mathematicians, Vol. 1 (Z¨ urich, 1994), 697–705, Birkh¨auser 1995. [54] R. Swan, Hochschild cohomology of quasiprojective schemes, J. Pure Appl. Algebra 110 (1996), 57–80. [55] T. Tanisaki, Hodge modules, equivariant K-theory and Hecke algebras, Publ. Res. Inst. Math. Sci. 23 (1987), 841–879. [56] R.W. Thomason, Les K-groupes d’un fibr´e projectif, in “Algebraic K-theory and algebraic topology (Lake Louise, 1991)”, 243–248, Kluwer, 1993. [57] R.W. Thomason, Les K-groupes d’un sch´ema ´eclat´e et une formule d’intersection exc´edentaire, Invent. Math. 112 (1993), 195–215. [58] R.W. Thomason, The classification of triangulated subcategories, Compositio Math. 105 (1997), 1–27. [59] B. Toen, The homotopy category of dg-categories and derived Morita theory, preprint math.AG/0408337(v5). [60] H. Uehara, An example of Fourier-Mukai partners of minimal elliptic surfaces, Math. Res. Lett. 11 (2004), 371–375. [61] M. Van den Bergh, Three-dimensional flops and noncommutative rings, Duke Math. J. 122 (2004), 423–455. [62] J. Wierzba, Birational geometry of symplectic 4-folds, preprint, http://www.dpmms.cam.ac.uk/∼jw227/publications.html. [63] J. Wierzba et J.A. Wi´sniewski, Small contractions of symplectic 4-folds, Duke Math. J. 120 (2003), 65–95.

Rapha¨el ROUQUIER Institut de Math´ematiques de Jussieu UMR 7586 du CNRS UFR de Math´ematiques, Universit´e Paris 7 Case 7012 2 place Jussieu F–75251 PARIS C´edex 05 E-mail : [email protected]

S´eminaire BOURBAKI 57`eme ann´ee, 2004-2005, no 947

Juin 2005

´ EN DEFORMANT ´ PREUVE DE LA CONJECTURE DE POINCARE ´ LA METRIQUE PAR LA COURBURE DE RICCI, ` G. PEREL’MAN D’APRES par G´ erard BESSON INTRODUCTION Dans un article c´el`ebre de 1904 ([48]), H. Poincar´e pose la question qu’en termes actuels nous ´enon¸cons sous la forme de la conjecture suivante : Conjecture 0.1. — Si M est une vari´et´e compacte sans bord simplement connexe de dimension 3, alors M est hom´eomorphe ` a la sph`ere. En dimension 3, la conclusion ´equivalente est que M est diff´eomorphe `a la sph`ere. De nombreux outils topologiques ont ´et´e ´elabor´es afin de r´esoudre ce probl`eme ; un historique de ces d´eveloppements est d´ecrit dans l’article [42]. Une preuve de la conjecture qui suit permettrait de compl´eter la compr´ehension des vari´et´es de dimension 3, compactes, connexes de groupe fondamental fini : Conjecture 0.2. — Un groupe fini de diff´eomorphismes qui agit librement sur S 3 est conjugu´e ` a un sous-groupe du groupe d’isom´etries de la sph`ere canonique. En 1982, W. Thurston a replac´e ces questions dans un cadre plus g´en´eral, inspir´e par la classification des surfaces. Reprenons l’´enonc´e de la conjecture dite de g´eom´etrisation tel qu’il est formul´e dans [57]. Conjecture 0.3. — L’int´erieur de toute vari´et´e compacte de dimension 3 admet une d´ecomposition canonique en pi`eces qui portent une structure g´eom´etrique. Dans cet ´enonc´e la vari´et´e peut avoir un bord. Dans la suite de ce rapport nous appellerons compacte une vari´et´e compacte sans bord (le terme ferm´ee serait plus usuel en topologie) et toutes les vari´et´es seront suppos´ees orient´ees. La d´ecomposition `a laquelle il est fait allusion proc`ede en deux ´etapes : 1) celle qui provient du th´eor`eme de Kneser dans lequel la vari´et´e est d´ecompos´ee en une somme connexe d’un nombre fini de vari´et´es premi`eres. On rappelle qu’une vari´et´e M est dite premi`ere si M = P #Q implique P = S 3 ou Q = S 3 . 2) Celle qui provient des travaux de K. Johannson et de W. Jaco et P. Shalen et qui consiste `a d´ecouper le long de tores incompressibles. La conjecture affirme que ceci peut ˆetre fait en sorte que les vari´et´es `a bords qui en r´esultent poss`edent une g´eom´etrie, c’est-`a-dire une m´etrique riemannienne compl`ete localement homog`ene. Celles-ci sont

947–02

classifi´ees, il y a huit possibilit´es (en dimension 3). Le lecteur trouvera une int´eressante discussion de cette conjecture ainsi que des r´ef´erences pr´ecises dans [57] et [1]. Un des avantages de la conjecture 0.3 est qu’elle fait r´ef´erence `a l’existence de m´etriques riemanniennes privil´egi´ees, sur certaines r´egions de la vari´et´e ´etudi´ee, et fournit ainsi des outils suppl´ementaires, au-del`a de la topologie. En 1982, R. Hamilton a introduit une m´ethode, que nous pouvons qualifier d’analytique, dans le but d’aborder ces questions. Il s’agit d’´etudier une ´equation diff´erentielle sur l’espace des m´etriques riemanniennes, nous dirons un flot, dont les solutions sont une d´eformation d’une m´etrique quelconque qui tend `a la rendre de courbure constante. L’´equation met en jeu la courbure de Ricci, qui est une notion de courbure de mˆeme nature que la m´etrique, c’est-`a-dire une forme bilin´eaire sym´etrique sur chaque espace tangent. L’´equation est : ∂g = −2 Ricg(t) , ∂t o` u g(t) d´esigne la m´etrique riemannienne qui ´evolue et Ricg(t) sa courbure de Ricci. L’´equation ci-dessus est inspir´ee par la tentative de minimiser l’int´egrale de la courbure scalaire dont ce n’est toutefois pas le flot de l’oppos´e du gradient ; elle est ´egalement li´ee `a l’´equation d’´evolution associ´ee aux applications harmoniques. Le signe n´egatif montre que la courbure positive est contract´ee et la courbure n´egative est dilat´ee, comme on peut s’en convaincre sur les exemples de courbure constante. Remarquons que, si la donn´ee initiale admet des isom´etries, c’est le cas pour la solution, pour tout temps de son intervalle de vie. En d’autres termes, le groupe d’isom´etries ne peut que croˆıtre. Dans une s´erie d’articles ([24], [25], [31], [29], [19], [26], [27], [28] et [30]), R. Hamilton d´eveloppe les outils d’analyse n´ecessaires `a l’utilisation de sa m´ethode et obtient de remarquables r´esultats g´eom´etriques, dont certains sont des r´eponses aux questions pos´ees ci-dessus, dans des cas particuliers. De nombreuses difficult´es persistent toutefois, en particulier celles li´ees `a l’´etude des singularit´es qui peuvent apparaˆıtre lors de l’´evolution. R´ecemment, G. Perel’man a d´epos´e sur la toile trois articles, [44], [46] et [45] dans lesquels une solution compl`ete de la conjecture 0.3 est propos´ee. Ils apportent des id´ees novatrices et puissantes `a la m´ethode du flot de la courbure de Ricci, et surtout `a la description des r´egions qui deviennent singuli`eres, c’est-`a-dire o` u la courbure explose. Ceci permet de pratiquer une chirurgie, d´ej`a en grande partie d´ecrite dans [25], de mani`ere efficace. On construit ainsi un flot d´efini pour tout temps mais pas de classe C ∞ , les singularit´es correspondant `a des temps de chirurgies. Il se peut mˆeme que la vari´et´e disparaisse `a un moment de l’´evolution, on dit alors qu’elle s’´eteint en temps fini. Les articles ne sont pas tr`es d´etaill´es, il s’agit plutˆot d’esquisses de preuve, n´eanmoins assez claires. Ils font l’objet d’un intense travail de mise en place et de v´erifications des d´etails (et d’ex´eg`ese). L’expertise n’´etant pas compl`etement termin´ee, il est difficile de se prononcer pour l’instant (au moment o` u ces lignes sont ´ecrites) sur la question de savoir si la conjecture 0.3 est prouv´ee. Toutefois, le cas de la conjecture de Poincar´e est plus (( simple )) dans le sch´ema de G. Perel’man ; il montre, en effet, que, pour n’importe

947–03

quelle m´etrique sur une vari´et´e compacte simplement connexe, le flot s’´eteint en temps fini ([45]). Une cons´equence est qu’on ne pratique qu’un nombre fini de chirurgies. L’auteur du pr´esent texte est convaincu que les conjectures 0.1 et 0.2 sont prouv´ees. Le but de ce rapport est de d´ecrire les outils d’analyse et de g´eom´etrie n´ecessaires ainsi que le sch´ema de la preuve des conjectures 0.1 et 0.2. Il est con¸cu comme interm´ediaire entre les survols [1], [39], [42] et [43] et les notes d´etaill´ees [36], [51] et [61]. L’auteur esp`ere qu’il peut ˆetre un guide de lecture de ces documents. Les premi`eres notes d´etaill´ees produites ont ´et´e celles de B. Kleiner et J. Lott, nous les conseillons vivement `a tous ceux qui souhaitent comprendre les travaux de G. Perel’man ; de mˆeme les documents [51] et [61] sont d’une grande pr´ecision sur de nombreux points de [44]. Ce texte est ´ecrit alors que l’auteur travaille encore `a am´eliorer sa compr´ehension de cet ensemble de travaux ; il contient certainement des erreurs qui seront expurg´ees dans des versions ult´erieures, d´epos´ees sur le site de l’Institut Fourier(1) . Signalons enfin les articles [47] et [2] qui s’adressent `a un large public et sont d’une grande utilit´e. Remerciements.— Je tiens `a remercier chaleureusement L. Bessi`eres pour le travail que nous avons fait en commun sur cette th´eorie durant deux ans et les nombreuses corrections apport´ees `a ce texte, ainsi que B. Kleiner pour avoir r´epondu avec gentillesse `a toutes nos questions et J-.P Bourguignon, J. Lott et S. Maillot pour leurs suggestions. Mes remerciements vont ´egalement `a V. Bayle, M. Boileau, H.-D. Cao, ´ Ghys, L. Guillou, J.-M. Iniotakis, B. Leeb (et tout le groupe de M¨ B. Chow, E. unich), Ph. LeFloch, J. Porti, L. Rozoy, R. Souam et P. Topping pour des ´echanges fructueux.

` 1. DES MODELES JOUETS Il existe deux mod`eles qui permettent de mieux se familiariser avec les rudiments concernant les ´equations d’´evolution g´eom´etriques. Il s’agit du raccourcissement des courbes et du flot de la courbure sur les surfaces. Ce sont des jouets d´ej`a assez sophistiqu´es que nous d´ecrivons tr`es bri`evement. 1.1. Le raccourcissement des courbes Soit C une courbe plane ferm´ee simple param´etr´ee par une fonction de classe C ∞ , F0 : S 1 → R2 ; on la suppose orient´ee positivement. Pour T > 0, on cherche une famille F : S 1 × [0, T ) → R2 de classe C ∞ en ses deux variables v´erifiant l’´equation d’´evolution  suivante :  ∂F (x, t) = k(x, t)N(x, ~ t) ∂t (∗c )  F (·, 0) = F0 ~ (x, t) (resp. k(x, t)) est le vecteur normal int´erieur (resp. la courbure) de la courbe o` uN Ft (·) = F (·, t) au point F (x, t). (1)

http ://www-fourier.ujf-grenoble.fr/GT/perelman/index.html

947–04

Cette ´equation est non lin´eaire car k et N d´ependent de F (voir la section 3). Il est facile de v´erifier qu’il s’agit ici du flot de l’oppos´e du gradient de la fonctionnelle longueur ; un calcul imm´ediat montre que l’aire A(t) enclose par la courbe Ft (l’aire de la composante connexe born´ee) v´erifie A′ (t) = −2π. Le th´eor`eme principal est dˆ u `a M. Gage et R. Hamilton [19] pour le cas o` u C est convexe et `a M. Grayson [21] pour le cas g´en´eral. Afin d’´enoncer ces r´esultats (en un seul th´eor`eme) d´efinissons les quantit´es kmax (t) = max{k(x, t); x ∈ S 1 } et, de mˆeme, kmin (t) comme minimum de la courbure au temps t, ainsi que rmax (t) = rayon du cercle circonscrit `a Ft et, de mˆeme, rmin (t) comme le rayon du cercle inscrit dans Ft . Th´ eor` eme 1.1 ([19] et [21]). — Pour toute courbe C ∞ ferm´ee simple il existe une unique solution de l’´equation (∗c ) d´efinie sur un intervalle de temps [0, T ) o` u T = A(0)/2π. La famille de courbe Ft converge, lorsque t → T , vers un point et devient circulaire aux sens suivants : i) le quotient kmax /kmin tend vers 1 lorsque t tend vers T , ii) le quotient rmax /rmin tend vers 1 lorsque t tend vers T . De plus, pour tout n ≥ 1, la d´eriv´ee spatiale n-i`eme de k converge uniform´ement vers 0 lorsque t tend vers T . Enfin, si la courbe C est convexe elle le reste tout au long du processus ([19]) et si C n’est pas convexe la courbe Ft le devient en un temps t < T ([21]). Ce th´eor`eme affirme en fait que, quitte `a renormaliser afin que l’aire int´erieure soit constante, la famille Ft converge dans la topologie C k , pour tout k, vers un cercle. Questions : 1) Si la courbe de d´epart est convexe, alors Ft reste dans son int´erieur pour tout t. En particulier le point limite est dans l’enveloppe convexe de C. Il serait int´eressant de d´eterminer sa position. 2) Ce th´eor`eme n´ecessite une courbe initiale r´eguli`ere. Que se passe-t-il si C poss`ede des coins ? Dans [19] il est fait allusion `a une solution possible. 3) Une extension aux corps convexes de Rn est d´ecrite dans [33]. 1.2. Le flot de la courbure sur les surfaces On munit une surface abstraite compacte et orientable Σ d’une m´etrique riemannienne not´ee g0 . Dans la classe conforme de g0 il existe une m´etrique de courbure constante (unique `a isom´etrie pr`es). On souhaite, comme pr´ec´edemment, obtenir cette (( forme )) id´eale comme limite d’un flot g´eom´etrique. Si g(t) est une famille C ∞ de m´etriques riemanniennes sur Σ, d´ependant de mani`ere C ∞ du param`etre t, on note R(x, t) la courbure scalaire de g(t) au point x ∈ Σ ; avec les conventions habituelles, la courbure scalaire est le double de la courbure de Gauß. La mesure riemannienne, not´ee vg(t) R (ou dvol), permet de d´efinir le volume de (Σ, g(t)) et la quantit´e r(t) = 1 R(x, t)dvg(t) . On consid`ere l’´equation suivante : vol(Σ,g(t)) Σ

947–05   ∂g = (r − R)g (∗s ) ∂t  g(0) = g0 .

Il est facile de v´erifier que le volume est constant en temps pour toute solution ; c’est donc une version normalis´ee du flot de la courbure que nous consid´erons. On peut ´egalement s’assurer imm´ediatement que toute solution g(t) est conforme `a g0 , pour tout t ≥ 0. Le r´esultat ci-dessous est prouv´e en combinant [26] et [11]. ´or` The eme 1.2 ([26] et [11]). — Soit (Σ, g0 ) une surface riemannienne de classe C ∞ ; le probl`eme (∗s ) admet une solution unique d´efinie pour t ∈ [0, +∞). La famille de m´etriques g(t) converge dans la topologie C k , pour tout k, lorsque t tend vers +∞, vers une m´etrique de courbure constante conforme ` a g0 . Ce th´eor`eme peut ˆetre vu comme une nouvelle preuve de l’uniformisation des surfaces compactes. C’est le cas pour toutes les surfaces de caract´eristique d’Euler n´egative ou nulle. Pour la sph`ere une ´etape de la preuve utilisait la structure complexe et ce n’est que r´ecemment que ce probl`eme fut r´esolu, dans [9], conduisant ainsi `a une nouvelle preuve compl`ete de l’uniformisation en dimension 2. Dans le cas o` u la courbure est strictement n´egative, la preuve de la convergence est imm´ediate. Il serait alors int´eressant d’avoir un proc´ed´e ou un algorithme simple permettant de munir une surface de caract´eristique d’Euler n´egative (strictement) d’une m´etrique de courbure n´egative. Le flot donnerait, alors, une m´etrique de courbure ´ Ghys). constante de mani`ere rapide (cette question a ´et´e pos´ee `a l’auteur par E. Le cas des orbifolds de dimension 2 est particuli`erement instructif. Il est trait´e dans les articles [15], [60] et [10]. Les orbifolds compactes en dimension 2 sont class´ees en deux cat´egories (voir [50] ou [56]) : les (( bonnes )) (good) orbifolds qui admettent une m´etrique de courbure constante et les (( mauvaises )) (bad) orbifolds qui n’en admettent pas. Pour ces derni`eres, on montre que le flot (∗s ) converge vers un soliton de Ricci (voir [59]). La preuve du th´eor`eme 1.2 contient une ´etape dans laquelle on montre que les seuls solitons sur S 2 sont constants (en temps) ´egaux `a une m´etrique de courbure constante (voir [13], th´eor`eme 5.21). 1.3. Conclusion Ces exemples ont la vertu de mettre en œuvre l’utilisation des outils de base, pr´esent´es dans les sections suivantes, sous une forme ´el´ementaire ; en cela ils constituent une bonne introduction aux travaux qui suivent. Ils ne sont toutefois pas complets en ce sens o` u, dans toutes ces situations, la courbure de l’objet consid´er´e explose (c’est-`a-dire tend vers +∞) au mˆeme moment en tous les points. La situation ´etudi´ee par R. Hamilton, en dimension 4, et G. Perel’man, en dimension 3, est radicalement diff´erente car la courbure scalaire peut exploser dans certaines r´egions de la vari´et´e alors qu’elle reste born´ee ailleurs. Il est alors n´ecessaire de d´ecrire ces r´egions avec pr´ecision.

947–06

´ 2. PREMIERS RESULTATS EN DIMENSION 3 C’est le point de d´epart de l’ensemble de travaux qui est l’objet de ce texte. C’est le premier r´esultat dˆ u `a R. Hamilton qui jette les bases de la m´ethode. On consid`ere une vari´et´e compacte connexe et orientable de dimension 3, not´ee M, munie d’une m´etrique riemannienne lisse g0 . On suppose le lecteur familier avec la notion de courbure de Ricci. Pour une m´etrique riemannienne g nous noterons Ricg sa courbure de Ricci, qui est un 2-tenseur sym´etrique, dvg (ou dvol) la mesure riemannienne et R sa courbure scalaire ; lorsque nous consid´erons une famille g(t), R(x, t) d´esigne la courbure scalaire de g(t) au point x ∈ M. Une bonne r´ef´erence pour les bases de la g´eom´etrie riemannienne est l’ouvrage [20]. On cherche alors une famille g(t) de m´etriques lisses, d´ependant de mani`ere C ∞ de t, et solution du probl`  eme de Cauchy suivant :  ∂g = −2 Ric g(t) (∗3 ) ∂t  g(0) = g0 .

Une version normalis´ee peut ˆetre ´ecrite, pour laquelle le volume de la m´etrique qui ´evolue est fix´e ; il suffit, en effet, de remplacer la premi`ere ligne de (∗3 ) par : Z 2 ∂g 1 = −2 Ricg(t) + R(x, t)dvg(t) (x) g(t). ∂t 3 vol(M, g(t)) M

Nous noterons (∗′3 ) cette version. On passe d’une solution de (∗3 ) `a une solution de (∗′3 ) par une homoth´etie et un changement de temps. Nous appellerons flot de Ricci un couple (M, g(t))) solution de (∗3 ). Le th´eor`eme fondateur de la th´eorie est le suivant :

´or` The eme 2.1 (R. Hamilton, [24]). — Soit M une vari´et´e compacte de dimension 3 qui admet une m´etrique de courbure de Ricci strictement positive. Alors, M admet une m´etrique de courbure sectionnelle constante (strictement positive). En particulier, M est diff´eomorphe `a un quotient fini de S 3 . La preuve consiste `a r´esoudre l’´equation (∗3 ) et `a montrer que la solution renormalis´ee correspondante, c’est-`a-dire la solution de (∗′3 ), est d´efinie pour t ∈ [0, +∞) et converge vers une m´etrique de courbure constante. En fait la solution de (∗3 ) ne vit que pendant un temps fini T et sa courbure explose en T . C’est le ph´enom`ene d´ej`a observ´e pour (∗c ). Comme dans les mod`eles jouets, pour les solutions de l’´equation (∗3 ), la courbure explose en tous les points lorsque le temps de T. s’approche R 1 2 La correspondance g −→ −2 Ricg + 3 vol(M,g) M Rdvg g(t) peut ˆetre interpr´et´ee comme un champ de vecteurs sur l’espace des m´etriques riemanniennes sur M. Une trajectoire de celui-ci est alors une solution de (∗′3 ) ; on peut esp´erer qu’une telle trajectoire converge vers un point fixe de ce champ de vecteurs, c’est-`a-dire une m´etrique d’Einstein, qui, en dimension 3, ne peut qu’ˆetre de courbure constante. Il s’agit bien entendu d’un point de vue heuristique. Toutefois, cette approche est d´evelopp´ee dans [3]. Dans [25], R. Hamilton obtient des r´esultats concernant le cas o` u la courbure de Ricci est suppos´ee positive ou nulle ; dans ce cas il d´emontre que M est diff´eomorphe `a un

947–07

quotient de S 3 , S 2 × S 1 ou R3 par un groupe d’isom´etries sans point fixe dans leur m´etrique standard. Pour les extensions en dimension 4 on peut se r´ef´erer `a [25], [30] et `a l’article r´ecent [8] qui reprend les m´ethodes utilis´ees par G. Perel’man pour corriger et ´etendre [30]. Un r´esultat optimal sous hypoth`ese de pincement ponctuel est obtenu dans [40]. Enfin, en dimension n quelconque, G. Huisken montre dans [33] un th´eor`eme comparable `a 2.1 avec une hypoth`ese plus forte sur la courbure.

3. LES OUTILS D’ANALYSE ` partir de maintenant, (M, g(t)) est une solution du flot de Ricci non normalis´e A (´equation (∗3 )), d´efinie sur un intervalle de temps [0, T ) (T fini ou non) et M est une vari´et´e diff´erentielle compacte, connexe, orientable et de dimension 3. Par abus de langage, nous dirons que (M, g(t)) est un flot de Ricci. La majorit´e des r´esultats qui suivent est valable en dimension n ≥ 2 `a l’exception notable du th´eor`eme 3.4. Notons que la quasi-totalit´e de ceux-ci est due `a R. Hamilton. 3.1. Existence de solutions en temps petit Une des premi`eres difficult´es que l’on rencontre en ´etudiant les ´equations pr´ec´edentes est l’existence en temps petit des solutions du probl`eme de Cauchy. En effet, ces ´equations ne sont que faiblement paraboliques, c’est-`a-dire que le membre de gauche de chacune d’elles est donn´e par un op´erateur qui n’est pas fortement elliptique ; son symbole a un noyau qui provient de l’invariance par diff´eomorphismes du probl`eme. Montrer l’existence en temps petit des solutions devient alors une tˆache d´elicate que R. Hamilton m`ene `a bien dans [24]. Dans [17], D. DeTurck d´ecrit une ´el´egante fa¸con de transformer les ´equations ci-dessus afin qu’elles deviennent fortement paraboliques ; dans ce cas l’existence de solutions r´esultent de th´eor`emes classiques (voir [37]). Les solutions de l’´equation transform´ee donnent des solutions de l’´equation initiale par simple transport par un diff´eomorphisme d´ependant du param`etre t. Une interpr´etation en terme d’applications harmoniques est donn´ee dans [29] et [13]. 3.2. L’´ equation d’´ evolution des courbures Un des outils de base est le principe du maximum. Il s’applique aux ´equations paraboliques qui r´egissent l’´evolution des diff´erents type de courbure. Pour simplifier, nous ne consid´ererons que la courbure scalaire et l’op´erateur de courbure. Rappelons que R d´esigne la courbure scalaire. On a alors, ∂R + ∆g(t) R = 2| Ric(g(t))|2g(t) ∂t o` u ∆g(t) d´esigne le laplacien, agissant sur les fonctions, d´efini par la m´etrique g(t). La convention adopt´ee est celle dite des g´eom`etres (en dimension 1, c’est −d2 /dx2 ). La

947–08

norme du tenseur de Ricci est prise pour la m´etrique g(t) (pour la norme d’un tenseur, le lecteur peut se reporter `a [20]). Nous noterons Rm l’op´erateur de courbure, c’est-`a-dire l’endomorphisme sym´etrique de Λ2 (T ∗ M) dans lui-mˆeme ; alors, ∂ Rm + ∆ Rm = Rm2 + Rm♯ . ∂t Nous utilisons ici le laplacien brut, c’est-`a-dire l’oppos´e de la trace de la d´eriv´ee covariante seconde du tenseur Rm. La notation Rm2 d´esigne le carr´e de l’endomorphisme Rm et Rm♯ d´esigne une expression quadratique en Rm que nous d´ecrirons plus loin. 3.3. Existence en grand temps Il est difficile de pr´eciser, a priori, l’intervalle de vie d’une solution. Des estimations existent toutefois. Les ´equations paraboliques ci-dessus permettent de montrer que si la solution n’est d´efinie qu’en temps fini, c’est-`a-dire sur un intervalle [0, T ) avec T < +∞, alors la courbure explose en T . Plus pr´ecis´ement, Proposition 3.1 ([13], p. 201). — Soit g0 une m´etrique C ∞ sur M ; alors l’´equation (∗3 ) a une unique solution sur un intervalle maximal, 0 ≤ t < T ≤ +∞. De plus, si T < +∞, alors, lim sup | Rm(x, t)| = +∞ . tրT x∈M

La norme de Rm(x, t) est la norme d’endomorphisme, calcul´ee `a l’aide de la m´etrique. La preuve se fait en constatant qu’une borne sur la courbure correspond `a une borne sur les d´eriv´ees secondes de la m´etrique. En cons´equence, si la courbure est born´ee au voisinage de T on peut trouver une limite `a g(t) lorsque t tend vers T , et poursuivre le flot `a partir de celle-ci, ce qui contredit la d´efinition de T . Pour les d´etails le lecteur est renvoy´e au chapitre 6 de [13]. 3.4. Principes du maximum

C’est l’outil indispensable pour l’´etude des solutions de l’´equation de la chaleur. Il faut en donner ici une version vectorielle, c’est-`a-dire une version pour les syst`emes paraboliques. C’est ce que fait R. Hamilton dans [24], [25] et [31]. Le lecteur int´eress´e peut ´egalement consulter [13] et [14]. Consid´erons une ´equation aux d´eriv´ees partielles du type ∂s/∂t + ∆t s = F (s) et l’´equation diff´erentielle ordinaire ds/dt = F (s). Les E.D.P. ci-dessus sont dites de r´ eaction-diffusion, le terme de diffusion est donn´e par le laplacien ; si F = 0, il s’agit d’une ´equation de la chaleur qui (( ´etale )) les solutions. Le terme non-lin´eaire F (s) est le terme de r´eaction qui, en l’absence de laplacien, conduit (souvent) `a l’explosion en temps fini des solutions (convergence de certaines normes vers +∞). La question est de savoir qui de la r´eaction ou de la diffusion l’emportera, dans une situation donn´ee.

947–09

Le principe du maximum r´esulte d’une comparaison entre le comportement des solutions de l’´equation aux d´eriv´ees partielles et la situation extrˆeme donn´ee par l’´equation diff´erentielle ordinaire. L’´equation satisfaite par la courbure scalaire peut s’´ecrire ∂R/∂t + ∆R ≥ 0. Le principe du maximum scalaire le plus simple (voir [49]) conduit alors au th´eor`eme suivant : ´or` The eme 3.2 (voir [13], lemme 6.8). — Soit (M, g(t)) une solution de l’´equation (∗3 ) ; alors la fonction Rmin (t) = min{R(x, t); x ∈ M} est croissante. Nous d´ecrivons maintenant une version vectorielle de ce principe. Soit M munie d’une famille C ∞ de m´etriques g(t), pour t ∈ [0, T ], et soit π : E −→ M un fibr´e vectoriel muni d’une m´etrique fixe et d’une famille C ∞ de connexions compatibles, ∇t . Ces donn´ees permettent de d´efinir un laplacien agissant sur les sections de E, qui d´epend de t et que nous noterons simplement ∆. Consid´erons une fonction F : E × [0, T ] −→ E de classe C ∞ (pour simplifier) telle que, pour t donn´e, F (., t) pr´eserve les fibres. Soit K un ferm´e de E que nous supposons invariant par le transport parall`ele de ∇t , pour tout t ∈ [0, T ], et tel que Kx = K ∩ π −1 (x) soit ferm´e et convexe. L’hypoth`ese cl´e est une relation entre K et l’´equation diff´erentielle ordinaire dtd u = F (u), d´efinie dans chaque fibre Ex de E ; nous supposons que toute solution de celle-ci telle que u(0) ∈ Kx reste dans Kx pour tout t ∈ [0, T ]. ´or` The eme 3.3 ([25], [24], [29] ou [13], th´eor`eme 4.8). — Avec les hypoth`eses ci-dessus, soit s(t) une solution de l’E.D.P. ∂ s + ∆s = F (s) ∂t telle que s(o) ∈ K, alors, pour tout t ∈ [0, T ], s(t) ∈ K. Pour appliquer ceci `a l’op´erateur de courbure il faut noter que, bien que la m´etrique du fibr´e Λ2 (T ∗ M) d´epende de t, une astuce, due `a K. Uhlenbeck (voir [13], section 6.1), permet de se ramener `a une m´etrique fixe sur un fibr´e fixe. En chaque point x ∈ M et t ∈ [0, T ] l’endomorphisme Rm se diagonalise et poss`ede trois valeurs propres not´ees λ(x, t) ≥ µ(x, t) ≥ ν(x, t). Avec les normalisations standards (voir [13], chapitre 6) ces nombres sont ´egaux au double de la courbure sectionnelle du 2-plan correspondant et R(x, t) = λ(x, t) + µ(x, t) + ν(x, t). On montre que les deux expressions Rm2 et Rm♯ se diagonalisent dans la mˆeme base et ont pour valeurs propres respectives (λ2 , µ2, ν 2 ) et (µν, λν, λµ). L’´equation diff´erentielle ordinaire prend donc une forme tr`es simple,  dλ 2    dt = λ + µν dµ = µ2 + λν dt    dν = ν 2 + λµ. dt

Appelons φ la fonction r´eciproque de x → x log x − x. La fonction φ est croissante et va de [−1, +∞) dans [1, +∞). En appliquant 3.3 `a l’ensemble ad´equat ´evident, on obtient

947–10

Th´ eor` eme 3.4 ([24], [25], [29] [34]). — Soit (M, g(t)) une solution de (∗3 ) telle que, pour tout x ∈ M, R(x, 0) ≥ −1 et ν(x, 0) ≥ −φ(R(x, 0)) ; alors, pour tout t ∈ [0, T ] et pour tout x ∈ M, on a ν(x, t) ≥ −φ(R(x, t)). La courbure scalaire ´etant la somme des valeurs propres de Rm on en d´eduit imm´ediatement que Corollaire 3.5. — Sous les mˆemes hypoth`eses, R(x, t) + 2φ(R(x, t)) ≥ λ(x, t) ≥ ν(t, x) ≥ −φ(R(x, t)). C’est-`a-dire, la courbure scalaire contrˆole le tenseur de courbure. L’hypoth`ese, qui est une normalisation, est toujours r´ealis´ee `a homoth´etie sur la m´etrique pr`es. Ce r´esultat est connu sous le nom de th´eor`eme de pincement de Hamilton-Ivey. Insistons sur le fait qu’il n’est valable qu’en dimension 3 et est dˆ u `a la forme particuli`ere du terme de r´eaction dans l’´equation qui gouverne l’op´erateur de courbure. En dimension sup´erieure, 4 par exemple, la situation est sensiblement plus compliqu´ee (voir [25], [30] et [40]). Nous verrons plus loin une cons´equence g´eom´etrique importante de cet ´el´egant r´esultat d’analyse, qui repose sur le fait que φ(x)/x → 0 lorsque x → +∞. D’autres th´eor`emes de pincement peuvent ˆetre obtenus en utilisant une version o` u l’ensemble E d´epend de t (voir [31] et [14] pour un principe du maximum adapt´e `a cette situation) ; ils utilisent d’autres fonctions φ. Nous dirons d’une vari´et´e riemannienne v´erifiant la conclusion du th´eor`eme ci-dessus, pour une fonction φ, qu’elle est de courbure φ-presque positive. 3.5. Estimation des d´ eriv´ ees de la courbure Le caract`ere r´egularisant des ´equations qui d´ecrivent l’´evolution de la courbure se traduit par le r´esultat suivant : ´or` The eme 3.6 ([29]). — Soit (M, g(t)) un flot de Ricci, alors, pour tout α > 0 et k ≥ 1, il existe une constante Ck (qui d´epend de k et α) telle que si α | Rm(x, t)|g(t) ≤ K , pour tout x ∈ M et t ∈ [0, ] , K alors Ck K α |∇k Rm(x, t)|g(t) ≤ k/2 , pour tout x ∈ M et t ∈ (0, ] . t K Les normes utilis´ees sont calcul´ees `a l’aide de la m´etrique g(t) et ∇ d´esigne sa connexion de Levi-Civita. En d’autres termes, si le flot vit assez longtemps il r´egularise suffisamment de sorte `a obtenir un contrˆole C k de la courbure, pour tout k. Ce r´esultat est valable en toute dimension. L’´equation d’´evolution satisfaite par la courbure scalaire R conduit alors `a un contrˆole de ∂R/∂t. Ce type d’in´egalit´es se prouve en montrant que la quantit´e `a estimer v´erifie une ´equation (ou une in´equation) d’´evolution parabolique `a laquelle on applique un principe du maximum. Dans [52] et [53] (voir aussi [29], paragraphe 13), W.-X. Shi prouve une version locale de 3.6, tr`es importante, dans laquelle l’hypoth`ese et les conclusions sont v´erifi´ees sur

947–11

un voisinage d’un point de M. Une liste exhaustive de r´ef´erences peut ˆetre consult´ee dans [13] page 201. 3.6. In´ egalit´ es de Harnack Ce sont des in´egalit´es qui permettent de comparer la courbure en deux points de l’espace-temps M × [0, T ). Dans [27], R. Hamilton prouve une in´egalit´e de Harnack diff´erentielle remarquable, dans l’esprit des r´esultats de P. Li et S. T. Yau ([38]). Il s’agit d’une in´egalit´e, portant sur un tenseur, dont nous donnons ici la cons´equence sur sa trace, dans un cas simple. Supposons que (M, g(t)) est `a op´erateur de courbure positif ou nul, alors, pour tout t ∈ [0, T ) et pour tout champ de vecteurs X sur M de classe C ∞ , on a : H(X) =

∂R R + + 2 < X, ∇R > +2 Ric(X, X) ≥ 0. ∂t t

Nous dirons que (M, g(t)) est une solution antique, si elle est d´efinie sur un intervalle du type (−∞, T ) (elle a un pass´e infini). En appliquant l’in´egalit´e ci-dessus `a la solution translat´ee en temps, g˜(t) = g(t + t0 ), pour t ∈ [0, T − t0 ), et en faisant tendre t0 vers −∞, nous obtenons, pour une telle solution, ∂R + 2 < X, ∇R > +2 Ric(X, X) ≥ 0. ∂t En particulier, en prenant X = 0, on prouve que, sous ces hypoth`eses, ∂R ≥ 0, ∂t c’est-`a-dire que la courbure scalaire est croissante en tout point d’une solution antique d’op´erateur de courbure positif ou nul. Si la solution n’est pas antique on peut v´erifier que la quantit´e tR est croissante. Une version int´egr´ee s’´enonce de la mani`ere suivante (voir [33]) : si (M, g(t)) est `a op´erateur de courbure positif ou nul, alors, pour tout t1 < t2 et x1 , x2 ∈ M, d2 (x , x ) 1 2 R(x1 , t1 ) , R(x2 , t2 ) ≥ exp − t1 2(t2 − t1 )

o` u dt1 d´esigne la distance associ´ee `a la m´etrique g(t1 ). Signalons une interpr´etation g´eom´etrique de ces in´egalit´es dans [12].

´ ´ 4. LES OUTILS GEOM ETRIQUES Hormis les outils standards de la g´eom´etrie riemannienne, les d´emonstrations faites par R. Hamilton et G. Perel’man font appel `a la notion de convergence des vari´et´es riemanniennes et n´ecessitent donc l’utilisation d’un th´eor`eme de compacit´e ; celui-ci doit ˆetre adapt´e afin que les limites obtenues soient munies d’un flot de Ricci. Il est dˆ u `a R. Hamilton ([28]).

947–12

4.1. Le th´ eor` eme de compacit´ e D´ecrivons d’abord la notion de convergence utilis´ee. Nous appellerons flot de Ricci marqu´e un quadruplet M = (M, g(t), O, F ) o` u M est une vari´et´e connexe de dimension n, g(t) un flot de Ricci sur M, d´efini pour t ∈ (α, ω), O est un point de M et F est un rep`ere orthonorm´e de (M, g(0)) en O. On suppose de plus que −∞ ≤ α < 0 < ω ≤ +∞ et que g(t) est compl`ete pour chaque t ; nous dirons que le flot est complet. D´ efinition 4.1. — On dit qu’une suite Mk = (Mk , gk (t), Ok , Fk ) converge vers M∞ = (M∞ , g∞ (t), O∞ , F∞ ) s’il existe i) une suite d’ouverts Uk ⊂ M∞ , contenant O∞ et telle que tout compact de M∞ soit contenu dans Uk pour k assez grand, ii) une suite de diff´eomorphismes Φk : Uk −→ Vk ⊂ Mk envoyant (O∞ , F∞ ) sur (Ok , Fk ), tels que Φ∗k gk converge vers g∞ uniform´ement sur tout compact de M × (α, ω), ainsi que toutes leurs d´eriv´ees spatiales et temporelles. On a alors le th´eor`eme suivant : Th´ eor` eme 4.2 ([28]). — Soit Mk une suite flots de Ricci marqu´es complets telle que, i) pour tout r > 0 et tout t ∈ (α, ω), il existe C(r, t) < +∞ v´erifiant, pour tout k, supBt (Ok ,r) {| Rm(gk (t))|} ≤ C(r, t), o` u Bt (Ok , r) d´esigne la boule de centre Ok et de rayon r pour la m´etrique gk (t). ii) Le rayon d’injectivit´e en Ok de la m´etrique gk (0) est born´e inf´erieurement par une constante strictement positive ind´ependamment de k. Alors, il existe une sous-suite de Mk qui converge vers un flot de Ricci marqu´e complet. Notons que le choix des rep`eres en Ok n’a pour but que de fixer les diff´eomorphismes locaux Φk . Par la suite nous ne mentionnerons plus cette donn´ee. Esquisse de preuve L’hypoth`ese sur la courbure et celle sur le rayon d’injectivit´e de la m´etrique gk (0) permettent de faire converger, `a une sous-suite pr`es, la suite (Mk , gk (0)) pour la convergence de Lipschitz point´ee. La limite n’est, a priori, que C 1,s pour 0 ≤ s < 1. Pour gagner de la r´egularit´e on utilise les estim´es de W.-X. Shi (3.5) ; en effet, l’in´egalit´e α < 0 implique que les d´eriv´ees spatiales de gk (0) sont uniform´ement born´ees, car en 0 le flot a d´ej`a v´ecu pendant une dur´ee au moins ´egale `a α/2. On construit alors une vari´et´e C ∞ limite, M∞ , et les diff´eomorphismes locaux Φk . Les mˆemes estim´ees permettent de montrer que la suite gk (t) est ´equicontinue et born´ee (pour des normes canoniques) d’o` u leur convergence pour une sous-suite. Comme pr´ec´edemment la convergence a lieu au sens C p , pour tout p ∈ N, et conduit `a un flot de Ricci g∞ (t). D`es lors, la principale difficult´e est de borner inf´erieurement le rayon d’injectivit´e en Ok . Dans certaines circonstances R. Hamilton y parvient mais, comme nous le verrons plus loin, G. Perel’man prouve un tr`es joli th´eor`eme g´en´eral dont c’est une cons´equence.

947–13

4.2. Les dilatations paraboliques Il s’agit d’une transformation de la solution de l’´equation parabolique (∗3 ) qui permet d’´etudier `a la (( loupe )) ce qui se passe au voisinage d’un point o` u la courbure scalaire est grande. C’est une technique classique pour ´etudier certaines E.D.P. D´ efinition 4.3. — Soient (M, g(t)) un flot de Ricci d´efini sur [0, T ], t0 ∈ [0, T ) et Q > 0. On appelle dilatation parabolique en t0 de rapport Q la famille de m´etriques, t g˜(t) = Qg t0 + . Q

Elle v´erifie l’´equation (∗3 ) sur l’intervalle [−Qt0 , (T − t0 )Q).

Il est imm´ediat de v´erifier que la transformation ci-dessus produit un nouveau flot de Ricci et l’expression (( dilatation parabolique )) est justifi´ee par le fait que l’´equation parabolique est pr´eserv´ee. Il s’agit d’une dilatation de la m´etrique combin´ee avec une contraction du temps (lorsque Q > 1) ainsi qu’un d´ecalage de l’origine des temps. Donnons un exemple d’utilisation. Soit (M, g(t)) un flot de Ricci d´efini sur un intervalle [0, T ) o` u T < +∞ et soient deux suites xk ∈ M et tk ∈ [0, T ) telles que Qk = R(xk , tk ) −→ +∞ lorsque k → +∞ (ceci ne peut se produire que si tk → T ). Nous consid´erons la solution g˜k (t) = Qk g(tk + Qtk ) , d´efinie sur [−Qk tk , (T − tk )Qk ). Si Qk v´erifie des hypoth`eses suppl´ementaires (voir la sous-section 5.2) et si nous pouvons prouver que le rayon d’injectivit´e en xk de g˜k (0) est minor´e, ind´ependamment de k, alors, par le th´eor`eme de compacit´e pr´ec´edent, il existe une sous-suite de (M, g˜k (t), xk ) convergeant vers un flot de Ricci marqu´e (M∞ , g∞ (t), x∞ ). Ce dernier flot est d´efini sur (−∞, T∞ ) (o` u T∞ ≥ 0), il s’agit donc d’une solution antique qui repr´esente un mod`ele infinit´esimal (et donc un mod`ele local approximatif) aux points o` u la courbure scalaire explose.

´ 5. LES RESULTATS DE G. PEREL’MAN I Les r´ef´erences pour cette section et les suivantes sont les articles de G. Perel’man [44], [46] et [45] ainsi que les notes ´ecrites par J. Lott et B. Kleiner [36], par N. Sesum, G. Tian et X. Wang [51], par P. Topping [58] et par R. Ye [61]. 5.1. Le flot comme gradient d’une fonctionnelle Le flot de la courbure extrins`eque d’une courbe (´equation ∗C ) est donn´e par l’oppos´e du gradient de la longueur et celui de la courbure moyenne d’un corps convexe provient du volume. En revanche, le flot de la courbure de Ricci n’est a priori pas un flot de gradient. Une des premi`eres originalit´es de [44] est de pr´esenter le flot de Ricci de sorte `a le faire apparaˆıtre comme un flot de gradient. Plus pr´ecis´ement, soient (M, g)

947–14

une vari´et´e riemannienne et f une fonction C ∞ sur M `a valeurs r´eelles ; on d´efinit la fonctionnelle, Z F (g, f ) = (R + |∇f |2)e−f dvol .

En se limitant `a l’ensemble des g et f telles que la forme volume e−f dvol soit constante, le gradient de la fonctionnelle F conduit aux ´equations,

∂g ∂f = −2(Ric + Hess(f )) et = −R + ∆f . ∂t ∂t Toutes les expressions qui interviennent sont calcul´ees pour la m´etrique g(t). En transportant la famille g(t) par une famille de diff´eomorphismes d´ependant de t, on se ram`ene ais´ement aux deux ´equations : ∂f ∂g = −2 Ric et = −R + ∆f + |∇f |2 . ∂t ∂t Elles n’ont en g´en´eral pas de solutions car, en effet, l’´equation portant sur la fonction f est une ´equation de la chaleur r´etrograde. L’astuce pour obtenir une solution de ce syst`eme consiste `a consid´erer une solution du flot de Ricci sur un intervalle [0, T ], qui existe pour une donn´ee initiale C ∞ , et `a r´esoudre l’´equation sur f de mani`ere r´etrograde, en imposant une donn´ee finale f (T ). Le long d’une telle famille (g(t), f (t)), la fonctionnelle F est croissante et mˆeme strictement croissante, sauf si Ric + Hess(f ) ≡ 0. G. Perel’man introduit alors la fonctionnelle suivante, d´efinie sur une vari´et´e M munie d’une m´etrique g, Z n W(g, f, τ ) = [τ (R + |∇f |2 ) + f − n](4πτ )− 2 e−f dvol , o` u f est une fonction C ∞ et τ > 0. Les variables de cette fonctionnelle sont contraintes R −f e par la relation M (4πτ dvol = 1. Dans les applications au flot de Ricci, le nombre )n/2 r´eel τ vaut T − t pour un choix judicieux de T . La fonctionnelle W est interpr´et´ee comme une entropie par G. Perel’man (voir [44], section 5) et a un rapport ´etroit avec les in´egalit´es de Sobolev logarithmiques. Le principe de monotonie affirme que, si g, f et τ v´erifient dτ ∂g ∂f n = −2 Ric , = −R + ∆f + |∇f |2 + , = −1 , ∂t ∂t 2τ dt alors W est croissante et strictement croissante sauf si Ric + Hess(f ) − 2τ1 g = 0. Ensuite G. Perel’man d´efinit l’invariant µ(g, τ ) = inf W(g, f, τ ) et montre que la fonction µ f

est born´ee inf´erieurement lorsque τ varie dans un intervalle fini (0, τ0 ]. De plus, la monotonicit´e de W montre que µ(g(t), τ0 − t) est croissante le long d’un flot de Ricci g(t). Les d´etails, principaux exemples et commentaires sont parfaitement r´edig´es dans les notes [36], [51] et [58] et d´epassent le cadre limit´e du pr´esent rapport. Insistons toutefois sur l’int´eressante relation entre la fonctionnelle W et les in´egalit´es de Sobolev logarithmiques sur les vari´et´es riemanniennes.

947–15

5.2. Le non-effondrement local Nous pr´esentons ici le premier r´esultat important, que l’on peut trouver dans la section 4 de [44]. D´ efinition 5.1. — Soient M une vari´et´e de dimension n et g une m´etrique sur M ; on dit que g est κ-non-effondr´ee ` a l’´echelle ρ, si toute boule m´etrique B de rayon −2 0 < r < ρ, qui v´erifie | Rm(x)| ≤ r pour tout x ∈ B, a un volume sup´erieur ` a κr n . Notons que λ2 g est κ-non-effondr´ee `a l’´echelle λρ d`es que g l’est `a l’´echelle ρ. Il est aussi imm´ediat de v´erifier qu’une limite (au sens fort d´ecrit ci-dessus) de m´etriques κ-non-effondr´ees `a l’´echelle ρ poss`ede ´egalement cette propri´et´e. Le r´esultat cl´e est le th´eor`eme suivant, valable en dimension n, ´or` The eme 5.2 (G. Perel’man, [44] section 4). — Soit (M, g(t)) un flot de Ricci sur une vari´et´e compacte M, d´efini sur un intervalle [0, T ) avec T < +∞ ; alors, il existe κ = κ(g(0), T ) tel que, pour tout t ∈ [0, T ), g(t) est κ-non-effondr´ee ` a l’´echelle T 1/2 . Le r´esultat 4.1 de [44] n’est pas exactement ´enonc´e de cette mani`ere, n´eanmoins le th´eor`eme ci-dessus en r´esume l’esprit. L’´echelle T 1/2 pourrait ˆetre remplac´ee par une autre constante. Plus pr´ecis´ement, comme nous l’a sugg´er´e J. Lott, le th´eor`eme cidessus pourrait ˆetre ´enonc´e sous la forme suivante : pour toute ´echelle ρ > 0, il existe κ(ρ, g(0), T ) tel que g(t) est κ-non-effondr´ee `a l’´echelle ρ, pour tout t ∈ [0, T ). Id´ ee de la preuve On utilise l’invariant µ de la sous-section 5.1. On montre que, s’il existe une suite de boules Bk = Bg(tk ) (xk , rk ), pour rk2 ≤ T et tk → T , telles que rk−n vol(Bk , g(tk )) → 0, alors µ(g(tk ), rk2 ) → −∞. Il suffit pour cela d’exhiber une fonction fk qui minimise W(g(tk ), . , rk2 ). La monotonicit´e de µ le long des trajectoires du flot de Ricci implique que µ(g(0), tk + rk2 ) −→ −∞, ce qui contredit la propri´et´e ´enonc´ee en 5.1 car la suite k→+∞

tk + rk2 est born´ee (T est fini). Un th´eor`eme de J. Cheeger (voir [5]) affirme que, sur l’ensemble des vari´et´es riemanniennes compactes (M, g) de dimension n telles que |Rm(g)| = sup{| Rm(x)|; x ∈ M} ≤ 1, vol(M, g) ≥ K et diam(M, g) ≤ 1, le rayon d’injectivit´e (global) est minor´e par un nombre strictement positif ǫ(n, K) ne d´ependant que de n et K. On peut prouver une version locale dans laquelle la vari´et´e (M, g) est remplac´ee par une boule de rayon 1. Consid´erons alors un flot de Ricci d´efini sur un intervalle [0, T ), avec T < +∞ et posons 1 erifie r(t) = | Rm(g(t))|−1/2 . Pour tout t la m´etrique g˜(t) = r(t) 2 g(t) v´ i) Bg(t) (x, r(t)) = Bg˜(t) (x, 1) pour x ∈ M, ii) | Rm(˜ g (t))| = r(t)2 | Rm(g(t))| ≤ 1 sur Bg˜(t) (x, 1), iii) vol(Bg˜(t) (x, 1), g˜(t)) ≥ κ, d’apr`es le th´eor`eme 5.2. Le r´esultat de J. Cheeger ´enonc´e ci-dessus montre que, si inj(x, g) d´esigne le rayon d’injectivit´e en x d’une m´etrique g, alors inj(x, g(t)) = r(t) inj(x, g˜(t)) ≥ r(t)ǫ(n, κ), c’est-`a-dire, | Rm(g(t))| inj2 (x, g(t)) ≥ ǫ2 (n, κ) ,

947–16

pour tout x ∈ M et t ∈ [0, T ). C’est une difficult´e majeure dans l’´etude du flot de la courbure de Ricci qui est lev´ee par ce r´esultat sur le rayon d’injectivit´e. Supposons maintenant que T < +∞ est le temps maximal de vie de la solution ; alors | Rm(g(t))| → +∞ lorsque t → T . Choisissons des suites xk ∈ M et tk −→ T , telles k→+∞ que Qk = | Rm(xk , tk )| = sup{| Rm(g(t))|; t ∈ [0, tk ]} −→ +∞ , et consid´erons la suite de m´etriques gk (t) obtenues par dilatation parabolique en tk et de rapport Qk . En pointant en xk , elle admet une sous-suite convergente vers un flot de Ricci ; on peut, en effet appliquer le th´eor`eme 4.2. La limite est un flot de Ricci complet qui est une solution antique et κ-non-effondr´ee `a toute ´echelle. Donnons maintenant une autre version de ce ph´enom`ene, en dimension 3, en consid´erant une suite (xk , tk ) telle que la courbure scalaire v´erifie : Hk = R(xk , tk ) = sup{R(x, t) ; x ∈ M et t ∈ [0, tk ]} −→ +∞ . La suite hk (t) obtenue par dilatation parabolique en tk et de rapport Hk admet une sous-suite convergente (point´ee en xk ) vers un flot de Ricci (M∞ , h∞ (t)) (point´e en x∞ ), d´efini sur (−∞, 0]. En effet, la courbure scalaire de g(t) est minor´ee pour tout t car son minimum croˆıt ; de plus, pour t ≤ tk son maximum est major´e par R(xk , tk ). On en d´eduit que, pour t ≤ 0 fix´e, la courbure scalaire de hk (t) est born´ee. Le corollaire du th´eor`eme 3.4 montre alors que les courbures sectionnelles de hk (t) sont born´ees pour t ≤ 0. Le rayon d’injectivit´e ´etant contrˆol´e par l’argument ci-dessus, nous pouvons appliquer le th´eor`eme de compacit´e 4.2. La limite est de nouveau une solution antique et κ-non-effondr´ee. Elle v´erifie de plus Proposition 5.3. — Pour tout t ≤ 0, la m´etrique h∞ (t) est non plate et d’op´erateur de courbure positif ou nul. Preuve Soit y∞ ∈ M∞ , il est limite d’une suite yk ∈ M et Rm∞ (y∞ , t) = limk→∞ Rmk (yk , t), o` u Rmk d´esigne l’op´erateur de courbure de hk . Or, pour t ≤ 0, Rmk (yk , t) =

Rm(yk , tk + Hk

t ) Hk

≥−

φ(R(yk , tk + Hk

t )) Hk

≥−

φ(Hk ) →0 , Hk k→+∞

d’o` u la positivit´e de la courbure de h∞ (t). De plus, comme la courbure scalaire de hk (tk ) est ´egale `a 1 en xk , celle de h∞ (0) est aussi ´egale `a 1 en x∞ ; or si une des m´etriques hk (t) ´etait plate, elles le seraient toutes. Une version plus ´elabor´ee du th´eor`eme 5.2 est prouv´ee dans la section 8 de [44] ; elle repose sur l’importante section 7 dans laquelle la fonctionnelle suivante est consid´er´ee. Si (M, g(t)) est un flot de Ricci, γ une courbe C 1 sur M et 0 ≤ τ1 ≤ τ = T − t ≤ τ2 , on d´efinit Z τ2 √ L(γ) = τ (R(γ(τ ), τ ) + |γ(τ ˙ )|2g(τ ) )dτ . τ1

947–17

La th´eorie variationnelle de cette fonctionnelle est d´ecrite en d´etail : formule de variation premi`ere, seconde, champs de Jacobi et une notion de volume associ´ee, appel´ee volume r´eduit. La monotonicit´e du volume r´eduit est prouv´ee et celui-ci est alors utilis´e en lieu et place de la fonctionnelle µ. Les notions et in´egalit´es introduites dans cette section 7 de [44] sont utilis´ees de mani`ere essentielle dans [46]. 5.3. Les κ-solutions On rappelle que les vari´et´es consid´er´ees sont de dimension 3 et orientables. Nous consid´erons maintenant une famille de solutions qui sont appel´ees `a ˆetre les mod`eles locaux au voisinage des points o` u la courbure scalaire est grande. Elles sont d´ej`a apparues dans la section pr´ec´edente comme limites de flots renormalis´es et le but de cette sous-section est d’en donner une classification. D´ efinition 5.4. — Soit κ > 0. Une κ-solution est une solution C ∞ du flot de Ricci, (M, g(t)), d´efinie pour −∞ < t ≤ 0, telle que i) M est une vari´et´e de dimension 3 qui peut ˆetre non compacte, ii) pour chaque t, la m´etrique g(t) est compl`ete, d’op´erateur de courbure positif ou nul, de courbure sectionnelle born´ee sup´erieurement et non plate, iii) pour chaque t, g(t) est κ-non-effondr´ee ` a toute ´echelle. Les premiers exemples de κ-solutions sont S 3 et S 2 × R munies de leur flot standard, c’est-`a-dire telles que la m´etrique au temps 0 est leur m´etrique canonique. En revanche, on v´erifie que le flot standard sur S 2 × S 1 n’est pas une κ-solution. Nous pouvons utiliser les in´egalit´es de Harnack diff´erentielles et int´egr´ees d´ecrites dans la sous-section 3.6. L’in´egalit´e int´egr´ee prouve, en particulier, que la courbure scalaire d’une κ-solution est partout strictement positive ; en effet, s’il existe (x2 , t2 ) tel que R(x2 , t2 ) = 0 alors, pour tout x1 ∈ M et tout t1 < t2 , on a R(x1 , t1 ) = 0 et g(t1 ) est plate, ce qui est exclu. Nous allons associer `a chaque κ-solution, une autre solution appel´ee soliton. D´ efinition 5.5. — On appelle soliton de Ricci, ou plus simplement soliton, un flot de Ricci g(t) tel qu’il existe une famille de diff´eomorphismes ψt , d´ependant de mani`ere C ∞ de t, et une fonction α(t), C ∞ et strictement positive, v´erifiant : g(t) = α(t)ψt∗ g(0) . On dit que le soliton est contractant (resp. dilatant) si α est strictement d´ecroissante (resp. strictement croissante). Enfin, le soliton est dit de type gradient si dψdst+s |s=0 (x) = ∇g(t) ft (ψt (x)), o` u ft est une famille de fonctions d´ependant de mani`ere C ∞ des deux variables x et t. Les solitons sont des points fixes du flot vu sur l’espace des m´etriques riemanniennes modulo l’action des diff´eomorphismes. Ils g´en´eralisent la notion de m´etrique d’Einstein

947–18

et sont des solutions auto-similaires. Un calcul imm´ediat montre qu’un soliton de type gradient v´erifie l’´equation (voir [58]) : Ricg(t) + Hessg(t) ft +

α′ (t) g(t) = 0 . 2α(t)

Soit alors une κ-solution (M, g(t)) ; G. Perel’man prouve la proposition suivante : Proposition 5.6 ([44], 11.2). — Il existe une suite (xk , tk ) telle que la famille de m´etriques obtenue `a partir de g(t) par dilatation parabolique en tk et de rapport −1/tk , point´ee en xk converge, lorsque tk tend vers −∞, vers un soliton contractant de type gradient et non-plat. Nous l’appellerons soliton asymptotique de la κ-solution et le noterons M−∞ . Un tel soliton n’est, a priori, pas unique, mais, par abus de langage, nous parlerons du soliton asymptotique. La preuve met en œuvre toute la th´eorie d´evelopp´ee dans le chapitre 7 de [44] et, en particulier, l’outil important qu’est le volume r´eduit. Les nombreux d´etails ne peuvent ˆetre d´ecrits dans ce rapport, le lecteur int´eress´e peut se reporter `a [36], [51] et [61]. L’id´ee est maintenant de classifier les κ-solutions en classifiant leur soliton asymptotique. On montre qu’un soliton asymptotique est luimˆeme une κ-solution (voir [36], 40.3). Consid´erons un tel soliton asymptotique. 1) Dans le cas o` u M−∞ est non compact, il ne peut avoir sa courbure sectionnelle constamment strictement positive d’apr`es le th´eor`eme suivant prouv´e dans [46], section 1 : ´or` The eme 5.7. — Il n’existe pas de soliton contractant de type gradient non compact de dimension 3, orient´e, complet et de courbure sectionnelle strictement positive et born´ee. Par ailleurs, si son tenseur de courbure a un noyau, pour une valeur de t, un th´eor`eme de R. Hamilton ([25]) montre que celui-ci est invariant par transport parall`ele et en temps ; c’est un principe du maximum fort pour les ´equations paraboliques vectorielles. On prouve alors que le revˆetement universel de la vari´et´e se scinde en un produit m´etrique N × R, o` u N est une κ-solution de dimension 2. G. Perel’man prouve dans [44], 11.3, que la seule κ-solution orient´ee de dimension 2 est la sph`ere munie de son flot de courbure constante (nous dirons la sph`ere ronde). Notons qu’il invoque un r´esultat de R. Hamilton dans [26], qui n’est malheureusement valable que pour le cas compact ; il faut donc se reporter `a [36] ou bien [61] pour compl´eter la preuve. Le soliton est donc un quotient non-compact et orientable de S 2 × R, c’est-`a-dire, S 2 × R lui-mˆeme, muni de son flot canonique (que nous appellerons cylindrique), ou S 2 ×Z2 R, o` u l’action de Z2 est donn´ee par la relation (x, s) ∼ (−x, −s), la vari´et´e est alors diff´eomorphe `a ¯ 3 (o` RP 3 B u B 3 est diff´eomorphe `a une boule euclidienne ouverte de dimension 3 et 3 ¯ est son adh´erence). B

947–19

2) Si M−∞ est compact et s’il se scinde localement, ce doit ˆetre un quotient de S 2 × S 1 muni de son flot canonique (par l’argument pr´ec´edent), or ce dernier n’est pas une κ-solution. Il ne reste donc que le cas o` u l’op´erateur de courbure est strictement positif pour tous les temps. Le th´eor`eme 2.1 montre que le soliton doit tendre `a ˆetre de courbure constante et, comme il est auto-similaire, il est de courbure constante. La vari´et´e M−∞ est un quotient de S 3 munie de sa m´etrique canonique. En r´esum´e, si M−∞ est compact c’est un quotient de la sph`ere canonique, et s’il est non compact c’est S 2 ×Z2 R ou S 2 × R. Pour classer les κ-solutions nous aurons recours au th´eor`eme de R. Hamilton, prouv´e dans [25], qui montre qu’un flot de Ricci compact en dimension 3 et qui est de courbure sectionnelle positive ou nulle est de l’un des trois types suivants : i) la m´etrique g(t) est plate pour tout t, ii) le flot se scinde localement en un produit N × R, o` u N est une surface de courbure strictement positive, iii) pour tout t, g(t) est de courbure sectionnelle strictement positive. 1) Si (M, g(t)) est une κ-solution compacte, elle ne peut ni ˆetre plate (par hypoth`ese) ni ˆetre recouverte par N × S 1 (qui n’est pas une κ-solution), elle est donc de courbure strictement positive et, par le th´eor`eme 2.1, est diff´eomorphe `a un quotient fini de S 3 . On peut encore subdiviser ce cas en deux sous-cas : i) le soliton asymptotique est compact. Celui-ci est alors, d’apr`es la discussion pr´ec´edente, le flot canonique sur un quotient de S 3 munie de sa m´etrique canonique. La κ-solution ressemble lorsque le temps se rapproche de −∞ `a ce soliton. Or, le th´eor`eme 2.1 montre que le flot tend `a rendre la vari´et´e de courbure constante ; si elle l’est en −∞, elle le sera pour tout temps. Il est ais´e de formaliser cette observation. Dans ce cas donc, la κ-solution est le flot canonique, de courbure constante pour chaque t, sur un quotient de S 3 . Notons que ce quotient peut ˆetre arbitrairement petit, au sens o` u il peut ˆetre un espace lenticulaire. ii) Le soliton asymptotique est non-compact. Nous traitons ce cas ci-dessous car il r´eclame une autre construction. 2) Si la κ-solution est non-compacte elle peut ˆetre localement scind´ee ou de courbure sectionnelle strictement positive. i) Si elle est localement scind´ee, comme pr´ec´edemment, elle est isom´etrique au flot canonique sur S 2 × R ou bien S 2 ×Z2 R. Topologiquement c’est un cylindre ou bien ¯ 3. RP 3 B ii) Si elle est de courbure sectionnelle strictement positive, elle est diff´eomorphe `a une boule B 3 (ou, ce qui revient au mˆeme, `a R3 ) ; c’est, en effet, une cons´equence d’un th´eor`eme dˆ u `a D. Gromoll et W. Meyer (voir [5], chapitre 8 et [23], pour un survol). C’est un cas que l’on pr´ecise ´egalement ci-dessous. En r´esum´e seuls restent `a d´ecrire un peu plus pr´ecis´ement les cas de courbure strictement positive, les autres tombant sous le coup du scindement. Si (M, g(t)) est une κ-solution et (x0 , t0 ) ∈ M × (−∞, 0], on

947–20

d´efinit la κ-solution normalis´ee en (x0 , t0 ) par : g0 (t) = R(x0 , t0 )g(t0 +

t ). R(x0 , t0 )

C’est une dilatation parabolique de sorte que Rg0 (x0 , 0) = 1. On a alors, ´or` The eme 5.8 ([44], 11.7). — Pour tout κ > 0, l’ensemble des κ-solutions normalis´ees est compact pour la topologie de la convergence point´ee. La topologie est celle sugg´er´ee dans l’´enonc´e du th´eor`eme de compacit´e 4.2. D´ efinition 5.9. — Soient (M, g) une vari´et´e riemannienne de dimension 3 et ǫ > 0. Une partie T ⊂ M est appel´ee une ǫ-gorge ((( neck )) chez Hamilton et Perel’man) centr´ee en x ∈ T s’il existe un diff´eomorphisme Ψ : T −→ S 2 × (−1/ǫ, 1/ǫ), tel que Ψ(x) ∈ S 2 × {0} et tel que l’image par Ψ de la m´etrique normalis´ee R(x)g (o` u R d´esigne la N courbure scalaire de g) est `a distance ǫ, dans la topologie C , du produit de la m´etrique de courbure scalaire constante ´egale ` a 1 sur S 2 par la m´etrique usuelle de l’intervalle. Nous dirons que R(x)g est ǫ-proche du cylindre. L’expression (( ǫ-gorge )) est un raccourci pratique pour (( gorge de taille 2/ǫ )). Le nombre N est grand et de l’ordre de [1/ǫ]. Revenons `a la κ-solution (M, g(t)). Pour ǫ > 0 et pour un temps t, on note Mǫ (t) l’ensemble des points qui ne sont pas centres d’une ǫ-gorge. L’´etude des κ-solutions se fait en contrˆolant la g´eom´etrie des ensembles Mǫ (t). On proc`ede grosso modo toujours de la mˆeme mani`ere ; si ces parties ne v´erifient pas les propri´et´es souhait´ees, on trouve une suite de points et de temps tels que les m´etriques correspondantes convergent, par le th´eor`eme de compacit´e ci-dessus, vers une κ-solution qui poss`ede une droite (i.e. une g´eod´esique param´etr´ee par R et minimisante sur toute sa longueur) ; on en d´eduit que la limite obtenue se scinde en un cylindre et, par cons´equent, juste avant la limite, les points choisis pour marquer la suite sont dans des ǫ-gorges, contredisant ainsi le fait qu’ils ont ´et´e choisis dans Mǫ (t). On diff´erencie deux cas : i) Mǫ est contenu dans deux boules disjointes s´epar´ees par un tube ; c’est le cas lorsque la κ-solution est compacte. Elle est alors diff´eomorphe `a S 3 ou RP 3 . On pourrait s’attendre `a ce qu’apparaissent ´egalement RP 3 #RP 3 ; ceci n’est pas possible car nous sommes dans une situation o` u la vari´et´e est diff´eomorphe `a un quotient de S 3 et a donc un groupe fondamental fini. ii) Mǫ est compact et inclus dans une boule en dehors de laquelle la vari´et´e est un tube ; on sait d´ej`a que la κ-solution est diff´eomorphe `a une boule B 3 , elle est munie de m´etriques telles, qu’en dehors d’un compact, tout point est le centre d’une ǫ-gorge. D´ efinition 5.10. — On appelle capuchon de taille 2/ǫ, ou, plus simplement, ǫ-capuchon ((( cap )) chez Perel’man), une m´etrique sur une boule euclidienne de ¯ 3 , telle que tout point en dehors d’un compact est le dimension 3, B 3 , ou sur RP 3 B centre d’une ǫ-gorge et telle que la courbure scalaire soit born´ee.

947–21

R´esumons ce que produit cette ´etude (voir [44], [36] et [51] pour les nombreux d´etails). Pour un flot de Ricci, un point x et un temps t, nous noterons B(x, t, r) la boule de centre x et de rayon r pour la m´etrique g(t). ´or` The eme 5.11 ([46] section 1.5 et [36] section 53). — Il existe ǫ0 > 0 tel que, pour tout 0 < ǫ ≤ ǫ0 , il existe une constante C1 = C1 (ǫ) > 0 telle que, pour toute κ-solution C1 1 (M, g(t)) et tout (x, t), il existe un rayon r ∈ [ C1 R(x,t) 1/2 , R(x,t)1/2 ] et un voisinage U, B(x, t, r) ⊂ U ⊂ B(x, t, 2r), qui v´erifie une des assertions suivantes : a) U est une ǫ-gorge, b) U est un ǫ-capuchon, c) U est une vari´et´e compacte diff´eomorphe ` a S 3 ou RP 3 et de courbure strictement positive, d) U est une vari´et´e compacte de courbure sectionnelle constante strictement positive. On peut mˆeme contrˆoler la courbure scalaire et minorer le volume dans les cas a), b) et c), par des quantit´es de l’ordre de R(x, t), de mˆeme que la courbure sectionnelle dans le cas c). De plus, en utilisant le soliton asymptotique et le th´eor`eme de compacit´e on prouve aussi qu’il existe κ0 > 0 et une constante universelle η > 0 tels que toute κ-solution soit ou bien un quotient de la sph`ere canonique, ou bien une κ0 -solution, et qu’en chacun de ses points on ait ∂R | ≤ ηR2 . ∂t On a exclu les quotients de la sph`ere canonique de la possibilit´e d’ˆetre une κ0 -solution, car ils peuvent ˆetre tr`es petits, des espaces lenticulaires par exemple pour lesquels la constante κ n’est pas minor´ee. Ces derni`eres in´egalit´es permettent de contrˆoler la courbure dans un voisinage en espace-temps d’un point donn´e. (5.3.1)

|∇R| ≤ ηR3/2 ,

|

5.4. Le th´ eor` eme des voisinages canoniques C’est le point culminant de [44], le r´esultat qui permet de pratiquer la chirurgie autorisant la poursuite du flot malgr´e les singularit´es. Utilisons, pour simplifier, une d´efinition donn´ee dans [44] D´ efinition 5.12. — On appelle voisinage parabolique, not´e P (x, t, r, ∆t), l’ensemble des points (x′ , t′ ) avec x′ ∈ B(x, t, r) et t′ ∈ [t, t + ∆t] ou t′ ∈ [t + ∆t, t] suivant le signe de ∆t.

On a montr´e dans la sous-section 5.2 que, si l’on regarde une solution du flot de Ricci au voisinage d’un maximum (en temps et en espace) de la courbure scalaire, alors la m´etrique ressemble `a (converge vers) une κ-solution. On prouve alors un r´esultat plus pr´ecis qui permet de d´ecrire les r´egions de grande courbure scalaire qui ne correspondent pas n´ecessairement `a des maxima

947–22

Th´ eor` eme 5.13 ([44], 12.1). — Soit ǫ > 0, κ > 0 ; il existe r0 > 0 tels que, si (M, g(t)) est un flot de Ricci d´efini pour t ∈ [0, T ], de courbure φ-presque positive, sur une vari´et´e compacte de dimension 3, κ-non-effondr´ee ` a l’´echelle r0 , alors, pour −2 1 tout (x0 , t0 ), t0 ≥ 1 et Q = R(x0 , t0 ) ≥ r0 , le voisinage parabolique P (x0 , t0 , √1ǫQ , − ǫQ ) est, apr`es dilatation parabolique en t0 de rapport Q, ǫ-proche du voisinage correspondant d’une κ-solution. La proximit´e de deux m´etriques est celle utilis´ee dans la d´efinition d’une gorge. On dit qu’un voisinage parabolique est proche d’une solution si le flot sur l’intervalle consid´er´e est proche du flot sur la solution pour un intervalle de temps identique. L’hypoth`ese t0 ≥ 1 est pr´esente car il est n´ecessaire que le flot ait v´ecu assez longtemps (disons 1 seconde) afin de r´egulariser les voisinages des points de grande courbure. On peut toujours se ramener `a cette hypoth`ese par dilatation parabolique qui rend la courbure petite au temps 0 ; les estim´es de W.-X. Shi montrent alors que l’explosion ne survient pas avant 1 seconde. Nous avons simplifi´e l’´enonc´e en omettant un param`etre qui est la fonction φ de l’in´egalit´e de Hamilton-Ivey ; le nombre r0 d´epend du choix de cette fonction (dont nous avons donn´e un exemple dans le th´eor`eme 3.4). Ceci, combin´e avec le th´eor`eme de structure des κ-solutions, donne une description, comme dans 5.11, des voisinages des points de grande courbure. Insistons sur le fait que ce th´eor`eme affirme que l’explosion a toujours lieu le long de sous-vari´et´es diff´eomorphes `a S 2 . Id´ ee de la preuve La principale difficult´e vient du fait que nous ne travaillons pas en un maximum de la courbure scalaire. La preuve est faite par contradiction. On suppose qu’il existe ǫ > 0, κ > 0, une suite de flots de Ricci (de dimension 3), not´es (Mk , gk (t)), de courbure φ-presque positive, d´efinis sur un intervalle [0, Tk ], xˆk ∈ Mk , tˆk ≥ 1, rk −→ 0, tels k→+∞

que Mk est κ-non-effondr´ee aux ´echelles inf´erieures `a rk , Qk = R(ˆ xk , tˆk ) ≥ rk−2 et le voisinage parabolique correspondant n’est pas ǫ-proche d’une κ-solution (apr`es changement d’´echelle de rapport Qk ). Si un tel point de l’espace temps (ˆ xk , tˆk ) est appel´e un mauvais point, on cherche parmi les mauvais points ceux qui ont (presque) la plus grande courbure scalaire. On trouve une suite (xk , tk ) de mauvais points tels que tout point (y, t), t ≤ tk , v´erifiant R(y, t) ≥ 2R(xk , tk ) est bon. Les estim´es du gradient de la courbure scalaire en espace montrent que, dans un voisinage de ces points de taille contrˆol´ee, la courbure scalaire est comparable `a R(xk , tk ). On peut alors prendre une limite sur ces voisinages en renormalisant les m´etriques comme dans la sous-section 5.2. Il faut ensuite montrer que la limite de la suite renormalis´ee existe au sens de la convergence point´ee, c’est-`a-dire sur toute boule. Par ailleurs, l’estim´e sur la d´eriv´ee de la courbure de la sous-section pr´ec´edente montre que cette limite poss`ede un (( bout )) de flot vers les temps n´egatifs et il faut l`a encore montrer qu’elle est munie d’un flot de Ricci qui est une solution antique. En conclusion on prouve que c’est une κ-solution,

947–23

ce qui contredit le choix des points (xk , tk ). Le th´eor`eme de compacit´e 4.2, dans des formes plus g´en´erales, est utilis´e plusieurs fois `a chaque ´etape.

6. LES TRAVAUX DE PEREL’MAN : LE FLOT AVEC CHIRURGIES L’article [46] repr´esente un travail techniquement difficile et qui utilise toutes les notions d´ej`a introduites dans [44]. Dans ce rapport nous ne retiendrons que la construction du flot avec chirurgies, qui permet de franchir les singularit´es. C’est une id´ee invent´ee par R. Hamilton – pour la dimension 4 dans [30] (voir aussi [29]) – qui a fait une grande partie du travail dont une br`eve description suit. La seule faiblesse de l’argument d´evelopp´e dans [30] est que la chirurgie ne se pratique qu’aux points de courbure (presque) maximale. Quelques arguments sont incomplets, en particulier la preuve de la non-accumulation des chirurgies. Pour ce qui concerne la dimension 4, ceci est trait´e dans la r´ecente pr´epublication [8], dans laquelle la m´ethode d´evelopp´ee par G. Perel’man, dans [46], est adapt´ee au contexte. 6.1. Premier temps singulier Consid´erons un flot de Ricci (M, g(t)) d´efini sur un intervalle maximal [0, T ), o` uT est fini et M est une vari´et´e compacte, connexe, sans bord, orient´ee et de dimension 3. Nous supposerons g(0) normalis´ee pour satisfaire les hypoth`eses de 3.4. La courbure de g(t) explose au voisinage de T (c’est-`a-dire, son supremum tend vers +∞). Par le th´eor`eme des voisinages canoniques, pour ǫ assez petit, il existe r = r(ǫ) > 0 tel que tout point (x, t) v´erifiant R(x, t) ≥ r −2 a un voisinage qui est soit une ǫ-gorge, soit un ǫ-capuchon, soit une vari´et´e compacte de courbure sectionnelle strictement positive. Dans ce dernier cas, par connexit´e, M est enti`erement contenue dans ce voisinage et est une vari´et´e de courbure strictement positive ; par le th´eor`eme 2.1, M peut ˆetre munie d’une m´etrique de courbure constante et est donc un quotient de la sph`ere S 3 par un groupe d’isom´etries de la m´etrique canonique. Dans les autres cas, les voisinages canoniques sont des gorges ou bien des capuchons. On appelle Ω l’ensemble des points o` u la courbure de g(t) reste born´ee lorsque t tend vers T . Notons que Ω n’est pas n´ecessairement connexe mais, grˆace `a (5.3.1), on montre qu’il est ouvert dans M. Au premier temps singulier, l’ensemble Ω ne peut pas avoir de composante compacte ; en effet, cette composante serait ouverte et ferm´ee, et M ´etant connexe, elle serait ´egale `a M en entier ; mais alors la courbure sur M serait born´ee, ce qui est incompatible avec la d´efinition de T . Donc MΩ est l’ensemble des points o` u la courbure tend vers l’infini lorsque t tend vers T et est non vide. L’ensemble, MΩ peut ˆetre tr`es compliqu´e ; en effet, le th´eor`eme des voisinages canoniques affirme que l’explosion a lieu dans des gorges, le long de sph`eres et celles-ci pourraient tr`es bien s’accumuler. L’ensemble Ω peut ˆetre vide. Si c’est le cas, en prenant un temps t tr`es proche de T , on constate que la vari´et´e M est enti`erement recouverte par des ǫ-gorges et des ǫ-capuchons

947–24

de courbure born´ee. Lorsque deux ǫ-gorges s’intersectent, leur r´eunion est diff´eomorphe a` S 2 × R, si ǫ est choisi assez petit. De mˆeme, si une ǫ-gorge intersecte un ǫ-capuchon, ¯ 3 . Par ailleurs les gorges et les capuchons leur r´eunion est diff´eomorphe `a B 3 ou RP 3 B sont de diam`etre minor´e, donc, pour t < T , on peut choisir un recouvrement fini par de tels ensembles. Cela montre que, dans ce cas, M est diff´eomorphe `a S 3 , RP 3 , S 2 × S 1 ou bien RP 3 #RP 3 . C’est un cas o` u la vari´et´e disparaˆıt en un temps fini. Si Ω est non vide, la m´etrique g(t) converge sur Ω vers une m´etrique de classe ∞ C not´ee g(T ) (pour prouver ce fait il faut utiliser les estim´es de W.-X. Shi). Le th´eor`eme des voisinages canoniques s’applique, par continuit´e, `a (Ω, g(T )), en changeant ´eventuellement la constante ǫ. Pour un nombre ρ < r, consid´erons l’ensemble Ω(ρ) = {(x, t) ; R(x, T ) ≤ ρ−2 }. Si Ω(ρ) est vide, on conclut comme dans le cas o` uΩ est vide ; on suppose donc Ω(ρ) non vide. Le nombre ρ est de la forme δr, o` uδ >0 est un param`etre `a choisir, qui permet d’avoir de la marge pour les op´erations qui suivent. Les in´egalit´es 5.3.1 montrent que Ωρ est compact. Nous allons d´ecrire ΩΩρ . La d´efinition qui suit s’applique `a des chirurgies ult´erieures, c’est pourquoi ii) mentionne une composante compacte qui n’existe pas au premier temps singulier. D´ efinition 6.1. — Dans l’ensemble Ω, on appelle i) ǫ-tube, une sous-vari´et´e diff´eomorphe ` a S 2 × I (I est un intervalle) dont chaque point est le centre d’une ǫ-gorge dans Ω, ii) ǫ-tore, une composante de Ω qui est une vari´et´e ferm´ee dont chaque point est le centre d’une ǫ-gorge. Un ǫ-tore est diff´eomorphe ` a S2 × S1, iii) ǫ-pointe ((( horn )) chez G. Perel’man), un sous-ensemble de Ω diff´eomorphe `a 2 S × [0, 1) dont le bord est contenu dans Ω(ρ) et dont chaque point est le centre d’une ǫ-gorge. La courbure scalaire de g(T ) tend vers +∞ ` a l’autre bout, iv) double ǫ-pointe, une composante connexe de Ω diff´eomorphe ` a S 2 × (0, 1) dont chaque point est le centre d’une ǫ-gorge. La courbure scalaire de g(T ) tend vers l’infini aux deux bouts, v) ǫ-pointe encapuchonn´ee, une composante de Ω diff´eomorphe ` a une boule ou `a 3 3 ¯ RP B dont chaque point est soit dans une ǫ-gorge, soit dans un ǫ-capuchon. La courbure scalaire tend vers l’infini au bout. Dans la suite nous pourrons omettre la mention `a ǫ pour all´eger le discours. Nous travaillons au temps T . Partons d’une gorge ou d’un capuchon dans ΩΩ(ρ), un point de son bord est contenu dans Ω(ρ), dans une gorge ou bien un capuchon adjacent `a la premi`ere gorge. Si c’est une gorge, en poursuivant ce proc´ed´e on ne peut s’arrˆeter que lorsque l’on rencontre un capuchon ou bien Ω(ρ) ; s’il se poursuit ind´efiniment on obtient une pointe ; notons qu’on ne sait rien du diam`etre des pointes qui peut ˆetre fini ou infini. On peut r´esumer ceci par l’assertion suivante : Fait 6.2. — Tout ǫ-gorge ou ǫ-capuchon de ΩΩ(ρ) est contenu dans l’un des ensembles suivants : a) un tube dont les bords sont dans Ω(ρ),

947–25

b) un capuchon dont le bord est dans Ω(ρ), c) une pointe dont le bord est dans Ω(ρ), d) une pointe encapuchonn´ee, e) une double pointe.

Rappelons que nous avons exclu les composantes compactes de Ω pour ce premier temps singulier. On remarque qu’un point x du bord de Ω(ρ) est contenu dans une ǫ-gorge, c’est-`a-dire un ensemble presque isom´etrique `a S 2 ×(− ǫ√1 ρ , ǫ√1 ρ ), dont les sph`eres sont de courbure presque ´egale `a ρ. Dans ce cylindre la courbure peut osciller autour de ρ−2 , il se pourrait donc qu’il se d´ecompose en une infinit´e de petits cylindres de courbure scalaire sup´erieure `a ρ−2 s´epar´es par d’autres de courbure scalaire inf´erieure `a cette valeur. Ceci montre que l’affirmation, figurant dans [46] page 7, selon laquelle les ǫ-tubes dont les bords rencontrent Ω(ρ) ont un volume minor´e n’est pas correcte, mais cela est sans importance pour la suite. Les ensembles de type b) ont un volume minor´e en fonction de ρ d’apr`es 5.11 et ceux de type c), dont la courbure tend vers l’infini au bout, contiennent une gorge de courbure de l’ordre de 2ρ−2 ; leur volume est donc ´egalement minor´e par une fonction de ρ. Par ailleurs le volume de (M, g(t)) est major´e ind´ependamment de t sur l’intervalle [0, T ) car la courbure scalaire est minor´ee (le minimum est croissant) et, d vol(M, g(t)) =− dt

Z

R(x, t)dvg(t) .

M

On en d´eduit que le volume de (Ω, g(T )) est fini et, par cons´equent, qu’il n’y a qu’un nombre fini de composantes de Ω contenant des points de Ω(ρ) et chacune d’elles a un nombre fini de bouts, tous de type c) (un capuchon n’est pas un bout et un tube relie deux parties de Ω(ρ)). Les autres composantes de Ω sont de types d) et e). Lorsque t se rapproche de T on peut voir apparaˆıtre un chapelet de doubles pointes avec d’un cˆot´e une pointe reli´ee `a Ω(ρ) et de l’autre une pointe encapuchonn´ee ou bien se terminant des deux cˆot´es par une pointe reli´ee `a Ω(ρ). Le nombre de doubles pointes peut ˆetre infini. Pour un temps fix´e juste avant l’explosion en T , la vari´et´e est de diam`etre fini et les gorges de diam`etre contrˆol´e par la courbure ; on peut donc recouvrir ΩΩρ par un nombre fini de gorges et de capuchons. Les chapelets pr´ec´edents proviennent donc de tubes bouch´es soit par des boules ou des ensembles diff´eomorphes ¯ 3 , dans le premier cas, soit par des tubes reliant deux parties de l’ensemble `a RP 3 B qui converge vers Ω(ρ), dans le second cas (figures 1 et 2 ci-dessous).

947–26

pointe

double-pointe

pointe avec capuchon

Ω

au temps T

voisinage canonique

pour t < T

Fig. 1 La topologie de M peut ˆetre reconstitu´ee comme suit : on consid`ere la liste Ωj , 1 ≤ j ≤ i, des composantes connexes de Ω qui contiennent des points de Ω(ρ), on tronque les pointes et on colle sur les bords obtenus des tubes S 2 ×I (I est un intervalle), ¯ 3 . En cons´equence, ou des boules B 3 ou bien des ensembles diff´eomorphes `a RP 3 B ¯ j d´esigne la compactification de Ωj qui consiste `a (( fermer )) chaque pointe par un si Ω ¯ j (ce qui correspond au point, alors M est diff´eomorphe `a la somme connexe des Ω recollement d’un tube entre deux Ωj diff´erents) avec un nombre fini de S 2 × S 1 (qui correspondent au recollement de tubes entre deux bords diff´erents du mˆeme Ωj ), un nombre fini de RP 3 et un nombre fini de sph`eres (qui n’ont aucune influence sur la topologie). Au passage nous avons fait disparaˆıtre MΩ ; le th´eor`eme des voisinages canoniques montre que si la courbure scalaire tend vers l’infini en un point qui est dans une gorge, elle le fait sur toute la sph`ere de dimension deux correspondante ; la structure des parties du compl´ementaire de Ω provenant des capuchons est moins claire.

Ωi

Ωj

au temps T

pour t < T

Fig. 2

947–27

Nous pouvons r´esumer cette section dans le diagramme suivant : M = quotient de S 3 . ր Ω=∅ ց

S

gorges

S

capuchons ⇒ M = S 3 , RP 3 , RP 3 #RP 3 , S 2 × S 1 .

¯ j # RP 3 # S 2 × S 1 . Ω 6= ∅ −→ M = #j Ω fini fini 6.2. La solution standard La condition initiale de la solution standard est une m´etrique compl`ete sur R3 , d’op´erateur de courbure positif ou nul et de courbure scalaire strictement positive qui est asymptote `a un cylindre canonique et invariante par rotation. Il s’agit donc de recoller un h´emisph`ere de courbure scalaire constante ´egale `a 1 `a un demi-cylindre S 2 × [0, +∞) muni de la m´etrique produit (S 2 est de courbure scalaire constante ´egale `a 1 ´egalement) ; le pˆole de l’h´emisph`ere est l’origine de R3 et est appel´e le centre. Il faut utiliser une partition de l’unit´e afin de r´ealiser une m´etrique de classe C ∞ et la m´etrique de l’h´emisph`ere est alors presque ronde. Il n’y a pas unicit´e et l’utilisation de l’article d´efini est abusive ; toutefois, nous faisons un choix que nous appellerons (( la )) condition initiale de la solution standard. La vari´et´e n’´etant pas compacte il n’est pas imm´ediat qu’il existe une solution ayant cette m´etrique pour donn´ee initiale en temps petit ; la courbure ´etant born´ee `a l’infini ce r´esultat est dˆ u `a W.-X. Shi ([52]). De mˆeme, l’unicit´e est `a prouver ([46], section 2 ou [8], appendice A). On d´emontre ´egalement que la solution est d´efinie pour t ∈ [0, 1), qu’elle est compl`ete et invariante par rotation pour tout t (voir [46] et [8]). Enfin, la solution standard v´erifie les conclusions du th´eor`eme 5.11 et on peut montrer que sa courbure scalaire v´erifie, pour tout x ∈ R3 et t ∈ [0, 1), . R(x, t) ≥ const. 1−t 6.3. La premi` ere chirurgie C’est l’id´ee invent´ee par R. Hamilton pour la dimension 4, dans [30], qui est reprise par G. Perel’man et adapt´ee `a la dimension 3. Elle consiste `a op´erer une chirurgie m´etrique pour ´eliminer les parties de la vari´et´e qui sont susceptibles de devenir des singularit´es. La chirurgie se pratique sur des composantes de Ω qui contiennent des points de Ω(ρ) ; ce faisant, nous sommes dans l’obligation d’´eliminer des parties de Ω dont nous devons contrˆoler la topologie. La description donn´ee dans la section pr´ec´edente joue alors un rˆole essentiel. Insistons sur le fait que la chirurgie se pratique toujours le long de sph`eres et ce n’est donc pas elle qui produira la d´ecomposition de Jaco-Shalen-Johannson mais plutˆot celle de Kneser. La chirurgie est faite `a une ´echelle diff´erente de ρ. En fait, il existe un nombre 0 < h < δρ tel que, si (x, T ) est un point qui est dans une pointe dont le bord rencontre 1 Ω(ρ), v´erifiant R(x, T ) ≥ h−2 , le voisinage parabolique P (x, T, δ −1 R(x, T )− 2 , −R(x, T )−1 )

947–28

est contenu dans une δ-gorge (en un sens plus fort que nous omettons de pr´eciser). Nous dirons que h est le param`etre de chirurgie ; il d´epend des donn´ees du probl`eme que sont la fonction φ du th´eor`eme 3.4, celle du nombre r0 apparaissant dans 5.13, de ǫ et δ. Tant que δ est minor´e on peut choisir h minor´e ; le travail de la prochaine sous-section est justement l’existence d’un tel δ. Le nombre δ est choisi beaucoup plus petit que ǫ. On proc`ede alors de la mani`ere suivante : a) on ´elimine les composantes de Ω qui ne rencontrent pas Ω(ρ). On connaˆıt leur impact sur la topologie de M, b) dans les pointes qui rencontrent Ω(ρ) on choisit un point x tel que R(x, T ) = h−2 ; il est le centre d’une δ-gorge (par d´efinition de h). On coupe le long de la sph`ere de dimension 2 qui le contient, c’est-`a-dire la sph`ere centrale, c) sur le bord libre, diff´eomorphe `a S 2 , on colle un homoth´etique de rapport h2 d’un voisinage de taille fixe du centre de la condition initiale de la solution standard. Le recollement est d´ecrit ci-dessous. ` partir de cette nouvelle vari´et´e on relance le flot en prenant T comme origine d) A des temps. solution standard

Ω

Fig. 3 Dans [30], R. Hamilton montre que la nouvelle vari´et´e v´erifie le pincement de Hamilton-Ivey avec la mˆeme fonction φ, quitte `a choisir correctement le recollement. Nous pr´ecisons ce dernier point. La demi-gorge sur laquelle la chirurgie est op´er´ee est identifi´ee `a S 2 × [0, hδ ). Soit λ un nombre `a choisir. 1) On munit S 2 × [0, λ] de la m´etrique g de la gorge, 2) On munit S 2 × [λ, 2λ] de la m´etrique e−2f g, o` u f est une fonction de la coordonn´ee longitudinale seulement qui vaut 0 au voisinage de λ, qui est partout tr`es proche de 0 et qui est choisie pour que la courbure sectionnelle soit positive `a partir de 2λ. On peut ´egalement la choisir en sorte que les courbures sectionnelles de e−2f g soient sup´erieures `a celles de g sur l’intervalle [λ, 2λ] (voir [18] pour les d´etails). Par monotonie de la fonction φ, la condition de Hamilton-Ivey est alors v´erifi´ee sur cet intervalle. Ensuite, 3) sur S 2 × [2λ, 3λ] la m´etrique est de la forme e−2f (ψg + (1 − ψ)h2 g¯), o` u ψ est une fonction plateau de la coordonn´ee longitudinale qui vaut 1 au voisinage de 2λ et 0 au voisinage de 3λ, et g¯ est la m´etrique de la condition initiale de la solution standard. La fonction f ´etant fix´ee on peut choisir δ assez petit pour que la courbure sectionnelle de cette m´etrique soit positive. La condition de hamilton-Yvey est alors trivialement v´erifi´ee. Enfin,

947–29

4) sur S 2 ×[3λ, c], pour 3λ ≤ c ≤ 4λ, la m´etrique est e−2f h2 g¯ et le centre de la solution standard correspond `a la valeur c du param`etre longitudinal. Sa courbure sectionnelle est strictement positive. On peut d´ecrire plus pr´ecis´ement g¯ comme un produit tordu sur le cylindre. Le nombre λ est de l’ordre de h/ǫ. On choisit donc les param`etres pour que la courbure soit sup´erieure `a celle de g (c’est le cas pour e−2f g) ou bien que la courbure sectionnelle soit positive ; dans les deux cas le pincement de Hamilton-Ivey est v´erifi´e. On note ´egalement que la distance du centre du capuchon ajout´e `a la sph`ere de chirurgie est de l’ordre de h/ǫ. En ´eliminant la demi-gorge on a perdu un volume de l’ordre de h3 /δ et, en collant le capuchon standard, on l’a augment´e de l’ordre de h3 /ǫ ; si δ est assez petit devant le param`etre ǫ fixe, alors la chirurgie fait perdre une quantit´e de volume de l’ordre de h3 . Ce volume pourrait ˆetre r´ecup´er´e tr`es rapidement par l’´evolution ult´erieure du flot ; il n’en est rien. En effet, cette chirurgie n’affecte pas le minimum de la courbure scalaire, puisqu’elle se pratique en des r´egions o` u celle-ci est grande, et ce minimum reste donc croissant. La formule d´ej`a utilis´ee montre alors que la d´eriv´ee logarithmique du volume de la nouvelle vari´et´e est major´ee ; l’accroissement de volume dans un intervalle de temps fini donn´e est donc contrˆol´e. Cet argument montre que ce type de chirurgies ne peut intervenir qu’un nombre fini de fois dans un intervalle de temps fini, tant que δ est fix´e ; le nombre de chirurgies d´epend de la condition initiale et des divers choix de param`etres. Remarque 6.3. — On peut dire que r0 est l’´echelle `a laquelle on contrˆole la g´eom´etrie d’un voisinage (th´eor`eme des voisinages canoniques), h est l’´echelle `a laquelle on effectue la chirurgie. On pourrait effectuer la chirurgie `a l’´echelle ρ mais l’argument pr´ec´edent montre qu’il faut se laisser un peu de marge. Le param`etre ǫ est un param`etre de contrˆole qui d´ecrit la proximit´e utilis´ee dans le th´eor`eme des voisinages canoniques. Il doit en particulier ˆetre assez petit pour que la r´eunion de deux gorges dont l’une est centr´ee sur le bord de l’autre soit diff´eomorphe `a S 2 × I ; c’est une condition ind´ependante de la vari´et´e. Le param`etre δ est un param`etre de contrˆole bien plus fin, n´ecessaire dans la chirurgie et, en particulier, dans l’argument pr´ec´edent. L’´etape suivante consiste `a montrer l’existence de ce flot modifi´e pour tout temps. 6.4. Existence pour tout temps du flot avec chirurgies C’est la partie o` u l’on choisit les param`etres r0 et δ afin de faire fonctionner le processus. Dans [46] il est appel´e (( Ricci flow with δ-cutoff )) ; nous garderons toutefois l’expression (( flot avec chirurgies )) sachant que cela implique l’utilisation du param`etre δ et du param`etre r0 . Une vari´et´e riemannienne M, compacte orientable de dimension 3 est dite normalis´ee si | Rm(x)| ≤ 1, pour tout x ∈ M, et le volume de toute boule de rayon 1 est au moins la moiti´e du volume de la boule unit´e de R3 . Dans [31], R. Hamilton montre que, pour des donn´ees initiales normalis´ees, la plus petite valeur

947–30

propre de l’op´erateur de courbure v´erifie (1 + t)R(x, t) ≤ (1 + t)(−ν(x, t))(ln((1 + t)(−ν(x, t)) − 3) , d`es que −ν > 0. Ceci montre l’existence d’une fonction d´ecroissante φ : (0, +∞) → R, 1 telle que φ(x) ∼ ln(x) , pour x grand, avec la propri´et´e que (1 + t)ν(. , t) ≥ −(1 + t)R(. , t)φ((1 + t)R(. , t)) . Ce choix g´en´eralise celui fait pour le th´eor`eme 3.4. Il est surtout utile pour les grands temps (et donc, comme nous le verrons plus loin, pour la g´eom´etrisation) ; il produit les mˆemes r´esultats que ceux prouv´es dans le th´eor`eme 3.4. La chirurgie n’affecte pas cette propri´et´e comme nous l’avons d´ej`a signal´e. Apr`es la premi`ere chirurgie la nouvelle donn´ee initiale n’est plus normalis´ee, la vari´et´e consid´er´ee n’est plus connexe et les param`etres utilis´es pour la chirurgie suivante doivent ˆetre modifi´es, par exemple en les faisant d´ependre du temps. Ils pourraient se d´egrader `a tel point que le processus s’arrˆete. La condition de courbure φ-presque positive ´etant pr´eserv´ee, la seule raison qui empˆeche la poursuite du flot est que le th´eor`eme des voisinages canoniques ne soit plus v´erifi´e pour la valeur de r0 choisie, il faut donc la modifier (essentiellement diminuer r0 ) mais alors le risque est que ce nombre tende vers 0 en un temps fini. Nous appellerons flot de Ricci avec chirurgies sur un intervalle [0, T ) le r´esultat de l’it´eration de la proc´edure d´ecrite ci-dessus. Apr`es la premi`ere chirurgie, la vari´et´e a un nombre fini de composantes connexes car on ne garde de Ω que les composantes qui intersectent Ω(ρ) ; on ´etudie le flot de Ricci sur chacune d’elles simultan´ement. On atteint ´eventuellement un nouveau temps singulier et apparaˆıt un nouvel ensemble Ω. On pratique une nouvelle chirurgie et on recommence, esp´erant poursuivre ce processus pour tout temps. Notons que maintenant Ω peut contenir des composantes compactes. On dira que la solution (ou une de ses composantes) est ´eteinte si Ω(ρ) (ou la composante correspondante) est vide. Par commodit´e on consid´erera, dans le cas d’une extinction totale, que le flot se poursuit pour tous les temps sup´erieurs en un flot sur une vari´et´e vide. La notion de flot avec chirurgies est formalis´ee de mani`ere g´en´erale dans [36], 61.1, et peut donc ˆetre appliqu´ee `a d’autres types de chirurgies que celles d´ecrites ci-dessus. Le r´esultat principal est la proposition suivante Proposition 6.4 ([46], 5.1). — Il existe des suites d´ecroissantes 0 < rj < ǫ2 , 0 < κj , et δ¯j < ǫ2 , pour j = 1, 2 . . . , telles que, pour toute condition initiale normalis´ee et toute fonction δ(t), satisfaisant 0 < δ(t) < δ¯j pour t ∈ [2j−1 ǫ, 2j ǫ], le flot de Ricci avec chirurgies correspondant est d´efini pour t ∈ [0, +∞). De plus, il est κj -non-effondr´e et v´erifie les conclusions du th´eor`eme des voisinages canoniques ` a l’´echelle rj sur l’intervalle de j−1 j temps t ∈ [2 ǫ, 2 ǫ]. Remarque sur la preuve Comme nous l’avons indiqu´e plus haut, la seule chose `a faire est de montrer que le th´eor`eme des voisinages canoniques est vrai avec un param`etre ne se d´egradant pas

947–31

trop vite. En cela la preuve n’est qu’une nouvelle version du th´eor`eme 5.13 tenant compte des chirurgies. Elle est techniquement plus difficile, mais ne contient pas d’id´ee fondamentalement nouvelle. On constate au passage que la constante κ doit aussi ˆetre modifi´ee, ce qui est indispensable comme on peut s’en convaincre en ´etudiant l’exemple du produit d’une surface hyperbolique avec S 1 (exemple sugg´er´e dans [39]). En conclusion, si la vari´et´e obtenue apr`es k chirurgies est appel´ee Mk , M s’obtient en faisant la somme connexe des composantes de Mk , d’un nombre fini de quotients de S 3 (par des sous-groupes finis du groupe d’isom´etries de la m´etrique ronde) et d’un nombre fini de copies de S 2 × S 1 .

7. TRAVAUX DE PEREL’MAN III 7.1. Extinction en temps fini Il y a un cas o` u l’on peut connaˆıtre compl`etement la topologie de la vari´et´e M, c’est celui o` u le flot s’´eteint totalement en un temps fini. En effet, sous cette hypoth`ese, il n’y a qu’un nombre fini de chirurgies et la discussion pr´ec´edente montre que M est obtenue comme somme connexe d’un nombre fini de copies de quotients de S 3 (par des sous-groupes du groupe d’isom´etries canonique) et de S 2 × S 1 . Il est donc int´eressant de chercher des hypoth`eses impliquant cette extension. C’est ce qui est fait dans [45]. Nous pr´esentons ici la variante due `a T. Colding et W. Minicozzi (voir [16]) qui nous semble plus simple. Soit M une vari´et´e de dimension 3, compacte, connexe, orient´ee, de classe C ∞ et g(t) un flot de Ricci sans chirurgies sur M. On suppose que M est premi`ere pour la d´ecomposition de Kneser en somme connexe, c’est-`a-dire que, si M = P1 #P2 , alors P1 ou P2 est hom´eomorphe `a S 3 (voir [32], th´eor`eme 1.5) ; on suppose ´egalement que M a un groupe fondamental fini. On dit que M est irr´eductible si toute sph`ere S 2 ⊂ M borde une boule. Si M est compacte, connexe, orientable, premi`ere et de groupe fondamental fini elle est irr´eductible ([32], proposition 1.4) et son revˆetement universel est une sph`ere d’homotopie. En particulier, π3 (M) 6= {0}. Consid´erons une situation g´en´erale o` u (N, g) est une vari´et´e riemannienne compacte, connexe et orientable ; on peut d´efinir l’espace H = L21 (S 2 , N) des applications de S 2 dans N dont la diff´erentielle est de carr´e int´egrable ; il suffit pour cela de plonger N isom´etriquement dans Rn (voir [41]). On peut ´egalement consid´erer des applications `a diff´erentielles H¨older afin d’avoir plus de r´egularit´e. Appelons i la fonction qui associe `a un point x ∈ N l’application i(x) : S 2 −→ N qui envoie tout S 2 sur x. Dans [41], les auteurs montrent que si π3 (N) 6= {0}, alors π1 (H, i(N)) 6= {0}, c’est-`a-dire : l’espace des applications de S 2 dans N modulo les applications constantes n’est pas simplement connexe. Soit alors un chemin continu β : [0, 1] −→ C 0 ∩ L21 (S 2 , N), tel que β(0) et β(1) soient des applications constantes et que la classe d’homotopie [β] de β soit non

947–32

triviale. On d´efinit l’´energie W (g) = min max E(γ(s)) , γ∈[β] s∈[0,1]

o` u E(γ(s)) d´esigne l’´energie de l’application γ(s) de S 2 dans N. On montre que les propri´et´es topologiques de H impliquent que W (g) > 0, pour toute m´etrique g (voir [35]). T. Colding et W. Minicozzi prouvent le r´esultat suivant, pour un flot de Ricci (M, g(t)), ´or` The eme 7.1 ([16]). — Soit (M, g(t)) un flot de Ricci (sans chirurgies) o` u M est une vari´et´e de dimension 3, compacte, connexe, orientable, premi`ere et non asph´erique (i.e. il existe k > 1 tel que πk (M) 6= {0}). Alors, 3 dW (g(t)) ≤ −4π + W (g(t)) , dt 4(t + C) 3 pour C = − 2Rmin si Rmin (0) < 0, et C = +∞ sinon (c’est-` a-dire, le terme correspon(0) dant disparaˆıt). En particulier, le flot s’´eteint en temps fini.

Notons que, bien que la fonction W ne soit pas n´ecessairement d´erivable, on peut donner un sens `a l’expression ci-dessus. La m´ethode de preuve utilise des r´esultats standards de la th´eorie des applications harmoniques et des calculs d’aires assez faciles. G. Perel’man consid`ere, dans [45], des classes d’homotopie d’applications de S 1 dans M. Il remplit ces applications par des disques minimaux ; toutefois, comme le probl`eme de Plateau est difficile `a r´esoudre si la courbe bordante n’a pas une forme agr´eable, il la (( r´egularise )) en lui appliquant le flot de la courbure extrins`eque d´ecrit par M. Grayson ([22]). On peut comparer cette id´ee `a un argument similaire utilis´e dans [31]. Le th´eor`eme 7.1 s’applique au cas o` u M est de groupe fondamental fini et irr´eductible. Question : Peut-il s’´etendre `a un flot avec chirurgies ? Admettons que ce soit le cas, cela montrerait qu’une vari´et´e irr´eductible de groupe fondamental fini est un quotient fini de S 3 par un groupe d’isom´etries canoniques. En effet, d’apr`es la discussion pr´ec´edente, la vari´et´e est le r´esultat de la somme connexe d’un nombre fini de quotients de S 3 (par des sous-groupes finis du groupe d’isom´etrie de la sph`ere canonique) et de S 2 × S 1 ; l’ind´ecomposabilit´e implique qu’il n’y a qu’un terme non ´egal `a S 3 dans cette suite d’op´erations et la finitude du groupe fondamental ne laisse que la possibilit´e d’un quotient de S 3 . Si la vari´et´e n’est pas premi`ere mais de groupe fondamental fini, ses composantes dans la d´ecomposition de Kneser sont premi`eres et de groupe fondamental fini, donc des quotients de S 3 ; une au maximum est non simplement connexe (sinon le groupe fondamental de M est infini). En appliquant la discussion pr´ec´edente `a chaque composante on montre que M est aussi un quotient de S 3 (voir aussi la discussion du cas non irr´eductible dans [45] et [16]). Ceci prouverait les conjectures 0.1 et 0.2. Revenons `a la vari´et´e compacte M irr´eductible et de groupe fondamental fini, munie d’un flot de Ricci avec chirurgies non trivial (il y a au moins une chirurgie). Apr`es la premi`ere chirurgie, une, au plus, des composantes connexes n’est pas une sph`ere, nous

947–33

l’appellerons M1 et la m´etrique riemannienne post-chirurgie sera d´esign´ee par g1 (T ) ; la composante connexe de Ω qui lui correspond est not´ee Ω1 et T d´esigne le premier temps singulier. La proposition suivante permet d’adapter l’argument de T. Colding et W. Minicozzi, Proposition 7.2. — Il existe une ´equivalence d’homotopie qui contracte les distances ¯ 1 , g(T )) et (M1 , g1 (T )). entre (Ω Esquisse de preuve Pour simplifier, supposons qu’il n’y a qu’une pointe dans Ω1 contenant des points de Ω(ρ). On tronque la pointe comme indiqu´e et on remplace le demi-cylindre not´e H par un voisinage du centre de la condition initiale de la solution standard pour obtenir M1 . En utilisant les notations de la sous-section 6.3, l’application consid´er´ee est l’identit´e sur (ΩH) ∪ S 2 × [0, c) et elle envoie HS 2 × [0, c) sur le centre de la solution standard. Comme pr´ec´edemment, la fonction f ´etant fix´ee, si δ est assez petit, l’applicaton ci-dessus contracte les distances. On peut ´egalement d´eformer celle-ci en ¯ 1 sur M1 . un hom´eomorphisme de Ω ¯ 1 n’a Cet ´enonc´e n’est pas parfaitement correct car la structure diff´erentiable sur Ω pas ´et´e d´efinie et donc g(T ) n’est pas d´efinie au bout de la pointe. On peut contourner ¯1 ce probl`eme en consid´erant (M, g(t)) pour t proche de T . M est hom´eomorphe `a Ω et `a M1 et si on effectue l’op´eration ci-dessus avec (M, g(t)), on construit une application lipschitzienne de rapport 1 + χ(t) avec χ(t) → 0 lorsque t → T . Les arguments qui suivent s’adaptent sans difficult´es. Pour simplifier l’expression nous conservons la formulation ci-dessus. Maintenant, si [β] est une classe non triviale de π1 (H, i(M)), elle persiste en une classe non triviale dans π1 (H, i(M1 )). De plus, grˆace `a la proposition ci-dessus, on voit que son ´energie v´erifie ¯ 1 , g(T )) W (M1 , g1 (T )) ≤ W (Ω ou bien ≤ lim inf (1 + χ(t))W (M, g(t)) . t→T

Le th´eor`eme 7.1 s’applique alors pour le flot sur M1 dont la donn´ee initiale est g1 (T ). La constante C peut ´eventuellement changer, mais le minimum de la courbure scalaire ´etant croissant le long d’un flot de Ricci sans chirurgies et non affect´e par une chirurgie (`a moins que toute la vari´et´e disparaisse), elle est croissante ´egalement le long d’un flot avec chirurgies ; en cons´equence, l’in´egalit´e du th´eor`eme 7.1 est valable pour le flot avec chirurgies et montre l’extinction en temps fini (par it´eration de l’argument pr´ec´edent). Ceci termine la preuve des conjectures 0.1 et 0.2. dkdkkdkdisd ;, , ;wsdkldkljklmsdjf Remarque 7.3. — Les arguments ci-dessus ont ´et´e v´erifi´es grˆace `a plusieurs ´echanges avec B. Kleiner et J. Lott. Je tiens `a les remercier pour leur aide.

947–34

7.2. Conclusion : vers la g´ eom´ etrisation des vari´ et´ es de dimension 3 S’il n’y a pas extinction en temps fini la situation est beaucoup plus complexe. Il peut, en effet, ˆetre n´ecessaire de pratiquer une infinit´e de chirurgies. Encore une fois le premier pas a ´et´e franchi par R. Hamilton, pour un flot de Ricci sans chirurgies, dans [31]. Nous reprenons l’´enonc´e tel qu’il est donn´e dans [43] ; le lecteur est renvoy´e `a [31] pour les d´etails et des ´enonc´es pr´ecis. ´or` The eme 7.4. — Soit (M, g(t)) un flot de Ricci sur une vari´et´e M de dimension 3, compacte, connexe et orient´ee. On suppose qu’il existe pour tout t ∈ [0, +∞) et que la courbure normalis´ee t Rm(x, t) est born´ee lorsque t tend vers l’infini. Alors, il existe un nombre fini de vari´et´es hyperboliques compl`etes Hi de volume fini, et, pour tout t assez F grand, un plongement φt : Hi −→ M v´erifiant les propri´et´es suivantes. L’image r´eciproque de la m´etrique (normalis´ee) t−1 g(t) par φt converge, uniform´ement sur tout F compact de Hi , vers une m´etrique de courbure constante n´egative. Les tores des Hi , sections des cusps, sont envoy´es, par φt , sur des tores incompressibles dans M. La m´etrique t−1 g(t) sur le compl´ementaire de l’image de φt s’´effondre ` a courbure sectionnelle born´ee en valeur absolue. On rappelle qu’un tore est dit incompressible si son groupe fondamental s’injecte dans celui de M. Les parties de M qui s’effondrent sont classifi´ees par les r´esultats de J. Cheeger et M. Gromov ([6] et [7]). On ne sait pas montrer que le flot de Ricci uniformise les vari´et´es qui s’effondrent et la conclusion doit venir d’un ingr´edient ext´erieur `a la th´eorie. G. Perel’man annonce essentiellement le mˆeme r´esultat dans la situation plus compliqu´ee du flot avec chirurgies et o` u la courbure normalis´ee n’est plus n´ecessairement born´ee `a l’infini. Une des difficult´es suppl´ementaires est que le compl´ementaire des vari´et´es hyperboliques s’effondre `a courbure sectionnelle minor´ee et leur classification ne rel`eve plus des travaux de J. Cheeger et M. Gromov. G. Perel’man affirme qu’en ´etudiant les espaces limites de ces effondrements, qui sont des espaces d’Alexandrov de courbure minor´ee (voir [4] pour une d´efinition), il arrive `a conclure. Une autre ´etude des effondrements `a courbure sectionnelle minor´ee est faite dans [55] et [54]. Insistons sur le fait que les chirurgies ne r´ealisent pas la d´ecomposition le long des tores incompressibles ; de plus, s’il y en a un nombre infini, elles ont lieu dans les r´egions qui s’effondrent (car leur compl´ementaire converge). Il manque `a cette th´eorie, outre la v´erification des ´enonc´es, une meilleure compr´ehension de l’´evolution des effondrements. L’´etat actuel de l’expertise ne permet pas de se prononcer sur ces d´eveloppements. Toutefois, la d´emarche est coh´erente et compatible avec les r´esultats esp´er´es. Pour terminer, il faut insister sur l’apport de G. Perel’man dans le premier article ([44]) : le non-effondrement local, l’´etude des solitons contractants et des κ-solutions et la description des r´egions o` u la courbure est grande sans ˆetre maximale. Bon nombre de ces r´esultats sont valables en dimension quelconque et donc utilisables dans d’autres

947–35

contextes (voir [8], par exemple). Il est aussi important de saluer la contribution de R. Hamilton `a cet ´edifice dont il a pos´e les fondations.

´ ERENCES ´ REF [1] M. Anderson. Geometrization of three-manifolds via the Ricci flow. Notices A.M.S., 51(2) :184–193, 2004. [2] L. Bessi` eres. Conjecture de Poincar´e : la preuve de R. Hamilton et G. Perelman. La gazette des math´ematiciens, 106, 2005. [3] J.-P. Bourguignon. L’´equation de la chaleur associ´ee `a la courbure de Ricci. In S´eminaire Bourbaki 1985-86, Exp. n◦ 653, Ast´erisque 145-146, pages 45–61. Soci´et´e Math´ematique de France, 1987. [4] D. Burago, Y. Burago, and S. Ivanov. A course in metric geometry, volume 33 of Graduate Studies in Mathematics. Amer. Math. Soc. Providence R.I., 2001. [5] J. Cheeger and D. Ebin. Comparison theorems in Riemannian geometry. NorthHolland Publishing Co., Amsterdam-Oxford, 1975. [6] J. Cheeger and M. Gromov. Collapsing Riemannian manifolds while keeping their curvature bounded I. J. Differential Geometry, 23 :309–346, 1986. [7] J. Cheeger and M. Gromov. Collapsing Riemannian manifolds while keeping their curvature bounded II. J. Differential Geometry, 32 :269–298, 1990. [8] B.-L. Chen and X.-P. Zhu. Ricci flow with surgery on four-manifolds with positive isotropic curvature. ArXiv : math.DG/0504478v1, april 2005. [9] X. Chen, P. Lu, and G. Tian. A note on uniformization of Riemann surface by Ricci flow. ArXiv : math.DG/0505163, may, 10 2005. [10] B. Chow. On the entropy estimate for the Ricci flow on compact 2-orbifolds. J. Differential Geometry, 33 :597–600, 1991. [11] B. Chow. The Ricci flow on the 2-sphere. J. Differential Geometry, 33 :325–334, 1991. [12] B. Chow and S.-C. Chu. A geometric interpretation of Hamilton’s Harnack inequality for the Ricci flow. ArXiv : math.DG/0211349, November, 22 2002. [13] B. Chow and D. Knopf. The Ricci flow : an introduction, volume 110 of Mathematical surveys and monographs. A.M.S., 2004. [14] B. Chow and P. Lu. The time-dependent maximum principle for systems of parabolic equations subject to an avoidance set. ArXiv : math.DG/0211209, november 2002. To appear in Pacific J. Math. [15] B. Chow and L.-F. Wu. The Ricci flow on compact 2-orbifolds with curvature negative somewhere. Comm. on Pure and Appl. Math., 44 :275–286, 1991.

947–36

[16] T. Colding and W. Minicozzi. Estimates for the extinction time for the Ricci flow on certain three-manifolds and a question of Perelman. Journal of the A.M.S., 18(3) :561–569, 2005. [17] D. DeTurck. Deforming metrics in the direction of their Ricci tensors. J. Differential Geometry, 18 :157–162, 1983. [18] Y. Ding. Notes on Perelman’s second paper. http ://www.math.uci.edu/˜yding/perelman.pdf. [19] M. Gage and R. Hamilton. The heat equation shrinking convex plane curves. J. Differential Geometry, 23 :69–96, 1986. [20] S. Gallot, D. Hulin, and J. Lafontaine. Riemannian geometry. Universitext. Springer-Verlag, 2004. [21] M. Grayson. The heat equation shrinks embedded plane curves to round points. J. Differential Geometry, 26 :285–314, 1987. [22] M. Grayson. Shortening embedded curves. Annals of Mathematics, 129 :71–111, 1989. [23] R. Greene. A genealogy of noncompact manifolds of nonnegative curvature : history and logic. In Comparison geometry, volume 30 of M.S.R.I. publications, pages 99–134. M.S.R.I., 1997. [24] R. Hamilton. Three-manifolds with positive Ricci curvature. J. Differential Geometry, 17 :255–306, 1982. [25] R. Hamilton. Four-manifolds with positive curvature operator. J. Differential Geometry, 24 :153–179, 1986. [26] R. Hamilton. The Ricci flow on surfaces. In Mathematics and general relativity (Santa Cruz 1986), volume 71 of Contemp. Math., pages 237–262. Amer. Math. Soc., Providence, RI, 1988. [27] R. Hamilton. The Harnack estimate for the Ricci flow. J. Differential Geometry, 37(1) :225–243, 1993. [28] R. Hamilton. A compactness property for solutions of the Ricci flow. Amer. J. Math., 117(3) :545–572, 1995. [29] R. Hamilton. The formation of singularities in the Ricci flow. In Surveys in differential geometry, volume II, pages 7–136. International Press, Cambridge MA, 1995. [30] R. Hamilton. Four-manifolds with positive isotropic curvature. Comm. Anal. Geom., 1 :1–92, 1997. [31] R. Hamilton. Non-singular solutions of the Ricci flow on three-manifolds. Comm. Anal.Geom., 7(4) :625–729, 1999. [32] A. Hatcher. Notes on basic 3-manifold topology. http ://www.math.cornell.edu/˜hatcher, 1997.

947–37

[33] G. Huisken. Ricci deformation of the metric on a Riemannian manifold. J. Differential Geometry, 21(1) :47–62, 1984. [34] T. Ivey. Ricci solitons on compact three-manifolds. Diff. Geom. Appl., pages 301– 307, 1993. [35] J. Jost. Two-dimensionnal geometric variational problems. J. Wiley-Intersciences, Chichester N.Y., 1991. [36] B. Kleiner and J. Lott. Notes on Perelman’s papers. http ://www.math.lsa.umich.edu/research/Ricci flow/ perelman.html, december 30 2004. [37] O.A. Ladysenskaja, V.A. Solonnikov, and N.N. Uralceva. Linear and quasilnear equations of parabolic type, volume 23 of Transl. Amer. Math. Soc. Amer. Math. Soc., 1968. [38] P. Li and S.T. Yau. On the parabolic kernel of the Schr¨odinger operator. Acta Math., 156(3-4) :153–201, 1986. [39] S. Maillot. Flot de Ricci et g´eom´etrisation des vari´et´es de dimension 3. Notes informelles, juin 2004. [40] Ch. Margerin. Pointwise pinched manifolds are space forms. In Geometric measure theory and the calculus of variations (Arcata, Calif., 1984), volume 44 of Proc. Sympos. Pure Math., pages 307–328. Amer. Math. Soc., Providence, RI, 1986. [41] M. Micallef and J. Moore. Minimal two-spheres and the topology of manifolds with positive curvature on totally isotropic two-planes. Annals of Mathematics, 127 :199–227, 1988. [42] J. Milnor. Towards the Poincar´e conjecture and the classification of 3-manifolds. Notices A.M.S., 50 :1226–1233, 2003. [43] J. Morgan. Recent progress on the Poincar´e conjecture. Bulletin of the Amer. Math. Soc., 42(1) :57–78, 2005. [44] G. Perelman. The entropy formula for the Ricci flow and its geometric applications. ArXiv : math.DG/0211159, november 2002. [45] G. Perelman. Finite extinction time for the solutions to the Ricci flow on certain three-manifolds. ArXiv : math.DG/0307245, july 2003. [46] G. Perelman. Ricci flow with math.DG/0303109, march 2003.

surgery

on

three-manifolds.

ArXiv

:

[47] V. Poenaru. Poincar´e et l’hypersph`ere. Pour la Science, Dossier hors-s´erie n◦ 41 :52–57, 2003. [48] H. Poincar´ e. Cinqui`eme compl´ement `a l’analysis situs. Rend. Circ. Mat. Palermo, 18 :45–110, 1904. [49] M.H. Protter and H.F. Weinberger. Maximum Principles in differential equations, volume 110 of Mathematical surveys and monographs. A.M.S., 2004.

947–38

[50] P. Scott. The geometries of 3-manifolds. Bull. London Math. Soc., 15 :401–487, 1983. [51] N. Sesum, G. Tian, and X. Wang. Notes on Perelman’s paper on the entropy formula for the Ricci flow and its applications. Notes, september 24 2003. [52] W.-X. Shi. Deforming the metric on complete Riemannian manifolds. J. Differential Geometry, 30(1) :223–301, 1989. [53] W.-X. Shi. Ricci deformation of the metric on complete noncompact Riemannian manifolds. J. Differential Geometry, 30(2) :303–394, 1989. [54] T. Shioya and T. Yamaguchi. Collapsing three-manifolds under a lower curvature bound. J. Differential Geometry, 56 :1–66, 2000. [55] T. Shioya and T. Yamaguchi. Volume collapsed three-manifolds with a lower curvature bound. ArXiv : math.DG/0304472, April, 15 2003. [56] W. P. Thurston. The geometry and topology of 3-manifolds. Lecture Notes. Princeton University, 1979. [57] W. P. Thurston. Three-dimensional manifolds, Kleinian groups and hyperbolic geometry. Bulletin of the Amer. Math. Soc., 6(3) :357–381, 1982. [58] P. Topping. Lectures on the Ricci flow. Communication priv´ee, 9 mai 2005. [59] L.-F. Wu. The Ricci flow on 2-orbifolds with curvature. J. Differential Geometry, 33 :575–596, 1991. [60] L.-F. Wu. The Ricci flow on 2-orbifolds with positive curvature. J. Differential Geometry, 33 :575–596, 1991. [61] R. Ye. Notes on the reduced volume and asymptotic Ricci solitons of κ-solutions. http ://www.math.ucsb.edu/˜yer/ricciflow.html, december 20.

G´erard BESSON Institut Fourier de Math´ematiques UMR 5582 du CNRS B.P. 74 ` ´ F–38402 SAINT-MARTIN-D’HERES CEDEX E-mail : [email protected]

S´eminaire BOURBAKI 57`eme ann´ee, 2004-2005, no 948

October 2005

ON THE PROOF OF THE PARISI FORMULA BY GUERRA AND TALAGRAND by Erwin BOLTHAUSEN

1. THE SHERRINGTON-KIRKPATRICK MODEL We consider “Ising spins” σi ∈ {−1, 1} , i = 1, . . . , N. Spin configurations will be def denoted by σ = (σi )i=1,...,N ∈ ΣN = {−1, 1}N . As the Sherrington-Kirkpatrick model (SK-model for short) is a mean-field model, there is no geometric structure of {1, . . . , N} assumed. Let further Jij , 1 ≤ i < j ≤ N, be i.i.d. standard Gaussian random variables, defined on some probability space (Ω, F , P). These random variables form the “random environment”. The Hamiltonian is the following random function ΣN → R : X 1 def Jij (ω) σi σj , ω ∈ Ω, (1) HN,ω (σ) = √ N 1≤i 0, h ∈ R, and the gi again being independent standard Gaussian random variables. It has some advantages to include such a Gaussian external field, as we will see later, but for the moment, we do not consider this possibility. We write FN for the finite volume free energy 1 log ZN,β,h , N which is a random variable, defined on Ω, and def

FN (β, h) =

def

fN (β, h) = EFN (β, h) its expectation, the so-called “quenched” free energy. Sometimes, “quenched” refers to the random quantity only, but there is not much difference, as we will explain. In contrast, the so-called “annealed” free energy is obtained by taking the expectation inside the logarithm. By Jensen’s inequality, fN is dominated by the annealed free energy. Before proceeding with the discussion of the model, we try to explain why it is interesting. The usual models of (non-random) Ising type are defined as follows. Consider a finite def set Λ, and let ΣΛ = {−1, 1}Λ . Let further A = (aij )i,j∈Λ be a real symmetric matrix, and h = (hi )i∈Λ be a real vector. Then the Gibbs measure GA,h on ΣΛ is defined by X X 1 1 def exp aij σi σj + hi σi , GΛ,A,h (σ) = i,j∈Λ i∈Λ ZΛ,A,h 2 where of course

def

ZΛ,A,h =

X

X X 1 exp aij σi σj + hi σi . σ i,j∈Λ i∈Λ 2

Of great importance is the (finite volume) free energy, defined by FΛ (A, h) =

1 log ZA,h . |Λ|

The importance of this quantity is coming from the fact that most of the physical interesting quantities can be expressed through it, like mean magnetization, entropy, etc. The best known example is the Ising model where Λ is a finite (large) box in Zd , and β |i − j| = 1 def aij = 0 otherwise. (1)

In contrast to the habit in physics, we do not take a minus in front of β, and we also do not apply β to h.

948–03

Short range models are usually rather difficult to analyze, and often a qualitatively good approximation is obtained from mean field models where every spin interacts with any other one on equal footing. The simplest mean-field model is the Curie-Weiss-model. Here def aij = β/ |Λ| , ∀i, j ∈ Λ. def

In that case one has with N = |Λ| o2 1X β nX σi , aij σi σj = i∈Λ i,j∈Λ 2 2N and anything one wants to know can be derived from the Stirling approximation, and it becomes an easy exercise in elementary probability. Spin glasses are models where the interactions are “disordered”, which typically means that they are obtained as a random object. A topic which is still very poorly understood is the case of short range random interactions, for instance when Λ = {−n, . . . , n}d , and the aij are independent Gaussians for |i − j| = 1, and 0 otherwise. This is the Edwards-Anderson model on which there are ongoing controversial discussions in the physics community, the more so as it is very difficult to simulate on computers with a reasonably large box and in interesting dimensions. The SK-model is a mean-field model of this random interaction type, and it was invented in [18] √ certainly with the aim to have a simple model with disordered interaction. The 1/ N factor is easy to understand. In the Curie-Weiss model, each spin variable interacts with the other ones with a total interaction strength of order 1. Due to the cancellations between positive and negative J’s, the situation is essentially the same for the SK-model. The model is evidently closely connected with questions probabilists have been interested in for a long time, namely maxima (or minima) of (Gaussian) random vectors. For instance, limβ→∞ (1/β) log ZN,β,0 is simply maxσ HN (σ) , which is just the maximum of a family of correlated Gaussians with a simple covariance structure. Probabilists have developed methods to investigate such questions for a long time, e.g. Dudley, Fernique, Talagrand, and many others. It is not difficult to see that maxσ HN (σ) is of order N and to prove that there are constants 0 < C1 < C2 satisfying lim P C1 N ≤ max HN (σ) ≤ C2 N = 1. N →∞

σ

However, the standard probabilistic techniques cannot derive the exact constant, which the Parisi-theory does, revealing a marvelous mathematical structure behind the problem, which is still very poorly understood, to this day. The Parisi-theory applies to many other problems besides to the SK-model, e.g. to the assignment problem from combinatorial optimization, to the perceptron and the Hopfield net from neural networks, to coding theory, and to others. For some of these applications, see Nishimori [14]. Back to the SK-model, the first question one typically answers is the existence of the free energy in the thermodynamical limit (here just N → ∞). It is however not at all

948–04

clear that the free energy lim FN (β, h)

N →∞

exists. In principle, even if the limit exists, it could be a random variable. This possibility is however ruled out by Gaussian concentration inequalities. One says that the free energy is “self-averaging”, meaning that no randomness remains in the N → ∞ limit. For a proof of the following inequality, see for instance [12]. Proposition 1.1. — Let γn be the standard Gaussian distribution on Rn . Let f : Rn → R be a Lipshitz continuous function with Lipshitz constant L. Then for any u>0 Z γn f > f dγn + u ≤ exp −u2 /2L2 . If we apply this inequality to FN (β, h), regarded as a function of the standard Gaussian vector (Jij )1≤i 1. The proof of the above result is surprisingly simple and can be done by a second moment computation, proving that EZ 2 ≤ const × (EZ)2 for β < 1, which is easy. Together with Gaussian isoperimetry (Proposition 1.1), this proves (4). The original proof in [1] was more complicated, but it derived also a much more detailed picture of the remaining fluctuations of log ZN . There are other models like directed polymers for which one can prove that the quenched free energy equals the annealed one in certain regions, but typically, this is not possible by a simple second moment method in the full region where it is true. The fact that a second moment computation gives the result in the SK-model up to the correct critical value (for h = 0) is rather surprising. For h 6= 0, “quenched=annealed” is never true, which reveals that this is a much more interesting situation, even where β is small.

2. THE REPLICA COMPUTATION AND THE PARISI FORMULA The first evaluation of the free energy f (β, h) was by Sherrington and Kirkpatrick [18], who applied the so-called “replica trick”. This is based on the observation that for a positive number x, one has log x = limn↓0 (xn − 1) /n. If X is positive random variable, one therefore has, provided the interchange of limits with the expectation is justified, EX n − 1 E log X = lim . n↓0 n

948–06

As integer moments are often easier to evaluate than non-integer ones, the “trick” is to evaluate EX n for integer n, then somehow extend things analytically, and perform the above limit. This is the folk tale how the replica trick works, but for the SK-model, this is not quite the way it is done. In fact, one just starts the computation of EZNn assuming that n is an integer, but as soon as convenient, one gives up this illusion and lets n → 0, before really finishing the computation. From computations of the integer moments (in the N → ∞ limit), one cannot derive the value of f (β, h). I do not repeat the computation here, as it is done in many textbooks (see e.g. [14]), and the most interesting issue starts after the (non-rigorous) replica computation. The variational formula one obtains from the replica trick is β2 X 1 β2 2 L(q,σ) + log 2, (6) f (β, h) = inf lim − qαβ + log trσ e + α 1. As we will prove f (β, h) ≤ RS (β, h) for all β, h, this proves that value in Theorem 1.2 is never correct for β > 1. For h > 0, the equation (8) does have a unique positive solution: Lemma 2.1. — Let β, h > 0 be arbitrary. Then (8) has a unique solution q (β, h) . The proof is due to Guerra and is short but a bit tricky. Talagrand has it in his book ([19]). The main question is whether f (β, h) = RS (β, h). It is certainly correct for h = 0 and β ≤ 1, as we have seen before. However, for β > 1, it is not correct. This is far from trivial to see. It will however turn out that for h 6= 0, the formula is correct again for small β, but not for large ones. Even the small β case is highly non-trivial. That the solution cannot be correct for large β was already realized by Sherrington and Kirkpatrick by calculating the entropy, which has to be positive, but it can also be computed from the free energy, and if one uses RS, it becomes negative for large β. So already Sherrington and Kirkpatrick concluded that their own solution is not correct for large β. The RS-solution is supposed to be correct for β up to the celebrated AT-line (de Almayda-Thouless line [3]), i.e. for β satisfying Z 1 1 2 2 √ e−x /2 dx < 1, (9) β p 2π cosh4 h + β q (β, h)x but this is not yet proved; it is now simply a nasty analytical problem, as the Parisiformula for f (β, h) is proved for the whole temperature region. (The above condition comes up through a local stability computation.)

In order to overcome the problem with the replica symmetric solution for large β, there had been various proposals for a different ansatz for the minimizing problem in (6), no longer assuming that all the qαβ are equal. This is the famous “replica symmetry breaking”. A particular ansatz for this is due to Parisi. The ansatz makes a very special assumption on the matrix Q = (qαβ ) , namely that it has a kind of hierarchical organization. The question then remained if there could not be a better choice not satisfying the Parisi-ansatz. A justification of the Parisi-ansatz before Talagrand’s proof was the proof that it is in a sense locally stable, by computing Hessians, and that it was the only one found having this property, but the really convincing argument was that the outcome had interesting consequences also outside the “replica formulation”. Very nice explanations of these issues can be found in [14]. Here just a cursory explanation of what is going on.

948–08

The replica symmetric ansatz fixes the matrix  0 q q ···  0 q ···   0 q  Q= ..  .  

Q to be of the following form  ··· q ··· q   ··· q   . ..  .   0 q  0

In the Parisi ansatz, one uses more complicated matrices. There are a number of levels. In the end, this number has to go to infinity, but let us first look at the simplest case, the case with one level of replica symmetry breaking. Here one takes a matrix of the form:       0 q2 q2 q1 q1 q1   0 q2   q1 q1 q1       0 q1 q1 q1        0 q2 q2        0 q2 0

The rule is that one divides the n × n-matrix by choosing n1 ≤ n such that n/n1 is an integer, and then one divides the matrix into (n/n1 )2 submatrices of the form n1 × n1 . The diagonal blocks get q2 above the diagonal, and the off-diagonal blocks all get q1 . In the above example, one has n = 6 and n1 = 3. Then one does the computation def analogously as above, keeps m1 = n1 /n fixed, and lets formally n → 0. This leads to a variational problem. One can check that one can always assume that 0 ≤ q1 ≤ q2 ≤ 1. For β small it turns out, that nothing new is achieved: The optimal choice for the q’s is q1 = q2 , but for large β, some q1 < q2 give a lower value. This is the “one level symmetry breaking”, but one can proceed by dividing the q2 blocks in a similar fashion, which leads to a “two level symmetry breaking”, and one can go on in this way with an arbitrary number of symmetry breakings. The calculations are somewhat lengthy but not difficult. Here is the outcome: Let K ∈ N (the number of symmetry breakings), and then we choose parameters (10)

0 = m0 < m1 < . . . < mK−1 < mK = 1,

(11)

0 = q0 ≤ q1 < . . . < qK < qK+1 = 1. def

For i = 0, . . . , K let gi be Gaussian with variance β 2 (qi+1 − qi ), and set YK+1 = P cosh h + K i=0 gi . Then one defines

(12)

1/mK def mK YK = EK YK+1 = EK (YK+1) ,

where EK means that one integrates out gK , so that YK still depends on g0 , . . . , gK−1. Then one defines 1/mK−1 def m YK−1 = EK−1 YK K−1

948–09

and so on, until one gets Y1 . Y1 is still a random variable as it depends on g0 . Remark however, that in case q1 = 0 which we do not exclude, there is no randomness left. In any case, we set K

(13)

def

PK (m, q; β, h) = E log Y1 −

β2 X 2 − qi2 + log 2. mi qi+1 4 i=1

Then inf m,q PK (m, q) is the value one obtains by optimizing (6) with the Parisi-ansatz at K levels of replica symmetry breaking, and therefore, believing that first of all the replica trick works, and secondly that the ansatz of Parisi finds the minimum, we get (14)

f (β, h) = inf PK (m, q) = lim inf PK (m, q) . K,m,q

K→∞ m,q

Theorem 2.2 (Parisi Formula). — The Parisi-formula (14) is correct for all β, h. The proof is due to Guerra [9] who proved the upper bound, and Talagrand [20] who then finished the proof. In the case of the SK-model, either one has K = 1, which gives the true value in the region where the replica-symmetric solution is correct, or one has to take K → ∞, and therefore one has “replica symmetry breaking” at infinitely many levels. There are other models, with the minimum assumed at one level of symmetry breaking, i.e. K = 2. One can artificially cook up cases with arbitrary K, but K = 1, 2, ∞ seem to be the only ones coming up “naturally”. In the case K = ∞, one can phrase the limit K → ∞ directly as a variational problem involving continuous functions q → x (q) . The finite K case then corresponds to taking step functions x (q) = mi for q ∈ [qi , qi+1 ). Here is an outline of what the physicists believe to be the picture behind the RSsolution (K = 1), and the replica symmetry breaking (K > 1). This picture emerged partly from another non-rigorous approach, the so-called “cavity method” which led to the same formula for the free energy, and gave a clearer picture about the Gibbs distribution (see [13]). The region where the RS-solution (7) is valid is characterized by the property that the σi under the Gibbs measure are still “fairly independent”. The h = 0 case is simple because, due to symmetry, the expectation under the Gibbs measure is 0. For h 6= 0, def the expectation of σi under the Gibbs measure GN,β,h,ω is mi = G (σi ) which satisfies Em2i = q (β, h), q being the solution of (8), equality in the N → ∞ limit. The mi are themselves approximately independent under the measure P. One therefore has the following picture (for large N): The randomness of the disorder (i.e. the Jij ) produces the nearly i.i.d. random variables mi , and given the disorder, the Gibbs measure has approximately independent spin variables σi with mean mi . The property that the σi are approximately independent is reflected in the physics community saying that there is just “one pure state”. Given this picture, q (β, h) has a precise mathematical interpretation in terms of the Gibbs measure. It is the almost sure limit (as N → ∞) of the overlaps of two

948–10

independent realizations of the spin variables: N N 1 X 1 X 2 ′ RN (σ, σ ) = σi σi ≃ m ≃ q (β, h) N i=1 N i=1 i ′

(15)

(2)

by the law of large numbers. The precise statement is as follows: Let νN be the measure on ΣN × ΣN defined by (2) νN

(16)

′

def

(σ, σ ) =

Z

⊗2 P (dω) GN,ω (σ, σ ′ ) ,

where G ⊗2 denotes the twofold product Gibbs measure. Then for small enough β (2)

lim νN (|RN (σ, σ ′ ) − q (β, h)| ≥ ε) = 0, ∀ε > 0.

N →∞

This means that the overlap of independent replicas is self-averaging. The hightemperature regime is now mathematically very well understood, mainly through the work of Michel Talagrand (see [19], Chapter 2). In the low temperature regime things become much more complicated. First of all, the RS-solution is no longer correct, but this is only one aspect. The overlaps are no longer self-averaging but stay random. The Gibbs distribution splits into a “countable number of pure states”, a statement made in the physics literature which is difficult to make mathematically precise. Essentially the “pure states” under the Gibbs-distribution should be organized in a hierarchical way. This hierarchy somehow reflects the hierarchical ansatz in the Parisi-matrices above. Nothing of this has been proved mathematically, and probably not all statements made in the physics literature should be taken (mathematically) too literally. One important aspect is “ultrametricity”, which has the following precise mathematical meaning: Take three independent (3) realizations σ, σ ′ , σ ′′ under the Gibbs measure. Define νN for the three replicas, simi(2) larly as νN defined above. The claim is that for any ε > 0 (17)

(3)

lim νN [RN (σ, σ ′′ ) ≥ min (RN (σ, σ ′ ) , RN (σ ′ , σ ′′ )) − ε] = 0.

N →∞

There is no proof of this. Together with the so-called Ghirlanda-Guerra identities, which I am not discussing here, this would essentially characterize the model completely. Despite the recent progress on the SK-model in the full temperature regime, which is explained below, much of the above picture is mathematically not understood. In a case with one level of symmetry breaking only, the so-called p-spin SK model, there are results by Michel Talagrand, which confirm the physicists predictions, if properly formulated (see [19] Chapter 6).

948–11

3. GUERRA’S INTERPOLATION SCHEME: THE REPLICA SYMMETRIC BOUND Much of the recent progress on the SK-model is based on a very clever argument invented by Guerra, which leads to bounds on the free energy. These bounds are obtained by interpolating continuously between the system one is interested in, and a much easier one. I will explain this in the simplest case, where one proves that the replica symmetric solution is a strict bound for the free energy, for all N and in the full region of parameters. Theorem 3.1. — For all β > 0, h ∈ R, and N ∈ N one has fN (β, h) ≤ RS (β, h) , where RS (β, h) is defined by (7). Proof. — The proof is by interpolation. Let for an arbitrary number q ≥ 0, and t ∈ [0, 1] r N X √ t X √ def Jij σi σj + 1 − t (18) H (t, σ) = qgi σi , N 1≤i · · · are real-valued random variables. We also just talk of the “point process P (ξi )”, meaning ∞ i=0 δξi , but we tacitly always assume that the points are ordered downwards. (The point processes we consider will always have a largest point.) We are not really interested in the energy levels, but rather in the Gibbs weights, which are given as exp [βHN (α)]. As we are interested only in the relative weights, we can as well consider exp [β (HN (α) − aN )]. Of course, we could normalize the weights to a (random) probability distribution, but it turns out to better be not too hasty with that, and to consider first the limiting point process of these points which converges in distribution evidently √ √ − 2 log 2t to the transformation of the point process PPP t → 2 log 2e obtained by def

applying the mapping ξ → η = eβξ to the points. This is a PPP (t → xt−x−1 ) , with √ the parameter x = x (β) = 2 log 2 β, i.e. we have X (27) δexp[β(HN (α)−aN )] → PPP t → x (β) t−x(β)−1 α

948–15

in distribution. The PPP (t → xt−x−1 ) (which of course are point processes on the positive real line) have a number of remarkable properties which are absolutely crucial for their appearance in the Parisi picture. Proposition 4.1. — Assume (ηi ) are the points of a PPP (t → xt−x−1 ), and let Y1 , Y2 , . . . be i.i.d. positive real random variables satisfying EY x < ∞, being also P def independent of the point process. Set ψ (x) = (EY x )1/x . Then i δψ(x)−1 Yi ηi is also a PPP (t → xt−x−1 ). In plain words, multiplying the points ηi by Yi amounts to the same (when regarded as a point process) than multiplying the points with the constant ψ (x). (We will see that this property is at the core of the Parisi formula). The proof is an easy exercise and I do not give it here. Note that the properties crucially depend on the special form of the intensity measure of the Poisson process. The property actually characterizes PPP (t → xt−x−1 ) as has recently been shown by Ruzmaikina and Aizenman [17]. In order to describe the limiting Gibbs distribution, one still has to apply a normalization, and it is plausible that we can interchange the normalizing operation with P taking the limit in (27), i.e. we would like to conclude that the point process α δGN,β (α) converges weakly to the proper normalization of PPP (t → xt−x−1 ). There is however a difficulty. Let η1 > η2 > . . . > 0 be the ordered (random) points of a PPP (t → xt−x−1 ) . We would like to apply a normalization procedure by normalizing the weights ηi , setting .X η i = ηi ηj . j

This we can only do if the sum converges. One easily proves the following statement for the points of a PPP (t → xt−x−1 ) X ηj < ∞ a.s. ⇐⇒ x < 1. j

If x < 1, we can therefore define the normalization procedure, obtaining the point P process i δηi which we denote by N (PPP (t → xt−x−1 )) . This is no longer a Poisson point process as is evident from the fact that the points sum up to 1. The following result is plausible, but its proof still requires some work as the above normalization is not a continuous operation. √ P Proposition 4.2. — Assume β > 2 log 2. Then α δGN,β (α) converges weakly to √ −x−1 N (P P P (t → xt )) , where x (β) = 2 log 2/β. For a proof (in a more general setting), see [6] or [19], Chap 1. The result states that for low temperature, there are configurations α which have Gibbs weight of order 1 in the N → ∞ limit, but these Gibbs weights stay random. So the limiting Gibbs distribution is not “self-averaging”. Furthermore, there is a “countable” number of such configurations in the limit. More precisely: For any ε > 0 there exists a number K (ε) such that the total Gibbs weight of the K (ε) configurations with the largest weight is ≥ 1 − ε, with P-probability larger than 1 − ε, and that uniformly in N. Furthermore √ K (ε) has to go to ∞ for ε → 0. The situation is easy to understand: For β > 2 log 2,

948–16

the Gibbs weights concentrate on the configurations α for which the energies HN (α) are maximal or close to the maximum. These energies (near the maximum) are spaced at a distance of order 1: The second largest is below the largest by a random distance which stays stochastically of order 1 in the N → ∞ limit. The maximum energy is √ approximately at 2 log 2N, with some correction of order log N. √ If β < 2 log 2, the situation is completely different. The main contribution comes √ from energies approximately at a level aN, where a < 2 log 2 (actually a = β, by accident). At this level, the energies are lying tightly, with exponentially small typical √ spacings. Therefore, the maximum Gibbs weight for β < 2 log 2 is exponentially small in N, and in order to catch a macroscopic weight one has to sum over exponentially many individual configurations. Therefore, in the limit, “uncountable” many configurations contribute to the Gibbs measure. A prediction of the Parisi theory is that the point process described above is a universal object in spin glass theory and appears as the distribution of the “pure states” in essentially all systems exhibiting “spin glass behavior”, in particular in the SK model. It is difficult to give the notion of a “pure state”, which is often appearing in the physics literature, a precise mathematical sense. This has been achieved only for the p-spin SK model which has a simpler structure than the regular SK model, by Talagrand (see [19], Chap 6). The above model is called the “random energy model”, REM for short. It is certainly an oversimplification, and Derrida [8] a bit later introduced a model which has hierarchical organized correlations. Shortly afterwards, Ruelle [16] in an attempt to get a clearer mathematical picture of the physicists predictions in spin glass theory introduced a point process version, which is the limiting object of Derrida’s model. This model was then further investigated in [4] and elsewhere. These models are now called “generalized random energy models”, or GREM for short. In contrast to the random energy model, they have a non-trivial notion of “overlaps”. Here is Derrida’s version. We consider a tree with 2N leaves and K branching levels, where K stays fixed (for the moment), and we let then N → ∞. We write the elements of the tree as α = (α1 , . . . , αK ) where αi ∈ 1, . . . , 2N/K . For convenience, we always assume that N/K is an integer. We again write ΣN for the collection of such α’s. Evidently, we have 2N elements in ΣN . For i ≤ K, we identify (α1 , . . . , αi ) with the “bond” from node (α1 , . . . , αi−1 ) to (α1 , . . . , αi ). To the bonds of the tree, we attach Gaussian random variables with variances proportional to N, but depending on the P 2 level inside the tree. We choose parameters σ12 , . . . , σK > 0 with i σi2 = 1, and for (i) i ≤ K, (α1 , . . . , αi ) as above, we choose Gaussian random variables Xα1 ,...,αi which have variance σi2 N. All these variables are independent. Then we define the random Hamiltonian (28)

def

HN (α) =

K X i=1

Xα(i)1 ,...,αi ,

948–17

i.e. for any leaf of the tree we sum the independent Gaussian variables attached to the bonds along the path from the root to this leaf. The HN (α) are evidently Gaussians with variance N, like in the REM case, but there are now correlations. Defining for α, α′ ∈ ΣN the overlap def

R (α, α′ ) = max {i : (α1 , . . . , αi ) = (α1′ , . . . , αi′ )} one has R(α,α′ )

EHN (α) HN (α′ ) = N

X

σi2 .

i=1

We impose the following condition (29)

2 σ12 > σ22 > . . . > σK > 0.

If this is not satisfied, just some levels disappear in the N → ∞ limit, so we can as well make this assumption(2) . The partition function and the Gibbs weights are defined as before in (24), (25). Despite its simplicity the model has a number of surprising properties which can be summarized as follows: – The limiting Gibbs measure is always that of random energy model if “properly interpreted”. This is true despite the fact that the limiting point process of the energy levels is not that of a random energy model, but by normalizing, the “notREM” part cancels out. – The model keeps a non-trivial overlap structure of the configurations, even in the N → ∞ limit, which also stays random (i.e. non-selfaveraging). Surprisingly however, the overlap structure becomes stochastically independent of the Gibbsweights in the limit (which is not true for finite N). The overlap structure has a simple Markovian structure as a coalescent with explicitly defined transition probabilities, a fact worked out in [4]. – The GREM overlap structure is of direct relevance for the Sherrington-Kirkpatrick model. It turns out that the Parisi-formula for the free energy of the SK shows up through a “one spin perturbation” of GREMs. This aspect can be used to prove that the Parisi-expression is an upper bound for fSK (β, h) . This will be explained in the next section. The free energy of the GREM can be computed (see [8]), but it is not of great relevance for the aspects discussed here. We now describe Ruelle’s limiting point process versions. One can perform the N → ∞ separately on each level. On the first level, one simply has 2N/K independent Gaussians with variance σ12 N. After subtracting a suitable constant from these “energies”, one arrives in the limit N → ∞, .pusing the same argument as for the REM, √ −at Kσ12 . As we are interested in the Gibbs at a PPP (t → ae ), with a = 2 log 2 distribution we can as well consider the point process where one maps the points ξ of (2)

There is a delicate issue in case of equalities in (29) which we do not address here.

948–18

the above point process to η = exp [βξ] ∈.R+ . This leads to a PPP (t → x1 t−x1 −1 ) on √ √ the positive real line where x1 = 2 log 2 Kβσ1 . In this way, one proceeds along the tree and arrives at the following object. Set √ 2 log 2 def . xi (β) = √ Kβσi The point process PPP (t → x1 t−x1 −1 ) for the first level consists of countably many random points which we can assume to be ordered downwards. Call them η11 > η21 > . . . > 0. For any i ∈ N, i.e. for any point from the first level, we choose independent point processes PPP (t → x2 t−x2 −1 ) , whose points we again order down2 2 wards: ηi,1 > ηi,2 > . . . > 0, and in this way we proceed: For j ≤ K and i1 , . . . , ij−1 j fixed, ηi1 i2 ...ij are the points of a PPP (t → xj t−xj −1 ). They are independent for ij ∈N

different i1 , . . . , ij−1 and also for different levels j, and we again assume that for each of these point processes, the points are ordered downwards. This is essentially Ruelle’s cascade construction. We can compose these point processes of the individual levels by just multiplying the “abstract Gibbs weights” along the tree (which corresponds to summing the energy levels of Derrida’s GREM along the tree). We therefore arrive at a point process with random points indexed by i = (i1 , . . . , iK ) , ij ∈ N, ηi = ηi11 ηi21 ,i2 · . . . · ηiK1 ,i2 ,...,iK .

(30)

This is not a Poisson point process, but after normalization, surprisingly, .√ it is simply √ cr def a normalized REM. For convenience assume β > βK = 2 log 2 KσK , so that xK (β) < 1. (If this is not satisfied, one has to collapse some of the latter levels and one arrives essentially to the same conclusion for the remaining ones.) In that case X ηi < ∞ i

with probability one, and so one can normalize the point process, defining ηi def ηi = P . j ηj

Then one has the following properties: – The point process

Ξ=

X

δηi

i

is the normalization of a PPP (t → xK t−xK −1 ). – The point process of the Gibbs-distributions of Derrida’s GREM converges weakly to the point process of Ruelle’s GREM: X δGβ (α) → Ξ, α

in distribution, as N → ∞. For a proof, see [6].

948–19

The point process Ξ does not keep track of the way the points were produced through the tree, so it “forgets” the tree structure. This structure is however important for the Parisi picture. The tree structure can be retained in the following way. As usual we order the energy levels ηi downwards, i.e. we define a (random) bijection π : N → NK such that ηπ(k) is the k-th largest element in the set {ηi } . This leads to an overlap structure on N, by measuring the hierarchical distance between π (i) and π (i′ ) , i.e. we set for i, i′ ∈ N def

q (i, i′ ) = max {r : π (i)1 = π (i′ )1 , . . . , π (i)r = π (i′ )r } . This leads to a sequence of (random) partitions of N, which for k ≤ K − 1 clumps together points in N whose π-value agrees on level k, i.e. we introduce the equivalence relation i ∼k i′ ⇐⇒ q (i, i′ ) ≥ k, which leads to a partition of N in the equivalence classes of ∼k . If k decreases, the partitions become coarser. For k = 0, evidently all of N is clumped into one set. Remarkably, this sequence of random partitions is stochastically independent of Ξ itself. Furthermore the sequence of clustering has a very simple Markovian structure, of viewed backwards in k (see [4]).

5. GUERRA’S REPLICA SYMMETRY BREAKING BOUND: THE AIZENMAN-SIMS-STARR PROOF In a remarkable paper [9], Guerra extended the bound derived in Section 3 to a bound of f (β, h) by the Parisi solution. The proof is not very complicated, but hard to understand without knowledge of the cascade picture introduced in the last section. A bit later, Aizenman, Sims, and Starr [2] reproved the bound, and generalized it by introducing what they call “random overlap structures”, which serve as an abstract model for measures on a countable set which have a notion of “overlaps”. Definition 5.1. — A random overlap structure R (ROSt for short) consists of a finite or countable set A, a probability space (Γ, G, P) , and random variables ηα ≥ 0, qα,α′ , α, α′ ∈ A, satisfying the following properties P 1. α ηα < ∞ 2. (qα,α′ ) is positive definite and satisfies qα,α = 1. The ηα play the rˆole of (unnormalized) Gibbs weights, and the q’s are the abstract overlaps. def

Example 5.2. — As an example take A = ΣN = {−1, 1}N . The ησ , σ ∈ ΣN , can be arbitrary. For qσ,σ′ we take the standard overlap RN (σ, σ ′ ), as introduced before. We write RSK N for this overlap structure. The q here are nonrandom. On the other hand, we can use a (random) reordering of the set A by ordering the ησ downwards:

948–20

η1 > η2 > . . . > η2N . After this random reordering, the q become random: q1,2 for instance is the overlap of the two indices with the largest η-weight. Example 5.3. — Another overlap structure is defined by Ruelle’s probability cascades (30) introduced in the last section. Fix 0 = m0 < m1 < . . . < mK = 1. We take A = NK , and the η are the (unnormalized) weights ηi as in the last section with def xi = mi , 1 ≤ i ≤ K (see (30)). There is a slight problem because we have to take P the last parameter xK = 1, which implies that i ηi = ∞. This will not cause any difficulties for what we do below. The overlaps are defined in the following way. Fix a sequence 0 ≤ q (1) < q (2) < . . . < q (K) < q (K + 1) = 1, and we set qi,i′ = q (max {k : (i1 , . . . , ik ) = (i′1 , . . . , i′k )} + 1) , i.e. we measure the hierarchical distance on the tree, and weight it with the function q. For this random overlap structure, we write RRuelle . K Given any ROSt, we attach to it families of Gaussian random variables (yα,i )α∈A, (κα )α∈A by requiring (31)

i∈N

,

2 E (κα κα′ ) = qα,α ′ /2,

and the “cavity field” by (32)

E (yα,j yα′ ,j ′ ) = qα,α′ δj,j ′ .

The κ and the y are independent. In case, the q’s themselves are random variables, these are just the conditional distributions, given (ξ, q) . It is not difficult to see that such random variables exist. By an extension of the probability space, we can assume that all the random variables are defined on a single probability space. For later use, we give the construction of the cavity variables for RRuelle . We simply K write (33)

yi = g

(0)

+

K X

(k)

gi1 ,...,ik ,

k=1

where the g’s are independent centered Gaussians, with var g (0) = q (1) , var g (k) = q (k + 1) − q (k) . Furthermore, the yi,j , j ∈ N, are independent copies of yi . The κi are constructed in a similar way. The above notion of a ROSt needs some explanation. The basic idea comes from what in the physics literature is called the “cavity method”. We consider the standard SK-Hamiltonian, but now with N + M spins, where one should think of N being much larger than M. We then try to write the Hamiltonian in terms of the Hamiltonian on N

948–21

spin variables acting on the M “newcomers”. We write τi = σN +i for the newcomers. NX +M X β Jij σi σj + h σi N + M i