Un cours de theorie analytique des nombres
 9782856291610, 2856291619, 9781423771258 [PDF]

  • 0 0 0
  • Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden
Datei wird geladen, bitte warten...
Zitiervorschau

U N COURS DE THÉORIE ANALYTIQUE DES NOMBRES

Emmanuel Kowalski

Comité de rédaction

Jean-Benoît BOST François LOESER

Joseph OESTERLÉ Daniel BARLET (dir.)

Diffusion

Maison de la SMF B.P. 67 13274 Marseille Cedex 9 France [email protected]

AMS P.O. Box 6248 Providence RI 02940 USA www.ams.org

EDP Sciences 17, avenue du Hoggar 91944 les Ulis cedex A France www.edpsciences.com

Tarifs 2004 Vente au numéro : 41 € ($59)

Des conditions spéciales sont accordées aux membres de la SMF.

Secrétariat : Nathalie Christiaën Cours Spécialisés Société Mathématique de France Institut Henri Poincaré, 11, rue Pierre et Marie Curie 75231 Paris Cedex 05, France Tél : (33) 01 44 27 67 99 Fax : (33) 01 40 46 90 96 [email protected] http://smf.emath.fr/

@ Société Mathématique de France 2004 Tous droits réservés (article L 122-4 du Code de la propriété intellectuelle). Toute représentation ou reproduction intégrale ou partielle faite sans le consentement de l'éditeur est illicite. Cette représentation ou reproduction par quelque procédé que ce soit constituerait une contrefaçon sanctionnée par les articles L 335-2 et suivants du CPI.

Directeur de la publication : Marie-Françoise ROY

COURS SPÉCLALISÉS 13

UN COURS DE THÉORIE ANALYTIQUE DES NOMBRES

Emmanuel Kowalski

Société Mathématique de France 2004

Page laissée blanche intentionnellement

Préface

......................................................................... vii

.

1 Introduction ................................................................. 1 1.1. Introduction ............................................................ 1 1.2. Le prétexte .............................................................. 2 1.3. Explicitation ............................................................ 3 1.4. Le critère d'équirépartition de Weyl ..................................... 8 1.5. Motivation 1 : le crible ................................................... 10 1.6. Motivation II : les formes modulaires .................................... 15

2. Préparatifs pour le théorème des nombres premiers ......................... 19 2.1. Séries de Dirichlet ....................................................... 19 2.2. Fonctions sommatoires et séries de Dirichlet ............................ 29 2.3. Séries de Dirichlet et fonctions sommatoires ............................ 30 2.4. Caractères de groupes abéliens finis ..................................... 39 2.5. La formule de sommation de Poisson ................................... 44 2.6. Fonctions L de Dirichlet ................................................46 Appendice : produits infinis ................................................. 52

.

3 Le théorème des nombres premiers .......................................... 55 3.1. Introduction ............................................................ 55 3.2. Le prolongement analytique des fonctions L de Dirichlet ............... 56 3.3. Les zéros des fonctions L de Dirichlet ................................... 62 3.4. Le théorème des nombres premiers ..................................... '78 Appendice : résultats d'analyse complexe .................................... 84

.

4 Discussion du théorème des nombres premiers .............................. 87 4.1. L'Hypothèse de Riemann Généralisée ................................... 8'7 4.2. Problèmes d'uniformité : exemple ...................................... 95 4.3. Le théorème de Siegel-Walfisz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 4.4. Le théorème de Bombieri-Vinogradov ...................................101 4.5. L'inégalité de Brun-Titchmarsh .........................................102

.

5 Crible et sommes oscillantes sur les nombres premiers ....................... 107 5.1. Le crible en général ..................................................... 107 5.2. Arguments heuristiques ................................................. 108 5.3. Un crible combinatoire simple ......................................... -111 5.4. Le crible oscillant de Duke-Friedlander-Iwaniec .........................124 5.5. Exemple pédagogique ..................................................135

.

6 Formes automorphes et décomposition spectrale ............................145 6.1. Formes linéaires en racines de congruences quadratiques ............... 145 6.2. Une pincée de géométrie hyperbolique .................................154 6.3. Formes automorphes : définitions de base ............................... 160 6.4. Séries d'Eisenstein ...................................................... 169 6.5. Le spectre discret .......................................................180 6.6. Décomposition spectrale complète pour To (q) ..........................184

.

7 Estimation d'une série de Poincaré ..........................................185

7.1. Première réduction .....................................................186 7.2. Première étape commune ...............................................190 7.3. Preuve conditionnelle ...................................................193 7.4. Preuve inconditionnelle ................................................. 195 Appendice : les fonctions tranquilles ......................................... 202

8. Équirépartition des racines de congruences quadratiques et applications . . . . 203 8.1. Introduction ............................................................203 8.2. Formes linéaires ........................................................ -205 8.3. Formes bilinéaires ....................................................... 206 8.4. Conclusion et applications .............................................. 210 Examen . Bordeaux. Mai 2002 .................................................221 Bibliographie

...................................................................225

Index .......................................................................... -231

Ces notes ont été rédigées pour un cours de DEA donné à l'université Bordeaux 1 au second semestre 2001/2002. L'idée était de présenter de manière motivée certaines des méthodes les plus modernes de théorie analytique des nombres par le biais d'un théorème très récent de Duke, Friedlander et Iwaniec. Pour que celui-ci soit présenté dans un contexte compréhensible, il a fallu tout naturellement développer les résultats fondamentaux concernant la distribution des nombres premiers, de sorte que le texte final peut aussi être considéré comme une introduction à toute la partie

3

+

Théorème 1.2.1. - Soit D 1 en entier et P = x2 D, ou plus généralement P(X) un polynôme quadratique irréductible sur Q, à coefJicients entiers et discriminant < O. Lorsque x -+ +oo, les racines de P modulo p premier; p x, dmiennent équiréparties pour la mesure de Lebesgue.


. - ->Pr.

Par exemple, p(P) = -1 pour tout p, p(P2) = O, p(P1P2) = 1 si pl # P2. Noter aussi que p (1) = 1 (il y a O facteurs premiers). La fonction de Mobius est sans doute la plus importante fonction arithmétique en théorie analytique des nombres, et la plus mystérieuse. Posons de plus

On a alors

De manière plus générale, soit d = (a,) une suite de nombres complexes. On souhaite en savoir plus sur les propriétés de a, quand n = p premier (penser à a, fonction caractéristique de la suite des nombre premiers décalés + 2, par exemple). Dans de nombreux cas, on arrivera à certains résultats par des méthodes de crible. Considérons le problème plus général d'évaluer les sommes

c'est-à-dire de comprendre an quand n n'a pas de diviseurs premiers cela donne à peu de choses près la somme sur les x


> par l'écriture d'une formule analytique, permettant de manipuler la condition qu'elle exprime avec des outils analytiques. Ici on en déduit

(1.9) en posant

On a donc exprimé la somme S(x, z) à l'aide de sommes d'apparence plus simple puisque la condition sur les sommandes n est « seulement » d'être divisibles par d (il s'agit donc de passer des nombres premiers à des progressions arithmétiques que l'on suppose plus élémentaires). Noter cependant que d peut être très grand, et si l'on veut aller plus loin il faudra des estimations uniformes pour toutes ces valeurs de d. Cela s'avère rédhibitoire dans l'état actuel de nos connaissances. On se trouve généralement dans une situation où on a une approximation correcte pour d assez petit avec

et rd (x) un « reste » (de sorte que g ( d ) mesure intuitivement la « probabilité » d'être divisible par d pour les éléments dans le support de la suite (a,), avec multiplicité). Par exemple si an = 1 (on veut compter les nombres premiers...), on a évidemment

COURS SPÉCIALISÉS 13

1.5. MOTlVATION 1 : LE CRIBLE

13


( l ) ,par {exemple. Pour le développement de cette Section, voir le Chapitre 5.


O.

L'équation P(v) = O (mod n)

a v e c a 2 1.

On réécrit cela an - v2 = D, et on l'interprète en disant que la forme quadratique a x 2 + 2vXY + nY a discriminant D > O. La somme sur les racines v de P modulo n va être interprétée comme une somme sur certaines classes d'équivalence de formes quadratiques de discriminant D . Or l'espace paramétrant les formes quadratiques définies positives a x 2 + 2bXY + GY de discriminant D sur R est

Une représentation commode de &D est fournie par le demi-plan de Poincaré

la bijection n : gD-t H est simplement l'opération qui associe à q E 6FD celui des deux complexes zq , Zq tels que

qui se trouve dans H, précisément

(autrement dit - l / z p et - l / Z q sont les racines du polynôme quadratique g (x) = q(x, 1)). Le changement de v en v + n correspond à un changement de variable linéaire unimodulaire ( i.e. de déterminant 1) pour q , (X, Y ) t+ (X, nX + Y ) , ce qui équivaut à n(q') = n(q) + n. Plus généralement l'action de SL(2,R) sur 6FD par

correspond à

Sous l'action induite par SL(2,Z) il y a un nombre fini d'orbites de formes à coefficients entiers (par exemple pour D = 1, à équivalence près, la seule forme quadratique entière est q = x2+ Y 2 ) . Soit A un ensemble contenant un point de chacune de ces orbites. On peut alors écrire

1

P (v) =O (mod n)

COURS SPÉCIALISÉS 13

C

e(hRe(yz))

1.6. MOTIVATION II : LES FORMES M O D U W R E S

Par exemple si D = 1, on voit que A = {i} convient, engendré par

ri est cyclique d'ordre

4

et la formule devient ph(n)=

1

e(:)=-

C

e(hRe(yi)).

YEBW

v2+1=0 (modn)

Pour faire la somme sur n 2 1 de manière souple, soit F : R+ -t R une fonction test (à support compact). On obtient -

avec Ph la fonction définie sur H par

Par construction, cette fonction est ï-invariante, i.e. De telles fonction sont appelées fonctions modulaires; on peut dire qu'elles vivent sur l'espace quotient X = SL(2,Z)\H. Maintenant on va estimer Ph(z) pour z arbitraire dans H. Pour ce faire, l'idée est en quelque sorte de développer P en série de Fourier sur X pour en détecter les > Toute la subtilité est que X n'est pas aussi simple sur le tore R/Z pour lequel s'applique la théorie des séries de Fourier. Plus précisément, la théorie spectrale va s'appliquer à décomposer toute fonction sur H qui est r-invariante (et assez régulière) comme combinaison de fonctions fondamentales. Celles-ci seront de deux types : les fonctions dites 1. Pour des raisons historiques on écrit en général s = o + it la décomposition en partie réelle et imaginaire de la variable d'une série de Dirichlet. Cela sera fait cidessous parfois sans mention explicite.

Proposition 2.1.2. - Soit f une fonction arithmétique. ( 1 ) Si f ( n ) = 0 (np) avec f3 E R, alors la série de Dirichlet D ( s ) converge absolument pour tout s E C tel que o > p + 1 , unifôrmément sur tout compact, et d@nit dans cette répon une fonction holomorphe D ( s ) de S . ( 2 ) Réciproquement, si la série converge pour so E C , on a f ( n ) < noo. ( 3 ) S'il existe so tel que la skie convmge pour so E C , alors D ( s ) = O pour tout s de partie réelle assez grande si et seulement si f (n) = O pour tout n. ( 4 ) Dans tout demiplan vertical o 2 A inclus dans la région de convmgence absolue, D ( s ) est uniformément bornée. Démonstration ( 1 ) On a pour tout s et le résultat provient de la convergence de la fonction zêta pour o > 1, ainsi que des résultats généraux sur les limites de fonctions holomorphes. ( 2 ) La convergence pour so implique que les coefficients tendent vers O, en particulier sont bornés donc f ( n )n-'O « 1. ( 3 ) Soit d, s'il existe, le plus petit entier n tel que f ( n ) # O. Par convergence uniforme on a alors lim d o D j ( O ) = f (d) # O "++OC

et donc D # O dans ce cas. D'où le résultat par contraposition. ( 4 ) C'est évident car pour o 2 A on a

Les fonctions f pour lesquelles les séries de Dirichlet ont une région de convergence non vide seront appelées à croissance modérée. C'est en particulier lorsque f ( n ) a des propriétés multiplicatives que la série de Dirichlet est particulièrement utile, en raison de la propriété

Proposition 2.1.3. - Soient f et g des fonctions à croissance modérée, D et Dg les séries de Dirichlet associées. Alors pour o = R e ( s ) assez grand on a D f ( s )Dg ( s ) = Dh ( s ) =

C h ( n )n-'

n> 1

où h , appelée convolution de Dirichlet de f et g , est donnée par

Démonstration. - Pour o assez grand, le produit des deux séries absolument convergentes D ( s ) et Dg ( s ) peut être ré-arrangé arbitrairement, et alors

On note souvent h = f * g . Comme cette opération correspond au produit ordinaire, on a une structure d'algèbre commutative : f * ( g h ) = ( f * g ) h , etc. L'élément neutre est la fonction 6 telle que 6 ( 1 ) = 1 et 6 ( n ) = O si n 2 2. Bien entendu la formule ci-dessus se généralise à plus de deux facteurs

*

DéJinition 2.1.4. - Une fonction arithmétique f est dite multiplicative si f

*

# O et

f ( n m ) = f ( n ) f ( m ) quand ( n , m ) = 1. Par exemple, la fonction 6 est trivialement multiplicative. Soit f multiplicative. On vérifie que f (1) = 1 . Par multiplicativité, si n = avecpl > - . . > P re t n l , ..., n , > O , o n a

PT'

..

donc f est connue à partir des f (pk)pour p premier, k 2 1, et ces nombres peuvent évidemment être arbitraires. Cela se traduit par l'existence d'un produit eulérien pour D ( s ). Proposition 2.1.5 ( 1 ) Soit f une fonction arithmétique multiplicative à croissance modérée. Alors pour tout s tel que D ( s ) converge absolument on a

où le produit est pris sur tous les nombres premiers et converge absolument; voir 1'appendice à ce chapitre pour un rappel des propriétés de base des produits infinis. (2) Soit f une fonction arithmétique multiplicative quelconque. Pour tout n 2 1 et tout s ~ C o n a

socrÉ~ÉMATHÉMATIQUE

DE FRANCE 2004

Démonstration (1) La convergence absolue de D (s) implique que, pour tout p, la série

qui en est extraite converge absolument. Soit z 2. Le produit sur les p z est un produit fini de séries de Dirichlet (chacune supportée sur les puissances d'un seul nombre premier) et peut donc être réarrangé comme désiré suivant la recette ci-dessus. Cela donne, si pl > - > p, sont les nombres premiers z et P(x) leur produit :


1. Cela découle de ce qui précède puisque

pour Re(s) > O, la série convergeant absolument. Euler en déduisit le premier résultat non trivial sur la distribution des nombres premiers depuis Euclide :

Corollaire 2.1.7 (1) On a

(2) Pour tout E > O, l'énoncé T C ( % ) « XI-' est faux.

COURS SPÉCIALISÉS 13

DIRICHLET

23

Démonstration. - Par sommation par partie (cf: (2.16) plus bas) on vérifie que

quand s -+ 1 par valeurs réelles > 1. Or pour s > 1 on peut prendre le logarithme dans le produit eulérien puisqu'il converge absolument et développer - log(1- x) =

Cxk/k

:

Cette somme double peut également être réarrangée, et on trouve

quand s -+1 car

converge absolument pour s > 1/2. Comparant les deux formules, le premier résultat en découle. On peut écrire par sommation par partie encore

Supposons x (x) « xl-S avec 8 s 4 1, ce qui contredit (1).

> O. Alors l'expression à droite est bornée

quand

0

Par une méthode similaire on peut démontrer aussi que

C -1 P O et tout n >, 1

2

O et Q est un polynôme ne dépendant pas de p.

et en particulia la série de Dirichlet D ( s ) converge absolument pour a

> A + 1.

Démonstration. - En considérant g ( n ) = n-A f ( n ) , on se ramène à A = O. Il existe C 2 O et d 2 O tels que Q ( k ) ckdpour tout k 2 1. Prenons d'abord n = pk avec f~ premier. On a

s

donc Soit E > O fixé. Pour n 2 No = No ( E ) assez grand, on peut « absorber » la constante ~ / ( l o ~ 2donc ) ~ , 1 f ( n )1 n' pour n = pk 2 No. Soit n quelconque. On écrit n = nln2 avec ( n i , n n ) = 1 et n i est le produit des facteurs 2 No de n et n2 le diviseur 1 f ( n 2 )In;, or n2 appartient à un ensemble fini complémentaire. On trouve 1 f ( n )1 d'entiers, disons m E E. D'où

s


1. De plus son produit eulérien est

Cette identité est équivalente à Dl, ( s )C(s) = 1 , c'est-à-dire est équivalente à l'énoncé du Lemme 1.5.1 d'après (2.3). On en déduit aussi la formule d'inversion de Mobius : étant données des fonctions arithmétiques f et g, on a n f ( n ) = C g ( d ) si et seulement si g ( n ) = y ( d ) f d 4% dln En terme de série de Dirichlet, c'est la tautologie D f ( s ) = C ( S ) D g ( s ) si et seulement ( s ) . Bien évidemment, cela est vrai sous la forme (2.10) même si si Dg( s ) = [ ( s ) f et g n'ont pas croissance modérée. En particulier on voit que y est l'inverse pour la convolution de la fonction constante 1. Plus généralement :

c

-'

(-)

Lemme 2.1.10. - Soit f une fonction arithmétique. Alors f admet un inverse notée f*(-'1 pour la convolution si et seulement si f ( 1 ) # O . E n particulier, si f est multiplicative, elle est inversible. Dans ce cas on a pour p premier

Démonstration. - On procède par récurrence pour déterminer g telle que f x- g = 6 : pour n = 1 , cela donne

1 = f ( l ) g ( l ) donc g ( 1 ) = f ( 1 ) - ' . Si g ( m ) est déterminée pour m

< n , on a l'équation pour g ( n ) :

dont tous les termes dans la somme sont connus par hypothèse, et donc

g ( n >= --

f

1

(')C f ( d ) g ( n / d ) . dln

Pour vérifier la dernière formule, il suffit de prendre n = p dans la formule ci-dessus. O Il n'est pas forcément évident, par contre, de déterminer la région de convergence absolue de Dyc-l) ( s ) : cela dépend bien évidemment de l'existence de zéros de D f ( s ) .

(2) La fonction

de sorte que le Lemme 2.1.8 s'applique et prouve de nouveau que D,(s) converge pour o > 1 , ainsi que l'estimation


1. SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2004

(3) La fonction d'Euler cp ( n ) = 1 ( Z / n Z ) théorème chinois. On a

1

est également multiplicative grâce au

et plus généralement par multiplicativité

Comme cp ( n )

< n , la série Dv ( s ) converge pour o > 2. On a de plus n=xcp(d)

oubien

4%

cp(n) = n C - ~ l(- 4

4%

d

(que l'on déduit de (2.11) ou bien de (2.10)).Donc pour o

> 2 on a

On a la majoration utile

4

-

cp ( 4 )

pour q

« log log q

2 2.

(4) On a vu que la série de Dirichlet D f ( s ) est holomorphe dans la région où elle converge absolument. Par convergence uniforme, on peut dériver sous le signe de sommation avec (S H

n?)'

= - (log n )n-',

et on obtient : Lemme 2.1.11. - Soit f une fonction arithmétique à croissance modérée telle que D ( s ) converge absolument pour o > 00. Alors pour o > oo la dénvée de D ( s ) est donnée par

D; ( s ) =

x(

- log n )f

( n )n-"

D-

.

log ( s )

n>l

Avec le Lemme 2.1.8, cela dit en particulier que la dérivée logarithmique -D; ( s )/ D (s) possède un développement en série de Dirichlet si f (1) # O. La fonction de von Mangoldt A ( n ) est définie par

C'est également une fonction fondamentale dans l'étude de la distribution des nombres premiers. Attention, cette fonction n'est pas multiplicative (voir ci-dessous) !

Lemme 2.1.12 (1) L a série DA ( s ) converge absolument pour o (2) O n a pour tout n 2 1

> 1.

si n n 'est pas une puissance d'un nombre premier

(2.15)

logp

s i n = p k a v e c k 2 1.

Démonstration (1)découle de la convergence de D p ( s ) pour CT > 1 que l'on a déjà vu (2) La première formule découle du produit DA (s) = - ( s ) ( s ) ; la seconde en est une conséquence car

c' c -'

La dernière formule peut se démontrer par un calcul combinatoire direct laissé en exercice, ou bien à partir du produit eulérien : comme

pour o

> 1, on peut calculer la dérivée logarithmique terme par terme

d'où le résultat. Notons la formule (conséquence de la définition) pour n 2 1

C A ( d ) = log n. dln

L'importance de A réside en partie dans le fait qu'essentiellement elle compte les nombres premiers avec un poids logp qui est parfaitement naturel du fait de leurs propriétés multiplicatives, et que de plus sa série de Dirichlet a des propriétés analytiques plus agréables que, par exemple, la série « naïve » Cp+. Par exemple on a

Lemme 2.1.l3. - Soit

la fonction sommatoire de A. Le théorème des nombres premiers est équivalent à l'assertion + ( x ) x quand x + +m. N

Démonstration. - On a tout d'abord


i

Terminons par la définition suivante :

Dé$nition 2.1.15. - Soit f une fonction arithmétique. La fonction sommatoire de f est la fonction Mf définie pour x 2 O par

COURS SPÉCIALISÉS 13

Les propriétés asymptotiques de M f ( x ) sont intimement liées aux propriétés analytiques de D f ( s ), vue comme fonction holomorphe (une idée essentiellement due à Riemann). Dans le cas de f = A, c'est la clé de la preuve du théorème des nombres premiers. Voir aussi la section suivante pour de premiers exemples « élémentaires. >>

2.2. Fonctions sornmatoires et séries de Dirichlet La formule de sommation par partie permet d'exprimer une série de Dirichlet D ( s ) en fonction de la fonction sommatoire M f ( x ). Lemme 2.2.1. - Soit an une suite complexe et f : [O, +co [ -t C une fonction de classe C' . O n a pour tout x 2 O

et si lim Ma (x) f ( x ) = O et la série ou l'intégrale converge absolument,

Cette formule, dont on a déjà vu des applications, permet souvent de déterminer le comportement asymptotique de C anf ( n ) connaissant celui de C an, lorsque f est une fonction très régulière (un polynôme, par exemple).

Démonstration. - Soit N entier tel que N on vérifie d'abord que de même

car Ma ( t ) = Ma ( N ) pour N

< x < N + 1. On a Maf ( x ) = Maf ( N ), et

< t < x. On peut donc supposer x = N. Alors on a

La dernière formule résulte évidemment de celle-ci quand x + +oo compte tenu de O l'hypothèse sur M a ( x )f ( x ).

SOCIÉTÉ MATHEMATIQUE DE FRANCE 2004

Exemple 2.2.2. - Soit f une fonction arithmétique telle que f ( n ) « na avec a 2 0, donc convergeant absolument pour o > a + 1. On a alors

et donc Dr ( s ) =

Cf

n21

( n )n-' = s J

M~( x )

'

1

pour o

> a + 1.

Cela justifie par exemple (2.5) et (2.7).

2.3. Séries de Dirichlet et fonctions somrnatoires Dans l'autre direction, depuis Df ( s ) vers Mf(x), le lien le plus direct est fourni par la transformation de Mellin. DéJinition 2.3.1. - Soit f : [O, +oo[ + C une fonction de Schwartz. La transformée de Mellin est la fonction holomorphe f définie par prolongement analytique de la fonction A

définie pour Re (s)

> 0.

Puisque f a décroissance plus rapide que tout polynôme à l'infini, il est clair que f ( s ) est effectivement définie et holomorphe pour o > O (la limitation venant de la divergence en O ) . Exemple 2.3.2. - Soit f ( x ) = e-x . La transformée de Mellin de f est la fonction gamma d'Euler : (2.17)

r(s)=

,-x

x s-1 dx.

Celle-ci est définie originellement pour o > 1 (regarder au voisinage de O), mais on vérifie par intégration par partie la relation d'ou, par récurrence, on déduit que ï ( s ) admet un prolongement méromorphe à C possédant comme seules singularités des pôles simples en s = -k, k 2 O entier. De plus on a T ( n ) = ( n - l ) !pour n 2 1. La fonction ï intervient fréquemment dans l'étude des séries de Dirichlet. Les propriétés suivantes sont bien connues (voir par exemple [Tl, 4.41, 4.421) : (1) On a T ( s ) # O pour tout s E C. (2) On a uniformément pour a < o < b et ( t (2 1

2.3. SÉRIES DE DIRICHLET ET FONCTIONS SOMMATOIRES

quand o + +m. (4) On a uniformément dans tout angle larg(s)1

r' r

- ( s ) = log lsl

+

1 suffit sous les conditions ci-dessus. Proposition 2.3.3. - Soit f une fonction de Schwartz sur [O, +m [ et f ( s ) sa transfomée de Mellin. ( 1 ) L a fonction f ( s ) se prolonge en une fonction méromorphe sur C dont les seules singularités possibles sont a u x entiers négatifs s = -k , k 3 0 , où f ( s ) peut auoir un pôle simple de résidu f ( k ) ( O )/ k ! . (2) Si f est à support compact dans ]O, +CQ [, la fonction f(s) est entière. h

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2004

(3) Dans toute bande verticale A

-k - 1 et donc que f (s) est holomorphe dans cette région. Soit maintenant f une fonction de Schwartz quelconque. Notons Pk E C [ X ] le k-ème polynôme de Taylor de f ; soit cp : [O, + a [ -+ [O, 11 une fonction Cm dont le support est [ O , 21 et qui vérifie y ( x ) = 1 pour O x 1. On écrit h

<
-k - 1 par le cas préliminaire,


-d on a 1

+

( x )xdiS-l dx. + d+s La dernière intégrale est une fonction entière, et cette formule donne donc le prolongement de la transformée de Mellin de x xdcp( x ) en une fonction méromorphe avec un unique pôle simple de résidu 1 en s = -d. Par linéarité, la transformée de Mellin de SOIax d y ( x ) x s l d x= JO

xd+'-ldx

cp ( x )xd+s-l dx

-

=l

<
>

pour cp : [O, +oo[ -+ C une fonction de Schwartz. Cette série converge absolument si f est à croissance modérée. L'avantage de ces sommes apparaîtra dans un instant : il s'agit du fait que « l'analyse harmonique >> (transformée de Mellin ici) d'une fonction très régulière cp (de classe Cm) est beaucoup plus agréable que celle de la fonction caractéristique de [O, x] car sa transformée décroît très vite à l'infini, ce qui élimine de nombreux problèmes délicats de convergence. De plus, il est souvent le cas, dans les applications, que l'on puisse se restreindre à de telles sommes sans difficultés, et sinon que l'on puisse utiliser des fonctions tests comme approximations de la fonction caractéristique. On en verra de nombreux exemples. (On peut même aussi utiliser cp à support compact dans de nombreux cas, rendant la somme finie).

DéJinition 2.3.4. - Soit y > O. Un majorant lisse de la fonction caractéristique de [O,y] d'amplitude A > 1 est une fonction cp : [O, +oo [ -+ R qui est Cm à support compact dans [O, Ay ] et telle que o 6 avec au plus dans cette région un unique pôle simple en s = 1 avec résidu r E C . (Le cas r = O correspondant au cas où D f est holomorphe pour o > 6 ) . Supposons de plus que D j ( s ) soit à croissance modérée pour o > 6, c'est-à-dire que pour tout 6' = 6 + E > 6, il existe C = C ( E ) tel que (2.25) uniformément pour o 2 6

+ E.

P f ( 41

Proposition 2.3.6. - Sous les hypothèses précédentes, on a pour tout y

> 1 et E > O

où la constante implicite ne dépend que de cp et de E . Noter que i j ( 1 ) = cp ( x )dx .

2.3. SÉRIES DE DIRICHLET ET FONCTIONS SOMMATOIRES

Démonstration. - On a (2.24) pour tout c et considérons l'intégrale curviligne

35

> 1. Soit T 2 1, E > O des réels arbitraires

+

+

est le rectangle de sommets c - iT, c iT, 6 E + iT, 6 + E - iT, pris dans le ou sens direct. D'après la formule de Cauchy, puisque q(s) est holomorphe pour o > O et s ++ yS est entière, on a donc

On sait que la transformée de Mellin $(s) décroît rapidement pour Isl -+ +oo dans une bande verticale. En combinaison avec (2.25), cela permet d'affirmer qu'il existe C = C (y, E ) > O telle que

<
1. Pour d = O, on a la fonction c. Dans ce cas, l'équation (2.5) démontre que c ( s ) se prolonge en fonction méromorphe pour o > O avec un unique pôle simple en s = 1 de résidu 1. De plus, estimant directement à partir de (2.5), on a

qui démontre que c ( s ) est à croissance polynomiale pour o > 0, uniformément pour o > 6 si 6 > O est fixé. On verra un résultat plus précis dans le chapitre suivant. En utilisant le produit eulérien on va en déduire un résultat pour f à l'aide du simple principe suivant : les valeurs f ( p ) d'une fonction arithmétique 1/2. Lemme 2.3.8. - Soit f une fonction multiplicative telle que f ( n ) «, nE pour tout E > 0. Suflosons que pour tout p premier on a f ( p ) = g 2 1, un entierfixé.Alors D ( s ) se prolonge en fonction mhomorphe sur o > 1 /2 avec un unique pôle d'ordre g en s = 1, et de plus D ( s ) est à croissance polynomiale unqormément dans toute bande 1/2 6 o A avec 6 > 0, A 2 1.

+ <
1

,

,

HP($-') = (s)H (s),disons. P Or, du fait que Hi (O) = O, il n'y a pas de coefficients en p-' dans le produit eulérien pour H (s), donc pour tout p

Dr (s) = (s)g,

(2.28)

ce qui démontre que H(s) est holomorphe pour o > 1/2. L'équation (2.28) et le prolongement de 'i(s) donnent donc celui de Df(s) avec un pôle d'ordre g en s = 1. De plus la convergence absolue du produit eulérien H (s) pour o > 1/2 démontre que H (s) « 1 dans toute bande 1/2 6 < o. La croissance polynomiale de Df(s) découle donc de (2.28) et de la croissance polynomiale de 0, où Pd est un polynôme de degré 2d - 1, dépendant de 9 , de la forme

On peut démontrer un résultat similaire pour la somme non lisse, mais le terme d'erreur n'est pas aussi bon pour d grand : pour x 2 1 on a par exemple avec & = x ~ ~+-o '( x ~ ~ - (On ~ ) .peut par exemple procéder de la manière indiquée dans l'Exercice 3.4.4). Si d = 1, on obtient une formule due à Dirichlet

où y est la constante d'Euler (1.11).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2004

CHAPITRE 2. PRÉPARATIFS POUR LE THÉORÈME DES NOMBRES PREMIERS

38

L'ordre de grandeur exact du terme d'erreur dans (2.30) est un problème ouvert. On conjecture que pour tout E > O on a

C r (n) = x (log x + 2y - 1) + O ( x ~ ' ~ " )

(2.31)

d 0, d'où pour tout E > O

en développant au voisinage de 1

Noter comme le terme d'erreur est bien meilleur que celui espéré pour (2.31). Exercice 2.3.9 (1) Démontrer (2.30) directement en écrivant

et en intervertissant les sommes; il faudra remarquer qu'on peut, en échangeant a et b, se limiter à a fi. (2) Démontrer que




-1 avec

2.4. CARACTERES DE GROUPES ABÉLIENS FINIS

39

(Cette constante intervient dans la solution du problème des diviseurs de Titchmarsh,

cf: Chapitre 4).

Le cas de la Proposition 2.3.6 où r = 0, c'est-à-dire quand pour o > 6 , est particulièrement intéressant. Il dit alors que

Df( s ) est holomorphe

améliorant la borne triviale

L'estimation (2.33) indique donc qu'il y a des changements de signe (ou d'argument) parmi les valeurs de la fonction arithmétique f ( n ) qui sont suffisamment importants pour créer des compensations non négligeables (la fonction rq n'est pas oscillante donc ne contribue pas à ces compensations).

2.4. Caractères de groupes abéliens finis DéJinition 2.4.1. - Soit G un groupe commutatif fini. Un caractère de G est un homomorphisme : G + CX de G dans le groupe multiplicatif CX. Le groupe dual G de G est le groupe des caractères de G.

x

Comme G est fini, l'image de x est forcément une racine de l'unité et donc de module 1. Le produit est simplement (xi ( x ) = x l ( x )~2 ( x ). L'élément neutre est le caractère dit trivial, noté parfois xo, tel que x o ( x ) = 1 pour tout x. Le caractère inverse est donné par x-' ( x ) = ( x ) = x ( x ) car ( x )1 = 1 et sera donc souvent noté 1. Il s'agit de la pointe minuscule de la théorie générale des représentations des groupes. Ce dont nous avons besoin est très élémentaire.

x2)

-'

Exemple 2.4.2. - Soit G un groupe cyclique d'ordre m. Puisque G est le groupe ayant un seul générateur y vérifiant la relation y" = 1, la théorie des groupes démontre que se donner un caractère de G est équivalent à se donner l'image de y vérifiant y" = 1, c'est-à-dire que G est isomorphe, via x I+ ~ ( y,au ) groupe des racines m-èmes de l'unité. En particulier on voit G E G, mais non canoniquement (il faut choisir y engendrant G) . A

h

Pour démontrer que des caractères non triviaux existent toujours, on a le Lemme 2.4.3 (1) Soit H

1 tel que xn E H , et soit z = x(xn). Si on veut que x' sur H' prolonge x, il faut que (x)%= z . Soit donc w E C tel que wn = z, et posons pour g = hxk E HI, avec h E H , ~ ' ( g = ) x(h)wk.Si hxk = h'xl, on a xk-' = h'h-l E H donc 1 = k (modn) et

x

ce qui démontre que est bien défini, et c'est bien évidemment un caractère de H' prolongeant . (2) Il suffit d'appliquer (1) au groupe H # 1 engendré par x qui est cyclique, et d'utiliser l'exemple ci-dessus qui démontre qu'il existe x caractère de H tel que

x

x w # 1.

O

Proposition 2.4.4. - Soit G u n groupe commutatifjîni. ( 1 ) Pour tout x E G on a

(2) Pour tout

x E G on a

Démonstration (1) Si x = 1, c'est évident. Sinon, soit On a

tel que

a(x) # 1 donné par le lemme.

par changement de variable. Donc la somme est nulle. (2) Le calcul est similaire, si ce n'est qu'il faut trouver, pour ~ ( x #) 1 : un tel x existe évidemment par définition même.

x # 1, un x tel que

0

Les deux formules ci-dessus sont appelées les relations d'orthogonalité pour les caractères. Pour expliquer cela, considérons l'espace vectoriel V des fonctions complexes sur G muni du produit scalaire

(c'est un espace de dimension finie dim(V) = IGI : il n'y a pas d'analyse ici).

Proposition 2.4.5 (1) Les caractèresforment une base orthonormée de V .

(2) On a GI

n

= /GI

n h

et l'homomor~hismecanonique G + G donné par x

H

(X

H

~ ( x ) )

est un isomorphisme. La décomposition d'une fonction suivant la base des caractères s'interprète comme une transformation de Fourier discrète.

Démonstration (1) Pour tout caractères x et X' on a

d'après (2.35)' donc les caractères forment une famille orthonormale, en particulier libre. Pour conclure il suffit de démontrer que si f : G C vérifie ( f / X ) = O pour tout X, alors f = O. Soit f une telle fonction, y E G. On calcule +=

d'après (2.34). (2) Comme dim V = IGI , on a IGI n

=

IGI par (1). (Cela simplifie (2.35)) . L'homo-

h

morphisme G -, G est clairement injectif. Les deux groupes ayant même cardinal, O c'est donc un isomorphisme.

Exemple 2.4.6 (1) Soit G = ( Z / @ ) ',

p

premier. Le caractère de Legendre est

défini par (1.3).On vérifie que c'est un caractère, dit quadratique car ~ ( x=)1 ~pour tout x , ou réel car ~ ( x E) R pour tout x. (Ces deux propriétés sont équivalentes). - p p est un entier quelconque, on définit le symbole de Jacobi pour Si q = p';' x E ( Z / q Z ) par

(;) fi (ilni. = 2=1

Noter qu'il n'est plus vrai que ( x) = 1 implique que x soit un carré modulo q. 4

(2) Soit G = Z/mZ. Les caractères de G sont les fonctions SIa, a E G, telles que +a (x) = e

(y),

ce qui est bien défini.

Cela provient immédiatement de l'Exemple 2.4.2. Noter qu'on voit ici directement que G F G, et que les relations d'orthogonalité s'écrivent A

c

x (mod9)

.(Y)={

q

si a = O (mod q)

O

sinon.

Ces relations peuvent se vérifier encore par sommation d'une suite géométrique finie.

DéJinition 2.4.7. - Soit q 2 1 et x un caractère du groupe multiplicatif (Z/qZ) Le caractère de Dirichlet associé à x est la fonction, encore notée X ,définie sur Z par x(n>= On dit que x(-1) = -1.

io

x (n (mod q) )

si (n, q) # 1 si (n, q) = 1.

x est défini modulo q. De plus, x est dit pair si x(-1)

=

1 et impair si

Il découle de la définition que ~ ( m n = ) x(m)x(n) pour tout m et n : les caractères sont des fonctions arithmétique totalement multiplicatives. De plus, x est bien entendu périodique de période q : (n q) = x (n) . Clairement les caractères de Dirichlet modulo q forment un groupe fini d'ordre

x +

(P (4).

Exemple 2.4.8 (1) Soit q 2 1 un entier. Le caractb-etrivial modulo q est le caractère de Dirichlet E~ correspondant au caractère trivial xo de (Z/qZ) '. On a donc

On peut remarquer que les caractères E~ dépendent de q en raison de la condition (n,q) = 1. On a q ( n ) = 1 pour tout n, mais # 1 si q > 1. (2) Si p est un nombre premier, le caractère de Legendre modulo p fournit un caractère de Dirichlet modulo p qui est quadratique. , est la fonction (3) Pour q = 2, le seul caractère est le caractère trivial ~ 2qui caractéristique des entiers impairs. Pour q = 4, il y a deux caractères modulo q, le caractère trivial ~4 et un caractère ~4 d'ordre 2 tel que (2.3'7) Donc

x4 (n) = O

si n est pair, et

x4 (n) = (- 1)(n-1)'2

x$ (n) = 1 si et seulement si n s 1 (mod 4).

si n est impair.

2.4. CARACTÈRES DE GROUPES ABÉLIENS FINIS

Pour q

= 8, il

existe deux caractères réels distincts, à savoir x g tel que

Si la notion de caractère de Dirichlet paraît bien simple, il faut se rappeler que la structure de groupe de (Z/mZ) n'est pas facile à décrire « explicitement >> : elle dépend de la factorisation de cp (m) . Si m = p est premier, il s'agit de la factorisation de p - 1, qui est un sujet bien mystérieux... Par exemple le problème suivant demeure non résolu : Problème 2.4.9. - Quel est l'ordre de grandeur, comme fonction de p, d u plus petit entier m 2 1 tel que m n'est pas un carré modulo p, c'est-à-dire d u plus petit m tel que ( m ) = - 1 ? P Est-il vrai que

pour tout

E

>O

?

(La dernière question est une conjecture de Vinogradov; le meilleur résultat connu est dû à Burgess [Bull qui prouve que m « qC pour tout c > 1 / 4 f i ) . Les relations d'orthogonalité des caractères de groupes finis se transposent immédiatement aux caractères de Dirichlet. Soit m 2 1, a 2 1 un entier, alors on a pour tout n 2 1 : (2.39)

C

X (modm)

x(a>x(n> = -

cp (m)

{O

si (a, m) = 1 et a

n (mod m)

sinon.

ou la somme porte sur l'ensemble de tous les caractères de Dirichlet modulo m. La raison de l'utilité des caractères de Dirichlet modulo m pour l'étude des nombres (premiers) dans les progressions arithmétique provient de ces relations : ils permettent de « détecter >> une condition n -. a (mod m) par la formule ( Z N ) , de manière similaire à la détection de la condition n = 1 par la formule (1.8). Plus analytiquement, le fait que les caractères soient des fonctions arithmétiques multiplicatives est crucial : en effet,, cela fournit des produits eulériens pour les séries de Dirichlet associées. Par contraste, les fonctions caractéristiques 6,(n) = 1 si n = a (modm) , O sinon, ne sont pas multiplicatives. Cela rend difficile l'étude, par exemple, d'un produit

n

p=a (modm)

(l-p-"-',

faute d'en avoir une expression vraiment manipulable sous forme de série.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2004

2.5. La formule de sommation de Poisson La formule suivante est la clé du prolongement analytique de c(s) et d'autres séries de Dirichlet. Proposition 2.5.1. - Soit f : R + C une fonction de Schwartz sur R, soit

sa transformée de Fourier. Alors pour tout x f R on a

la série convergeant absolument et uniformément sur tout compact dans R. Démonstration. - Considérons la fonction définie par

pour x E R. Du fait que f décroît rapidement, il découle que cette série converge absolument et uniformément sur les compacts. Cela permet de conclure que est Cm sur R. Le point crucial est que est également 1-périodique :

+

+

en posant n' = n + 1. On peut donc développer et uniformément également :

+ en série de Fourier, laquelle convergera absolument

il suffit de démontrer que c ( h ) = f ( h ) . Or on a par définition

= c Jf ( x + n ) e ( - h x ) d x = ~ J n

O

n

f(x)e(-hx)dx

parpériodicité

n

Tous les échanges de somme et intégrale sont immédiatementjustifiés par la converO gence absolue qui est omniprésente. Le cas x = O donne la jolie formule auto-duale

2.5. LA FORMULE DE SOMMATION DE POISSON

Noter que

est la moyenne continue de f , et la formule peut donc s'interpréter comme donnant une relation exacte entre la somme de la série Cf (n) et l'intégrale J" f ( x ) d x , la différence entre les deux étant la somme

des contributions des « fréquences » non nulles. Dans de nombreux cas, la somme et l'intégrale sont proches, ce qui se traduit par le fait que les autres termes f ( h ) avec h # O ou du moins h assez grand (les « hautes fréquences ») sont petits. Il s'agit encore d'un phénomène d'oscillation (de la fonction x H e ( h x ) ) donnant lieu à des compensations dans les in tégrales f ( x )e ( -h x ) d x . On peut aussi remarquer l'analogie entre la façon de construire une fonction 1périodique, en faisant la moyenne de l'action de Z sur R par translation (2.41)' et la définition (1.13) de la fonction Pl,(z) qui sera utilisée pour démontrer le théorème principal. Exemple 2.5.2. - Soit f ( x ) = e - " ~ ~la fonction cloche classique. Il est bien connu que f est « sa propre transformée de Fourier ». Plus généralement : Lemme 2.5.3. - Soit y

Démonstration.

> O et f y ( x ) = e-nyxz

. Alon pour tout 5

- Par changement de variable

A

donc il suffit de traiter y = 1 où il s'agit effectivement de démontrer f = f .

et donc par dérivation sous le signe d'intégration (évidemmentjustifiée dans la classe de Schwartz), on a

=i

SR

e - n ~ 2(2ixE)e(-XE) d x

par intégration par partie

L'espace des solutions de l'équation différentielle y' = - 2 x x y est de dimension 1 engendré par f , et donc il existe A E C tel que f = A f .

SOCIRE MATHEMATIQUE

DE FRANCE 2004

Pour voir que h = 1, on peut soit évaluer en O et faire appel à la formule bien connue

soit appliquer de nouveau la transformation de Fourier (f est paire) :

h

donc h = f 1, mais visiblement f (O)

> O donc

h = 1. (Ce qui prouve aussi (2.43)). O

Si l'on applique maintenant la formule de Poisson à fy , on trouve la très importante formule de modularité >> de la fonction thêta de Jacobi. Proposition 2.5.4. - Soit 0 la fonction deJiniepour y

>O

On a alors pour tout y

Démonstration. O(Y)

> O par

suffit d'appliquer (2.42) à fy :

Cn f y (n) = ch f^r (h) =

h

y-1/2

fy-1 (h) = Y-1/20(y-1).

2.6. Fonctions L de Dirichlet

x

Défiitàon 2.6.1. - Soit q 3 1, un caractère de Dirichlet modulo q. La fonction L de est la fonction holomorphe définie par

x

pour o

> 1.

x

Comme j~ (n) 1 = O ou 1, la série converge absolument pour o > 1, et comme est (totalement) multiplicative, l'expression en produit eulérien est valide dans cette région, puisque

pour toutp et o

COURS SPÉCIALISÉS 13

> 0.

2.6. FONCTIONS L DE DIRICHLET

47

Proposition 2.6.2. - Soit q 2 1, x un caractère de Dirichlet modulo q . Pour o

> 1, on a

Démonstration. - Il suffit d'utiliser les produits eulériens ou, pour la dérivée logarithmique, la formule correspondante pour c(s), ainsi que la multiplicativité totale de

x (n)

O

Exemple 2.6.3 (1) Soit E~ le caractère trivial modulo q. On trouve aussitôt

Ainsi L ( E ~ S) , ne diffère de c(s) que par un produit fini de facteurs eulériens très simples. En particulier les propriétés analytiques de L(cq,S) découleront immédiatement de celles de [(s) . (2) Soit ~4 le caractère de Dirichlet non trivial modulo 4. On a (2.47)

L(x4,S) =

1 1 (-1) (n-1)/2n-s= 1 - - + - - . . . 3S 5s n impair

C

+

(-lY + . . . l)s

(2k

+

Le phénomène apparaissant dans (1) est un exemple de la notion d'imprimitivité. Plus généralement que pour les caractères triviaux, on peut à partir d'un caractère modulo q en construire un (disons XI ) modulo dq pour tout d 2 2, en posant

x

x i (n) =

O

x (n)

si (n, dq) # 1 si (n, dq) = 1, donc (n, q) = 1;

-

autrement dit en considérant le caractère associé au caractère de (Z/dqZ) par la composition (Z/dqZ)X --+ (Z/qZ)X

X

donné

CX

où la première application estjuste la réduction modulo q. Le caractère XI est dit induit par x (il ne s'agit pas de la notion d'induction en théorie de représentation des groupes).

x

Définition 2.6.4. - Un caractère de Dirichlet modulo q est dit primitif si il n'est pas induit par un caractère modulo q1 où q' 1 q est un diviseur propre de q. On dit que q est le conducteur de X. L'importance des caractères primitifs est qu'ils contiennent essentiellement toutes les informations sur les caractères, et en particulier leurs fonctions L.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2004

Proposition 2.6.5 (1) Tout caractère de Dirichlet est induit par un unique caractère primitq Son conducteur est appelé aussi le conducteur de . (2) Soit un caractère de Dirichlet modulo q induit par le caractère primitq X* modulo q* 1 q . O n a

x x

x

Démonstration (1) est évident par récurrence. (2) Il s'agit du même calcul que ci-dessus pour le caractère trivial E~ : soit d = q/q* , on a

Exercice 2.6.6. - Soit cp* ( q ) le nombre caractères primitifs modulo q. Démontrer que

[Indication : Démontrer que

et appliquer la formule d'inversion de Mobius.]

Exemple 2.6.7 (1) Le caractère trivial modulo q est induit par le caractère trivial modulo 1, lequel est primitif. (2) Le caractère x q est primitif modulo 4. (3) Pour tout p premier impair, le caractère de Legendre est primitif modulo p ; en effet, un caractère non primitif modulo un nombre premier doit être induit par un caractère modulo 1, et c'est donc nécessairement le caractère trivial, ce qui n'est pas le cas du caractère de Legendre (car p > 2). La définition de primitivité est par négation. En voici une conséquence > importante.

x

DéJinition 2.6.8. - Soit un caractère de Dirichlet modulo q associée à est le nombre complexe défini par

x

COURS SPÉCIALISÉS 13

> 1. La somme de Gauss

2.6. FONCTIONS L DE DIRICHLET

Proposition 2.6.9. - Soit q 2 1 et n 2 1 ona

49

x u n caractère de Dirichlet primitif modulo q . Pour tout

et de plus

Autrement dit, pour x primitif, on peut écrire de façon très explicite le développement de Fourier discret de la fonction obtenue sur Z/qZ en prolongeant par zéro : (Z/qZ) + C. Remarquer l'analogie entre la définition de T ( X ) et le caractère celle de la fonction r par (2.1'7).

x

Démonstration. - Si (n, q) = 1, il suffit de faire le changement de variable y = nx dans le membre de droite de (2.50) pour obtenir par multiplicativité

Cette première partie ne requiert donc pas que x soit primitif. Mais cette hypothèse est nécessaire pour étendre la formule à n tel que (n, q) > 1. Dans ce cas on a x(n) = O et donc il faut prouver que la somme est nulle. Soit d = (n,q) > 1 donc n = dnl, q = dql avec (ni, q l ) = 1. On a

avec

On va démontrer que S(xi) = O pour tout xi. Comme dans la preuve des relations d'orthogonalité on a X(y)S(xl) = S(yxl) par changement de variable, pour tout y E (Z/qZ) et donc

x

Or est primitif, donc son noyau ne contient pas celui de la réduction (Z/qZ) + (Z/qlZ) X . 11 existe par conséquent y = 1 (mod q i ) tel que x(y) # 1. On en déduit donc que S(xl) = O pour tout x i . Pour démontrer (2.51), prenons le module (au carré) de (2.50) et sommons pour n modulo q. On trouve

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2004

Par orthogonalité des caractères de (Z/qZ) (voir (2.36)), la somme intérieure sur n vaut O si x # y, et vaut q sinon, donc

Enfin, la dernière relation est évidente.

Exemple 2.6.1O (1) Soit q = p premier, de sorte que tous les caractères non triviaux sont primitifs. Dans ce cas la formule à vérifier pour n = O est

Cette formule est simplement la formule d'orthogonalité si x # 1, et on constate par contre qu'elle est fausse si x = 1 est non primitif (la somme de droite valant p - 1 ) . (2) La somme de Gauss du caractère trivial

E~

est

Plus généralement on définit les sommes de Ramanujan cq (r) par

En utilisant la formule d'inversion de Mobius et la relations d'orthogonalité des caractères, on démontre (exercice !) que

cd6

(2.53)

=

C

dEL(q/d).

dl (VI)

En particulier, c q ( l ) = p(q) ; pour q = P premier, c'est évident. Cela démontre aussi que (2.51) n'est pas vrai pour x non primitif. Il existe même des caractères pour lesquels T (x) = 0. (3) Soit q = p premier et et donc

x le caractère quadratique modulo p. On a alors X = x

lm

I =x(-1)W2 = desorteque r ( ~ E) {&fi} si x(-1) = l , e t r(x) E {kifi)si x(-1) = -1. Gaussa montré que dans les deux cas, c'est le signe + qui est le bon ;ce résultat est équivalent à la loi de réciprocité quadratique (voir la Remarque 3.3.10). P 7

Comme application, nous pouvons construire des fonctions thêta associées aux caractères de Dirichlet et démontrer qu'elles satisfont à une relation similaire à (2.44). Soit q 2 1 et a E Z. On considère la fonction thêta dite de congruence ~ ( yq,;a) =

C n€Z n=a (mod q )

e-""*y.

2.6. FONCTIONS L DE DIRICHLET

Proposition 2.6.11. - Pour tout y > O on a 1 0(y;q,a)= - C e q\/I x (mod q ) Démonstration. - On a

avec la notation du Lemme 2.5.3. Or la transformée de Fourier de x H fy (qx + a ) est fy-1 ( E / q ) . Le Lemme 2.5.3 et la formule de sommation de Poisson 5 H q-le donnent donc h

1

q \/I x (mod q) Corollaire 2.6.12. - Soit q 2 1 et x u n caractère de Dirichlet modulo q. Soit

Alors si

x

est primitq on a

Démonstration. - Puisque classes modulo q

x est défini modulo q on peut scinder la somme suivant les

et appliquer la Proposition précédente à chaque terme, ce qui donne

1

q

Puisque d'où

x

est primitif,

X

x (mod y)

l'est aussi. La somme intérieure vaut . c ( ~ ) X ( xpar ) (2.50),

q \/Y

x

a (mod q )

x (mod q )

x

Exercice 2.6.13. - Si est un caractère impair, c'est-à-dire si (- 1) = -1 , il est clair que O ( . ; X ) est la fonction nulle, de sorte que la formule obtenue est triviale.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2004

CHAPITRE 2. PRÉPARATIFS POUR LE THÉORÈME DES NOMBRES PREMIERS

52

Soit alors

01 ( y ; q, a ) = 0, (y;X ) =

c

n=a (mod q )

ne-'n2~

C n X( n )e-nn2~.

n€Z

Démontrer que

et en déduire que

pour y

> 0.

Appendice :produits infinis Nous énonçons ici simplement les résultats fondamentaux concernant les produits infinis. Voir par exemple [Ru, 15.11 ou [Tl, 1.41 pour plus de détails concernant ce sujet.

Définition 2.A.14. - Soit a, E C , n 2 1 et z E C . On dit que z = lim

n ( 1 + a,) N

N++m ,=l

n ( 1 + a n ) si

= z.

Le produit infini est dit absolument convergent si le produit

converge.

Proposition 2.A. 15 ( 1 ) Si ( 1 + an) est absolument convergent, alors il est convergent et de plus on a

n

n

( 2 ) Si w = ( 1 + an) est absolument convergent alors w = O si et seulement si il existe m 2 1 telquea, = - 1 . (3) Si an 2 O pour tout n , alors le produit ( 1 + a,) est absolument convergent si et seulement si la sirie 2 a, est absolument convergente. ( 4 ) Soit a, : U + C des fonctions holomorphes sur un ouvert U de C telles que C a, ( z ) converge unqormément sur les compacts dans U . Alors le produit inJini f (2) = ( 1 + a, ( 2 ) ) converge absolument pour z E U , uniformément sur les compacts.

n

n

APPENDICE : PRODUITS INFINIS

53

De plus, la fonction f est une fonction holomorphe sur U , f ( z ) = O si et seulement si il existe m tel que a, ( 2 ) = - 1 , et on a

la série convergeant absolument et unijormément sur tout compact dans 1'ouvert

V = {x

EU

/

a, ( z ) # 1 pour tout m).

Démonstration. - Nous ne donnons que des indications minimales. Pour démontrer que la convergence absolue implique la convergence, on note les inégalités N

III

( 1 +an)

-

1


0.

U

Si l'on choisit u = q-l, on trouve (3.10)

A (x, s) =

1

+"

0 (x;x) xs/'

X

+ w (x)

' 0 (u;XI u(l-s)/2 U

d'où l'équation fonctionnelle (3.5) puisque

par hypothèse. Il reste à adapter cela à C(s) ( q = 1 ) et aux caractères impairs. Pour 1 découle alors de la formule de Stirling (2.18). Pour tout E > 0, l'hypothèse (i) du Lemme 3.A.l est fournie - par (1) pour b = 1

+ E ,avec C(b) = [ ( l+ E ) ,D(b) = 0 ;

(2) pour a = -E, avec C(a) = c ~ ~ ~D(b) / ~= +1/2~ +, E ,pour une certaine constante Cl 2 O ne dépendant que de E. - par

La borne (3.11) est alors une conséquence immédiate du lemme (quitte à changer E ) . On procède de même pour les caractères impairs et pour (s) pour 1 t 1 2 1, le pôle en s = 1 étant incorporé dans l'estimation finale (3.11). O


O ayant la propriété suivante :pour tout entier q 2 1, il existe au plus un caractère modulo q tel que L (x,s) ait un zéro p = P+iy dans la régzon

x

Le caractère exceptionnel, s'il existe, est un caracttke réel primitif x,, et L(x,, s) a un z&o unique p, < 1 dans la régzon (3.19) ;de plus ce zéro est réel et simple. Pour s dans la régzon

on a de plus la majoration

la constante implicite étant absolue et le second terme n Ztant présent que si le z&o exceptionnel existe. Ce théorème date du début du xxe siècle, et le problème de démontrer que le zéro > (dit aussi zéro de Siegel, ou zéro de Landau-Siegel) n'existe pas (pour une valeur de c > O fixée) demeure complètement ouvert malgré de nombreux travaux et efforts : voir la Section 4.3 pour (essentiellement) le mieux que l'on sache faire actuellement. Avant de commencer la démonstration, indiquons par quelle heuristique on peut justifier le raisonnement qui va suivre, dans le cas de C x(fi>p-o, p ~ (mod a q) Y ( 4 ) x (mod y ) P

C

pour o > 1, et comme pour (2.6), on a à partir du produit eulérien

quand o + 1. Pour

et pour

x=

x non trivial, puisque L ( x , 1 ) # O, cela démontre que

on a

par (2.4). Finalement on obtient

p-" = - i l o g ( o - 1 ) + 0 ( 1 ) p=a (mod q ) (P ( 4 )

-

--

1

Nous finissons maintenant d'établir la région sans zéros pour les fonctions L .

Démonstration d u Théorème 3.3.2. - Puisque les zéros supplémentaires des fonctions L non primitives sont situés sur la droite o = O , on peut supposer x primitif. On utilise l'inégalité trigonométrique (3.23),mais pour la dérivée logarithmique. On a pour o > 1 le développement

donc

Par (3.23) on a pour n

1

3 + 4 ~e ( x( n )n-it) donc en sommant sur n , pour o

+ Re (X( n )2n-2it) ) 0

> 1 on a

On applique maintenant (3.26), ou plutôt le corollaire (3.27). Pour c ( s ) et L ( ~s ) ~ , on prend X = 0 , et pour L ( x , s ) un sous-ensemble fini X de zéros non triviaux.

Avec (3.36), on trouve donc

Il est plus clair ici de préciser le terme d'erreur. Il existe une constante absolue c > O telle que pour t ( t ) = clog(q(ltl 2 ) ) on a

+

1

3

60- 1- + 4 8 ( ~Re(o )

-

1

+

it

1

) + ' ( X ~ ) R ~-(1~+2it ) + 2 ~ ( t )

pour o 2 1 et tout X . Soit maintenant p = p + iy un zéro quelconque de L(x, s). On considère t = y donc s - p E R. Si = 1, puisque $l(0)-' qui est donc une région contenant au plus un zéro, forcément réel et simple, de L(x,s). (Correspondant à p l ci-dessus, ou au cas où L(x, s) a un seul zéro réel sur lequel on n'a rien pu dire). D'après la Proposition 3.3.8, ce zéro éventuel P vérifie P < 1. Il reste encore pour finir la preuve à établir qu'un seul caractère primitif modulo q peut avoir un zéro exceptionnel. Si q est impair, ou si q = 4q' avec q' = 1 (mod 2), c'est évident car il existe alors au plus un caractère réel primitif modulo q. Mais si 8 1 q, il peut en exister plusieurs (cf: Exemple 2.4.8, (3)) . On peut cependant dans ce cas appliquer le Lemme 3.3.12 ci-dessous dû à Landau. La vérification de la majoration (3.21) dans la région (3.20) est donnée aussitôt par l'approximation (3.26) : pour s vérifiant (3.20), on a 1st 2 1/2 et 1s - p l 2 inf (o ( t ) /2,1) pour tout zéro p # Pe de L (x,s) , donc

et par définition de o(t) et (3.25), le résultat en découle.

0

Lemme 3.3.12. - Soient ql , q2 >, 2 et XI, ~2 des caractères primitifs réels distincts modulo ql et q2 respectivement. Soient pi un zéro réel de L (xi,s) . II existe une constante absolue c telle

que

Démonstration. - Il s'agit encore d'une application d'une inégalité similaire à (3.23). Cette fois on remarque que pour o > 1 on a

L'hypothèse

XI

# xg

implique que

~3 = ~ 1 x est 2

un caractère non trivial modulo X = {Pi) pour L(xi,s) ,

qlq2 (pas forcément primitif). Appliquant encore (3.27) avec

et X = 0 pour L (x3,s) , on trouve

avec l = c log q pour une certaine constante absolue c on vérifie aussitôt que inf (Pl, P2)

> O. En prenant o = 1+ (2l)-'

1

< 1 - -.6e

Exercice 3.3.13. - Optimiser les arguments précédents à partir de (3.37) et vérifier qu'il n'est pas possible d'en déduire une région sans zéros plus importante, à la valeur de la constante c près.

CHAPITRE 3. LE THÉORÈME DES NOMBRES PREMIERS

78

3.4. Le théorème des nombres premiers Nous allons d'abord démontrer une version lisse, avec un terme d'erreur assez bon, du théorème des nombres premiers. Pour q 1 donné, on note comme ci-dessus X, l'éventuel caractère exceptionnel admettant un zéro réel (3, dans la région (3.19). Si X, n'existe pas, les termes cidessous où il apparaît doivent être omis.

>

Théorème 3.4.1. - Soit q 2 1 , a 2 1 tel que (a, q) = 1. Soit 7 un majorant lisse de [O, 11 d 7amplitude 1 + 6 . Alors pour tout y 1 on a

>

n=a (mod q)

où c

>O

est une constante absolue et la constante implicite ne dépend que de 3 .

Noter que pour tout c > O et A

(3.41) pour y

> O, on a

exp(-4G3

log^)-^

«A,C

2 2, la constante ne dépendant que de A

et c.

Corollaire 3.4.2. - Soit q 2 1 et (a, q) = 1. Alors on a

$ (x; 4, a)

-

X

- et

cp (4)

n(x;q,a)

-

1

x

-- quand x

'P (4) 1%

-+

+oo

Démonstration d u corollaire. - Par sommation par partie, comme dans le cas de +(x) et n(x) déjà traité, il suffit de démontrer la première équivalence. Puisque ici q est fixé et que (3, < 1 si le caractère exceptionnel existe (il ne serait pas même nécessaire de savoir qu'il y a au plus un caractère X, exceptionnel), le Théorème 3.4.1 donne par positivité n=a (mod q )

quand x

-+

+m, pour tout choix de

d'amplitude 1 + 6

et pour 6 -+O, on obtient par (2.22) lim sup x4+m

+(.; 4, a) X

n=a (mod q )

1

< -' ~ ( 4 ) '

'P (4)

> 1. Donc

donc

6 + O.

0

Démonstration du Théorème 3.4.1. - On a par orthogonalité des caractères de Dirichlet (2.39)

Pour évaluer cette dernière somme on veut déplacer le contour d'intégration. En raison du peu de choses connues concernant la localisation des pôles de la dérivée logarithmique de L (x,s) , il faut être plus attentif que dans la Section 2.3. On veut ramener l'intégrale sur le > de la région sans zéro du Théorème 3.3.2, mais il faut pouvoir contrôler la taille de L1/L, ce qui requiert de déplacer ce bord un peu et de faire appel à (3.21).Une dernière complication de détail est qu'il faut s'assurer que ce nouveau contour ne passe pas trop près du zéro exceptionnel P,, s'il existe. Précisément, soit c > O donné par le Théorème 3.3.2. On peut choisir d = 1 ou 1/2 tel que P, (s'il existe) soit à une distance (46 log ~ 4 ) du ~ ' contour formé par la courbe paramétrée s(t) = 1 - do(t) it pour t E R (voir (3.19)).À part les pôle simples en s = 1 pour = E~ de résidu 1 et (éventuellement) en s = Pe, de résidu -1, il n'y a pas de pôle de (L1/L)(x,s) sur le contour 3 ou sur sa droite. Grâce à (3.21) on a alors sur le contour 3 lui-même la borne

+

x

T 1

avec une constante implicite absolue (s (t) est assez éloigné de Pe et de 1) . On peut alors déplacer le contour d'intégration vers 27 et écrire

(le second terme n'existe que si pe existe et se trouve à droite(*) de 3 ) . Pourjustifier ce déplacement, remarquons d'abord que l'intégrale sur 3est effectivement convergente d'après la majoration (3.21) et la décroissance rapide de ?(s). La preuve de (3.44) procède alors comme dans la Section 2.3 : on considère l'intégrale

(')Si ce n'est pas le cas, il n'est plus vraiment exceptionnel, mais on peut le rajouter de toute manière sans erreur.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2004

+

où i? consiste en le segment de droite de 3 - iT à 3 + iT, le segment de 3 iT à s (T) E Z , la courbe 3 depuis ce point jusqu'au symétrique s(-T) , et le segment horizontal qui ferme le contour. Cette intégrale est bien définie si T > O puisque le contour ne peut rencontrer de zéro de L(x, s) . Par le théorème de Cauchy on déduit (3.44) car les contributions horizontales tendent vers O quand T + +oo, par exemple

pour tout A > 0. Ayant démontré (3.44), l'estimation (3.40) sera achevée par (3.42) si l'on prouve qu'il existe ci > O telle que l'estimation

2 soit valide, la constante implicite ne dépendant que de 7 . On a

I=-

--

(x,1 - do(t) + it)?j(l - da (t) + i t ) ~ - ~ ~ ( ' ) + " d t .


O

« 1,

> O quelconque pour compenser log t )

Li

- - (x, 1 - do (t)

COURS SPÉCIALISÉS 13

+ it)?j(l - do ( t ) + it)y-do(t)+itdt« (logq)

(1 + A) l

.

3.4. LE THÉORÈME DES NOMBRES PREMIERS

Ces deux estimations ensembles donnent

Le second terme (venant des valeurs de s proches de 1) doit être considéré comme le plus important. Cela explique le choix de A pour équilibrer entre A et exp(-(logy) (logq(A + 2))-') Fixons une constante c2 > O telle que cg < d/2c. On va supposer d'abord que log q < $ J G . Dans ce cas, on peut choisir A tel que log q(A 2) = c2 ce qui implique en particulier log(A 2) 2 $ J G , en particulier A » 1 puisque

+

+

Y

JG,

2 2.

Il vient donc (log q)2 1+A


O telle que c < (d/2c) - c2. Si au contraire log q 2 $ J&,on remarque que l'on a la borne triviale

C

si cg

< c2/2.

n=a (modq )

~(n)>1(5) O , la constante implicite dépendant de A et

Y

(

(1% Y )

~

)

seulement.

Exercice3.4.4. - Démontrer que l'énoncé du Théorème 3.4.1 est valable sans « lissage » de la manière suivante : (1) Soit y, z > O tels que z y et f la fonction


y + z .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2004

Démontrer que la transformée de Mellin f(s) est holomorphe pour o

> O et vérifie

<
O est une constante absolue. (3) En choisissant convenablement la valeur de z, démontrer alors que

pour tout y >, 2, q 2 1 et (a, q) = 1 , la constante c implicite étant absolue (mais, bien entendu, l'éventuel omis s'il n'existe pas).

>

Pe

O ainsi que la constante n'est pas connu et il est

Exercice3.4.5. - Une autre méthode est basée sur la formule de Perron, qui permet d'exprimer directement la fonction sommatoire d'une fonction arithmétique au prix de complications d'analyse harmonique. (1) Démontrer que pour y > O , y # 1, T > O et c > O on a la formule de Perron approchée

où H(y)=

{

1

siy>1

1/2

siy=1

O

siO O un entier: On a

quand x --+ +oo. Démonstration. - D'après (1.4) et le Lemme 1.3.2, (ii), on a

Quand D = 1, on a vu (Lemme 1.3.3, (iv)) que ceci se transforme aussi en

p(x) = 21c(x;4 , l ) + 1

- -44 X

-

log x par le Théorème des Nombres Premiers. Dans le cas général, la difficulté est que l'application

pourrait bien ( a fn-io~) être assez obstinée pour prendre presque toujours la même valeur. Ce n'est pas le cas en raison de la loi de réciprocité quadratique déjà mentionnée dans la Remarque 3.3.10. Nous en faisons un énoncé un peu excentrique(3) : il existe un caractère de Dirichlet réel, primitif et non trivial X ,modulo un diviseur Dl de 4 0 (qui pourrait être décrit explicitement) tel que

pour Re(s)

>

1. Par unicité des développements en série de Dirichlet (Proposi-

En divisant dans (3.48) les p suivant les classes de congruence modulo Dl, on trouve

-

pour x 2 2, d'où p(x) .n(x) en utilisant le Théorème des Nombres Premiers pour chaque n(x; DI, a) et le fait que

C

puisque

x est non trivial.

a (mod D')

xw=o O

(3)Maisqui se justifie par son petit air de famille avec de nombreux résultats ultérieurs culminant avec la conjecture de modularité dont la preuve fournit à Wiles celle du Grand Théorème de Fermat. SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2004

CHAPITRE 3. LE THÉORÈME DES NOMBRES PREMIERS

84

Exercice 3.4.7. - Prendre l'énoncé de la loi de réciprocité quadratique trouvé dans l'une des références mentionnées dans la Remarque 3.3.10, et en déduire directement le Corollaire 3.4.6.

Appendice : résultats d'analyse complexe Nous regroupons ici quelques résultats purement analytiques et bien connus qui ont été utilisés dans la preuve du théorème des nombres premiers. Nous donnons des indications de preuve en plus de références. Le premier lemme, souvent appelé principe de Phragmen-Lindelof, généralise le principe du maximum à certaines régions non bornées du plan, moyennant une hypothèse de croissance relativement faible. Lemme 3.A.I.- Soit f u n e fonction holomorphe déjînie sur u n e bande vertical A ,< o Soient A < a < b < B et supposons que (i) O n a p o u r t E R

1f

(ii) Il existe o:

(a

+ i t ) / < ~ ( a ) l s l ~ ( "et)

> O tel que

1f

(b

< B.

+ i t ) ]6 c ( b ) ~ s ] ~ ( ~ ) ) .

o ù l ( 0 ) est la fonction affine telle que l ( a ) = 1 et l ( b ) = 0 . Voir, par exemple, [Tl, 5.61, [Ru, 12.7-101 pour la preuve (parfois dans un cas un peu différent, mais facilement adaptable).

DéJinition 3.A.2. - Une fonction entière f : C + C est dite d'ordre a u plus 1 si elle vérifie

pour tout

E

> 0.

-' est une

Exemple 3.A.3. - La formule de Stirling (2.18) démontre que f ( s ) = T ( s ) fonction d'ordre au plus 1. Théorème 3.A.4.- Soit f u n e fonction entière d'ordre a u plus 1 . Alors (1) Les zhos n o n nuls (p,) de f vhJient

pour tout

E

> 0.

COURS SPÉCIALISÉS 13

APPENDICE : RÉSULTATS D'ANALYSE COMPLEXE

( 2 ) O n a, pour tout x E C

où r est l'ordre de f en z = O, p parcourt l'ensemble des zéros non nuls de f avec multiplicité, a et b E C sont des constantes. Le produit converge absolument et unqormément sur tout compact de C . Indication de preuve. - On peut bien sûr supposer que O n'est pas un zéro de f . On démontre d'abord que si une fonction entière d'ordre au plus 1 n'a pas de zéros, alors nécessairement f (z) = pour certaines constantes a, b E C . Pour cela on développe en série g ( x ) = log f (z), qui existe puisque f ne s'annule pas, et on démontre que ses coefficients de Taylor en O, disons b,, vérifient bnrn «, rl+& en utilisant (3.49). Cela démontre que g est linéaire. Soit = I{P I lPl < et f (P) = (2-1. On utilise ensuite la formule de Jensen

pour f holomorphe dans lzl < R avec R > r , ne s'annulant pas en O, pour démontrer que (1) est vrai. Cela permet de définir le produit infini

et de vérifier (voir l'Appendice du chapitre 2) que g est une fonction entière. Enfin on démontre que h ( z ) = f ( z ) ~ ( z ) est une fonction entière d'ordre au plus 1 (cela nécessite de minorer g ( z ) sur des cercles bien choisis), qui ne s'annule pas. On peut donc appliquer à h le premier argument pour déduire que h(t) = Voir par O exemple [Tl, 8.21 pour les preuves complètes.

-'

Page laissée blanche intentionnellement

CHAPITRE 4 DISCUSSION DU THÉORÈME DES NOMBRES PREMIERS

4.1. L'Hypothèse de Riemann Généralisée

On a vu au chapitre précédent comment le raisonnement amenant au théorème des nombres premiers serait simplifié si l'Hypothèse de Riemann était valide. Pour les nombres premiers dans les progressions arithmétiques, l'énoncé analogue est 1'Hypothèse de Riemann Généralisée.

Conjecture 4.1.1. - Soit q 1 et x un caractère primitif modulo q. Alors tous les zéros + i y non triviaux de L ( x , s ) , cést-à-dire ceux tels que O < (3 < 1 , vhJient P = 1 / 2 .

p = (3

En voici diverses formes équivalentes liées à la répartition des nombres premiers dans les progressions arithmétiques.

Proposition 4.1.2. - Les énoncés ci-dessous sont équivalents : ( 1 ) Pour tout x primitifmodulo q, les zéros non triviaux p de L ( x , s ) v h j î e n t ( 2 ) Pour tout a tel que ( a ,q ) = P on a pour x 2

pour tout E > O , la constante implicite ne dépendant que de E . (3) Pour tout a tel que ( a , q ) = 1 on a pour x 2 2 TC( x ;q, a )

li ( x )

=-

)

pour tout E > O , la constante implicite ne dépendant que de E . ( 4 ) Pour tout caractère primitif non trivial modulo q, on a pour x

x

pour tout

E

> O , la constante implicite ne dépendant que de E .

2

P = 1/2.

(5) Pour tout a tel que (a, q) = 1 on a pour x M(x;q,a) =

n O , la constante implicite ne dépendant que de E . Rappelons que le logarithme intégral est défini en (1.1).

Démonstration. - L'hypothèse de Riemann implique (2) par la méthode du chapitre précédent (voir en particulier les Exercices 3.4.4 et 3.4.5 pour l'utilisation de sommes non lisses) en déplaçant le contour d'intégration jusqu'à a = 1/2 + E. Pour cela, on utilise d'abord (3.26) et (3.25) pour majorer la dérivée logarithmique des fonctions L dans la bande critique : il vient

<
O. En particulier, L1/L est à croissance

mais le facteur logq peut être éliminé en notant qu'il est inutile si x 2 q et que si x < q, o n a $(x;q,a) 1 < x (La même remarque s'applique pour le point (5).) De plus, par (3.25), on voit qu'il existe une constante absolue c > O ayant la propriété suivante : pour tout X ,il existe une suite tn de réels tels que n tn < n 1 et tels que





O

x

pour tout caractère de Dirichlet primitif modulo q 2 1 et tout t E R, la constante implicite ne dépendant que de E et de 6 pour la seconde inégalité. (2) On a pour tout 6 > O et E > O pour tout caractère de Dirichlet primitif ne dépendant que de E .

x

rnodulo q

2 1 et tout t

E

R, la constante implicite

Démonstration. - D'après le principe de Phragmen-Lindelof, le point (2) implique le point (1) en faisant 6 + O. L'idée pour (4.4) est que l'hypothèse de Riemann permet de travailler avec le logarithme des fonctions L, plutôt qu'avec les fonctions L ellesmêmes. On va en fait obtenir un résultat plus précis. On peut supposer x primitif; pour simplifier quelque peu la présentation, on supposera de plus non trivial. Soit s = o it tel que o 2 1/2 6, O < 6 1/2. Pour y 1, paramètre à fixer ultérieurement, on considère la somme lisse

x

+

+


1 le développement en série de Dirichlet

avec A (n) 2 O pour n 2 1. Considérons alors un majorant lisse q de [O, 11 d'amplitude 2 et, pour y 2 1 et 1/2 P 1, la somme lisse

<
O est choisie assez grande.

avec une constante implicite ne dépendant que de q, en utilisant encore que ?(s) a un pôle simple en s = 0. Par conséquent Autrement dit, si un zéro exceptionnel réel Pl existe, on peut minorer L ( l , x2) assez bien. Le théorème découle de cela, de la manière subreptice suivante... Soit E E ]O, 1/2[. Si aucune des fonctions L de caractères réels n'a un zéro p tel que p > 1 - E , l'estimation (4.9) est vraie avec une constante parfaitement effective.

COURS SPÉCIALISÉS 13

Supposons par contre que x,, modulo q,, a un zéro prenant XI = x,, et pi = P, dans (4.11) on trouve

P,

tel que 1 - P,

< E.Alors,

car, pour E fixé, qe et p, le sont également. C'est là que la constante n'est pas effective, puisque l'on ignore complètement la valeur (probablement inexistante) de q, ... Cette inégalité, quitte à changer E ,donne (4.10), et d'après le Lemme 4.3.1, l'estimation (4.9) en découle. O La preuve ci-dessus est basée sur celle de D. Goldfeld.

On déduit du théorème de Siegel celui de Siegel-Walfisz, qui reste le meilleur résultat connu pour l'équirépartition des nombres premiers dans une progression arithmétique individuelle. Corollaire 4.3.4. - Soit A (a,q) = 1, o n a

>O

un nombre réel quelconque. Alors pour tout y

2 2, q 2

1 et

L a constante ne dépend que de A, elle n ést pas effective. Démonstration. - D'après (3.46)' on a

Si p, n'existe pas, le terme correspondant disparaît et le corollaire est vrai Si p, existe, pour tout E < 1/2 on a

(cf. (3.41)).

d'après le théorème de Siegel, la constante CEétant non effective, et le terme correspondant satisfait C E log y

(- E) -

~ X P

On voit alors que si q est plus grand que ( l ~ g y ) " ~ce, dernier majorant est du même ordre de grandeur que le terme principal. Soit A > O donné et distinguons donc deux cas : si q > (logy)", l'estimation du corollaire est triviale. Sinon, pour E = 1/4A, on trouve

Remarque 4.3.5. - Cette remarque développe en partie la Remarque 3.3.10 du Chapitre 3. Le théorème de Siegel, exprimé par la minoration de L(x, 1), dit qu'il existe CE> O telle que IL(x, 1)l

cEq-E,

CHAPITRE 4. DISCUSSION DU THÉORÈME DES NOMBRES PREMIERS

100

donc, si K/Q est un corps quadratique imaginaire, associé au caractère quadratique impair modulo A, on a par (3.35)

x

En particulier, prenant E < 1/2 quelconque, cela résout une des premières conjectures de Gauss concernant les nombres de classes de formes quadratiques, après traduction en terme de corps quadratiques : on a iim h ( Q ( n ) ) = +W.

>

D++w

Donc, pour tout h 1 donné, il existe un nombre fini de corps quadratiques imaginaires K/Q tels que h ( K ) = h. Mais, parce que la constante C, est non effective, il n'est pas possible d'utiliser le théorème de Siegel pour déterminer ces valeurs de h, ni même pour fournir une borne supérieure à la plus grande valeur du discriminant de K s'il vérifie h (K) = h. Gauss, par exemple, avait également conjecturé que h(K) = 1 si et seulement si K = Q(\/-D) avec Ceci fut finalement démontré de manière ad hoc par Heegner, Stark et Baker indépendamment (voir par exemple [Ba, 51 ). Enfin, D. Goldfeld [Go] et Gross-Zagier [GZ] ont obtenu la première minoration effective non triviale permettant, en principe, de calculer tous les K vérifiant h(K) = h : on a (dans la présentation dYOesterlé[Oe])

Le produit sur p est décroît extrêmement lentement (il est de l'ordre de (loglog A)-' ) , mais du point de vue « concret » il n'est pas négligeable : cette estimation, sans plus d'astuces, ne permet pas d'espérer calculer effectivement les K tels que h(K) = 4, par exemple. L'idée de Goldfeld (déjà présente sous forme d'ébauche dans des travaux de Friedlander [Fr]) est d'utiliser comme « pivot » pour minorer effectivement L ( x , 1), non pas un très hypothétique caractère exceptionnel XI comme dans la preuve du théorème de Siegel, mais une autre fonction L qui admet effectivement un zéro réel. D'après les généralisations de l'hypothèse de Riemann, ce zéro ne peut être qu'en s = 1/2, et il se trouve que l'on connaît effectivement des fonctions L vérifiant les propriétés demandées. Cependant, elles ne sont pas associées à des caractères de Dirichlet mais à des objets arithmétiques plus complexes, les courbes elliptiques (ou bien, d'un point de vue dual, des formes modulaires). Le fait que le zéro soit en 1/2 affaiblit considérablement l'effet (dit de répulsion) sur les autres zéros exceptionnels, ce qui explique que la minoration obtenue ne soit meilleure que par un facteur logarithme de la minoration triviale.

COURS SPÉCIALISÉS 13

4.4. LE THÉORÈME DE BOMBIERI-VINOGRADOV

4.4. Le théorème de Bombieri-Vinogradov Le théorème de Siegel-Walfisz est l'un des deux ingrédients essentiels dans la démonstration du théorème de ~ombieri-vinogradod2). Cet important théorème peut se présenter comme démontrant que l'Hypothèse de Riemann Généralisée est vraie > dans un certain sens. Un tel énoncé, en plus de son propre intérêt intrinsèque, est d'une importance décisive dans de nombreuses applications car c'est souvent sous une telle forme qu'elles se présentent. Ainsi, c'est le cas du problème des diviseurs de Titchmarsh d'après la formule (4.6) : les progressions arithmétiques f~ = 1 (modd), d y sont considérées en moyenne sur d et non individuellement.


O un réel quelconque. Il existe B

x

qO

tel que

Y

-

log^)^

(10gy)-~.L a constante implicite n é s t pas effective. De plus B = 7A + 1

Pour une preuve, voir par exemple [Bo, § 71. Pour justifier la description de ce résultat donnée ci-dessus, notons que si l'on divise par le nombre de termes on trouve en moyenne

- ~qui , représente bien l'ordre de grandeur du terme d'erreur pour Q = \ l ~ ( l o ~ y )ce impliqué par l'Hypothèse de Riemann ( cJ: Proposition 4.1.2). L'ineffectivité de la constante provient de l'utilisation du théorème de SiegelWalfisz dans la démonstration. On en déduit : Proposition 4.4.2. - On a

quand x + +oo avec B = 8

( 2 ) L'autre étant le principe dit du grand crible.

Démonstration. - On calcule en introduisant le terme principal espéré

C x ( ~ ; d , l=) C

d O, il existe cx > O tel que

2-6 1= 1 - 6 ' a v e c ~ ' > O , (prendre a < 6/2). 1-a Il est plus clair dans ce qui suit d'expliciter (4.21) et quitte à remplacer c l par une constante plus petite (mais toujours > O), on voit qu'il existe Xo 2 1, d > 0, xa, et tout zéro constantes absolues et effectives, telles que pour tout x 2 Xo, q exceptionnel Be, on a --


Q on a les inégalités

puisque cx est fixé et déterminé par 6 seul, et que x -+ +oo quand q -+ +m.

4.5.L'INÉGALITÉ DE BRUN-TITCHMARSH

Maintenant, pour tout q pour x ainsi choisi

> Q pour

105

lequel un zéro exceptionnel (3, existe, on a

par (4.22), et donc

avec une constante implicite effective et absolue. Comme de plus les valeurs finies q < Q vérifient trivialement une telle estimation, on en déduit le théorème. 17 Si la preuve ci-dessus a été présentée de manière si « pointilleuse »,c'est bien sûr pour qu'il n'y ait pas de doute quand à l'effectivité de l'estimation obtenue, puisque c'est là toute la difficulté... Remarque 4.5.6. - Dans (2.30) on a une formule asymptotique forte avec deux termes principaux de taille x log x et x, respectivement. Ceci est naturel et provient du fait que la série de Dirichlet associée à .c (n) à un pôle d'ordre 2 en s = 1. On peut se demander si un tel phénomène reste vrai pour le problème des diviseurs de Titchmarsh : c'est effectivement le cas, mais la preuve est singulièrement plus difficile. Le résultat démontré indépendamment par Bombieri-Friedlander-Iwaniec [BR] et Fouvry [Fou] est qu'il existe une constante cl > O (explicite) telle que

C ~ ( p -1) = c x + q P pi -

Par exemple, si on prend a, = 1, on a H (s) = 1 qui est entière (!), et cela donne H = 1 : l'heuristique ci-dessus prédit donc

ce qui est équivalent au théorème des nombres premiers (Lemme 2.1.13). Noter que l'argument heuristique ainsi présenté est plus précis que celui (plus naïf) basé directement sur la formule de Legendre ( cJ: la Section 1.5, en particulier la discussion après (1.10)).

110

CHAPITRE 5. CRIBLE ET SOMMES OSCILLANTES SUR LES NOMBRES PREMIERS

Il est possible (le premier exemple publié fut donné par Selberg) de construire des suites an qui mettent en défaut cet argument heuristique : il s'agit bien entendu d'avoir A d ( % ) de signe égal à p ( d ) pour beaucoup de valeurs de d. Cependant ces suites sont artificielles et, dans tous les cas naturels où il a été possible d'évaluer rigoureuse, la formule (5.2)s 'est avérée correcte. ment T (d)

Exercice5.2.1. - En considérant a, conjecturer que

A(n

=

-

2 ) , démontrer que l'on est amené à

Démontrer que si c'est le cas, alors on a n2( x )

-

-C

uC

(log x)*

c'est-à-dire que la Conjecture 1.1.2 est vraie.

Exercice 5.2.2. - Soit a, la fonction caractéristique des entiers n < x ayant un nombre pair de facteurs premiers. Démontrer que pour d sans facteurs carrés on a

avec

[Indication : Écrire an = ( 1 + A ( n )) /2 où A ( n ) = (- 1 )w ( n ) , w ( n ) étant le nombre de diviseurs premiers de n et démontrer que

en calculant la série de Dirichlet associée.] Démontrer que pour tout E > O on a

pour D = x ' - ~ . Démontrer que si r = x 1 I 2 , la formule heuristique (5.2) est fausse pour la suite

(an). Comment comprendre ce résultat d'après la discussion qui précède ?

5.3. UN CRIBLE COMBINATOIRE SIMPLE

5.3. Un crible combinatoire simple On suppose dans cette section que les éléments a, de la suite d sont positifs, an 2 O. Parmi les nombreuses variantes du crible, nous allons présenter un crible combinatoire simple, relativement proche de la méthode originale de Brun [Br]. Pour une présentation beaucoup plus exhaustive,voir [HR], ainsi que [Bo] et [Te]. Soit D > z un paramètre supplémentaire. Un crible de niveau D, tel que défini par Brun, est essentiellement une « déformation » h+ (n) ou h (n) de la fonction de Mobius, supportée sur les entiers d < D, qui vérifie h+ (1) = 1 (resp. A- (1) = 1) et l'inégalité

pour n 2 2. Dans le cas de hf , on parle de crible majorant et dans celui de A- de crible minorant. Cette terminologie est justifiée par le lemme suivant. Lemme 5.3.1. - Soit A+, resp. A-, un crible majorant, resp. minorant, de niveau D > z . Si a, 2 O, on apourtout 2 z x

<
yi+l > O pour tout i , et soit

(yi), i

1, des

Alors on a

l'autre étant à peu près idenDémonstration. - Nous considérons simplement g+, tique. Si un diviseur d 1 n n'appartient pas à g + , il existe un entier i (impair) minimal tel que

pi 2 Yi et

fi < y j

si j

< i impair,

(où Pi = Pi(d) ) + Notant Sil'ensemble des d 1 n pour lesquels cet entier vaut i, il vient tautologiquement

Or les éléments de gisont de la forme d = pl . .Pid2 = d1d2 OÙ pl > Pj < y j si j < i est impair, tandis que tous les diviseurs premiers de dg sont écriture est évidemment unique.

COURS SPÉCIALISÉS 13

> p i , et < pi ; cette

5.3. UN CRIBLE COMBINATOIRE SIMPLE

113

Pour dl donné (c'est-à-dire pl, . . . ,pi donnés), d2 parcourt les diviseurs de m, où m est le produit des diviseurs < pi de n, de sorte que

car p (dl) = (- 1)' = - 1 et la somme intérieure est soit nulle, soit = 1. D'après (5.7),il vient

Ce lemme est purement combinatoire et permet de construire une abondance de cribles majorant ou minorant en choisissant des limites Yi pour tout d 2 2 de façon consistante; dans le lemme ces limites peuvent dépendre de n tel que d ( n, mais si on choisit Yi comme fonction de d seulement, on obtient Corollaire 5.3.3. - Soient (yi) , i (d) > 0 pour d 2 2. Soit

2 1 , des fonctions arithmétiques réelles telles que Yi (d) >

Yi+l

9'

= {d = pi

. - . p,

1 Pm < y,

pour m impair}

par convention. Alors avec 1 E 9+

est un crible majorant. De même la fonction de Mobius restreinte à

est un crible minorant. En pratique, pour simplifier la notation, Yi est considéré implicitement comme fonction de d, tout comme l'était pi. Le niveau D n'est pas explicité, mais les conditions imposées sur d = pl . .Pr E 9+ permettent de majorer effectivement d, comme on le verra plus bas. Il en est de même pour 9-,à l'exception dans ce cas des d = p E 9- puisque la définition de 9- n'offre aucune restriction sur p. Si on suppose z < D, la condition p < x permettra néanmoins de contrôler le niveau du crible minorant. Pour aller plus loin, il faut nécessairement introduire des hypothèses sur la suite d , à commencer (6Section 1.5 et Section 5.2) par écrire

CHAPITRE 5. CRIBLE ET SOMMES OSCILLANTES SUR LES NOMBRES PREMIERS

114


O dépendant de la suite. Par exemple si a, = 1 et g(d) = l / d , on a rd(x) « 1 pour x 2 2, de sorte que

( R ( d ,D) 1

< D.

Voir ci-dessous pour d'autres exemples.

(2) Attention encore une fois à ne pas faire l'erreur de penser que la formule exacte de Legendre fournirait la bonne formule asymptotique pour S ( d ,z ) en négligeant le terme d'erreur : on l'a déjà vu dans la Section 1.5 pour le cas a, = 1 et z = XI/*,avec g (d) = d-' , X = x. L'heuristique basée sur la fonction de Mobius de la Section 5.2 est beaucoup plus robuste.

COURS SPÉCIALISÉS 13

5.3. UN CRIBLE COMBINATOIRE SIMPLE

115

Pour les applications, la complexité des coefficients Ak(d) du crible (que l'on préfère d'ailleurs voir comme purement auxiliaires et simplement > par ce qui s'appelle souvent un lemme fondamental) rendrait la majoration ci-dessus assez déplaisante. On désire donc éliminer cette dépendance en reliant V + ( z ) à V (x) . Il faut remarquer d'emblée que contrairement à p, les fonctions A+ et A- n'ont pas de raison d'être multiplicatives (donc V + ( z ) n'est pas donné par un produit eulérien comme l'est V (x) ) . Notons pour la suite les propriétés suivantes de V (z) :

2 O pour tout z

V (z)

< V ( w ) pour w < z

V(z)

qui proviennent du produit eulérien (5.9) et de l'hypothèse O Dans le cas du crible combinatoire décrit ci-dessus, on a :

< g ( p ) < 1.

Lemme 5.3.5. - Soit (A+) et (A-) les c~blesmajorant et minorant construits à partir des paramètres de troncation (yi) . On a alors V(z) = v + ( z )

-

i

où pour tout entier i

C

impair

K(z) = v - ( z ) +

C

i pair

K(z)

2 1 on a

On peut démontrer cela en répétant simplement l'argument du Lemme 5.3.2. Une autre écriture provient d'une identité de crible générale à la fois simple et importante, 1'identité de Buchstab.

Lemme 5.3.6. - Soit d une suite de nombres complexes, z (and) - On a

2 2. Pour d 2 1 on note Md =

Cette identité est souvent utilisée par récurrence ; elle permet de diminuer la valeur du paramètre de criblage z. Rappelons que I d 1 signifie

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2004

CHAPITRE 5. CRIBLE ET SOMMES OSCILLANTES SUR LES NOMBRES PREMIERS

116

Démonstration. - Il s'agit encore du principe d'inclusion-exclusion : pour (5.19), le terme de droite « compte » tous les entiers n x, sauf ceux qui ont un diviseur premier p < x ; c'est donc la même condition que pour S ( d , x) , et la multiplicité correspond car, pour p donné, la somme est restreinte aux entiers n tels que p est le plus petit diviseur premier de n (puisque (n, P(p)) = 1).Cette condition, réciproquement, détermine la valeur de p pour laquelle un n donné apparaît. La seconde formule est tout à fait similaire. O




O, soit 8 tel que

5.3. UN CRIBLE COMBINATOIRE SIMPLE

121

Démonstration. - Il suffit d'après les propriétés du crible majorant de majorer V + ( 2 ) . Pour tout i , on a par (5.30) log z v(yi) KV ( 2 ) (j----)' KV (z)G-". Og Yi Écrivons 8-' = 1 + ( b x ) - ' , de sorte que b 2 1 devient un nouveau paramètre du crible. L'inégalité 1 + x < ex démontre que




1, on voit On cherche d'abord l'approximation (5.8) pour Ad (x) . Pour d que Ad(x) est le nombre d'entiers n x qui sont divisibles par d et = a (modq). Or d 1 qn + a si et seulement si n est, modulo d, une racine de l'équation linéaire qX + a=O. Cela permet d'écrire, pour d 2 1 fixé


O quelconque). C'est un des grands succès de la théorie analytique des nombres, puisqu'il va, inconditionnellement, plus loin que ce que l'on peut déduire directement de l'Hypothèse de Riemann Généralisée. Les preuves sont basées sur des estimations profondes, dues à Deshouillers et Iwaniec [DIl], de sommes de Kloosterman en moyenne, utilisant fondamentalement les formes modulaires, en particulier la formule de Kuznetsov (les Chapitres 6 et 7 contiennent une introduction à ces idées...)


O (car z $ R ) qui est atteint pour oo, disons. Cela signifie que Im(ooz) est maximal. Le sous-groupe

agit sur H par translations horizontales :

et il existe donc k E Z tel que z l

= .ckooz vérifie

1 Re(zl)1 < 1/2. La matrice

agit pour sa part par 1 etdonc Im(Sz) =1m(z)lz/-' x par (6.8). Or par définition de oo on doit avoir (6.11)

Sz

= --

(comme I ~ ( T ~=Im(w) w ) ), et par (6.11) cela implique lzi / 2 1, d'où z l = rkooz E F. L'unicité de o pour w E F est laissée en exercice au lecteur... (2) Soit z = zq le point paramétrant une forme quadratique q E &, et w = x,, E F le représentant équivalent correspondant dans le domaine fondamental. On a

pour certains entiers b et c > O. Comme Im(w) 2 &/2

et 1 Re ( w ) 1

< 1/2, on a

L'ensemble des couples (b, c) d'entiers, avec c > 0, vérifiant ces deux inégalités est évidemment fini, et donc l'ensemble des points w , et l'ensemble SL (2, Z) \H, sont finis. (3) Il s'agit d'un calcul élémentaire. C l

Exemple 6.1.5. - Si D = 1, P = x2+ 1 et on vérifie que A = {q = x2 + y2} = {i} (vu comme forme quadratique ou comme point dans H, respectivement). Il y a donc un seul élément. De plus Ti E 2/42, engendré par S. En effet, Si = -l/i = i ; noter que s2= -Id mais l'action de cette dernière matrice est triviale. En particulier, on a toujours {fId} c Tz, et à l'exception de z E {i, e(l/3), e(2/3)), il y a égalité, en particulier (T,( = 2. Si maintenant b H f (b) est une application quelconque définie sur les b E Z qui sont racines de l'équation b2 + D = O (modn), on a d'après le lemme et la Remarque 6.1.2 l'égalité formelle (la convergence de la somme sur o n'étant pas discutée)

où le facteur lTzl-' permet d'éliminer la multiplicité dans la représentation des points oz, o E SL(2,Z), z E A . Pour exprimer ph (n) par le biais de ces paramétrisations, il reste à passer des solutions b E Z à leurs classes modulo n. Mais cela est aisé car le changement b H b ns pour s E Z correspond ($ (6.7)) à

+

c'est-à-dire à l'action du sous-groupe B défini par (6.9). Par conséquent on a Lemme 6.1.6. - Soit D > O un entier, P = x2 + D. Pour tout n 2 1, si f ( v ) est une fonction complexe définie sur les racines v E Z/nZ de v2 + D = 0, on a

1

C f (v) = C - C f (nRe(o4 v€Z/nZ € I r otB\SL(2,Z) P ( v ) =O

1m(oz) = f i / n

Dans ce cas, toutes les sommes sont finies, donc ce lemme est effectivement valide f (v) = e(hv/n) il vient :

O

un entier; h E Z. On a

Remarque 6.1.8. - L'ensemble B\SL (2, Z) peut être interprété très concrètement : l'application

induit une bijection entre B\SL (2, Z) et les couples (y, 8) d'entiers tels que (y, 8) = 1 (i.e. les couples d'entiers premiers entre eux). En effet, d'après la relation de Bezout, la condition det(o) = 1 implique que (y, 8) = 1 , et réciproquement que tout couple satisfaisant cela peut être relevé B en une matrice de SL(2, Z). Il ne reste alors qu'à vérifier l'injectivité de l'application ci-dessus, mais cela provient du fait que les solutions (cc, P) de a6 - py = 1 sont toutes de la forme

si (ao,Po) est une solution donnée et n E Z. On vérifie aussitôt que

donc ces solutions forment exactement une classe de B-équivalence. Pour construire Y d , il reste à incorporer la condition d 1 n et à sommer sur n. Pour ce faire, on introduit les sous-groupes de congruence de Hecke lo (d) =

{(

)



(

2 Z)

1

y

-

O (mod d)

}

pour d 2 1 (un calcul immédiat démontre qu'il s'agit effectivement d'un sous-groupe ; voir le lemme ci-dessous pour une interprétation). Noter que lo (1) = SL(2,Z) et que B c ï o ( d ) pour tout d 2 1. Lemme 6.1.9. - Pour tout d sément

1, To(d) est un sous-groupe d 'indice$ni de SL(2,Z) , préci-

Démonstration. - Considérons l'action naturelle du groupe SL(2,Z) , via son quotient fini SL(P,Z/dZ), sur la droite projective P' (Z/dZ), autrement dit que l'ensemble des droites (sous-groupes isomorphes à Z/dZ) dans z/dz2. Si [a : b] sont COURS SPÉCIALISÉS 13

des coordonnées homogènes (correspondant à la droite ax + by = O, a et b étant bien définis modulo multiplication par un scalaire A E (Z/dZ) ), cette action est

On voit alors que To(d) est le stabilisateur de la droite el = [1 : O] pour cette action ; d'une part cela démontre sans calcul que To(d) est un sous-groupe, et d'autre part, comme l'action en question est transitive, cela implique que [SL(2,Z) : To(d)] = IP'(Z/dZ) 1

< +m.

Le calcul de cette dernière fonction est élémentaire et donne la formule annoncée. (Considérer le cas d = fik,où fi est premier et k 2 1, puis utiliser le théorème chinois ; le cas important d = p donne IP'(5) 1 = p + 1, fi points habituels >> et un point à l'infini). 17 Du point de vue des formes quadratiques la condition d 1 n pour q = mx2 + 2bxy ny2 est équivalente à q(O, 1) E O (mod d) . Soit Hd c Cz l'ensemble des formes quadratiques entières vérifiant cette dernière propriété. L'observation cruciale est que To(d) agit sur @ en laissant globalement invariant g d , puisque

+

Procédant alors comme précédemment, il y a une bijection entre les solutions b E Z de b2 D = O (modn) avec d 1 n et les points oz où a E To(d) et z E Ad, un ensemble de représentants pour To(d)\ g d . Or on a

+

Lemme 6.1.IO. - L'ensemble To(d)\Hd est en bijection avec Z'ensembb des points sz, où = To(1)\gzet T E rO (d)\rO (1) vhifient la condition z E

Im ( T Z ) =

(6.13)

0 pour un entier rn 2 1.

-

md

Démonstration. - Clairement on peut voir T0(d)\gd comme un sous-ensemble de To(d)\Hz. Introduisant les classes s E To(d)\To (1), on a la réunion disjointe évidente

où A est comme précédemment. Il s'agit donc de distinguer parmi les points TZ, s E To(d)\To (1), z E A, lesquels correspondent à g d . Or la condition est justement que la forme quadratique correspondante s'annule (modulo d) en (O, l ) ,ce qui se traduit par le coefficient de y2 divisible par d, ce qui est équivalent à (6.13). O On en déduit donc pour d 1 n

où la somme

*

C

restreint (z, T) aux éléments vérifiant (6.13). SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2004

CHAPITRE 6. FORMES AUTOMORPHES ET DÉCOMPOSITION SPECTRALE

152

En sommant sur n 2 1, d 1 n, comme Im(orz) est toujours de la forme \/D/n pour un n 2 1, on fait simplement s'évanouir la dernière condition de sommation, obtenant la formule finale formelle

que l'on rend aisément rigoureuse en introduisant une fonction test du type(')

avec F à support compact. Ainsi :

Corollaire 6.1.11. - Soit D > O, d CD" à support compact. O n a

1 des entiers, h E Z, F : ]O, +oo[ + C une fonction

Les propriétés fondamentales de Ph sont les suivantes : Lemme 6.P . 12. - L a fonction Ph est CD" sur H , et vémjie

(6.15)

ph(oz) = ph(z)

pour tout z E H , o E ï0(d) . Démonstration. - Puisque F est à support compact, la somme dans (6.14) ne fait intervenir en réalité qu'un nombre fini de o , qui est même borné un$ormément pour z E H (voir la preuve du Lemme 6.4.2 ci-dessous) pour tout z dans un compact fixé. Il est donc évident que Ph est CD" sur H. De plus, puisque la fonction est invariante par l'action de B, il est alors clair que Ph est ï0(d)-périodique (c'est la même idée que dans la preuve de la formule de sommation de Poisson). La relation (6.15) (dite de modularité) pour Ph est la clé de la suite des arguments puisqu'elle permet de faire intervenir la profonde théorie des formes automorphes, qu'on peut voir comme un analogue en géométrie hyperbolique du développement en série de Fourier de fonctions périodiques sur R~ (comparer avec la formule de Poisson, Proposition 2.5.1). ( l )La normalisation particulière est choisie pour simplifier certaines formules ultérieures.

COURS SPÉCIALISÉS 13

6.1. FORMES LINÉAIRES EN RACINES DE CONGRUENCES QUADRATIQUES

153

Avant de discuter cela plus avant, un dernier lemme est important pour la suite puisque l'on va estimer Ph ( z ) pour tout z E H et qu'il faut donc contrôler le nombre de termes dans la somme sur z et T . Lemme 6.1.13. - Soit D > O et d 2 1 des entiers sans facteurs carrés. Soit z E A et q = ax2 + 2bxy + cy2 la forme quadratique entière associée. Le nombre m(d, z) de solutions T E To (d)\To (1) à l'équation (6.13) vémjîe

Remarque 6.1.14. - On pourrait majorer m(d, z) en général, mais ce cas sera suffisant pour la suite. Si D = 1, par exemple, la seule forme quadratique qui intervient est q = x2 + y 2 pour z = i . Démonstration. - On a vu que To (d)\To (1) s'identifie à la droite projective P' (Z/dZ) . Explicitement, l'application

donne une telle bijection, comme le produit de matrices modulo d

le démontre. Soit maintenant z E A et q = ax2 + 2bxy + +y2 la forme quadratique correspondant à z. Alors TZ,où

vérifie (6.13) si et seulement si zq E gd, si et seulement si q ( (O, 1)z) = O modulo d. Or q ( ( 0 , l ) z ) = q(y, 6) et la condition est donc que (y, 6) soit zéro de la forme quadratique q modulo d. Ces zéros sont vus dans P' (Z/dZ) d'après la remarque du début. Remarquons que ( a , b, c) = 1 car si p 1 ( a ,b, c ) , on a p2 1 D, contrairement à l'hypothèse sur D. On peut calculer le nombre de zéros de q pour p 1 d, 1, premier et et appliquer ensuite le théorème chinois. Mais (y, 6) ne peut être = (0, O) modulo p. Si 6 est non divisible par P, donc inversible, on a dans P' (Z/pZ) [y, 61 = [y6-1 : 11 donc le nombre de tels zéros est égal au nombre de solutions de l'équation quadratique ax2 2bx c = O (modp).

+

+

Comme ce polynôme est non nul modulo p, le nombre de solutions est Si p 1 6 par contre, on a p { y et la solution est le point à l'infini

< 2.

154

CHAPITRE 6. FORMES AUTOMORPHES ET DÉCOMPOSITION SPECTRALE

l'équation devenant a = a + 2bpt + cp2t2 = O (modp). Il y a une unique solution si a, et aucune sinon. En remarquant que p 1 a ne se produit que lorsque il y a 1 solutions dans le premier cas, le nombre total de solutions modulo p est donc 2. Par multiplicativité il vient donc m(d, z) .c (d) (puisque d est sans facteurs O carrés).

p 1

<
O , on a clairement

pour toute courbe joignant z à w, et cette valeur correspond au segment vertical joignant z et w , de sorte que d(i,iy) = Ilogyl.

SOCIÉTÉ MATHEMATIQCE DE FRANCE 2004

156

CHAPITRE 6. FORMES AUTOMORPHES ET DÉCOMPOSITION SPECTRALE

Soient maintenant z et w quelconques. On peut trouver y tel que yz = i et yw = iy pour un certain y > O : en effet, étant donné y0 tel que yoz = i, on peut remplacer y0 par k (0) y0 pour tout

k(0) =

cos0 sin 0

- sin0

cos 0

)

t SO(2,R) < SL(2,R)

car un tel k laisse fixe i, et comme le signe de Re(k(x/2)yow) est l'opposé de celui de Re (yow), il existe par continuité 0 tel que Re (k (0)yow) = O. Cela permet de calculer la distance d(z,w) = d(i, k ( 0 ) yow), par invariance par isométries. En utilisant cela et l'action de G, on arrive à démontrer sans trop de difficulté que les géodésiques de H , c'est-à-dire les courbes réalisant localement la distance entre deux points, sont précisément les droites hyperboliques décrites au début de ce paragraphe. En particulier, elles se prolongent à l'infini, ce qui signifie que H est complet (au sens riemannien, ou pour la topologie induite par la distance hyperbolique). Noter que cette topologie n'est donc pas la même que la topologie induite par celle « ordinaire >> sur C. On démontre aussi que les géodésiques minimisent globalement la distance, et (comme déjà indiqué) il existe une unique géodésique reliant deux points donnés. On peut également calculer la courbure (scalaire, ou de Gauss) K de la métrique hyperbolique, et on trouve que K est constante, K = -1 < O. C'est la signification moderne de la notion de géométrie hyperbolique. À partir de la métrique hyperbolique, comme de toute métrique riemannienne, sont définis différents objets intrinsèques : le groupe des isométries de H (dont on a vu qu'il contient (l'image de) SL (2,R) ), la mesure riemannienne, et le laplacien. On démontre que le groupe de toutes les isométries est PSL(2,R) >a 2/22, où PSL(2, R) est le sous-groupe distingué des isométries conservant l'orientation (cf: le Lemme 6.2.1, (3)),le quotient 2/22 reflétant l'orientation admettant comme représentant non trivial la réflexion z H -Z. En utilisant les formules générales pour une métrique riemannienne arbitraire (cf: [GHL, p. 140, 1831, par exemple), on trouve que la mesure hyperbolique est dxdy dp(z) = -

y2

et le laplacien est

D'après la théorie générale, ces deux objets sont intrinsèques, donc invariants par l'action des isométries, et en particulier de SL(2,R) . Cela peut bien entendu se vérifier directement.

COURS SPÉCWISÉS 13

6.2. UNE PINCÉE DE GÉOMÉTRIE HYPERBOLIQUE

Lemme 6.2.3. - Soient

dxdy dp(z) = -

a2

a2

y2

L a mesure p et 1'opérateur différentiel A sont invariants par SL (2,R) , c'est-à-dire

pour y E SL (2, R) , où on a noté Remarque 6.2.4. - On a bien sûr f 1 yz = (f 1 y) 1 z.

Soit ï < SL(2,R) un sous-groupe discret, ou la topologie sous-entendue est la to. peut considérer l'espace topologique pologie euclidienne sur SL(2,R) c R ~ On quotient ï \ H . Du fait que la mesure dp ci-dessus est SL(2,R)-invariante, elle induit une mesure sur ce quotient. Comme pour SL(2,Z) , on peut démontrer ($ par exemple [Iw4, 2.21) aisément qu'il existe un domaine fondamental F pour ï, c'està-dire un ouvert tel que tout z E H est ï-équivalent à un élément de F , et deux éléments distincts z, w E F ne sont jamais r-équivalents. La mesure sur le quotient peut alors se voir concrètement comme la restriction de dp (z) à F (si le bord est de mesure nulle, ce qui est vrai pour les domaines fondamentaux « classiques », polygones de Dirichlet ou de Ford par exemple [Iw4, loc. cit.] ). En particulier on a Vol(I'\H) = p (F). Le lemme suivant est très important. Lemme 6.2.5. - Le sous-groupe SL(2,Z) est discret dans SL(2,R) et le quotient ï \ H est de

volume mais est non compact. Démonstration. - Par l'invariance de la mesure, on voit que le volume du quotient SL(2,Z) \H est simplement le volume hyperbolique du domaine fondamental F de la Proposition 6.1.4 (le bord étant de mesure nulle). Le fait que 7C

dxdy

3=sl77 se vérifie aussitôt par un calcul d'intégrale direct, mais c'est aussi une conséquence simple du théorème de Gauss-Bonnet pour le plan hyperbolique, selon lequel l'aire A d'un triangle hyperbolique (dont l'un ou plusieurs des sommets peut être sur le bord R U {CO)) est égale à

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2004

158

CHAPITRE 6. FORMES AUTOMORPHES ET DÉCOMPOSITION SPECTRALE

où cr, p, y sont les trois angles (rappelons que les angles hyperboliques coïncident avec les angles euclidiens) aux sommets du triangle(2).Ici on a a = x/3, P = n/3, y = O d'où le résultat de nouveau. La non-compacité est évidente encore d'après la Proposition 6.1.4 : les points z, = ni, n 2 1, par exemple, forment une suite de points dans F tels que d(z,, 2,) = log m / n , donc qui n'admet pas de sous-suite de Cauchy. Cl Si T est un sous-groupe discret de SL(2,R) et ï' < ï un sous-groupe d'indice fini, il est encore discret et on a vol (I?\H)

=

[ï': ï]Vol (I'\H)

en particulier si ï \ H est de volume fini, il en est de même de T'\H. Pour ce qui nous concerne, le cas particulier important est celui de ïo(d) < SL(2,Z) : avec le lemme qui précède et le Lemme 6.1.9, on trouve que ïo(d) est un sous-groupe discret tel que

et de plus To (d) \H est non compact (parce que « plus gros » que SL (2, Z) \H) . Pour conclure, une remarque sur la nature de la géométrie hyperbolique par rapport à la géométrie euclidienne. La définition même fait apercevoir un effet de « concentration » qui est très visible en écrivant les inégalités isopérimétriques respectives dans le plan R~ et dans H. Soit D un ensemble compact connexe dont le bord est une courbe C de classe c'. Alors, dans le plan, on a

où A est l'aire de D et L la longueur du périmètre C , avec égalité si et seulement si D est un disque. Dans H, l'inégalité correspondante est

A : la et il y a encore égalité pour les disques (hyperboliques). En particulier L longueur du périmètre est comparable à l'aire. Si l'on prend un disque D de grande taille et U un voisinage « cylindrique » autour de C à distance 1

on trouve que l'aire de U est comparable à la longueur L. Dans le cas euclidien, celle-ci est de l'ordre de fi,ce qui signifie que l'aire du disque est bien répartie « uniformément » à l'intérieur, mais dans le cas hyperbolique, l'aire de U est du même ordre de grandeur que celle de D : l'aire s'est concentrée sur le bord. (*)En particulier si les trois sommets ne sont pas alignés, la somme des angles est

COURS SPÉCLAL~SÉS 13

base orthonormée de cet espace de Hilbert, puis estimer les coefficients apparaissant dans cette décomposition. La question est de savoir quelle base choisir. Les deux exemples suivants justifient en partie le chemin qui va être parcouru. Exemple 6.3.1 (1) Soit X = R/Z : la situation est très analogue à ce qui précède puisque X est un quotient d'un groupe > par un sous-groupe discret. Dans ce cas, la > décomposition de L"R/Z) est donnée par les séries de Fourier

où e,(x) = e(ax) pour a E R. Les (en),n E Z, forment la base orthonormée recherchée de L2(R/Z) . (2) Soit X = R. Il n'y a pas ici de sous-groupe discret, et la théorie analogue prend un autre aspect : il s'agit de la transformation de Fourier dans L2, f (x) =

JR ?(t)

h

e(xt) dt

où f (t) =

f (x) e(-xt) dx. JR

Formellement, on peut écrire f ( t ) = (f 1 e t ) , mais une différence importante avec le cas précédent est que et & L2(R) , de sorte que cette expression est seulement formelle. De fait, pour f E L2(R) , l'intégrale de Fourier n'a pas de sens en général et la théorie s'obtient par prolongement par continuité. h

Il s'avérera que pour T\H, la décomposition obtenue pour une fonction f E L ~ ( T \ H )sera un mélange de ces deux exemples fondamentaux : une partie > (analogue des séries de Fourier), faisant intervenir une base orthonormale du sous-espace correspondant ; et une partie >, faisant intervenir des intégrales et en particulier des fonctions de base (les séries d'Eisenstein) qui ne sont pas dans L2(T\H) .

COURS SPÉCIALISÉS 13

Reste à expliquer pourquoi les fonctions en (resp. e t ) ci-dessus sont naturelles, et comment en chercher les analogues dans notre situation. Les fonctions exponentielles sont distinguées, dans le cas de R/Z, comme étant des caractères, c'est-à-dire des homomorphismes de groupes R/Z + C X . Dans le cas de R, les homomorphismes R -+C X sont les exponentielles eu pour tout a E C. Cependant, seules les exponentielles « unitaires >> eu avec a E R (où unitaire se réfère au fait que lea (x) 1 = 1 pour tout x E R ) interviennent dans la formule d'inversion pour f E L2(R). Une manière de comprendre cela est de remarquer que, bien que eu & L2(R) pour tout a E C , les exponentielles unitaires sont « les plus proches d'être dans L2.>> Comme justification, on peut dire que ce sont les seules qui sont bornées sur R puisque

L'analogue le plus proche des caractères R + C X ou R/Z -+ CX ci-dessus serait fourni par les représentations (unitaires) sphériques de SL (2, R) apparaissant dans la représentation régulière sur L2(I'\SL(2, R ) ) ; c'est le point de vue original de Gelfand-Graev-Piatetskii-Shapiro, et de Jacquet-Langlands, qui est à la source des généralisations en dimension supérieure; cf: par exemple [Bor] ou [Bu] pour des introductions. Ce point de vue n'est cependant pas nécessaire pour nous, et il est historiquement postérieur aux notions qui suivent, dues à Maass et Selberg essentiellement(3).L'autre propriété caractéristique des exponentielles, qui sera plus facile à généraliser à T\H, est qu'elles sont fonctions propres du laplacien ordinaire, c'est-àdire simplement de l'opérateur A = -d2/dx2 agissant sur les fonctions de classe c 2 . On a en effet Ata = 4rr2a2e,. Les exponentielles unitaires ont alors la propriété que la valeur propre correspondante 4rr2a2est un réel 2 O. Or A étant un opérateur auto-adjoint sur L2, ses valeurs propres doivent être positives. On peut deviner que le bon cadre pour comprendre ce type de question (de la façon la plus abstraite en tout cas) est celui des opérateurs linéaires non bornés définis sur un sous-espace dense d'un espace de Hilbert : c'est le cas de A, qui n'est certes pas défini sur tout L2 ! Cette théorie définit le spectre d'un opérateur, qui généralise l'ensemble des valeurs propres d'une matrice, et le décompose en spectre discret, résiduel ou continu. Dans le cas de R/Z, le laplacien a un spectre purement discret, ce qui correspond à de a vraies >> fonctions propres en E L2(R/Z) ; dans le cas de R, le laplacien a un spectre purement continu. Les fonctions propres n'existent pas au sens littéral dans L2( R ) , mais dans un sens approché. Cette dichotomie est directement liée au fait que R/Z est compact, alors que R ne l'est pas ; le mélange des deux situations pour un espace comme X = SL(2,Z) \H est dû au fait que X est de volume fini, mais non compact. (3)

es deux points de vue sont cependant, dans un certain sens, équivalents.

SOCIÉTE MATHÉMATIQUE DE FRANCE 2004

162

CHAPITRE 6. FORMES AUTOMORPHES ET DÉCOMPOSITION SPECTRALE

Nous renvoyons à [Iw4, App. A] pour un survol des définitions qui interviennent. Pour notre propos, qui n'est pas de donner des démonstrations complètes, nous n'entrerons pas dans ces détails, aussi important soient-ils : une fois le théorème de décomposition énoncé, avec quelques résultats de base sur les fonctions qui y interviennent, on peut le prendre comme « boîte noire » très efficacement. (De même, il n'est pas fréquent de construire la théorie des opérateurs non bornés pour démontrer que la transformée de Fourier existe et est une isométrie de L~(R) ...) On va donc étudier la décomposition spectrale du laplacien hyperbolique A agissant sur les fonctions I'-périodiques de carré intégrable, et cela fournira une « bonne base » de L ~ ( T \ H )Noter . que l'aire du domaine fondamental étant finie, les constantes sont de carré intégrable. Le défaut de compacité de I'\H se « lit >> sur le domaine fondamental F par la présence d'un nombre fini de O tel que, notant

1

Fa(Y) = {z E F

1rn(o~'r)> Y}

a de ï, les ouverts Fa (Y ) sont disjoints et

pour toute pointe

avec C compact. Noter que Fa (Y ) est bien défini sans ambiguïté par (6.19) car Im(.ctz) = Im(x) pour toute translation.

Exemple 6.3.5. - Si ï

= ï o ( d ) avec

d 2 1, et

Fi étant le domaine fondamental de la Proposition 6.1.4 pour SL(2,Z) = ï o ( l,)on peut prendre Y = 2 par exemple (voir le dessin de Fi ) . Nous considérons maintenant divers espaces de fonctions ï-périodiques, suivant leur régularité ou leur croissance aux voisinages des pointes. Pour une fonction f : H t C et une pointe a, on note de sorte que le comportement pour z

t

co de fa reflète celui de f pour z

t

a.

DéJintion 6.3.6. - Soit r comme ci-dessus. (1) On note

d(ï) =d(I'\H)

=

{f : H

t

C

1

f(yz) = f ( z ) pour touty ~ ï ) ,

l'espace des fonctions ï-périodiques. (2) On note

dm (ï)= dm ( ï \ H ) = {f

E

d ( r )1

f est Cm)

l'espace des fonctions I'-périodiques lisses. (3) On note (6.21) d P ( ï ) = d P ( ï \ ~ )=

{f

1

E d (î) Il existe N

> O tel que fa (e) «YN pour toute a et tout y 2 Y (ï)},

l'espace des fonctions automorphes pour ï (à croissance modérée en toute pointe). COURS SPÉCIALISÉS 13

(4) On note

le domaine du laplacien automorphe. Noter que le laplacien hyperbolique A définit des applications linéaires

Mm( r )

-+

d m ( r ) et 9(r)

--+

9( r ) .

On remarque aussi que puisque Vol(T\H) < +CO,on a Lm (I'\H) c L2(T\H) et en particulier 9 ( T ) c L~(I'\H). Cela s'avère important : agissant ainsi sur un sous-espace de L2, le laplacien a des propriétés assez différentes de ses propriétés purement formelles comme simple opérateur différentiel. C'est une des clés de la décomposition spectrale. Lemme 6.3.7. - Lbpbateur A est symétrique positif sur 9(T) . Précisément on a

pour f , g E 9(T) , où V f = (&f, ôyf ) et le produit scalaire dans l'intégrale est le produit scalaire usuel dans c 2 . E n particulier on a

La preuve peut soit provenir des faits généraux de géométrie riemannienne, soit s'obtenir à l'aide de la formule de Stokes et d'une petite analyse du bord du domaine fondamental F (pour démontrer que la contribution correspondante est nulle), qu'il faut alors avoir choisi convenablement (cf: [Iw4, 4.11). C'est ce lemme associé à un résultat d'analyse fonctionnelle (théorème de Friedrich~)qui permet de dire que A admet une extension auto-adjointe, de définir le spectre de A , et de conclure que ce spectre est un sous-ensemble de [O, +CO [ par positivité. En particulier, si f E L~(T\H) est dans g (T) , non nulle, et vérifie A f = A f , alors h 2 0. Nous étudions maintenant les valeurs propres du laplacien automorphe en exploitant la présence des pointes, et des stabilisateurs Ta correspondant : on peut décrire explicitement les conditions que l'invariance par Ta < ï , et le fait de satisfaire Af = h f , imposent sur f .

Avposition 6.3.8. - Soit f E dm (I') n & ( ï ) et a une pointe de I'. Supposons que A f = hf avec h E C. O n a alors un déoeloppement convergeant absolument et uniformément sur les compacts

S O C I É MATHÉMATIQUE ~ DE FRANCE 2004

166

CHAPITRE 6. FORMES AUTOMORPHES ET DÉCOMPOSITION SPECTRALE

où bJa (n), cga (O) E C et s (1 - s) = A. La fonction Kv(y) est la fonction dite de BesselMacDonald donnée par K. (y)

1

=-

2

Io

exp

(-

Si s = 1/ 2, c'est-à-dire A = 1/4, ilfaut remplacer De plus, il existe A > O dépendant de f tel que (6.24)

b ~ (n) a

< nA

(t

+

i))

t-'-'dt.

par

0log y .

pour n # O.

Noter qu'il n'est pas du tout nécessaire d'avoir A O ici car f & L~ en général : on verra plus bas des exemples importants de fonctions vérifiant A f = A f avec A E C - R. Démonstration. - La fonction fa vérifie, par construction, fa (z + 1) = fa ( z ) . Comme elle est Cm, elle admet donc un développement de Fourier convergeant absolument et uniformément sur les compacts donné par

avec des coefficients de Fourier (dépendant de y ) donnés par

qui sont également des fonctions Cm sur ] 0, +oo [ . Par SL (2,R) -invariance du laplacien on a A fa = A fa. On peut dériver terme à terme pour calculer A b , ce qui donne (séparation de variables)

Par unicité du développement de Fourier, l'équation A fa = A fa équivaut au fait que bLa (n; .) est solution de l'équation différentielle ordinaire du second ordre

pour tout n E Z. On exploite alors la théorie de ces équations différentielles pour préciser la forme du développement de Fourier : pour chaque n, l'espace vectoriel des solutions est de dimension 2. Pour n = 0, l'équation est que l'on résout facilement en g(y) = cxyS + pyl-' avec s ( l - s ) = A , si s # 1/2, et g(y) = a d + p\/Y1ogy si s = m . Si n # 0, l'équation (6.27) est une équation du type de Bessel. Deux solutions linéairement indépendantes sont données par g1 (Y) = m ~ s - 1 / 2 ( 2 7 + 4 ~et) g2 (Y) = \/2;;i;;ii1s-l/2(2nlnly) ou K et I sont des fonctions de Bessel de seconde espèce. On peut prendre cela comme une simple définition ; ce qui permet de distinguer ces solutions est l'analyse

du comportement à l'infini. Précisément, quand y + asymptotiquement équivalentes à celles de l'équation

+CO, les

solutions deviennent

+ 47r 2 n2 g = 0, qui sont de la forme g(y) = ae2xlnlJ'+ pe-2"nl~.Cela permet de définir gl g"

comme

l'unique solution de (6.27) telle que gl (y)

e-2Tlnl~ quand y -+ +m

et 92 comme l'unique solution telle que g2 (y)

e2nlnly quand y + +m.

La condition f E MP(T) cependant exclut que b~,(n;y) puisse faire intervenir la solution exponentiellement croissante à l'infini. Il existe donc une constante bja (n) E C telle que (après normalisation pour des raisons historiques)

ce qui donne (6.22). La formule (6.23) est l'une des nombreuses expressions disponibles pour la fonction de Bessel, cf. l'Exercice 6.3.12 ci-dessous. Enfin, pour estimer les coefficients bLa (n), on écrit la formule

valable pour tout y y + 0) il vient

> O.

Puisque fa (x + iy) est à croissance polynomiale (aussi pour

pour une certaine constante A. Prenant y

=

0

~nl-', on obtient bien (6.24).

Remarque 6.3.9. - On isole de la preuve l'estimation suivante sur la fonction de Bessel, qui est souvent tout ce qu'il est nécessaire de savoir :

(6.28)

Kv (y) = O (y-'/2e-~)

pour v fixé et y -+ +m Remarque 6.3.10. - En raison du développement (6.22)' il est habituel d'écrire A = s (1- s) . L'application s H A est un « revêtement à deux feuillets » ramifié en s = 1/2, c'est-à-dire que pour s # 1/2, à chaque A correspondent exactement deux valeurs s et 1 - s, alors que s = 1/2 est l'unique valeur correspondant à 1/4. Quand on veut choisir une valeur de s bien définie, on peut demander que Re(s) 1/2, et Im (s) 2 O pour Re (s) = 1/2. Au vu du Lemme 6.3.7, il est important de savoir à quelle condition correspond A 2 O. On s'aperçoit rapidement que c'est le cas si et seulement si s E [O, 11 ou bien

>

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2004

168

CHAPITRE 6. FORMES AUTOMORPHES ET DÉCOMPOSITION SPECTRALE

si Re (s) = 1/2. Cela motive d'écrire aussi parfois s = 1/2 + it, avec t E C, de sorte que h = 1/4 t2, et h 2 O équivaut à t E R ou bien t = ir avec r E [-1/2,1/2]. Le « spectre » semble se décomposer en deux parties : Re(s) = 1/2 (ou t E R, ou A 2 1/4) et s E [O,1] (ou t = ir, r E ] - 1/2,1/2[, ou O h < 1/4). Onverra que ceci correspond effectivement à un phénomène important et n'est pas seulement une coïncidence.

+


1, ce O qui donne la dernière possibilité.

Exercice 6.3.12. - Soit f (v,y) la fonction donnée par (6.23) :

(1) Démontrer que ceci définit pour tout v E C une fonction f (v, .) de classe Cm sur ] 0, +oo [. (2) Démontrer la relation de récurrence pour tout v et tout y > O

[Indication : Faire une intégration par partie.]

COURS SPÉCIALISÉS 13

169

6.4. SÉRTES D'EISENSTEIN

(3) En déduire que pour v fixé, la fonction g(y) = f (v,y) est une solution de l'équation différentielle ordinaire du second ordre

(4) Démontrer que h(y) = \/Yg(y) est solution de l'équation différentielle

où h = s (1 - s ) , v = s - 1/2, et décroît exponentiellement à l'infini. (5) Démontrer que l'espace des solutions bornées de cette dernière équation différentielle est de dimension 1 [Indication : Étudier le wronskien W(y) = det de deux solutions fi et f2.] (6) Justifier par conséquent que la fonction (6.23) est un multiple de celle apparaissant dans la preuve de la Proposition 6.3.8. ('7) Démontrer qu'il y a même égalité, c'est-à-dire que gn(y) = g(2xnly) vérifie gn(y)

N

e-2"lnlJ

quand y + +m.

6.4. Séries d'Eisenstein La première étape pour la décomposition de L*(T\H) est de construire des éléments y appartenant. La seule méthode « évidente » est basée sur l'idée de moyennisation, et est similaire à ce qui se passe dans la formule de Poisson (Proposition 2.5.1). Plutôt que de sommer une fonction f sur tout ï, on peut également sommer une fonction qui est déjà ïl-invariante sur Tl \I',où ïl < ï est un sous-groupe quelconque (cf: aussi la série de Poincaré Ph).

+

Définition 6.4.1. - Soit : ]O, +oo [ + C une fonction Cm à support compact. Soit a une pointe de ï. La série d'Eisenstein incomplète définie par et a est la fonction

Lemme 6.4.2. - Pour toute fonction test particulier E, (.; +) E L~( ï \ H ) .

+

+ et toute pointe a, o n a Ea (-;+)

E

L3(T), e n

Démonstration. - Formellement, il est clair que si la série converge, elle définira une fonction ï-invariante pour la raison ci-dessus : la fonction dont on fait la moyenne

est ï,-invariante : si y = ryl avec r E Ta, on a o;'roa

E Tm par (6.18) et donc

SOCIÉTÉ MATHEMATIQUEDE FRANCE 2004

170

CHAPITRE 6. FORMES AUTOMORPHES ET DÉCOMPOSITION SPECTRALE

+

La convergence est en réalité triviale car, du fait que est à support compact dans ]O, +m [, la somme définissant Ea (., +) est $nie, uniformément pour tout z E H. Cela étant acquis, il est alors évident que la série d'Eisenstein incomplète est dans 9(ï). Pour établir l'affirmation ci-dessus, supposons supp(4) c [A, BI avec O < A B < +m. Un argument de comptage assez élémentaire basé sur le fait que le groupe ï est discret dans SL(2,R) démontre alors que le nombre de solutions y E ï a \ T à l'inégalité 1m (a;' yz) > A est uniformément borné pour z E H ($ [Iw4, Lemma 2.101 ) . Par exemple, si ï = SL(2,Z) , ou d'indice fini dans SL(2,Z) avec a = m. On peut supposer z E Fi, par ï-invariance, donc y y0 = \/3/2. On a


1 et déJinit dans cette région

(3) O n a pour tout s jîxé tel que Re (s) > 1

c'est-à-dire que les séries d Eisenstein sont fonctions propres d u laplacien hyperbolique. Démonstration. - L'équation (6.29) est évidente formellement en écrivant la transformation de Mellin (cf: (2.21))

valable pour tout o E R car $J est à support compact dans ]O, +oo[ (Proposition 2.3.3, (2)), et en sommant sur y. La question est de justifier la convergence, c'est-à-dire de démontrer que la série (6.30) converge pour Re(s) > 1 (c'est pour avoir un demi-plan « vers la droite » qu'on utilise 4(-s) ci-dessus). Puisque AyS = s(1- s)yS (cf: aussi le calcul du terme n = O dans le développement de Fourier (6.22)),la convergence de la série d'Eisenstein et l'invariance par SL(2,R) suffira à établir que Ea (., s) est une fonction propre de A (c'est-à-dire (3)).Le fait que h

172

CHAPITRE 6. FORMES AUTOMORPHES ET DÉCOMPOSITION SPECTRALE

A O puisque -1 E T ; tout entier c tel que q 1 c intervient dans une seconde ligne (c,d) de To(q) , et ad - bc = 1 implique que d est inversible modulo d. On a l'identité

qui démontre que dans la double classe de y, le coefficient c est constant et d est bien défini modulo c. De plus, la double classe ne dépend pas de a : en effet, si

ilvient yy;'ca

= ca donc y y l l E Tm.

Démonstration de la Proposition 6.4.7. - Nous procédons avec une généralité décroissante pour arriver au seul cas de SL(2,Z) . On a d'abord pour toute fonction $l telle que la série converge absolument

et en utilisant la décomposition donnée par le lemme ceci est égal à I

(2) + Ç

Ç

E $1 ((:

c>0 d (mod c) nez

;)

7%~)

où 7%est toujours la translation par n . La somme intérieure sur n peut être transformée par la formule de Poisson

Supposons pour continuer que $l ( 2 ) = $(Im(z)) (le cas des séries d'Eisenstein, incomplètes ou ordinaires) : alors on a

6.4. SÉRIES D'EISENSTEIN

de sorte que le changement de variable t = u

-

x - d / c fournit l'expression

et alors



~ ( h ; c ) = C* e ( y )

et ~ + ( y ; c , h j =

d (modc)

Pour terminer on utilise les formules du sous-lemme suivant (voir [GR, 8.380.3, 8.432.51 par exemple) : Lemme 6.4.9. - Soit s E C tel que Re ( s ) > 1 / 2 . Alors on a

Pour le développement d'une série d'Eisenstein cela donne en reportant un premier développement de Fourier

?a,b ( s ) =

g n ( s )=

r ( s - 1/2)

fi

C s ( O ; C ) C-*'

c>o

C~(n;c)c-~'. c>o

Finalement prenons T = SL(2, Z ) . On a alors :

Lemme 6.4.10. - Si r = SL(2,Z) , on a S (O; c ) = cp ( c ) fonction d Euler)

Comme on a

ce lemme et le développement ci-dessus terminent la preuve de la proposition.

O

176

CHAPITRE 6. FORMES AUTOMORPHES ET DÉCOMPOSITION SPECTRALE

Démonstration du Lemme 6.4.10. - Pour SL (2, Z) , d parcourt les éléments inversibles modulo c 2 1, donc S (O; c) = cp (c) puisque cette somme compte simplement les éléments d possibles pour un c fixé. Plus généralement, on a S(h;c)=

C* d (mod c )

e(F) =

C

dp(i)

dl ( n J )

(c'est une somme de Ramanujan, cf: (2.52),calculée en (2.53)) . La série de Dirichlet associée à la fonction d'Euler est donnée par (2.12) et celle associée aux sommes de Ramanujan se calcule aisément

L'application suivante est alors conséquence des propriétés analytiques de la fonction c de Riemann. Démonstration du Théorème 6.4.6pour SL (2, Z) . - Soit, comme dans le Théorème 3.2.1

de sorte que, d'une part, A(s) est une fonction méromorphe admettant comme seules singularités des pôles simples en s = O et s = 1 de résidu = 1 et vérifiant

(Théorème 3.2.1, (4)) et, d'autre part, on peut écrire les coefficients du développement de Fourier de E (x,s) comme

avec Le prolongement méromorphe de E(x, s) est donc évident à partir de celui de A(s) , en utilisant la majoration

et (6.28) qui démontre que la série sur n converge très rapidement pour tout s E C qui n'est pas de la forme s = p/2 où p est un zéro non trivial de la fonction zêta de Riemann.

COURS SPÉCIALISÉS 13

177

6.4. SERIES D'EISENSTEIN

Réciproquement, si s = p/2, 2s - 1 n'est pas un zéro (ni un pôle) de A (s), donc cp(s) a un pôle (d'ordre la multiplicité de p ) en s = p. Il y a un pôle additionnel en s = 1 provenant du pôle de A(2s - 1) en ce point. (Le pôle en s = 1/2 de cette même fonction est annulé par le zéro de A(2s)-'). D'après le Théorème 3.3.2, il n'y a pas de zéro vérifiant Re(p) = 1, et donc E (2, s) 1/2. Cela est holomorphe, à l'exception du pôle simple en s = 1, pour Re(s) donne le partie (1) du Théorème 3.3.2, à l'exception du calcul exact du résidu en s = 1. Mais là tous les termes n # O sont holomorphes, donc le résidu vaut (après un petit calcul)

>

RessZlE (x,s) = R ~ S , cp=(s) ~y

1-s -

-

A(2)

.n

= Vol ( S L(2, Z) \H)

par le Lemme 6.2.5 (on rappelle la valeur spéciale c(2) = 3 / 6 ; le lecteur qui n'en connaît pas de preuve la retrouvera par exemple en appliquant la formule de Parseval à la fonction 1-périodique valant x sur [- 1/2,1/2] ) . Passons à la partie (2) du théorème. On a (6.32) avec cp(s) définie ci-dessus. Multipliant par A(2s), on peut écrire symétriquement

Comme l'échange a

t+

b démontre que

on en déduit que

Enfin l'équation cp (s)cp (1 - s) = 1 est une conséquence de l'équation fonctionnelle O A(s) = A(1 - s) de T(s). Remarque 6.4.11. - Noter que la preuve démontre que l'holomorphie de E (x, s) sur Re(s) 2 1/2 (à l'exception du pôle en 1 ) est équivalente à la non-annulation de c(s) pour Re(s) 2 1, donc en fait pour Re(s) = 1. La méthode d'Hadamard-de la Vallée Poussin expliquée après l'énoncé du Théorème 3.3.2 suffirait donc à la démontrer. On peut même procéder dans l'autre sens : utilisant une preuve générale du prolongement analytique des séries d'Eisenstein (par exemple comme dans [Iw4, Ch. 6]), on obtient le Théorème 6.4.6 et on analyse ensuite le développement de Fourier de E (x, s) . Voir aussi [T2,p. 691 pour un résumé plus élémentaire de ce genre d'idées.

SOCIÉTÉ MATHÉMATIQUE: DE FRANCE 2004

178

CHAPITRE 6. FORMES AUTOMORPHES ET DÉCOMPOSITION SPECTRALE

Disposant du prolongement analytique des séries d'Eisenstein, on peut énoncer le théorème de décomposition spectral de A « agissant » sur 8(ï). Théorème 6.4.12. - Soit ï comme ci-dessus. Soient LZa l'ensemble fini des pôles des séries d Eisenstein Ea ( .;s ) pour o > 1/2, et

pour w E LZa le résidu correspondant; on a u, E 8(ï). Soit uw Uw

=IIuw 112

la fonction normalisée correspondante. Pour toute f E C!? (ï)f l L 2 (ï), on a

où Ea ( f ) désigne la transformée d'Eisenstein de f en la pointe a

celle-ci est bien définie. L a série converge absolument et uniformément sur tout compact et de plus on a la formule de Plancherel

Remarque 6.4.13 ( 1 ) Par abus de notation, on écrit souvent plutôt

la transformée d'Eisenstein : l'abus consiste à écrire un produit scalaire alors que la série d'Eisenstein n'est pas de carré intégrable. (2) Comme pour la transformée de Fourier, la formule (6.41) permet d'étendre la décomposition spectrale (au sens L ~ à) toute f E C!?(T). L'abus de notation du (1) est alors évidemment d'autant plus grand puisque l'intégrale ne converge pas ... En particulier, on peut appliquer ce théorème à une série d'Eisenstein incomplète f = Eb ( 2 ; 4).Deux choses sont alors à remarquer : bien que la fonction Eb (-; +) soit définie par référence à une seule pointe b, sa décomposition spectrale doit faire appel à toutes les pointes. En particulier, cette formule est distincte de la formule (6.29), même après avoir déplacé le contour d'intégration jusqu'à la droite o = 1/2, c'est-àdire que $ (- 1/2 - i t ) # ( E b(.; 2 ) 1 EU(.; 1/2 i l ) ) . h

+

Cependant (6.29) est à la base de la preuve. En effet, déplaçant le contour jusqu'en o = 1/2 (en utilisant une croissante polynomiale des séries d'Eisenstein qui est également un résultat non trivial en général, quoique cela soit plus facile à démontrer

COURS SPÉCIALISÉS 13

179

6.4. SÉRIES D'EISENSTEIN

lorsque r = SL(2,Z) ou To(q)), on passe par les pôles w E 9 b qui ne posent pas de problèmes car u, E ~ ~ ( ïSur ) .la droite a = 1/2, on utilise l'analogue de la formule (6.42) ci-dessous et le développement des séries d'Eisenstein (6.32) pour voir que

(utilisant 7

=

1 - s pour Re(s) = 1/2). Sommant sur

après avoir multiplié par

Ea (., s) on trouve

par l'équation fonctionnelle (6.34) des séries d'Eisenstein. Les intégrales sur la droite de partie réelle 1/2 des deux termes du membre de droite sont égales (par s t+ 1 - s ) , et (divisées par 2i.n) leur valeur commune est

qui est donc la partie non-résiduelle de (6.29) après déplacement du contour d'intégration. L'expression de gauche est la partie continue dans la formule de décomposition (6.39). La partie restante de la preuve consiste à démontrer l'existence des coefficients d'Eisenstein et le fait que cela donne une isométrie : voir par exemple [Iw4, Ch. 71 pour une démonstration complète. Remarquons pour finir que dans le cas qui nous intéressera de To(q) ,on démontre que le seul pôle des séries d'Eisenstein pour a 2 1/2 est s = 1 (comme pour SL(2,Z) , cela peut se remarquer directement sur le développement en série de Fourier des séries d'Eisenstein). On notera alors uo le résidu normalisé correspondant, la constante

(cf: (6.31)),de sorte que le terme résiduel dans le développement spectral est évidemment la valeur moyenne de f sur T\H : (f I uo)uo =

1

dxdy

SOCIÉTÉ MATHÉMATIQUE

DE FRANCE 2004

180

CHAPITRE 6. FORMES AUTOMORPHES ET DÉCOMPOSITION SPECTRALE

6.5. Le spectre discret On va d'abord identifier l'espace orthogonal à 8(T) dans L2 (T\H) .

'

Lemme 6.5.1. - Soit g (T) = (T) . Alors g (I') est 1'espace des fonctions f dans L2 (I'\H) telles que, pour toute pointe a de T, le terme constant en a

est n u l presque partout comme fonction ] O, +CO [

4

C.

On appelle (T) l'espace des fonctions paraboliques. L'adjectif O et F est à support compact dans ]O, +oo [ . Démonstration. - Le point (1) est évident par (7.4) puisque uo n'a pas de coefficient de Fourier non nul pour h # O. Pour (2), on a maintenant, par exemple

(pour h

2 O), d'où le résultat par le changement de variable u = 2nhy dans (7.4). O

Démonstration du Lemme 7.1.1. - On procède comme pour (6.42) avec T = To( d ) :

dxdy f(z)F(Znhy)e(-hx)=

(Io1 + (%

y2

1-

(car f ( y 4

=f

(4)

dy iy)e(-hx) dx F ( 2 x 4 ~)

Y*

(noter B\H = T,\H) d'où le résultat. Les échanges sont justifiés puisque si F 2 0, O cette dernière intégrale est clairement finie. Ainsi, pour h

> 1, (7.3) devient

le terme j = O , la valeur moyenne de Ph, étant nul d'après le Corollaire, (1). Ce point d'apparence anodine est crucial. L'idée intuitive maintenant est que nous avons décomposé Ph dans une bonne base de L~ ( T g(d)\H) , de sorte que ce premier coefficient doit représenter la taille approximative de Ph, et qu'en estimant maintenant individuellement le module des autres termes (ce qui revient à négliger donc leurs variations de phase) on obtiendra une borne non triviale. L'analogue dans le cas euclidien serait le suivant : soit f une fonction test sur R, on construit la fonction périodique

qu'on développe en série de Fourier

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2004

(c'est la formule de Poisson) avec

et si f est (par exemple) Cm à support compact, on a (par intégrations par partie successives) pour tout N > 1, ce qui permet de majorer la partie h # O de la série (en général, ce calcul n'a de sens qu'en fonction d'un autre paramètre dont dépend f ) . Dans notre cas, il y a deux « quantités inconnues » : d'une part les coefficients de Fourier des harmoniques (les formes paraboliques de Maass, et les séries d'Eisenstein), et d'autre part les valeurs mêmes de ces harmoniques, ou leur module. Noter que ce deuxième « problème » est purement hyperbolique puisque le(xt) 1 = 1 pour tout x, t E R. Commen~onscependant par estimer 3 . Lemme 7.1.3. - Soit t E C tel qque l / 4 Alors i(t)

< (1 + l

+ t2 2 O, et F vhjriant les hypothèses ('7.1) et ('7.2).

t l ) - 4cosh / ~ nt ( Y i t

+rit + 210g(Y + 2)).

la constante implicite étant absolue. Noter que pour t vérifiant les hypothèses (y compris t non réel), on a cosh nt et y" +yy210g (Y 2) 2 O

+

+

2O

est Remarque 7.1.4. - Cette estimation est très précise : noter que le facteur Y de F. On peut sur le support [Y -l, 2Y (à un facteur près) l'intégrale de décroît se demander pourquoi mettre le facteur (1 + l t ~ ) -puisque ~ le (cosh exponentiellement quand t -+ + m , mais on verra que cette décroissance est exactement compensée par la croissance des coefficients de Fourier. Cela démontre qu'on a là un résultat quelque peu délicat. Démonstration. - Comme F est à support compact et Kit est une fonction Ca sur ]O, + m [, l'intégrale k (t) ne pose pas de problème d'existence. Pour la même raison de localisation, on peut simplement développer Kit(y) en série entière en O pour en faire l'estimation. Plus précisément, on a ($ par exemple [Iw4, App. BI) pour t # O

où Ikitdésigne les fonctions de Bessel à croissance exponentielle déjà mentionnées dans la preuve de la Proposition 6.3.8. (La croissance est sans importance ici puisque y est petit). On a le développement

COURS SPÉCIALISÉS 13

*

pour E = 1. On va considérer le terme correspondant à second étant exactement similaire. Inversant la somme et l'intégrale, on trouve

in2-"

F+ ( t ) = C sinh nt

E

=

+1 (disons

F+ ) , le

"2m + it - 1 / 2 ) 22mm!r(m+ 1 + it) '

où F est la transformée de Mellin de F, qui est entière puisque F est à support compact dans ] O, +oo [ . Intégrant par partie quatre fois dans la définition, on trouve pour s & {O, -1, -2, -3)

1

h

F (y)yS-'dy =

F (s)=

+

+

s(s+ l ) ( s 2 ) ( s 3 )

F ( 4 )( y ) y s i 3 ~ 0

par (7.2), la constante implicite étant absolue. En vérifiant ces valeurs séparément on a, pour tout s,

F ( s ) « (1+ I S ~ ) - ~ Y -O.

Cela nous permet d'estimer

F+ ( t ) :

Pour estimer la série, on fait appel à la relation de récurrence de la fonction gamma pour obtenir

r ( m + 1 + i t ) = (it + m ) . . . (it + l ) r ( i t + 1 ) » rn!lr(it + l ) I , et en déduire

C m$,

(2Y ) -2m m!lT(m 1 it) 1

+ +

« Ir(1 + it) 1-',

(le terme m = O ) ,

la constante implicite étant absolue. Or on a pour t réel

Ir(1 + it) 1 = et donc finalement pour t

#O

.J

(cf: par exemple [GR, 8.3321 )

-

:is

nt

F+(t) « ( 1 + ~ t l ) - ~ ~ ' / ~ ( s i n h n t ) - ' / ~ ~ ~ ~ ' l d'où le résultat pour Itl 2 1 / 4 (par exemple). Pour t proche de O, en utilisant l'asymptotique ( [GR, 8.44'7. ( 3 ) ])


de telles formules avec une fonction test dépendant du paramètre v qui est à notre disposition, on peut déduire le Théorème 7.4.1. La formule ad hoc est cosh n r (t) dr = -2cosh xt ' cosh x ( r - t ) cosh n ( r + t )

r

ainsi que moults identités entre fonctions de Bessel, et estimations d'icelles.

17

Cela étant on peut alors fournir une estimation convenable de R d ( h ), et donc de Ph

(4.

Théorème 7.4.5 (1) Soit D > O un entier3xé. O n a

pour tout d 2 1 et tout h 2 1, la constante implicite étant absolue. (2) Soit D > O et d 2 1 des entiers sans facteurs carrés. O n a (7.26)

C

n=O ( m o d d )

2 n h a P~(~)F(-)

'/'

< D ( h) ~ (1

+(

h ) ' ~/ 4 d - ' / 2 ( h , d ) 1 / 4 ) (log( Y

pour toutefonction F vérifiant les hypothèse (7.1) et (7.2), et tout h dépendant de D seulement.

+ 2) ) 2 r ( d )2 r ( h )

2 1, la constante implicite

Démonstration. - L'estimation (7.26) provient de la précédente à partir du Corollaire 6.1.11, utilisant (7.7) et le Corollaire 7.2.4 ainsi que le Lemme 6.1.13 pour contrôler le nombre de termes où évaluer la série de Poincaré lorsque D et d sont sans facteurs carrés. Pour (7.25), par le Théorème 7.4.1 et (7.15), il vient R d ( h )< h y { f o

+y c - ' w , dlc

Par (7.16), on a trivialement

li: c ) f

(T)).

CHAPITRE 7. ESTIMATION D'UNE SÉRIE DE POINCARÉ

200

(noter que dans la formule de Kuznetsov, les valeurs de t du côté « dual » ne correspondent qu'à t E R, comme si les éventuelles valeurs propres exceptionnelles t R avaient disparu...) On doit donc évaluer f (x) . On écrit pour cela (7.17) sous la forme d'une intégrale complexe en posant (naturellement) s = 1/2 + it :

À cause de (7.20),il est bénéfique de déplacer la droite d'intégration vers la droite o < 1 et pour gagner dans la majoration de Jv (x) . D'après (7.20), on a pour 1/2 t E R, une majoration


1

4xh (h, h; cd)f (Cd)« d1/2-20(hy ) 201 (log(y + 2) )

« d1/2-2"~(d)(hy )20-1

(log(Y

x

c> 1

Cl/2-20(h, cd)

+ 2)) (h, d) 1/2 x (h,

(cd)

C) T (c)

c>l

Supposons o

> 3/4

qui donne

x

c> 1

COURS SPÉCIALISÉS 13

donc 20

-

1/2

> 1. On évalue facilement la série en écrivant

(h, C) T (c) c ~ / ~ = - ~ "

7.4. PREUVE INCONDITIONNELLE

Puisque < ( l+ h )

« h-'

pour h

> 1, on a pour 3/4 < O < 1

Prenant

avec C > O une constante assez petite, on obtient finalement

Remarque 7.4.6. - L'estimation donnée est uniforme en d et h . On pourrait à première vue se demander pourquoi ne pas traiter h comme fixé puisque cela semble être le cas pour l'estimation finale des sommes de Weyl. La raison est que, dans le chapitre suivant, on va utiliser le Théorème 7.4.5 avec des valeurs dqférentes de h pour traiter les formes bilinéaires du type (5.40) : cela est comparable à ce que l'on a fait dans la preuve de (5.49) ($ Corollaire 5.5.6). Remarque 7.4.7. - L'estimation obtenue est non triviale pour tout d et h tels que d < ( h Y )1 / 2 : en effet, la majoration triviale est

n=O (mod d )

que l'on compare aux deux termes « principaux » ( h ~ ) l et / ~ ( h ~ ) ~ / ~ d :- 'il/ ~ n'est donc pas étonnant que cette estimation soit suffisante pour démontrer l'hypothèse (5.41) portant sur les formes linéaires modulo d < x ' / ~ - & ,E > O. (Le gain par rapport à l'estimation triviale devient de plus en plus faible quand d augmente, mais ce n'est pas ce qui importe le plus : on voit là une manifestation très claire du fait que c'est l'uni$ormité par rapport au paramètre critique d qui est vitale - du moins tant que l'estimation est non triviale, même de peu !) Noter que pour d = 1 on trouve

pour Y 2 2. Ce résultat suffit (cf: la Section 8.2) à démontrer le résultat de Hooley [Ho] selon lequel les racines de x2 + D = O modulo n 2 1 sont équiréparties quand n -++cm (cJ: Remarque 1.4.6, (3))' et on a alors une bien meilleure estimation des sommes de Weyl puisque on gagne un facteur Y '14 par rapport à la majoration évidente.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2004

Appendice : les fonctions tranquilles Nous développons ici en quelques paragraphes des propriétés strictement élémentaires de la classe des fonctions « qui n'oscillent pas trop », vérifiant essentiellement des hypothèses du type (7.1) et (7.2). Ce genre de choses est parfaitement standard mais assez rarement explicité.

Définition 7.A.1. - Une fonction f : ] O, +oo [ + C est tranquille d'ordre k 2 1 si f est de classe ck,à support compact dans [ y2Y] avec Y > O, et ses dérivées vérifient pour O $ j $ k et x > 0. (La terminologie n'est pas standard). Comme mentionné dans l'introduction, de telles fonctions sont celles qui n'oscillent pas significativement. La constante pour la borne de f (ici 1 ) n'est bien entendu pas importante, puisqu'on peut souvent multiplier f par une constante non nulle pour satisfaire (7.27),mais permet d'éviter d'introduire un paramètre supplémentaire. Il est clair intuitivement que l'ensemble de ces fonctions doit être très stable. C'est ce que l'on va formaliser un peu ... Lemme 7.A.2. - Soit f u n e fonction tranquille d'ordre k . (1) Pour tout a > O , la fonction g(x) = f (ax) est tranquille d'ordre k . (2) 11existe u n e constante ck ne dépendant que de k tel que la fonction g(x) = ckf ( l / x ) est tranquille d'ordre k . Soient f et g des fonctions tranquille d'ordre k . (3) L a fonction fg est tranquille d'ordre k .

Démonstration. - (1) est évident puisque g à support compact dans [Z, 221 avec Z Y/a et g(j)(x) = ai f (j)(ax), donc 1 g(j)(x) 1 < 1 a' 1 Y -j = 2-j .

=

(2) s'obtient aisément par récurrence sur k : soit h(x) = f ( l / x ) . Alors h a support dans [Z, 221 avec Z = ( 2 ~ ) ~et' ' h(j) est combinaison linéaire de 2k termes du type x-" f (m) ( l / x ) avec n, m 2 O et n m = j , les coefficients étant fonction de n , m et j seulement. Comme

+


O ne dépendant que de j . Prenant ck = max(dyl) on obtient le résultat. (3) Il faut appliquer la formule de Leibniz pour la dérivée j-ème ... O

COURS SPÉCIALISÉS 13

CHAPITRE 8 ÉQUIRÉPARTITION DES RACINES DE CONGRUENCES QUADRATIQUES ET APPLICATIONS

8.1. Introduction Nous pouvons maintenant appliquer l'estimation du chapitre précédent (Théorème 7.4.5) et le théorème de crible de la Section 5.4 pour déduire le Théorème 1.2.1. Soit D > O un entier fixé et h # O un entier. On veut évaluer les sommes de Weyl

C

s h , ~ ( x > = C ~ h ( ~ > = C P O, et x 2 xo (E) indépendant de N, on a par celle-ci :

(utilisant 2-N (1 + 6)x

2 fi). Sommant sur N

on obtient

donc

pour x 3 xo , la constante implicite dans le facteur Q ( -) étant absolue ( $ ci-dessus). O Comme 6 > O et E > O sont arbitraires, on en déduit aussitôt la proposition. Pour démontrer (8.2), on va appliquer le Corollaire 5.4.11 à




O, la constante implicite ne

O

Dans B* (x) , puisque (m, n) = 1, une racine v de P (v) = O (mod mn) (où P = x2 D comme précédemment) équivaut, par le théorème chinois, à un couple (6,v ) où 6 (mod m) est une racine modulo m et v (mod n) une racine modulo n. On somme sur 6 pour chaque m fixé, et on applique alors l'inégalité de Cauchy-Schwarz,non sans avoir inséré au préalable un facteur

+

pour obtenir l'inégalité

Lemme 8.3.2. - La contribution à (8.7) des « termes diagonaux » où ni = n2 vémjîe

D < x2 (log x) 4w-1.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2004

CHAPITRE 8. ÉQUIRÉPARTITION DES RACINES DE CONGRUENCES QUADRATIQUES

208

Démonstration. - Posons n = ni = ng . La somme intérieure sur 6 et ~ ( m n )et~ ,

vi

est bornée par

+

ng, et on suppose ceux-ci fixés. Notons On considère maintenant le cas ni C*(nl, n2) la somme correspondante. Puisque ni et ng sont premiers, on a (ni, n2) = 1. Dans (8.7),les racines v l et v2 ont même réduction 6 modulo m, donc par le théorème chinois encore, le triplet (6, V I , v2) correspond bijectivement aux racines v (mod mnln2) de f,c'est-à-dire que

C

P ( 6 )=O P ( v i )=O ( m o d mni) v , S (modm)

vi=8 ( m o d m)

-

C

P ( v )=O ( m o d mnl n 2 )

et donc

Démonstration. - Il faut rajouter (de nouveau !) les termes avec (m, nln2) Puisque nl et ng sont premiers, il suffit de majorer

COURS SPÉCIALISÉS 13

>

1.

et la somme analogue avec n2 1 m au lieu de nl 1 m. Or 9

-

La somme C(ni, n2) est encore du type ('7.26),avec d = nln2 à la place de d (c'est un entier sans facteurs carrés), h = h (n2 - ni) à la place de h et

à la place de F. On remarque l'importance d'avoir une estimation qui soit aussi

uniforme en h dans le Théorème '7.4.5. Plus précisément, il faut normaliser j pour qu'elle vérifie (7.1) et ('7.2). Pour la première notons que C(ni, n2) = O sauf si

de sorte que avec

(en remplaçant les deux conditions

par la « moyenne géométrique » qu'elles impliquent). De plus comme O g(y) 1 on trouve


O si w est donné par (8.4) et v = x'/~-', la constante implicite dépendant de D , h, E et A. Cela est suffisant pour prouver (5.42) pour la suite (an) donnée par (8.3) et finir donc la démonstration de l'équirépartition des racines de l'équation x2 + D = O modulo p d'après le Corollaire 8.1.2.

8.4. Conclusion et applications Le Théorème 1.2.1 possède un certain nombres d'applications que nous présentons ici, de la plus intéressante à la plus anecdotique (qui reste d'ailleurs inachevée) ... La plus intéressante est déjà présente dans l'article de Duke-Friedlander-Iwaniec : il s'agit de déduire du théorème l'équirépartition des angles de sommes de Salié. Commençons par définir ces proches cousines des sommes de Kloosterman. DéJinition 8.4.1. - Soient a, b E Z et c T(a,b;c) =

2 1 un entier. On note

ax + bZ C* (E).e(-) c C

x (mod c )



(+) est le symbole de Jacobi modulo c, cf. Exemple 2.4.6. On utilisera simplement le cas c = p premier dans la suite. On a alors :

COURS SPÉCIALISÉS 13

211

8.4. CONCLUSION ET APPLICATIONS

Théorème 8.4.2. - Soient a , b des entiers tels que ab n'est pas un carré. Alors pour tout premier tel que j!~ii 2a il existe un unique « angle » Op E [O,n ] tel que

p

T ( a ,b;f i ) = 2T ( a ,0 ;fi) cos Op et quand fi -+ +oo, les angles Op sont équirépartis dans [O,n ] pour la mesure de Lebespe normalisée n- dx . La première partie est bien connue, et se déduit aussitôt du calcul explicite suivant : Lemme 8.4.3. - O n a pour tout p f 2a

La preuve ci-dessous est due à P. Sarnak [Sa].

Démonstration. - Notons x p le caractère de Legendre modulo fi (Exemple 2.6.10, ( 3 ) ) :

Il sera utile de noter aussi que

pour z # O : en effet puisque 1 + x p ( x ) est le nombre de solution de y2 = x dans Z / p Z , on a O

=

xp( z )T (xp)

en posant xz = y.

On considère plus généralement

où a E Z / p Z . Par « transformation de Fourier >> sur Z/pZ (cJ: Proposition 2.4.5) on a

avec

s o c r É ~ ÉMATHÉMATIQUE

DE FRANCE 2004

212

CHAPITRE 8. ÉQUIRÉPARTITION DES RACINES DE CONGRUENCES QUADRATIQUES

Or on calcule

en complétant le carré (puisque 2a

Comme aussi g (wz) =

# O dans Z/pZ)

:

xp (z) g ( w ) il vient, après disparition du symbole de Legendre, s(a) = g(a) =*

A

*

b

x (modp)

-

p2G) P

et la dernière somme est la somme de Ramanujan cp(b - p2&) ($ 2.52). Donc par (8.13) et le calcul (direct ici puisque le module est premier) de cp(m) , en prenant a = 1 il vient

=g(4

4ab-p2=0 (modp)

d'où le résultat par un dernier changement de variable et (8.12) puisque

Rimarque 8.4.4. - Cet énoncé peut se généraliser facilement à T (a, b; c) pour tout c tel que (2a, c) = 1. Noter que l'on obtient aussitôt

+

pour p Za, c'est-à-dire l'analogue exact de l'estimation de Weil (7.21) pour les sommes de Kloosterman, mais avec une preuve infiniment plus simple. On peut se demander s'il existe une bonne raison pour que les sommes de Salié soient ainsi plus faciles à calculer que les sommes de Kloosterman. C'est effectivement le cas et cela provient de la très forte analogie entre les sommes de Kloosterman ou de Salié et les fonctions de Bessel : par exemple, on peut comparer (6.23) et (7.18) ou (8.11), en notant que t H t-\) est un 1 (fixé, k = 23 convient) de facteurs premiers(2). En plus des expériences numériques aisément réalisables qui sont très convaincantes, une certaine confirmation théorique de la conjecture est la validité de son analogue «vertical »,prouvé par N. Katz [K2]: rappelons que Op dépend de a et b. Notons alors maintenant O p , l'angle correspondant à S (a, 1;p) . Alors pour p -+ +CO, les p - 1 angles (Op,,) où a E FX P deviennent équirépartis pour p, c'est-à-dire que

pour toute fonction continue f E C ( [O, n]) . La preuve de ce résultat fait appel aux résultats profonds de Deligne concernant l'Hypothèse de Riemann sur les corps finis (conjectures de Weil). (*)Leurs arguments sont cependant clairement inopérants lorsque k = 1.

COURS SPÉCIALISÉS 13

215

8.4. CONCLUSION ET APPLICATIONS

La seconde application du théorème principal est due à M. van der Put [VdP] et concerne, aussi étrange que cela paraisse, un cas particulier d'une généralisation d'une conjecture de Katz-Grothendieck concernant originellement la relation entre l'existence de solutions algébriques d'une équation différentielles linéaire à coefficients ai E Q(z), et sa résolubilité modulo premier pour presque tout p (voir l'introduction de [VdP] pour un énoncé simple et rigoureux). La généralisation est une conjecture de Beukers : soient a, b E Q(z) des fractions rationnelles, alors si l'équation différentielle = ay + b

a une solution modulo p dans Fp(z) pour presque tout p, il existe une solution rationnelle y E Q (z) . Le théorème de Duke-Friedlander-Iwaniec permet de traiter un cas particulier. Précisément, on a :

Proposition 8.4.7 (van der Put). - Soit a E Q (z) une fraction rationnelle dont le dénominateur est un polynôme irréductible de degré 2. Alors la conjecture ci-dessus est vraie. Démonstration. - Pour simplifier, on considérera seulement le cas

avec a , p E Q , a & Z et p # O. Dans ce cas il n'y a pas de solution y E Q(z) et il faut donc démontrer qu'il existe une infinité de p premiers tels que l'équation modulo n'a pas de solution dans Fp(2). Soit p =. 1 (mod 4). On note {d) pour d E Fp le représentant entier de d tel que O {d} p - 1. Il existe un unique i E Fp tel que i2 E -1 (modp) et { i } < p/2 (cf: Lemme 1.3.3). Grâce à l'identité


p - 2, c'est-à-dire si Il s'agit là clairement d'une condition portant sur la localisation de la racine i de la congruence i2+l = O (modp) , et donc en relation avec le théorème d'équirépartition de Duke-Friedlander-Iwaniec. Nous laissons le cas général au lecteur et supposons pour simplifier que a = 1/2 et P = 2 : dans ce cas l'inégalité (8.1'7) devient {1/4

+ i) + {1/4

Comme j5 = 1 (mod 4), on a {1/4) = (3p en question équivaut à

-

i)

+ 1)/4

< p. et on voit aussitôt que l'inégalité

6 {i) < P-, en particulier elle est vraie si -1 < 4 2 4 {1/4 - 6) ne prend que deux puisque on vérifie que la fonction f ( b ) = {1/4 b) b < p/2, à savoir (3p 1)/2 > pour 0 6 b < (p - 1)/4 et valeurs pour O (p+ 1)/2 < p pour (p- 1)/4 b < P R .


max{l +m2 1 m E S) et p = 1 (mod4). Il existe m 1 tel que p 1 m2 + 1 (c'est-à-dire m2 = -1 (modp)),et nécessairement m & S, tandis que (par le même raisonnement utilisé dans la preuve du lemme) soit arctan (m) est irréductible, soit arctan (m) s'écrit sous la forme (8.18) avec mj & S. Dans tous les cas, on a construit un élément irréductible hors de S, ce qui donne N (x) -+ + m . Nous allons voir qu'un raisonnement simple basé sur une extension possible du théorème d'équirépartition amène à une conjecture précise :

Conjecture 8.4.10. - On a

N (x) quand x + + m . COURS SPÉCIALISÉS 13

-

(log 2)x

219

8.4. CONCLUSION ET APPLICATIONS

D'après le lemme, arctan(m) est irréductible si et seulement si il existe p 1 m2 + 1 tel que 2 2m. Or un tel p est alors unique puisque fi q implique pq 2 4m2 > m2 + 1. On peut donc écrire


z.]

< 1, /Pn/ < 1.

EXAMEN - BORDEAUX, MAI 2002

En déduire que pour tout

E

> O on a

et enfin

C P(m)e(am)« ( q1/2,1/2

+ q-1/2x + ,4/5),~

rngx

pour tout E > O, la constante implicite ne dépendant que de E . (3) On rappelle que sous l'Hypothèse de Riemann Généralisée, on a

x

pour tout caractère de Dirichlet modulo q, où la constante implicite est absolue. En déduire que pour tout q 2 1, (a, q) = 1, on a

[Indication : Utiliser les sommes de Gauss.] (4) Soit a E R, Q 2 1. Montrer qu'il existe q

< Q et (a, q) = 1 tels que

et en déduire pour tout E > 0. ( 5 ) Montrer que pour tout a E R, on a sous l'Hypothèse de Riemann Généralisée

avec une constante implicite absolue. (6) Pensez-vous que l'on puisse estimer non-trivialement la somme ci-dessus (avec un résultat éventuellement moins bon ...) sans faire appel à l'Hypothèse de Riemann Généralisée? De plus, pensez-vous que l'exposant 5/6 soit le meilleur possible ou pas ? Problème 3. Soit cp une fonction COo sur [O, +oo [ telle que O

< cp < 1, cp (y) = 1 pour

(1) Montrer que la transformée de Mellin de cp a un pôle simple en s = O dont on calculera le résidu x et n'a pas d'autres singularités pour o > - 1.

EXAMEN - BORDEAUX, MAI 2002

(2) Montrer que pour tout t 3 0, X 2 1, la constante implicite ne dépendant que de cp. (3) Soit T > O. Soit f (t) la fonction continue définie sur R telle que

et f est linéaire sur les deux segments [-N, O] et [T,T + NI. Montrer que

+

vérifie F(1) = T N et F(x) « ~ - ' ( l o ~ x )si- x~# 1. (4) Soient (a,), n N, des nombres complexes quelconques et