40
INTRODUCTION À LA THÉORIE DES NOMBRES COURS DE M1 par Laurent Berger Table des matières 1. Corps de nombres .................................................... 2 2. Entiers algébriques ................................................... 4 3. Anneaux de Dedekind ................................................ 7 4. Corps finis et résidus quadratiques ................................... 10 5. Groupes de classes ................................................... 12 6. Le premier cas du théorème de Fermat ............................... 13 7. Formes quadratiques binaires ......................................... 15 8. Géométrie des nombres ............................................... 20 9. Unités ............................................................... 24 10. Correspondance de Galois ........................................... 27 11. Corps cyclotomiques ................................................ 28 12. Lois de réciprocité .................................................. 29 13. La fonction ζ de Dedekind .......................................... 32 14. Fonctions L ......................................................... 35 Références .............................................................. 40

INTRODUCTION À LA THÉORIE DES NOMBRES …perso.ens-lyon.fr/laurent.berger/autrestextes/PolyM1TDN.pdf · INTRODUCTION À LA THÉORIE DES NOMBRES COURS DE M1 par LaurentBerger Tabledesmatières

  • Upload
    lamhanh

  • View
    220

  • Download
    0

Embed Size (px)

Citation preview

INTRODUCTION À LA THÉORIE DES NOMBRESCOURS DE M1

par

Laurent Berger

Table des matières

1. Corps de nombres. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22. Entiers algébriques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43. Anneaux de Dedekind. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74. Corps finis et résidus quadratiques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105. Groupes de classes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126. Le premier cas du théorème de Fermat. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137. Formes quadratiques binaires. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158. Géométrie des nombres. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209. Unités. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2410. Correspondance de Galois. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2711. Corps cyclotomiques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2812. Lois de réciprocité. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2913. La fonction ζ de Dedekind. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3214. Fonctions L. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35Références. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

2 LAURENT BERGER

1. Corps de nombres

Soit K un corps qui contient Q (par exemple K = R ou C). Un nombre α ∈ K est ditalgébrique s’il est racine d’un polynôme à coefficients dans Q.

Proposition 1.1. — Si α ∈ K, alors les propriétés suivantes sont équivalentes :

1. α est algébrique ;

2. Q[α] est de dimension finie sur Q ;

3. Q[α] = Q(α).

Démonstration. — Montrons que (1) implique (2) ; si α est annulé par P (X), alors Q[α]est un quotient de Q[X]/P (X) et est donc de dimension finie sur Q.

Montrons que (2) implique (3) ; si β ∈ Q[α] est non nul, alors la multiplication par βest un endomorphisme injectif de Q[α] qui est alors surjectif comme on est en dimensionfinie, ce qui fait que tout élément non nul de Q[α] a un inverse et que Q[α] est un corps.

Montrons que (3) implique (1) ; on a 1/α ∈ Q[α] et il existe donc R(X) tel que1/α = R(α) ce qui fait que α est annulé par le polynôme P (X) = XR(X)− 1.

Le degré de α est alors défini par deg(α) = dimQ(Q[α]). On déduit de la propositionque si α, β ∈ K sont algébriques, alors α ± β et αβ et α/β le sont aussi. En effet, ilsappartiennent tous à Q[α, β] qui est engendré par les αiβj avec 0 ≤ i ≤ deg(α) − 1 et0 ≤ j ≤ deg(β)− 1.

Si α est algébrique, alors Iα = {P (X) ∈ Q[X] tels que P (α) = 0} est un idéal de Q[X]dont on note Pmin,α le générateur unitaire, c’est le polynôme minimal de α. Ce polynômeest irréductible sur Q et il est scindé à racines simples sur C. Son degré est celui de α.

L’ensemble des nombres algébriques de C est dénombrable. Le résultat suivant permetde construire des exemples d’éléments de R qui ne sont pas algébriques.

Théorème 1.2. — Si α ∈ R est irrationel et algébrique de degré d, alors il existe c > 0telle que ∣∣∣∣∣α− p

q

∣∣∣∣∣ ≥ c

qd

pour tous p, q ∈ Z (q 6= 0).

Démonstration. — Soit P = m · Pmin,α où m ∈ Z≥1 est tel que P (X) ∈ Z[X]. Si α ∈ Ret p, q ∈ Z (q 6= 0), il existe y ∈ [α; p/q] tel que P (α)− P (p/q) = (α− p/q) · P ′(y). On aP (α) = 0 et P (p/q) ∈ 1/qd · Z \ {0} ce qui fait que |α − p/q| ≥ 1/qd · 1/|P ′(y)|. Il suffitalors de prendre c = min(1,miny∈[α−1;α+1] 1/|P ′(y)|).

INTRODUCTION À LA THÉORIE DES NOMBRES 3

Par exemple, on en déduit que ∑k≥0 1/2k! n’est pas algébrique.

Définition 1.3. — Un corps de nombres est une extension finie K de Q. Son degré noté[K : Q] est la dimension de K sur Q.

Le résultat ci-dessous (le théorème de l’élément primitif) va nous simplifier la vie.

Théorème 1.4. — Si K est un corps de nombres, alors il existe α ∈ K tel que K =Q(α).

Démonstration. — Comme K est de dimension finie sur Q, il existe α1, . . . , αk ∈ K telsque K = Q(α1, . . . , αk) et pour montrer le théorème, il suffit donc de montrer que siK = Q(x, y), alors il existe z ∈ K tel que K = Q(z). Pour cela, plaçons nous dans uneextension de K qui contient les racines x1 = x, x2, . . . , xr de Pmin,x(X) et les racines y1 =y, y2, . . . , ys de Pmin,y(X). Comme Q est infini, il existe t ∈ Q tel que xi+tyj 6= x+ty pourtout (i, j) 6= (1, 1) et on pose z = x+ty. Si on pose Q(X) = (X−z+ty1) · · · (X−z+tys),alors Q(X) = (−t)sPmin,y((X − z)/(−t)) est à coeffcients dans Q(z) et l’hypothèse faitesur t implique que le pgcd de Q(X) avec Pmin,x(X) est X − x ce qui fait que x ∈ Q(z).On a de même y ∈ Q(z) et donc on a bien Q(x, y) = Q(z).

Si L/K est une extension de corps de nombres, alors il existe α ∈ L tel que L = Q(α)et donc a fortiori, L = K(α).

Rappelons que C est algébriquement clos. Si K est un corps de nombres, alors unplongement de K dans C est un morphisme de corps σ : K → C. Par le théorème 1.4, ilexiste α ∈ K tel que K = Q[α] = Q[X]/(Pmin,α(X)) et il existe donc deg(α) plongementsdistincts de K dans C, donnés par σi(α) = αi où α1, . . . , αd sont les racines de Pmin,α(X)dans C. On a donc aussi Pmin,α(X) = ∏

σ:K→C(X − σ(α)).Un plongement σ est dit réel si σ(K) ⊂ R et complexe sinon. Dans ce dernier cas, σ

et σ sont distincts. Le corps K admet donc r1 plongements réels dans C et r2 paires deplongements complexes conjugués, avec d = r1 + 2r2.

Plus généralement, on a le résultat ci-dessous qui se démontre de la même manière.

Proposition 1.5. — Si L/K est une extension de corps de nombres de degré d et siσ : K → C est un plongement, alors il existe d plongements distincts de L dans C dontla restriction à K est σ.

Soit K un corps de nombres et x ∈ K et mx : K → K l’application de multiplicationpar x. C’est un endomorphisme Q-linéaire et on pose TrK/Q(x) = Tr(mx) et NK/Q(x) =det(mx).

4 LAURENT BERGER

Proposition 1.6. — Si σ1, . . . , σd sont les plongements de K dans C, alors TrK/Q(x) =σ1(x) + · · ·+ σd(x) et NK/Q(x) = σ1(x) · · ·σd(x).

Démonstration. — Remarquons que si R(X) ∈ Q[X], alors R(mx) = mR(x) et donc que lepolynôme minimal de l’endomorphisme mx est Pmin,x(X). On en déduit que si K = Q(x),alors mx est diagonalisable à valeurs propres σ1(x), . . . , σd(x) chacune étant comptée avecmultiplicité un ce qui montre la proposition dans ce cas. En général, K est une extensionde Q(x) de degré e et K est la somme de e copies de Q(x) stables par mx ce qui faitque TrK/Q(x) = e · TrQ(x)/Q(x) et que NK/Q(x) = (NQ(x)/Q(x))e. Par ailleurs, chaqueplongement σi de Q(x) dans C s’étend en e plongements distincts de K dans C, quiprennent la même valeur σi(x) sur x. On en déduit la proposition dans le cas général.

On utilise la trace pour définir une forme bilinéaire 〈·, ·〉K : K × K → Q don-née par 〈x, y〉K = TrK/Q(xy). Cette forme est non dégénérée car 〈x, 1/x〉K = [K :Q] 6= 0. Si α1, . . . , αd sont d éléments de K, alors le discriminant de cette famille estdisc(α1, . . . , αd) = det(〈αi, αj〉K). On a alors :

disc(α1, . . . , αd) = det(〈αi, αj〉K) = det(t(σi(αj))i,j · (σi(αj))i,j) = det((σi(αj))i,j)2.

En particulier, si (αi) = M · (βi) avec M ∈ Md(Q), alors disc(αi) = det(M)2 disc(βi).Notons aussi que disc(α1, . . . , αd) = 0 si et seulement si α1, . . . , αd sont liés sur Q. Enfinsi K = Q(α), alors :

disc(1, α, . . . , αd−1) = det

1 σ1(α) σ1(αd−1)... ... . . .

...1 σd(α) σd(αd−1)

2

=∏i<j

(σi(α)− σj(α))2

= ±NK/Q P′min,α(α).

2. Entiers algébriques

Si K est un corps de nombres, alors on dit que α ∈ K est entier si Pmin,α(X) ∈ Z[X].

Proposition 2.1. — Si α ∈ K, alors les propriétés suivantes sont équivalentes :

1. α est entier ;

2. il existe P ∈ Z[X] unitaire tel que P (α) = 0 ;

3. Z[α] est un Z-module de type fini.

INTRODUCTION À LA THÉORIE DES NOMBRES 5

Démonstration. — Le fait que (1) implique (2) est évident et le fait que (2) implique (1)suit du lemme de Gauss : si P (α) = 0, alors Pmin,α(X) divise P (X) et est donc unitaireà coefficients dans Z[X].

Montrons que (2) implique (3) : si P (α) = 0 et si d = deg(P ), alors αd ∈ Z + Zα +· · ·+ Zαd−1 et par récurrence, on trouve que Z[α] = Z + Zα+ · · ·+ Zαd−1 ce qui montreque Z[α] est de type fini.

Montrons enfin que (3) implique (2). Soit x1, . . . , xn une famille génératrice de Z[α]. Ilexiste M ∈Mn(Z) telle que (αxi) = M · (xi) ce qui fait que (α Id−M)(xi) = (0) et doncdet(α Id−M) = 0 ce qui fait que P (α) = 0 avec P (X) = det(X Id−M) qui est unitaireà coefficients entiers.

En particulier, si α, β ∈ K sont entiers, alors α ± β et αβ le sont aussi. On note OKl’ensemble des entiers de K et c’est donc un anneau.

Théorème 2.2. — Si K est un corps de nombres, alors OK est un Z-module libre derang d = [K : Q].

Démonstration. — Commençons par remarquer que si α ∈ K, alors il existe m ∈ Z telque mα ∈ OK . En effet, si αn + an−1α

n−1 + · · ·+ a0 = 0 avec ai ∈ Q, alors en mutlipliantcette relation par mn, on trouve (mα)n + man−1(mα)n−1 + · · · + mna0 = 0 et il suffitdonc de prendre m tel que mai ∈ Z pour tout i. On déduit de cela qu’il existe des entiersα1, . . . , αd qui forment une base de K/Q. Si α ∈ OK , on peut donc écrire α = ∑d

i=1 xiαi

avec xi ∈ Q. En appliquant les d plongements σ1, . . . , σd à cette relation, on trouve :σ1(α)

...σd(α)

=

σ1(α1) . . . σ1(αd)

...σd(α1) . . . σd(αd)

x1...xd

,et donc :

x1...xd

=

σ1(α1) . . . σ1(αd)

...σd(α1) . . . σd(αd)

−1

σ1(α)...

σd(α)

= disc(αi)−1 det((σi(αj))ij) · tco

σ1(α1) . . . σ1(αd)

...σd(α1) . . . σd(αd)

σ1(α)

...σd(α)

.On déduit de l’équation ci-dessus que disc(αi)xj appartient à OK quel que soit j et doncà Q ∩ OK = Z ce qui fait que l’on a

⊕dj=1Z · αj ⊂ OK ⊂ ⊕dj=1Z · disc(αi)−1αj

et donc OK est bien libre de rang d.

6 LAURENT BERGER

Une famille α1, . . . , αd de OK telle que OK = ⊕di=1Zαi s’appelle une base entière de K.Si (αi) et (βi) sont deux bases entières de K, alors on a (αi) = M · (βi) avec M ∈ GLd(Z)ce qui fait que disc(αi) = disc(βi), et ce nombre ne dépend donc pas du choix de la baseentière. Le discriminant de K est le discriminant d’une base entière de K.

Lemme 2.3. — Si α1, . . . , αd est une famille libre de OK et si disc(αi) est sans facteurcarré, alors α1, . . . , αd est une base entière de K.

Démonstration. — Si (βi) est une base entière de K, alors il existe M ∈Md(Z) telle que(αi) = M · (βi) et donc disc(αi) = det(M)2 disc(βi). Le fait que disc(αi) est sans facteurcarré implique que det(M) = ±1 et donc que α1, . . . , αd est une base entière de K.

Exemple 2.4. — Si p ≥ 3 est premier, l’anneau des entiers de K = Q(ζp) est Z[ζp].

Démonstration. — Soit π = ζp − 1. Le polynôme P (X) = ((1 +X)p − 1)/X annule π etest irréductible par le critère d’Eisenstein ; c’est donc le polynôme minimal de π. On endéduit que [K : Q] = p− 1, que NK/Q(π) = p et que πp−1 ∈ pOK .

On calcule NK/Q(P ′(π)) en écrivant XP (X) = (1 + X)p − 1 et on trouve quedisc(1, π, . . . , πp−2) = ±pp−2. Ceci montre que Z[π] ⊂ OK ⊂ p−(p−2)Z[π].

Pour montrer que Z[π] = OK , il faut alors voir que si x ∈ OK vérifie px ∈ Z[π], alorsx ∈ Z[π]. Écrivons px = y0+y1π+· · ·+yp−2π

p−2. En multipliant par πp−2 et en utilisant lefait que πp−1 ∈ pOK , on trouve que y0π

p−2 ∈ pOK et en prenant la norme que yp−10 ∈ pZ

ce qui fait que y0 ∈ pZ. On traite les autres yi de la même manière.

Lemme 2.5. — Si x ∈ OK est un entier non nul tel que |σ(x)| ≤ 1 pour tout plongementσ : K → C, alors x est une racine de l’unité.

Démonstration. — On peut supposer que K = Q(x). Le polynôme Pmin,x(X) annule les{σ(x)}σ:K→C et donc ∏σ:K→C(X − σ(x)) = Pmin,x(X) ∈ Z[X]. La théorie des polynômessymétriques implique que P (k)(X) = ∏

σ:K→C(X − σ(xk)) ∈ Z[X] pour tout k ≥ 1.On a |σ(xk)| ≤ 1 quel que soit k ≥ 1 et les coefficients a(k)

i du polynôme P (k)(X)vérifient donc |a(k)

i | ≤(dk

)avec d = [K : Q]. L’ensemble des σ(xk) avec k ≥ 1 et

σ : K → C est donc fini et il existe donc σ : K → C et i > j tels que σ(xi) = σ(xj) cequi fait que x est une racine (i− j)-ième de l’unité.

INTRODUCTION À LA THÉORIE DES NOMBRES 7

3. Anneaux de Dedekind

Si K est un corps de nombres, alors on cherche à étendre à OK l’arithmétique usuellesur Z. Cela nous amène à nous poser les questions suivantes : est-ce que OK est un anneauprincipal ? Que dire de la factorisation dans OK ?

Si K = Q(√−5), alors OK = Z[

√−5] n’est pas factoriel car :

6 = 2× 3 = (1 +√−5)× (1−

√−5),

alors que 2 et 3 et 1±√−5 sont irréductibles. L’idée de Dedekind a été de remplacer les

éléments de OK par les idéaux de OK . Dans Z[√−5], on a alors :

6 = (2, 1 +√−5) · (2, 1−

√−5) · (3, 1 +

√−5) · (3, 1−

√−5),

et chacun des idéaux ci-dessus est un idéal premier.Un anneau de Dedekind est un anneau A qui satisfait les trois propriétés suivantes :

1. A est intègre et noethérien ;

2. si I est un idéal premier non nul de A, alors I est maximal ;

3. A est intégralement clos (par exemple, si K = Frac(A) est un corps de nombres,alors A est l’anneau des entiers de K).

Proposition 3.1. — Si K est un corps de nombres, alors OK est un anneau de Dede-kind.

Démonstration. — L’anneau OK est intègre car OK ⊂ K et il est noethérien car c’est unZ-module libre de rang d, ce qui montre le (1). Si I est un idéal non nul, alors il existem ∈ Z∩ I non nul (si x ∈ I et P (x) = 0, alors P (0) ∈ Z∩ I) ce qui fait que OK/I est finipuisque c’est un quotient de (Z/mZ)d. Si I est premier alors OK/I est intègre, et commeun anneau intègre fini est un corps, I est maximal ce qui montre le (2). Enfin le (3) suitde la définition de OK .

Un idéal fractionnaire de A est un A-module I ⊂ K tel qu’il existe x 6= 0 ∈ A vérifiantx · I ⊂ A. Comme xI · yJ = xyIJ , le produit de deux idéaux fractionnaires est un idéalfractionnaire. Nous allons montrer que l’ensemble des idéaux fractionnaires non nuls deA forme un groupe, de neutre A.

Lemme 3.2. — Si A est un anneau noethérien, alors tout idéal non nul I de A contientun produit d’idéaux premiers non nuls.

Démonstration. — Rappelons que dans un anneau noethérien A, tout ensemble non vided’idéaux de A admet un élément maximal. S’il existe un idéal I qui ne contient pas un

8 LAURENT BERGER

produit d’idéaux premiers non nuls, on peut donc supposer que I est maximal parmi cesidéaux-là ; en particulier, il n’est pas premier et il existe donc r, s ∈ A \ I tels que rs ∈ I.Les idéaux (I, r) et (I, s) contiennent tous les deux un produit d’idéaux premiers nonnuls et comme (I, r) · (I, s) ⊂ I, on a une contradiction.

Lemme 3.3. — Si I est un idéal propre de A, alors il existe λ ∈ K \A tel que λI ⊂ A.

Démonstration. — Soient a ∈ I et p un idéal maximal tel que I ⊂ p. Par le lemmeprécedent appliqué à l’idéal (a), il existe des idéaux premiers p1, . . . , pr non nuls tels que :

p1 · · · pr ⊂ (a) ⊂ I ⊂ p

et p est alors l’un des pi disons p1. On peut supposer que r est minimal et donc quep2 · · · pr 6⊂ (a) ce qui fait qu’il existe b ∈ p2 · · · pr tel que b /∈ (a), c’est-à-dire queλ = b/a ∈ K \ A. Si x ∈ I, alors x ∈ p = p1 et donc bx ∈ p1 · · · pr ⊂ (a) ce qui revient àλx ∈ A.

Si I est un idéal fractionnaire de A, on pose I−1 = {x ∈ K tels que xI ⊂ A}.

Proposition 3.4. — Si I est un idéal fractionnaire non nul de A, alors I−1 est un idéalfractionnaire de A et I · I−1 = A.

Démonstration. — Si y ∈ I∩A, alors yI−1 ⊂ A et donc I−1 est bien un idéal fractionnairede A. De plus, cela implique que I ·I−1 est un idéal de A, et il reste à montrer qu’il coïncideavec A. Si ce n’était pas le cas, alors le lemme précédent appliqué à I · I−1 nous fourniraitλ ∈ K \A tel que λI · I−1 ⊂ A et par définition de I−1 cela impliquerait que λI−1 ⊂ I−1

et donc que pour tout n ≥ 1 on aurait λnI−1 ⊂ I−1. Si x ∈ I−1, on a alors λn ∈ x−1y−1A

et donc A[λ] est un A-module libre de type fini ce qui fait que λ ∈ A puisque A estintégralement clos, contradiction.

Corollaire 3.5. — L’ensemble des idéaux fractionnaires non nuls de A forme un groupepour la multiplication, de neutre I = A.

Remarquons que si I et X sont deux idéaux de A, alors on peut écrire I = XY avecY un idéal de A si et seulement si I ⊂ X. Un sens est trivial et si I ⊂ X, alors on poseY = X−1I. Le fait que I ⊂ X implique que Y ⊂ A.

Théorème 3.6. — Tout idéal non nul de A s’écrit d’une et une seule manière commeun produit d’idéaux premiers non nuls.

Démonstration. — Il faut montrer l’existence et l’unicité de la décomposition. Commen-çons par l’existence. L’ensemble des idéaux qui ne sont pas un produit d’idéaux premiers

INTRODUCTION À LA THÉORIE DES NOMBRES 9

admet un élément maximal I ; cet idéal est inclus dans un idéal maximal p et commeI ⊂ p, on peut écrire I = pJ . Comme I ⊂ J , on peut écrire J comme produit d’idéauxpremiers J = p1 · · · pr et donc I = pp1 · · · pr.

Montrons maintenant l’unicité de la décomposition. Si l’on avait une égalité p1 · · · pr =q1 · · · qs alors p1 · · · pr ⊂ q1 et donc il existe i (disons i = 1 quitte à renuméroter) tel quepi = q1 ce qui fait qu’en multipliant par p−1

1 = q−11 on trouve que p2 · · · pr = q2 · · · qs.

Ceci permet de conclure par récurrence que r = s et que quitte à réordonner, on a pi = qi

pour tout i.

Soit p un nombre premier de Z et K un corps de nombres. Par le théorème 3.6, l’idéal(p) de OK se décompose en un produit pe1

1 · · · perr où les pi sont des idéaux premiers

distincts contenant p et ei ≥ 1. Les idéaux p1, . . . , pr s’appellent les idéaux premiers deOK au-dessus de p. Comme pi est maximal, OK/pi est un corps de caractéristique p etdonc de cardinal pfi où fi ≥ 1. On dit que ei est l’indice de ramification de pi et que fi estle degré d’inertie de pi. Réciproquement, si p est un idéal premier de OK alors p∩Z = pZpour un nombre premier p et p est alors l’un des pi.

Lemme 3.7. — Si p est un idéal premier de OK et e ≥ 1, alors OK/pe est principal.On a card(OK/pe) = card(OK/p)e.

Démonstration. — Les idéaux de OK/pe sont en bijection avec les idéaux de OK quicontiennent pe et sont donc des puissances de p/pe. Soit π ∈ p\p2. On a (π) = p ·q1 · · · qravec qi 6= p pour tout i. Comme pe + qi = OK , on a bien (π) = p dans OK/pe. Ceciimplique que pk/pk+1 est un OK/p-espace vectoriel de dimension 1, engendré par πk. Lecardinal de OK/pe en suit par dévissage.

Corollaire 3.8. — Si pOK = pe11 · · · per

r , alors∑ri=1 eifi = d.

Démonstration. — On a card(OK/pOK) = pd. Par ailleurs, OK/pOK = ∏ri=1OK/p

eii et

donc pd = p∑r

i=1 eifi par le lemme précédent.

La proposition suivante donne un moyen de calculer la décomposition des idéaux pre-miers si l’anneau des entiers de K est monogène.

Proposition 3.9. — Soit K un corps de nombres et α ∈ OK tel que OK = Z[α] et Q(X)le polynôme minimal de α. Si p est un nombre premier, soit Q(X) = Q1(X)e1 · · ·Qr(X)er

la décomposition de Q(X) dans Fp[X] où les Qi(X) sont unitaires irréductibles et dis-tincts. Soit Qi(X) ∈ Z[X] unitaire qui se réduit sur Qi(X) et pi = (p,Qi(α)).

L’idéal pi est alors premier dans OK, les pi sont distincts, et pOK = pe11 · · · per

r .

10 LAURENT BERGER

Démonstration. — On a OK/pi = Z[X]/(p,Q(X), Qi(X)) = Fp[X]/Qi(X) qui est uncorps car Qi(X) est irréductible. Ceci montre que pi est premier. Par ailleurs pi + pj =(p,Qi(α), Qj(α)) = OK et donc les pi sont premiers entre eux. Enfin soit fi = deg(Qi(X)).On a Q(X) = ∏

Qi(X)ei + pR(X) ce qui fait que ∏Qi(α)ei ∈ pOK et donc pe11 · · · per

r ⊂pOK . Comme ∑r

i=1 eifi = d, cette inclusion est une égalité par le corollaire 3.8.

Corollaire 3.10. — Si K est un corps de nombres tel que OK est monogène, et si p estpremier, alors p est ramifié dans K si et seulement si p divise disc(K).

Démonstration. — On a disc(K) = ±NK/Q P′min,α(α) = ±res(P, P ′) et donc p divise

disc(K) si et seulement si Pmin,α(X) a une racine double dans Fp[X].

Ce corollaire est toujours vrai même si OK n’est pas monogène, mais la démonstrationest plus technique.

4. Corps finis et résidus quadratiques

La décomposition des nombres premiers dans les corps quadratiques demande de savoirquels entiers sont des carrés modulo un nombre premier donné, ce que nous étudions àprésent. Dans tout ce chapitre, p est un nombre premier avec p 6= 2. Rappelons que F×pest un groupe cyclique de cardinal p − 1. L’application x 7→ x2 de F×p → F×p a pournoyau {±1} et son image est donc de cardinal (p − 1)/2. Si a ∈ Z, on dit que a est uncarré modulo p, ou encore un résidu quadratique modulo p, si l’image de a dans Fp estun carré. On définit une fonction, le symbole de Legendre

(·p

)→ {0,±1} par

(ap

)= 0 si

p divise a,(ap

)= 1 si a est un carré non nul modulo p et

(ap

)= −1 si a n’est pas un carré

modulo p.

Lemme 4.1. — On a(ap

)≡ a(p−1)/2 mod p.

Démonstration. — On a manifestement(ap

)≡ a(p−1)/2 mod p si a est un carré modulo p.

Le polynôme Xp−1−1 est le produit de X(p−1)/2−1 par X(p−1)/2+1 et est décomposé dansFp[X]. Les racines de X(p−1)/2 − 1 sont les carrés non nuls et les racines de X(p−1)/2 + 1sont donc les non-carrés.

Ceci implique que(abp

)=(ap

)×(bp

).

Exemple 4.2. — On a(−1p

)= 1 si p = 1 mod 4 et

(−1p

)= −1 si p = 3 mod 4.

Démonstration. — On a(−1p

)≡ (−1)(p−1)/2 mod p.

INTRODUCTION À LA THÉORIE DES NOMBRES 11

Le théorème suivant est la célèbre loi de réciprocité quadratique, conjecturée par Euleret Legendre, et démontrée (six fois !) par Gauss (1801).

Théorème 4.3. — Si p et q sont deux nombres premiers impairs, alors :(pq

)=(qp

)· (−1)

(p−1)(q−1)4 , et

(2p

)= (−1)

p2−18 .

Démonstration. — Soit ζ = exp(2iπ/p) et a ∈ Z. On se place dans K = Q(ζ). On définitles sommes de Gauss par G(a) = ∑p−1

k=0

(kp

)ζak. On voit que G(a) =

(ap

)G(1). Par ailleurs,

p−1∑a=0

G(a)G(−a) =p−1∑a=0

p−1∑k,j=0

(k

p

)(j

p

)ζak−aj =

p−1∑k,j=0

(k

p

)(j

p

) p−1∑a=0

ζak−aj = p(p− 1).

En particulier, si on pose p∗ =(−1p

)p, alors G(1)2 = p∗ et donc (p∗)(q−1)/2 = G(1)q−1. On

a G(1)q −(qp

)·G(1) ∈ qOK et donc G(1) · (p∗)(q−1)/2 −

(qp

)·G(1) ∈ qOK . En multipliant

par G(1) et comme p∗ est inversible modulo q, on trouve que(p∗

q

)=(qp

), ce qui implique

la première formule puisque(−1p

)= (−1)(p−1)/2.

La deuxième se démontre de manière similaire : on pose G = ζ8+ζ78 de sorte que G2 = 2

et 2(p−1)/2 = Gp−1. On a donc G · 2(p−1)/2 ≡ ζp8 + ζ7p8 mod p et il sufit alors d’examiner les

quatre possibilités pour p mod 8.

Le théorème permet de calculer(ap

)en écrivant a = q1 · · · qr et

(ap

)= ∏r

i=1

(qi

p

). Par

exemple, (5773

)=( 3

73

)·(19

73

)=(73

3

)·(73

19

)= 1 ·

(1619

)= 1.

Ce théorème implique aussi que la valeur de(ap

), quand p varie, p ne divisant pas a, ne

dépend que de p modulo a ou 4a. Par exemple,(

5p

)= 1 si p = 1, 4 mod 5 et

(5p

)= −1 si

p = 2, 3 mod 5. De même,(

3p

)= 1 si p = 1, 11 mod 12 et

(3p

)= −1 si p = 5, 7 mod 12.

Les résidus quadratiques (et donc aussi les non-résidus) ne peuvent pas s’accumuler ende longues plages, comme le montre l’inégalité de Polya-Vinogradov ci-dessous.

Théorème 4.4. — Si a ∈ Z et n ≥ 1, alors∣∣∣∣∣∣a+n∑j=a

(j

p

)∣∣∣∣∣∣ < √p log(p).

Démonstration. — Rappelons que si G(j) = ∑p−1k=1

(kp

)ζjk, alors G(j) =

(jp

)G(1). On a

G(1) ·a+n∑j=a

(j

p

)=

a+n∑j=a

G(j) =a+n∑j=a

p−1∑k=1

(k

p

)ζjk =

p−1∑k=1

(k

p

)a+n∑j=a

ζjk =p−1∑k=1

(k

p

)ζka

ζk(n+1) − 1ζk − 1 .

12 LAURENT BERGER

Rappelons que |G(1)| = √p. On a |ζk(n+1)− 1| ≤ 2 et |ζk − 1| = 2 sin(kπ/p). Si x ≤ π/2,alors sin(x) ≥ 2/π · x et donc∣∣∣∣∣∣

a+n∑j=a

(j

p

)∣∣∣∣∣∣ = 1√p

∣∣∣∣∣∣p−1∑k=1

(k

p

)ζka

ζk(n+1) − 1ζk − 1

∣∣∣∣∣∣ ≤ 2√p

p−12∑

k=1

12/π · kπ/p ≤

√p

p−12∑

k=1

1k<√p log(p).

Le théorème implique que dans tout intervalle [a; a+ n] ⊂ [1; p− 1], les nombres R etN de résidus et de non-résidus vérifient |R−N | < √p log(p).

5. Groupes de classes

Notons IK le groupe des idéaux fractionnaires non nuls de K et PK le sous-groupede IK constitué des idéaux fractionnaires principaux. Le groupe de classes de OK est legroupe Cl(OK) = IK/PK . Le groupe Cl(OK) est trivial si et seulement si OK est unanneau principal. Le résultat principal de ce chapitre est le suivant :

Théorème 5.1. — Le groupe Cl(OK) est un groupe fini.

L’anneau OK est donc pas trop loin d’être principal. Ce théorème sera démontré unpeu plus tard. Avant cela, nous faisons quelques compléments sur les idéaux de OK .

Si f : Zd → Zd est injective et si M est la matrice de f dans une base de Zd, alorsZd/f(Zd) est fini de cardinal |det(M)|. En appliquant cela à l’endomorphimse mx de OKon trouve que si x ∈ OK alors |NK/Q(x)| = card(OK/(x)). Si I est un idéal de OK alorson pose N(I) = card(OK/I).

Lemme 5.2. — Si I et J sont deux idéaux de OK alors N(IJ) = N(I) N(J).

Démonstration. — Écrivons I = ∏prii et J = ∏

psii . On a OK/I = ∏OK/pri

i et OK/J =∏OK/psii et OK/IJ = ∏OK/pri+si

i . Par le lemme 3.7, on a card(OK/pe) = card(OK/p)e.Cela implique le lemme.

Si I est un idéal et si a ∈ I vérifie |NK/Q(a)| = N(I), alors I = (a) et donc I estprincipal.

Proposition 5.3. — Il existe une constante G (qui ne dépend que de K) telle que pourtout idéal I de OK, il existe α 6= 0 ∈ I vérifiant |NK/Q(α)| ≤ G · N(I).

Démonstration. — Soit α1, . . . , αd une base de OK et Gi = ∑dj=1 |σi(αj)|. Si m ≥ 1, alors

l’ensemble {m1α1 + · · ·+mdαd} où 0 ≤ mi ≤ m est de cardinal (m+ 1)d et si l’on choisitm de manière que md ≤ card(OK/I) < (m+ 1)d, alors par le principe des tiroirs il existe

INTRODUCTION À LA THÉORIE DES NOMBRES 13

α = n1α1 + · · · + ndαd ∈ I non nul avec |ni| ≤ m. On a |σi(α)| ≤ Gi ·m quel que soit iet donc |NK/Q(α)| ≤ G · N(I) avec G = G1 · · ·Gd.

Une classe d’idéaux est une classe à gauche de PK dans IK . Si C est une classe d’idéauxet I ∈ C−1 est un idéal de OK , alors par la proposition ci-dessus il existe α ∈ I tel que|NK/Q(α)| ≤ G · N(I). Comme (α) ⊂ I, on peut écrire (α) = IJ et donc J est un idéalde OK appartenant à C qui vérifie N(J) ≤ G.

Démonstration du théorème 5.1. — Pour terminer la démonstration du théorème 5.1, ilfaut donc montrer qu’il n’existe qu’un nombre fini d’idéaux I de OK vérifiant N(I) ≤ G

puisque les classes de ces idéaux recouvrent Cl(OK).Si I est un tel idéal alors par le théorème 3.6, on peut écrire I = pn1

1 · · · pnrr et donc

N(I) = N(p1)n1 · · ·N(pr)nr . Si pi est un idéal au-dessus de pi, alors N(pi) ≥ pi. On a doncpi ≤ G et pour chacun de ces pi l’exposant ni de pi est borné par pni

i ≤ G. Ceci achèvela démonstration.

La démonstration implique que Cl(OK) est engendré par les idéaux premiers au-dessusdes nombres premiers p ≤ G. Ceci permet de le déterminer si G n’est pas trop grand.

Si K est un corps de nombres, on note hK = |Cl(OK)|

6. Le premier cas du théorème de Fermat

Soit p un nombre premier impair et K = Q(ζp). Le but de ce chapitre est de montrerle théorème suivant, le premier cas du théorème de Fermat, sous l’hypothèse que p estrégulier, c’est-à-dire que p ne divise pas hK . Ce théorème est dû à Kummer (1850), ets’inspire d’une démonstration incorrecte de Lamé (1847) (qui supposait implicitementque OK était principal, erreur relevée par Liouville).

Théorème 6.1. — Si p ne divise pas hK, alors l’équation xp + yp = zp n’a pas desolutions en nombres entiers avec p - xyz.

Avant de montrer ce théorème, faisons quelques compléments sur le corps K = Q(ω)où ω = exp(2iπ/p). C’est une extension de Q de degré p − 1 et les p − 1 plongementsde K dans C sont donnés par ω 7→ ωj avec j = 1, . . . , p − 1. Rappelons que OK = Z[ω](cf. exemple 2.4). Par la proposition 3.9, le nombre premier p est totalement ramifié dansOK et on a (p) = (ω − 1)p−1. Si i 6= 0 mod p, alors (ωi − 1)/(ω − 1) est une unité deOK . On note z 7→ z la conjugaison complexe sur C et on pose F = {x ∈ K tels quex = x}. On utilisera plusieurs fois l’observation que si α = α0 + · · ·+ αp−2ω

p−2 ∈ OK etsi m = αp0 + · · ·+ αpp−2, alors αp −m ∈ pOK

14 LAURENT BERGER

Lemme 6.2. — Le groupe (1 + pOK) ∩ O×K est sans torsion.

Démonstration. — Il suffit de montrer que si x ∈ 1 + pOK et si ` est un nombre premiertel que x` = 1, alors x = 1. Écrivons x = 1 + pky avec k ≥ 1 et y non divisible par p.Si ` = p, alors xp = 1 + pk+1y + p2k+1z et donc p divise y, contradiction. Si ` 6= p, alorsx` = 1 + pk`y + p2kz et on conclut de même.

Lemme 6.3. — Si u ∈ O×K, alors il existe r ∈ Z et v ∈ O×F tels que u = ωrv.

Démonstration. — Si u ∈ O×K , alors u/u est un élément de OK tel que pour tout plon-gement σ : K → C, on a |σ(u/u)| = 1 et c’est donc une racine de l’unité par le lemmede Kronecker. Par l’observation ci-dessus, il existe m ∈ Z tel que up −m ∈ pOK et donc(u/u)p ∈ 1 + pOK . Comme 1 + pOK est sans torsion, on a (u/u)p = 1 et il existe doncr ∈ Z tel que u/u = ω2r = ωr/ω−r ce qui implique le lemme avec v = uω−r.

Démonstration du théorème 6.1. — On suppose que p ≥ 5 (la démonstration du théo-rème de Fermat pour p = 3 est classique). On se donne x, y, z ∈ Z premiers entre eux telsque xp + yp = zp et on suppose que p - xyz. Quitte à remplacer (x, y, z) par (x,−z,−y),on peut de plus supposer que x 6≡ y mod p.

On a (z)p = ∏p−1j=0(x+ yωj). Montrons que les idéaux (x+ yωj) sont premiers entre eux

deux à deux dans OK pour 0 ≤ j ≤ p− 1. On a x+ yωj − (x+ yωi+j) = yωj(ωi − 1) etωi(x+yωj)− (x+yωi+j) = x(ωi−1). L’idéal I engendré par x+yωj et x+yωi+j contientdonc x(ω− 1), y(ω− 1) et zp. Comme x, y et zp sont premiers entre eux, I contient ω− 1et donc p. Comme p - zp, on a I = OK .

Les idéaux (x+ yωj) sont premiers entre eux et (z)p = ∏p−1j=0(x+ yωj) et donc chacun

d’entre eux est une puissance pième. Soit Ij l’idéal tel que Ipj = (x+ yωj). Si p ne divisepas hK , alors Ipj principal implique Ij principal, et on peut donc écrire x + yωj = ujα

pj

avec uj ∈ O×K et αj ∈ OK . En particulier, on a x+ yω = uαp.Par le lemme 6.3, on peut écrire u = ωrv où v ∈ O×F . Par ailleurs, il existe m ∈ Z tel

que αp −m ∈ pOK . Ceci implique que ω−r(x + yω) ∈ vm + pOK et en conjuguant queωr(x+ yω−1) ∈ vm+ pOK aussi. On trouve que xωr + yωr−1 − xω−r − yω1−r ∈ pOK .

Il suffit alors d’examiner les cas, en utilisant le fait que si β = β0 +β1ω+ · · ·+βp−1ωp−1

avec l’un des βi = 0, alors β ∈ pOK si et seulement si p divise tous les βi. Si r 6≡0, 1/2 mod p, alors on trouve que p divise x. Si r = 0, alors p divise y. Si r ≡ 1/2, alorsp divise x− y.

INTRODUCTION À LA THÉORIE DES NOMBRES 15

Les nombres premiers qui ne sont pas réguliers sont 37, 59, 67, 101, 103, 131, 149, . . .Siegel conjecture que 1/

√e (soit à peu près 60,65%) des nombres premiers sont réguliers,

mais on ne sait même pas s’il y en a une infinité.

7. Formes quadratiques binaires

Une forme quadratique binaire est une fonction q : Z2 → Z qui est de la forme (x, y) 7→ax2 + bxy+ cy2 avec a, b, c ∈ Z. Les entiers a, b et c sont alors déterminés par q et on note(a, b, c) pour la forme q. Si n ∈ Z, on dit que q représente n s’il existe (x, y) ∈ Z2 tels queq(x, y) = n (si n = 0, on demande en plus que (x, y) 6= (0, 0)). On dit que q représente nprimitivement si en plus on peut prendre x et y premiers entre eux. Le discriminant deq = (a, b, c) est D = disc(q) = b2− 4ac. On a D ≡ 0, 1 mod 4. Si D ≡ 0 ou 1 mod 4, alorson définit la forme principale qD de discriminant D par (1, 0,−D/4) ou (1, 1, (1−D)/4).

Proposition 7.1. — Soit q une forme quadratique binaire.

1. La forme q représente 0 si et seulement si D est un carré.

2. Tous les entiers représentés par q sont de même signe si et seulement si D ≤ 0.

Démonstration. — Si a = 0, alors D = b2 et q(x, y) = y(bx + cy). Le (1) et le (2) sontalors évidents. On suppose donc que a 6= 0. On a 4a · q(x, y) = (2ax + by)2 − y2D. Siq(x, y) = 0 avec (x, y) 6= (0, 0), alors y 6= 0 et D = (2ax+ by)2/y2 est un carré. Si D = z2,alors q(x, y) = 0 si 2ax+ by = yz. Ceci montre le (1).

Si D ≤ 0, alors les valeurs de q(x, y) ont le même signe que a. Réciproquement, siD > 0, alors 4a · q(1, 0) = 4a2 > 0 et 4a · q(−b, 2a) = −4a2D < 0. Ceci montre le (2).

Si P ∈ M2(Z) et(x′

y′

)= P · ( xy ), alors la fonction (x, y) 7→ q(x′, y′) est aussi une forme

quadratique binaire, notée q◦P . On a q◦PR = (q◦P )◦R et disc(q◦P ) = disc(q) det(P )2.On dit que deux formes q1 et q2 sont équivalentes, noté q1 ∼ q2, s’il existe P ∈ GL2(Z)telle que q1 ◦P = q2 et on dit que q1 et q2 sont proprement équivalentes, noté q1

+∼ q2, s’ilexiste P ∈ SL2(Z) telle que q1 ◦ P = q2. Par exemple, via ( 0 −1

1 0 ) et ( 1 k0 1 )

(a, b, c) +∼ (c,−b, a) +∼ (a, b+ 2ka, ak2 + bk + c).

Avec ( −1 00 1 ), on trouve que (a, b, c) ∼ (a,−b, c). Deux formes équivalentes représentent les

mêmes entiers et ont le même discriminant. Les formes (2, 2, 3) et (1, 0, 5) ont le mêmediscriminant −20 mais ne sont pas équivalentes car la première représente 2 mais pas laseconde.

16 LAURENT BERGER

Le problème de savoir quels entiers sont représentés par quelles formes quadratiques amotivé le développement de la théorie, notamment par Lagrange puis par Gauss. Rappe-lons par exemple que les nombres premiers impairs de la forme x2 + y2 sont exactementceux qui valent 1 mod 4, et que les entiers n de la forme x2 + y2 sont donc ceux tels quesi p ≡ 3 mod 4 divise n, alors vp(n) est pair.

Proposition 7.2. — Si n ∈ Z, alors q représente n primitivement si et seulement s’ilexiste b, c ∈ Z tels que q +∼ (n, b, c). Dans ce cas, on peut prendre −|n| < b ≤ |n| si n 6= 0.

Démonstration. — Si q = (n, b, c), alors q(1, 0) = n et donc si q +∼ (n, b, c), alors qreprésente n primitivement. Supposons à présent que q(x, y) = n avec x ∧ y = 1. ParBezout, il existe x′, y′ tels que xy′ − x′y = 1, c’est-à-dire que P =

(x x′

y y′

)∈ SL2(Z). On a

(q ◦ P )(1, 0) = q(x, y) = n et donc q ◦ P = (n, ∗, ∗). Le fait que pour tout k ∈ Z, on a

(n, b, c) +∼ (n, b+ 2kn, nk2 + bk + c)

permet ensuite de transformer q ◦ P en une forme proprement équivalente avec −|n| <b ≤ |n| si n 6= 0.

Corollaire 7.3. — Une forme q de discriminant D représente 1 ssi q +∼ qD.

Démonstration. — Il est immédiat que qD représente 1. Réciproquement, la proposition7.2 montre que si q représente 1, alors q +∼ (1, b, c) avec b ∈ {0, 1}. Comme D ≡ b mod 2,b est déterminé puis c = (b2 −D)/4.

Corollaire 7.4. — Si n,D ∈ Z, alors il existe une forme q de discriminant D quireprésente n primitivement si et seulement si D est un carré modulo 4n.

Démonstration. — On a q +∼ (n, b, c) et donc D = b2 − 4nc est un carré modulo 4n.Réciproquement, si D est un carré modulo 4n, alors il existe b et c tels que D = b2−4nc

et si q = (n, b, c), alors q(1, 0) = n. Il existe donc une forme quadratique q de discriminantD qui représente n primitivement.

Théorème 7.5. — Si p est un nombre premier tel que D est un carré modulo 4p, alorsà équivalence ∼ près, p est représenté par une unique forme de discriminant D.

Démonstration. — On vient de voir l’existence, montrons l’unicité. Comme dans lapreuve de la proposition 7.2, on peut remplacer q par une forme équivalente de tellesorte que |b| ≤ p, et on peut de plus supposer b ≥ 0 si on travaille avec ∼. Notons queb détermine c car c = (b2 −D)/4p. Il ne reste plus qu’à vérifier qu’il n’existe qu’un seul0 ≤ b ≤ p tel que D ≡ b2 mod 4p.

INTRODUCTION À LA THÉORIE DES NOMBRES 17

Ce théorème dû à Lagrange pose la question des classes d’équivalence de formes.

Théorème 7.6. — Si D 6= 0, alors il n’y a qu’un nombre fini de formes de discriminantD à équivalence +∼ près.

Démonstration. — Supposons que D n’est pas un carré, de sorte que 0 n’est pas repré-senté par q par la proposition 7.1. Soit alors m > 0 le plus petit entier qui est de laforme |q(x, y)| avec (x, y) 6= (0, 0) et a = ±m la valeur correspondante de q(x, y). Par laproposition 7.2, on a q +∼ (a, b, c) avec |b| ≤ |a|. Par ailleurs, q(0, 1) = c et donc |a| ≤ |c|.On en déduit que 4|a|2 ≤ 4|ac| = |b2 − D| ≤ |a|2 + |D| et donc |a| ≤

√|D|/3. Comme

|b| ≤ |a| et que c est déterminé par a, b et D, le théorème suit.Si D = b2 est un carré avec b ≥ 1, alors on montre qu’il existe 0 ≤ c ≤ b − 1 tel que

q+∼ (0, b, c).

Si D < 0, le théorème de Gauss ci-dessous permet de simplifier le calcul de l’ensembledes classes d’équivalence pour +∼. Il suffit de regarder les formes positives. Disons que laforme positive (a, b, c) est réduite si −a < b ≤ a ≤ c, avec b ≥ 0 si a = c.

Théorème 7.7. — Si D < 0, alors toute forme quadratique positive est +∼ à une uniqueforme réduite.

Démonstration. — Soit a comme dans la démonstration du théorème de Lagrange. Laproposition 7.2, et le fait que (a, b, a) +∼ (a,−b, a), impliquent que toute forme positivede discriminant D < 0 est équivalente à une forme réduite (a, b, c). Il faut donc vérifierl’unicité.

Lemme 7.8. — Si q = (a, b, c) est positive et réduite, alors a est le plus petit entierprimitivement représenté par q. De plus,

1. si a < c, alors a = q(x, y) ssi (x, y) = (±1, 0) et c est le deuxième plus petit entierprimitivement représenté par q. Dans ce cas, c = q(x, y) pour deux vecteurs primitifs(x, y), sauf si b = a auquel cas il y en a quatre ;

2. si a = c, alors a = q(x, y) pour quatre vecteurs primitifs (x, y), sauf si b = a auquelcas il y en a six.

Démonstration. — Si q est réduite, alors |D| = 4ac−b2 ≥ 3ac. Rappelons que 4a·q(x, y) =(2ax+ by)2 + y2|D|.

1. Si |y| ≥ 2, alors 4a · q(x, y) ≥ 4|D| ≥ 12ac et donc q(x, y) ≥ 3c.

2. Si y = ±1, alors |2ax+ by| ≥ b car |b| ≤ |a| et donc 4a · q(x, y) ≥ b2 + 4ac− b2 ≥ 4acet q(x, y) ≥ c, avec égalité pour x = 0 si a 6= b et pour x = 0 et x = −y si a = b.

18 LAURENT BERGER

3. Si y = 0, alors q(x, y) = ax2 et q(x, y) = a ssi x = ±1.

On montre le lemme en examinant les cas ci-dessus.

Revenons à la démonstration du théorème, en remarquant que deux formes équivalentesreprésentent primitivement les mêmes entiers le même nombre de fois. Si q = (a, b, c) etq′ = (a′, b′, c′) sont positives réduites et équivalentes, alors a = a′. Si a est représenté deuxfois, alors c = c′ est le deuxième plus petit entier primitivement représenté par q. Sinon,a = c et donc a′ = c′ ce qui fait que c = c′ aussi.

Comme D = D′, on a b′ = ±b. Si a = c, alors b′, b ≥ 0 et donc b′ = b. Si a 6= c, alorsle (1) du lemme 7.8 montre que a = b si et seulement si a′ = b′. Supposons donc quea 6= b et donc que a et c sont chacun représentés primitivement exactement deux fois,par (±1, 0) et par (0,±1). La matrice P ∈ SL2(Z) qui envoie q sur q′ doit donc envoyer{(±1, 0)} sur lui-même et {(0,±1)} sur lui-même ce qui fait que P =

(±1 00 ±1

)et donc

P = ± Id puisque det(P ) = 1.

On note Cl(D) l’ensemble des classes de formes de discriminant D pour la relation +∼(si D < 0, on ne considère que les formes positives, c’est à dire telles que q(Z2) ⊂ Z≥0).Si D < 0, le théorème 7.7 et la démonstration du théorème 7.6 donnent un moyen facilede calculer Cl(D) : pour tout b ∈ Z, tel que |b| ≤

√−D/3 et b ≡ D mod 2, on écrit les

triplets (a, b, c) tels que 4ac = b2−D avec |b| ≤ a ≤ c. L’ensemble des tels triplets (a, b, c)qui sont en plus réduits forme un système de représentants de Cl(D).

Exemple 7.9. — Si D ∈ {−3,−4,−7,−8,−11,−12}, alors h(D) = 1 et h(−15) = 2.

1. La forme x2 + y2 a pour discriminant −4 et c’est la seule à équivalence près. Lethéorème de Lagrange nous dit que tout nombre premier tel que −4 est un carrémodulo p est de la forme x2 + y2.

2. Si D = −20, alors il y a deux formes réduites (2, 2, 3) et (1, 0, 5). On trouve doncque tout nombre premier p tel que −20 est un carré modulo p est de la forme2x2 + 2xy + 3y2 ou (exclusif) x2 + 5y2. En fait, si p = x2 + 5y2, alors p est un carrémodulo 5. Si p = 2x2 + 2xy + 3y2, alors 2p = 4x2 + 4xy + 6y2 = (2x + y)2 + 5y2

et donc p n’est pas un carré modulo 5. Ce phénomène est un cas particulier de lathéorie du genre pour les formes quadratiques.

Nous allons maintenant voir qu’il y a un lien fort avec la théorie des classes d’idéauxdans les corps quadratiques. Pour simplifier, nous considérons des corps quadratiquesimaginaires. Soit donc K un corps quadratique imaginaire de discriminant D. On a OK =Z⊕Zα ⊂ C avec α =

√D/2 ou (1+

√D)/2 selon que D ≡ 0 ou 1 mod 4. Si I est un idéal

INTRODUCTION À LA THÉORIE DES NOMBRES 19

non nul de OK , alors c’est un Z-module libre de rang 2 et il admet donc une base u, v. Sil’on écrit u = u1 + αuα et v = v1 + αvα, on peut supposer (quitte à remplacer v par −v)que u, v est une base directe de I par rapport à 1, α, c’est-à-dire que u1vα−uαv1 > 0. Ondéfinit alors une fonction qu,v sur Z2 par qu,v(x, y) = NK/Q(ux + vy)/N(I). Le théorèmeci-dessous est dû à Dedekind.

Théorème 7.10. — La fonction qu,v est une forme quadratique binaire positive de dis-criminant D, la classe de qu,v dans Cl(D) ne dépend que de la classe de I dans Cl(OK),et l’application I 7→ qu,v donne une bijection entre Cl(OK) et Cl(D).

Démonstration. — La fonction qu,v est de la forme ax2 + bxy + cy2 avec a, b, c ∈ Q.Si x, y ∈ Z, alors z = ux + vy ∈ I et on peut écrire (z) = IJ . On a donc q(x, y) =N((z))/N(I) = N(J) ∈ Z≥0, et qu,v est donc une forme quadratique binaire positive.

Notons que q1,α = qD et que cette forme est bien de discriminant D. Si (u, v) est unebase de I et si P est la matrice de (u, v) dans la base (1, α), alors qu,v = (q1,α ◦ P )/N(I)et det(P ) = N(I) ce qui fait que disc(qu,v) = D.

Montrons que la classe de qu,v ne dépend que de la classe de I. Si s, t est une autrebase directe de I, alors il existe P ∈ SL2(Z) telle que ( st ) = P ( uv ) et alors qs,t = qu,v ◦P .Enfin si I ′ = zI avec z ∈ K× est un idéal de OK , alors zu, zv est une base directe de I ′

et qzu,zv(x, y) = N(xzu+ yzv)/N(zI) = NK/Q(xu+ yv)/N(I) = qu,v(x, y) et donc en faitqzu,zv = qu,v.

Définissons à présent une application de Cl(D)→ Cl(OK). Si q = (a, b, c) est une formequadratique binaire positive de discriminant D, alors a > 0 car q est positive. On voitque q(x, y) = a · NK/Q(x + τy) où τ = (b +

√D)/2a est déterminé par cette formule et

la condition que 1, τ est directe. On a aτ ∈ α + Z de sorte que OK = Z ⊕ aτZ. PosonsIq = aZ⊕ aτZ. Comme (aτ)2 = b(aτ)− ac, Iq est un idéal de OK . On a OK/Iq = Z/aZde sorte que N(Iq) = a et donc q = qa,aτ . De plus, la base a, aτ est directe. Si q′ = q ◦ Pavec P =

(e fg h

)∈ SL2(Z), alors

q′(x, y) = a · NK/Q((ex+ fy) + τ(gx+ hy))

= a · NK/Q(x(e+ τg) + y(f + τh)) = a′ · NK/Q(x+ τ ′y),

où a′ = a · NK/Q (e+ τg) = q(e, g) et τ ′ = (f + hτ)/(e+ gτ).On a alors Iq′ = a′Z⊕ a′τ ′Z, la base a′, a′τ ′ de Iq′ est directe, et

(e+ gτ)Iq′ = (e+ gτ)a′Z⊕ a′(e+ gτ)τ ′Z = (e+ gτ)a′Z⊕ (f + hτ)a′Z = a′(Z⊕ τZ),

20 LAURENT BERGER

ce qui fait que Iq et Iq′ ont même image dans Cl(OK). L’application q 7→ Iq passe bien auquotient. Pour terminer la démonstration du théorème, il suffit de vérifier que I 7→ qu,v

et q 7→ Iq sont bien inverses l’une de l’autre.

Corollaire 7.11. — Si K est un corps quadratique imaginaire de discriminant D, lesidéaux a ·Z⊕ (b+

√D)/2 ·Z, où (a, b, c) parcourt l’ensemble des formes réduites positives

de discriminant D, sont un système de représentants de Cl(OK).

Remarquons que le théorème 7.10 implique que Cl(D) admet une structure naturellede groupe. On peut définir la notion de composition de deux formes quadratiques, etretrouver ainsi cette structure sur Cl(D).

Si l’on suppose à présent que K est un corps quadratique réel, alors on obtient presquele même résultat. Disons que deux idéaux I et J de OK sont strictement équivalentssi I = αJ avec α ∈ K× vérifiant N(α) > 0 et soit Cl+(OK) l’ensemble des classesd’équivalence stricte d’idéaux. On a alors une surjection Cl+(OK) → Cl(OK) dont lenoyau est Z/2Z ou {1} et le théorème 7.10 devient une bijection entre Cl+(OK) et Cl(D).

8. Géométrie des nombres

Afin de déterminer efficacement le groupe de classes d’un corps de nombres K, on abesoin de connaître la proposition 5.3 avec une constante G aussi petite que possible,c’est l’objet de la théorie de Minkowski.

Si H est un sous-groupe de Rn, on dit que H est discret si quelle que soit la partiebornée B de Rn, l’ensemble H ∩B est fini.

Lemme 8.1. — S’il existe r > 0 tel que H ∩B(0, r) est fini, alors H est discret.

Démonstration. — Soit B une partie bornée telle queH∩B est infinie. Il existe a1, . . . , am

tels que B ⊂ ∪mi=1B(ai, r/2) et il existe donc i tel que H ∩B(ai, r/2) est infini.Si h ∈ H ∩B(ai, r/2), alors H ∩B(ai, r/2)− h ⊂ H ∩B(0, r) et est infini.

Proposition 8.2. — Si f : Zn → Rn est un morphisme de groupes injectif, et hi =f(ei), alors h1, . . . , hn est une base de Rn si et seulement si H = f(Zn) est un sous-groupe discret de Rn.

Démonstration. — Si h1, . . . , hn est une base de Rn, soit P = ∑ni=1 ]−1, 1[·hi. C’est un

ouvert de Rn et P ∩ H = {0}. Comme P est ouvert, il contient une boule B(0, r) avecr > 0 qui vérifie alors que H ∩B(0, r) est fini.

INTRODUCTION À LA THÉORIE DES NOMBRES 21

Si h1, . . . , hn n’est pas une base de Rn, alors il existe x1, . . . , xn tels que ∑ni=1 xihi = 0.

Si N ∈ Z, soit vN = ∑ni=1{xiN}hi. On a vN = ∑n

i=1 Nxihi −∑ni=1[Nxi]hi ∈ H et si

R = 1 + ∑ni=1 ‖hi‖, alors vN ∈ B(0, R) pour tout N . Enfin si vN = vM alors, comme les

hi sont Z-linéairement indépendants, on a [Nxi] = [Mxi] pour tout i. Ceci permet deconstruire une infinité d’éléments de B(0, R) ∩H.

Un réseau de Rn est un sous-groupe de Rn qui est de la forme ⊕ni=1Z`i où `1, . . . , `n

est une base de Rn. Par la proposition ci-dessus, si f : Zn → Rn est injective, alors sonimage est un réseau si et seulement si son image est un sous-groupe discret de Rn.

Dans la suite, on fixe la base canonique e1, . . . , en de Rn. Si Λ = ⊕ni=1Z`i est un réseaude Rn, le volume de Λ est vol(Λ) = |det(M)| où M est la matrice des (`i) dans la base(ei). Cette définition ne dépend pas du choix de la base (`i) et vol(Λ) est le volume d’undomaine fondamental de Λ.

Lemme 8.3. — Si M est une partie mesurable de Rn telle que vol(M) > vol(Λ), alorsil existe deux points distincts m1 et m2 de M tels que m1 −m2 ∈ Λ.

Démonstration. — Le tore Rn/Λ est muni d’une mesure de mesure totale vol(Λ) et si laprojection naturelle π : Rn → Rn/Λ était injective surM , on aurait vol(M) ≤ vol(Λ).

On déduit de cela le théorème de Minkowski ci-dessous.

Théorème 8.4. — Si Λ est un réseau de Rn et si C ⊂ Rn est une partie convexe etsymétrique par rapport à l’origine de volume vol(C) > 2n vol(Λ), alors il existe ` 6= 0appartenant à C ∩ Λ.

Si on suppose en plus que C est compact, alors il suffit que vol(C) ≥ 2n vol(Λ).

Démonstration. — Le lemme 8.3 appliqué à M = 1/2 · C, nous donne c1 6= c2 ∈ C telsque 1/2 · (c1 − c2) ∈ Λ. Comme C est convexe et symétrique par rapport à l’origine,1/2 · (c1−c2) ∈ C ce qui montre le premier résultat. Le deuxième se déduit par compacitédu premier appliqué à C + B(0, ε) avec ε→ 0 : pour tout ε, on a cε ∈ C et `ε ∈ Λ \ {0}avec |cε − `ε| < ε. Si cε → c, alors c ∈ C ∩ Λ \ {0}.

Revenons à présent à un corps de nombres K, dont on note σ1, . . . , σd les plongementsdans C, ordonnés comme suit : les plongements réels sont σ1, . . . , σr1 et les plongementscomplexes sont σr1+1, . . . , σr1+r2 , σr1+1, . . . , σr1+r2 . On définit σ : K → Rd par :

σ(x) = (σ1(x), . . . , σr1(x),Re(σr1+1(x)), Im(σr1+1(x)), . . . ,Re(σr1+r2(x)), Im(σr1+r2(x))) .

C’est clairement une application injective.

22 LAURENT BERGER

Lemme 8.5. — L’image de OK par l’application σ ci-dessus est un réseau de Rd dontle volume est :

vol(σ(OK)) = 12r2

√|disc(K)|.

Démonstration. — L’image de OK par σ est un sous-groupe de Rd, et si x ∈ σ(OK) ∩B(0, 1/2), alors |σi(x)| < 1 pour tout i et donc |NK/Q(x)| < 1 ce qui fait que x = 0. Onen déduit que σ(OK) est discret. Comme σ est injective et OK ' Zd, σ(OK) est bien unréseau de Rd.

Si α1, . . . , αd est une base de OK sur Z, alors σ(OK) a une base dont la matrice est :σ1(α1) . . . σr1(α1) Re(σr1+1(α1)) Im(σr1+1(α1)) . . . Im(σr1+r2(α1))

... ... ... ... ...σ1(αd) . . . σr1(αd) Re(σr1+1(αd)) Im(σr1+1(αd)) . . . Im(σr1+r2(αd))

,et cette matrice s’obtient à partir de la matrice (σi(αj))i,j en faisant r2 opérations dutype (Cj, Ck) 7→ (1/2 · (Cj + Ck), 1/2i · (Cj − Ck)) ce qui montre la formule puisquedet(σi(αj))2

i,j = disc(K) (ce calcul donne une nouvelle preuve du fait que σ(OK) est unréseau de Rd).

Corollaire 8.6. — Si I est un idéal de OK, alors σ(I) est un réseau de Rd dont levolume est vol(σ(I)) = 2−r2

√|disc(K)|N(I).

Si v ∈ Rd, notons le v = (w1, . . . , wr1 , x1, y1, . . . , xr2 , yr2) et notons par ailleurs N(v) =∏r1i=1 |wi| ·

∏r2i=1(x2

i + y2i ) ce qui fait que si x ∈ K, alors N(σ(x)) = |NK/Q(x)|. Considérons

l’ensemble A défini par :

A = {(w1, . . . , wr1 , x1, y1, . . . , xr2 , yr2) ∈ Rd,

|w1|+ · · ·+ |wr1 |+ 2√x2

1 + y21 + · · ·+ 2

√x2r2 + y2

r2 ≤ d}.

Cet ensemble est manifestement un convexe compact symétrique par rapport à l’origineet si a ∈ A, alors l’inégalité de moyennes arithmétiques-géométriques nous donne queN(a) ≤ 1.

Proposition 8.7. — Si A est l’ensemble défini ci-dessus, alors on a :

vol(A) = dd

d! · 2r1 ·

2

)r2

.

Démonstration. — La démonstration se fait par récurrence sur r1 et r2. On note :

Ar,s = {(w1, . . . , wr, x1, y1, . . . , xs, ys) ∈ Rr+2s,

|w1|+ · · ·+ |wr|+ 2√x2

1 + y21 + · · ·+ 2

√x2s + y2

s ≤ 1}.

INTRODUCTION À LA THÉORIE DES NOMBRES 23

Si l’on fixe t ∈ [−1; 1], alors Ar,s ∩ {w1 = t} = {(t, (1− |t|)Ar−1,s)}. On en déduit que :

vol(Ar,s) = 2∫ 1

0vol(Ar−1,s)(1− t)r+2s−1dt = 2

r + 2s vol(Ar−1,s).

De même si ρ ≤ 1, alors on a :

Ar,s ∩ {x21 + y2

1 = (ρ/2)2} ={(

ρ

2 cos(θ), ρ2 sin(θ), (1− ρ)Ar,s−1

)},

et donc :

vol(Ar,s) =∫ 1

0

∫ 2π

0vol(Ar,s−1)(1− ρ)r+2s−2ρ

4 dθdρ = π

2(r + 2s)(r + 2s− 1) vol(Ar,s−1).

Ceci permet de montrer par récurrence que vol(Ar,s) = 2r(π/2)s/(r+2s)! et la propositionsuit alors du fait que A = d · Ar1,r2 .

Ceci nous permet de préciser la proposition 5.3.

Théorème 8.8. — Si K est un corps de nombres et si I est un idéal de OK, alors ilexiste α ∈ I vérifiant |NK/Q(α)| ≤ G · N(I) avec :

G = d!dd

( 4π

)r2 √|disc(K)|.

Démonstration. — Posons :

C =(

2r1+r2

vol(A) ·√|disc(K)| · N(I)

)1/d

· A,

ce qui fait que C est un convexe compact symétrique par rapport à l’origine qui vérifievol(C) = 2d vol(σ(I)) par le corollaire 8.6. Le théorème 8.4 nous fournit alors x ∈ C∩σ(I)non nul, c’est-à-dire un élément α = σ−1(x) ∈ I tel que :

|NK/Q(α)| = N(x) ≤ 2r1+r2

vol(A) ·√|disc(K)| · N(I) = G · N(I),

la dernière égalité résultant de la proposition 8.7.

Corollaire 8.9. — Si K est un corps de nombres différent de Q, alors |disc(K)| ≥ 2.

Démonstration. — On a forcément G ≥ 1 et donc :√|disc(K)| ≥ dd

d!

4

)r2

≥ dd

d!

4

)d/2.

Il reste à montrer que cette fonction est > 1 si d ≥ 2, c’est un exercice d’analyse réelle.

Application : le théorème de Rabinowitz (1913).

Théorème 8.10. — Si q ≥ 2 et 4q − 1 est sans facteurs carrés, alors a2 + a + q estpremier pour tout 0 ≤ a ≤ q − 2 si et seulement si le corps K = Q(

√1− 4q) est de

nombre de classes égal à 1

24 LAURENT BERGER

Démonstration. — Soit f(X) = X2 +X + q. On pose θ = (1 +√

1− 4q)/2 de sorte queOK = Z⊕ Z · θ. Commençons par deux observations :

1. Si x, y ∈ Q, alors N(x + θy) = x2 + xy + qy2 = (x + y/2)2 + y2(q − 1/4). On endéduit que si z ∈ OK et p = N(z) est premier, alors p ≥ q.

2. Soit 0 ≤ a ≤ q − 2 tel que f(a) est composé. On a f(a) ≤ (q − 1)2 + 1, et il existedonc p premier tel que p ≤ q − 1 et f(a) = 0 mod p.

Montrons tout d’abord que si OK est principal, alors a2 + a+ q est premier pour tout0 ≤ a ≤ q − 2. Si ce n’est pas le cas, soit p ≤ q − 1 divisant f(a) = N(a + θ) commeci-dessus. L’idéal (p, a + θ) de OK est principal, et donc engendré par π ∈ OK . L’idéal(p, a + θ) est propre (si 1 = px + (a + θ)y, alors en multipliant par a + θ, on voit que pdivise a + θ) et il contient strictement (p) car on ne peut pas écrire a + θ = p(x + yθ),ce qui fait que N(π) = p. On a vu au (1) que N(π) ≥ q. C’est donc que a2 + a + q estpremier pour tout 0 ≤ a ≤ q − 2.

On suppose désormais que a2+a+q est premier pour tout 0 ≤ a ≤ q−2. Si 2 ≤ p ≤ q−1est un nombre premier et 0 ≤ a ≤ p − 1 ≤ q − 2, alors p ne peut pas diviser f(a) carsinon, comme f(a) est premier, on aurait p = f(a) ≥ q (par le (1)). L’image de f(X) dansFp[X] est donc irréductible. On en déduit que p est inerte dans K pour tout p ≤ q − 1.Comme G = (2/π) ·

√4q − 1, on a bGc ≤ q − 1 si q ≥ 2 et OK est principal.

Ceci se produit pour q ∈ {2, 3, 5, 11, 17, 41}. Ces nombres s’appellent les “nombreschanceux d’Euler”. Pour une discussion des d < 0 tels que h(Q(

√d)) = 1, voir le §20.6

de [IR].

9. Unités

Dans les chapitres précédents, on a donné une réponse à la question de la factorisationdans OK : tout idéal est un produit d’idéaux premiers et le groupe de classes de OKest fini. Dans ce chapitre, nous déterminons O×K . On note µK l’ensemble des racines del’unité contenues dans K. C’est le sous-groupe de torsion de O×K .

Théorème 9.1. — Le groupe µK est fini et O×K/µK ' Zr1+r2−1.

Afin de montrer ce théorème (dû à Dirichlet), nous utilisons l’application Log : O×K →Rr1+r2 donnée par la formule :

Log(x) = (log |σ1(x)|, . . . , log |σr1(x)|, 2 log |σr1+1(x)|, . . . , 2 log |σr1+r2(x)|),

où les plongement σi sont rangés comme au chapitre précédent.

INTRODUCTION À LA THÉORIE DES NOMBRES 25

Le lemme 2.5 implique immédiatement que le noyau de l’application Log est le groupeµK . Par ailleurs, si x ∈ O×K , alors NK/Q(x) = ±1 et donc l’image de Log est contenuedans l’hyperplan H de Rr1+r2 constitué des vecteurs (xi)i tels que

∑r1+r2i=1 xi = 0.

Si c > 0 et Log(x) ∈ H ∩ B(0, c), alors |σi(x)| ≤ C = exp(c) et donc il n’y a qu’unnombre fini de possibilités pour x par le lemme 8.5 selon lequel σ(OK) est un sous-groupediscret de Rd. On trouve que µK est fini, et que l’image de O×K par Log est un sous-groupediscret de H. Montrons que c’en est un réseau.

Lemme 9.2. — Si 1 ≤ k ≤ r1 + r2 et si α ∈ OK \ {0}, alors il existe β ∈ OK \ {0} telque :

|NK/Q(β)| ≤( 2π

)r2 √|disc(K)|

et tel que log |σi(β)| < log |σi(α)| quel que soit i 6= k.

Démonstration. — Soit ai = log |σi(α)| et soit Rr1+2r2 = {(wi, xi, yi)} comme au cha-pitre précédent et E l’ensemble des vecteurs de Rr1+2r2 qui vérifient |wj| ≤ exp(aj)/2et |x2

j + y2j | ≤ exp(aj)/2 pour tout j 6= k et en j = k la valeur absolue correspondante

est ≤ (2/π)r2√|disc(K)|/∏j 6=k(exp(aj)/2). L’ensemble E est un convexe compact symé-

trique de volume 2d vol(σ(OK)) et par le théorème 8.4 il existe β non nul appartenant àσ(OK) ∩ E.

Corollaire 9.3. — Si 1 ≤ k ≤ r1 +r2 alors il existe une unité uk telle que log |σi(uk)| <0 pour tout i 6= k.

Démonstration. — On choisit α0 ∈ OK \ {0} et on applique le lemme 9.2 à répétitionpour trouver une suite {αi}i≥0. Comme la norme des αj est bornée indépendamment dej, il n’y a qu’un nombre fini de possibilités pour les idéaux (αj) et il existe donc j ≥ 0 et` ≥ 1 tels que αj+`/αj est une unité. On peut alors prendre uk = αj+`/αj.

Proposition 9.4. — L’image de O×K par l’application Log est un réseau de l’hyperplanH de Rr1+r2.

Démonstration. — On a déjà vu que l’image de O×K par l’application Log est un sous-groupe discret de H. Le corollaire 9.3 nous fournit r1 + r2 unités u1, . . . , ur1+r2 telles quesi l’on écrit la matrice des Log(ui) on trouve les signes suivants :

⊕ . . . ⊕ . . . ... ... ... . . . ⊕

26 LAURENT BERGER

De plus, les lignes de cette matrice sont toutes de somme nulle. C’est un exercice d’algèbrelinéaire de montrer qu’une telle matrice est de rang r1 + r2 − 1. Le groupe Log(O×K) estdonc un sous-groupe discret de H qui en contient une base, c’est-à-dire (par le lemmeci-dessous) un réseau.

Lemme 9.5. — Si G est un sous-groupe discret de Rn qui en contient une base, alorsG est un réseau de Rn.

Démonstration. — Soit g1, . . . , gn une base de Rn contenue dans G et X = ∑ni=1[0, 1] ·gi.

L’ensemble X ∩G est fini et comme Rn = X +⊕ni=1Z · gi, on a G = X ∩G+⊕ni=1Z · gi.On en déduit que G/⊕ni=1 Z · gi est fini, et donc que G est un Z-module libre de rang n.Comme c’est un sous-groupe discret de Rn, c’en est un réseau.

Ceci achève la démonstration du théorème 9.1. Si u1, . . . , ur1+r2−1 sont tels que lesLog(ui) forment une base de Log(O×K), alors le déterminant d’un mineur r1 + r2 − 1 ×r1 + r2 − 1 de la matrice des Log(ui) ne dépend pas (au signe près) du choix du mineurni de celui de la base et sa valeur absolue s’appelle le régulateur de K noté RK .

Proposition 9.6. — On a vol(Log(O×K)) =√r1 + r2 ·RK.

Démonstration. — Les Log(ui) sont r1 +r2−1 vecteurs de somme des composantes nulledans Rr1+r2 et le vecteur de composantes constantes v = (1/

√r1 + r2 . . . 1/

√r1 + r2) est

de norme 1 et orthogonal aux Log(ui) ce qui fait que :

vol(Log(O×K)) = |det|

v

Log(u1)...

Log(ur1+r2−1)

.

Il suffit alors de remplacer l’une des colonnes par la somme de toutes les colonnes.

Application : l’équation de Pell-Fermat. Si d > 0 est sqf et d ≡ 2, 3 mod 4 et K =Q(√d), alors OK = Z[

√d]. On a NK/Q(x + y

√d) = x2 − dy2 et si z = x + y

√d est

une unité, alors NK/Q(z) = ±1. Le théorème 9.4 implique donc qu’il existe toujours unesolution à l’équation x2 − dy2 = 1, et ces solutions sont toutes de la forme (x, y) avecx + y

√d = (x0 + y0

√d)n où x0 + y0

√d est une unité fondamentale ou son carré (selon

que sa norme est 1 ou −1).

INTRODUCTION À LA THÉORIE DES NOMBRES 27

Pour trouver les unités fondamentales de Z[√d], on utilise les fractions continues. Si

{ai}i≥0 est une suite de R>0, on pose

[a0; a1; . . . ; an] = a0 +1

a1 +1

· · ·+1an

Si on définit deux suites {pi}i≥0 et {qi}i≥0 par p0 = a0 et q0 = 1 et p1 = a0a1 + 1 etq1 = a1 et pn = anpn−1 + pn−2 et qn = anqn−1 + qn−2, alors [a0; a1; . . . ; an] = pn/qn pourtout n.

Si x ∈ R≥0 est irrationnel, on pose x0 = x et pour n ≥ 0, an = bxnc et yn = xn − anet xn+1 = 1/yn. La suite {ai}i≥1 est une suite de Z≥1. La proposition suivante rassemblequelques propriétés des fractions continues.

Proposition 9.7. — On a x = limn→+∞[a0; a1; . . . ; an]. De plus :

1. Si n ≥ 1 et si 1 ≤ q ≤ qn et p sont tels que |x−p/q| ≤ |x−pn/qn|, alors p/q = pn/qn.

2. Si p, q sont tels que |x− p/q| < 1/2q2, alors il existe n tel que p/q = pn/qn.

Si d ≥ 5 est sqf et d ≡ 2, 3 mod 4 et K = Q(√d), alors OK admet une unité fonda-

mentale, de la forme p+ q√d avec p, q ∈ Z≥1. On a p2 − dq2 = ±1 et donc∣∣∣∣∣√d− p

q

∣∣∣∣∣ = 1q(p+ q

√d)<

12q2 .

Par le (2) de la proposition ci-dessus, p/q est de la forme pn/qn et l’unité fondamentalede OK est donc égale à pn +

√dqn où n est le plus petit entier tel que p2

n − dq2n = ±1.

Si d ≡ 1 mod 4, alors les unités de OK donnent des solutions de l’équation x2−dy2 = 4avec x et y de même parité, et on adapte la méthode ci-dessus.

10. Correspondance de Galois

Le théorème principal de la théorie de Galois est le suivant.

Théorème 10.1. — Si L/K est une extension galoisienne de groupe de Galois G =Gal(L/K), alors on a une « dualité » entre les sous-extensions K ⊂ F ⊂ L et les sous-groupes H de G, donnée par :

F 7→ Gal(L/F ) et H 7→ LH ,

ces deux constructions étant réciproques l’une de l’autre.De plus, l’extension LH/K est galoisienne si et seulement si H est un sous-groupe

distingué de G.

28 LAURENT BERGER

Avant de continuer, voyons ce qui se passe pour les corps finis. Un corps fini est toujoursde cardinal q = pf et si l’on travaille dans une clôture algébrique fixée Fp de Fp et si k estde cardinal q, alors k = {x ∈ Fp tels que xq = x} = Fq : il n’existe donc qu’une extensionde Fp de degré f . On a par ailleurs Fpf ⊂ Fpn si et seulement si f divise n. L’applicationσq : Fp → Fp donnée par σq(x) = xq est un automorphisme de corps qui est l’identitésur Fq et qui préserve Fqf ; l’extension Fqf/Fq admet donc f automorphismes distincts1, σq, . . . , σf−1

q et est donc galoisienne de groupe Z/fZ. La théorie de Galois des corpsfinis est donc très simple : toutes les extensions sont galoisiennes et tous les groupes deGalois sont cycliques. Enfin, le théorème de l’élément primitif est vrai pour les corps finiscar F×q est cyclique.

11. Corps cyclotomiques

Une classe importante de corps de nombres est donnée par les corps cyclotomiques ; cesont les corps K = Q(ζn) où n ≥ 3. Le n-ième polynôme cyclotomique est :

Φn(X) =∏

k∈(Z/nZ)×(X − ζkn).

Lemme 11.1. — Le polynôme Φn(X) appartient à Z[X] est irréductible dans Q[X].

Démonstration. — Les conjugués de ζn sont de la forme ζan avec a ∧ n = 1 et commex 7→ ax est une bijection de (Z/nZ)× on voit que les coefficients de Φn(X) appartiennentà Z. Soit à présent P (X) le polynôme minimal de ζn de telle sorte qu’on peut écrireXn − 1 = P (X)Q(X). Si p est un nombre premier qui ne divise pas n, et si P (z) = 0,montrons que P (zp) = 0. Si ce n’est pas le cas, alors c’est que Q(zp) = 0 et donc queP (X) divise Q(Xp). Dans Fp[X], le polynôme P (X) divise alors Q(X)p et donc Xn − 1admet des racines multiples. Ceci n’est pas possible car le discriminant de Xn − 1, quivaut ±nn, est non nul dans Fp si p ne divise pas n. On en déduit que P (ζpn) = 0 pourtout p premier ne divisant pas n, puis que P (ζan) = 0 pour tout a premier à n ce qui faitque P (X) = Φn(X) qui est donc irréductible.

Le polynôme Φn(X) est donc le polynôme minimal de ζn et donc [Q(ζn) : Q] = ϕ(n).Rappelons que si n = pe1

1 · · · perr , alors ϕ(n) = ∏r

i=1 pei−1i (pi − 1).

Théorème 11.2. — L’anneau des entiers de Q(ζn) est Z[ζn].

Démonstration. — Nous ne démontrons pas ce résultat dans ce cours, la démonstrationétant un peu technique.

INTRODUCTION À LA THÉORIE DES NOMBRES 29

Si g ∈ Gal(Q(ζn)/Q), alors il existe χ(g) ∈ (Z/nZ)× tel que g(ζn) = ζχ(g)n et on en

déduit un morphisme injectif qui est alors bijectif (comparer les cardinaux), le caractèrecyclotomique :

χ : Gal(Q(ζn)/Q) ' (Z/nZ)×.

Les corps cyclotomiques sont des cas particuliers d’extensions abéliennes de Q, c’est-à-dire de corps K tels que Gal(K/Q) est abélien. Un théorème de Kronecker et Weber ditque toute extension abélienne de Q est contenue dans un corps cyclotomique. C’est parexemple le cas pour les corps quadratiques.

Proposition 11.3. — Si d 6= 0, 1 est sans facteur carré, alors il existe n ≥ 1 tel queQ(√d) ⊂ Q(ζn).

Démonstration. — Rappelons que si p est un nombre premier impair, nous avons définiles sommes de Gauss G(a) = ∑p−1

k=0

(kp

)ζakp , et que nous avons montré que G(1)2 = p∗ où

p∗ =(−1p

)p. Observons que G(a) ∈ Z[ζp] et donc que

√p∗ ∈ Q(ζp). Par ailleurs

√−1 = ζ4

et√−2 ∈ Q(ζ8) comme ζ8 + ζ8 =

√2. On en déduit que si d = ±2e · p1 · · · pr, alors

Q(√d) ⊂ Q(ζ8)·Q(ζp1) · · ·Q(ζpr). On peut donc prendre n = 8p1 · · · pr voire n = 4|d|.

12. Lois de réciprocité

Si l’extension L/K est galoisienne et si q est un idéal au-dessus de p, alors pour g ∈Gal(L/K) l’idéal g(q) est un idéal au-dessus de g(p) = p.

Proposition 12.1. — Si l’extension L/K est galoisienne, alors Gal(L/K) agit transi-tivement sur l’ensemble {q1, . . . , qr} des idéaux au-dessus de p.

Démonstration. — Supposons que q2 6= g(q1) quel que soit g ∈ Gal(L/K). Dans cecas on a q2 + g(q1) = OL quel que soit g ∈ Gal(L/K) et par le théorème des restes,il existe x ∈ OL tel que x = 0 mod q2 et x = 1 mod g(q1) pour tout g. Commex ∈ q2 on a NL/K(x) ∈ q2 ∩ OK = p et comme x = 1 mod g(q1) pour tout g, on aNL/K(x) = ∏

g∈Gal(L/K) g−1(x) = 1 mod q1 et donc NL/K(x) = 1 mod p ce qui est une

contradiction.

Si L/K est galoisienne et si pOL = qe11 · · · qer

r , on en déduit que e1 = · · · = er et quef1 = · · · = fr. Soit L/K une extension finie. Si q est un idéal premier de OL au-dessus del’idéal premier p de OK , on note e(q/p) l’indice de ramification de q/p et f(q/p) = [kq : kp]l’indice d’inertie de q/p. Si l’on a une tour d’extensions, alors e(r/p) = e(r/q)e(q/p) etf(r/p) = f(r/q)f(q/p).

30 LAURENT BERGER

Proposition 12.2. — On a ∑q|p e(q/p)f(q/p) = [L : K].

Démonstration. — Cette proposition généralise le corollaire 3.8. La démonstration estessentiellement la même, mais algébriquement un peu plus pénible si p n’est pas principal.Si L/Q et K/Q sont toutes les deux galoisiennes, on peut s’en sortir de la manièresuivante. Pour un p donné, la valeur des indices e et f ne dépend que de l’extension, etil s’agit donc de montrer que e(L/K)f(L/K)r(L/K) = [L : K]. Par le corollaire 3.8, ona e(L/Q)f(L/Q)r(L/Q) = [L : Q] et e(K/Q)f(K/Q)r(K/Q) = [K : Q]. On en déduitque e(L/K)f(L/K)r(L/K) = [L : K].

Soit L/K une extension galoisienne. Si q est un idéal premier de OL on note Dq

le sous-groupe de Gal(L/K) constitué des g tels que g(q) = q : c’est le sous-groupe dedécomposition de q. Par la proposition 12.1, c’est un sous groupe de Gal(L/K) de cardinal[L : K]/r = ef . Si q′ est un autre idéal au-dessus de p alors par la proposition 12.1, ilexiste g tel que q′ = g(q) et on a alors Dq′ = gDqg

−1.Le corps kq est une extension de kp de degré f et le groupe Dq agit sur kq d’où un

morphisme Dq → Gal(kq/kp) ' Z/fZ. Nous allons voir que ce morphisme est surjectif.Par la correspondance de Galois, on a une tour d’extensions L ⊃ LDq ⊃ K. L’idéal

q de L est au-dessus d’un idéal qD de LDq et comme Gal(L/LDq) = Dq l’idéal q estle seul idéal de L au-dessus de qD. On a par ailleurs e(q/qD)f(q/qD) = [L : LDq ] =card(Dq) = e(q/p)f(q/p) et donc e(q/p) = e(q/qD) et f(q/p) = f(q/qD) et donc aussie(qD/p) = f(qD/p) = 1. En particulier, kqD

= kp.

Proposition 12.3. — Le morphisme Dq → Gal(kq/kp) est surjectif.

Démonstration. — Soit θ un élément de OL tel que kq = kp[θ] et A(X) ∈ kp[X] lepolynôme minimal de θ et B(X) ∈ OLDq [X] celui de θ sur LDq ce qui fait que B(X) estscindé (à racines simples) dans OL et que A(X) | B(X). Si σ ∈ Gal(kq/kp), alors σ(θ) estune racine de A(X) et donc de B(X) ce qui fait qu’il existe une racine θ′ ∈ OL de B(X)dont l’image dans kq est σ(θ). Si g est un élément de Gal(L/LDq) = Dq tel que g(θ) = θ′

alors on voit que l’image de g dans Gal(kq/kp) est σ.

Le noyau Iq du morphisme Dq → Gal(kq/kp) s’appelle le sous-groupe d’inertie de Dq etil est donc de cardinal e(q/p). Si q est non-ramifié, alors Iq = {1} et le groupe Gal(L/K)contient le sous-groupe cyclique Dq ' Gal(kq/kp). Le groupe Gal(kq/kp) est engendré parle morphisme de Frobenius [x 7→ xq] où q = card(kp) et on appelle le Frobenius de q

l’élément σq ∈ Dq ⊂ Gal(L/K) dont l’image dans Gal(kq/kp) est le Frobenius [x 7→ xq].Cet élément est aussi noté (q, L/K) ∈ Gal(L/K).

INTRODUCTION À LA THÉORIE DES NOMBRES 31

Si g ∈ Gal(L/K), alors (g(q), L/K) = g(q, L/K)g−1 et donc si Gal(L/K) est abélien,alors (q, L/K) ne dépend que de p et on le note alors (p, L/K) ∈ Gal(L/K). Si I =∏ni=1 p

αii est un idéal de OK tel qu’aucun pi n’est ramifié dans L, alors on note (I, L/K) =∏n

i=1(pi, L/K)αi , et l’objet des lois de réciprocité est de décrire explicitement ces élémentsen termes de I, ce que nous allons faire pour l’extension K = Q(ζn)/Q.

Rappelons que l’anneau des entiers de Q(ζn) est Z[ζn]. Remarquons que ζn est annulépar Xn − 1 dont le discriminant est ±nn ce qui fait que si p est un nombre premier quine divise pas n, alors p est non-ramifié dans Q(ζn). Rappelons que l’on a construit unisomorphisme canonique Gal(K/Q)→ (Z/nZ)×, donné par g 7→ χ(g) où g(ζn) = ζχ(g)

n .

Théorème 12.4. — Si a ∈ Z≥1 est premier à n, alors χ((a),Q(ζn)/Q) = a.

Démonstration. — Par multiplicativité, il suffit de vérifier cette formule pour un nombrepremier p ne divisant pas n. Si σ = χ−1(p) ∈ Gal(Q(ζn)/Q), alors σ(ζn) = ζpn. ÉcrivonspZ[ζn] = ∏r

i=1 qi. On a qi = (p,Qi(ζn)) où Qi(X) ∈ Z[X] et Qi(ζpn)−Qi(ζn)p ∈ pZ[ζn] cequi fait que σ(qi) ⊂ qi et donc σ(qi) = qi. On a bien σ ∈ Dqi

. Ensuite, σ agit par [x 7→ xp]sur Z[ζn]/p = ∏r

i=1 Z[ζn]/qi où pZ[ζn] = ∏ri=1 qi et donc σ = ((p),Q(ζn)/Q).

Cette loi de réciprocité nous donne en particulier des informations sur la décompositiond’un nombre premier p dans Q(ζn). En effet ((p),Q(ζn)/Q) engendre un groupe isomorpheà Z/fZ et donc le théorème 12.4 implique que f est l’ordre de p modulo n.

Corollaire 12.5. — Un nombre premier p - n est totalement décomposé dans Q(ζn) siet seulement si p ≡ 1 mod n.

Proposition 12.6. — Si L ⊃ K ⊃ Q est une tour d’extensions telle que L/Q estabélienne et si q est un idéal premier de L au-dessus de p de K et de p de Q, alors :

1. (p,K/Q) est l’image dans Gal(K/Q) de (p, L/Q) ∈ Gal(L/Q) ;

2. (p, L/K) = (p, L/Q)f(K/Q) dans Gal(L/K) ⊂ Gal(L/Q).

Démonstration. — L’image de (p, L/Q) dans Gal(kq/Fp) est le Frobenius [x 7→ xp] etdonc la restriction de (p, L/Q) à K est bien (p,K/Q). Montrons le (2). L’image de(p, L/Q)f(K/Q) est l’application [x 7→ xq] avec q = pf(K/Q) et par le (1) son image dansGal(K/Q) est triviale ce qui fait que (p, L/Q)f(K/Q) ∈ Gal(L/K) vaut donc (p, L/K).

Le théorème 12.4 permet de redémontrer la loi de réciprocité quadratique. Si p estun nombre premier impair, posons p∗ = (−1)(p−1)/2p de telle manière que Q(

√p∗) ⊂

Q(ζp). On a Gal(Q(ζp)/Q) = (Z/pZ)× et Gal(Q(√p∗)/Q) = {±1}. Comme (Z/pZ)× est

32 LAURENT BERGER

cyclique, il n’existe qu’une seule application non triviale (Z/pZ)× → {±1} et c’est doncle symbole de Legendre. Si q est un nombre premier distinct de p, on a donc :

(q,Q(√p∗)/Q) = q

p−12 =

(qp

).

Par ailleurs, on a (q,Q(√p∗)/Q) = ±1 selon que q est décomposé ou pas dans

Q(√p∗)/Q c’est-à-dire selon que p∗ est un carré modulo q ou pas, ce qui fait que :(q

p

)= (q,Q(

√p∗)/Q) =

(p∗

q

)et donc que : (q

p

)(pq

)= (−1)

p−12 ·

q−12

C’est la partie la plus importante de la loi de réciprocité quadratique, démontrée parGauss. Il faut lui rajouter la formule

(2p

)= (−1)(p2−1)/8 qui suit de la même manière du

fait que 2 est décomposé dans Q(√p∗) si et seulement si p∗ = 1 mod 8.

13. La fonction ζ de Dedekind

Si s ∈ C vérifie Re(s) > 1, alors ζ(s) = ∑n≥1 1/ns converge et cela définit une fonction

holomorphe. On a la décomposition en produit eulérien :

ζ(s) =∏

p premier

11− p−s

qui permet de relier les propriétés de la fonction ζ à la distribution des nombres premiersde Z. Dans ce chapitre, nous allons généraliser la définition de cette fonction à un corpsde nombres. Avant tout, nous avons besoin d’étendre son domaine de définition.

Rappelons que la fonction Γ est définie par :

Γ(s) =∫ ∞

0ts−1 exp(−t)dt si Re(s) > 0,

et que l’on a Γ(s + 1) = sΓ(s) et que Γ(s) 6= 0 pour tout s ∈ C tel que Re(s) > 0. Parailleurs, on a Γ(s) =

∫∞0 ns−1ts−1 exp(−nt)d(nt) ce qui fait que :

1ns

= 1Γ(s)

∫ ∞0

ts−1 exp(−nt)dt

et donc que :

ζ(s) = 1Γ(s)

∫ ∞0

ts−1

∑n≥1

exp(−nt) dt = 1

Γ(s)

∫ ∞0

ts−1

exp(t)− 1dt

En écrivant :

Γ(s)ζ(s) =∫ 1

0ts−1

(1

exp(t)− 1 −1t

)dt+ 1

s− 1 +∫ ∞

1

ts−1

exp(t)− 1dt,

INTRODUCTION À LA THÉORIE DES NOMBRES 33

on voit que la fonction ζ se prolonge en une fonction méromorphe sur {s ∈ C tels queRe(s) > 0} avec un pôle simple de résidu 1 en s = 1.

On peut montrer que la fonction ζ se prolonge en une fonction méromorphe sur C toutentier avec pour seul pôle s = 1 et qu’elle vérifie l’équation fonctionnelle :

ζ(1− s) = 2(2π)−sΓ(s) cos(πs/2)ζ(s).

Dans ce cours, nous généralisons plutôt la définition de la fonction ζ à un corps denombres K afin d’étudier son résidu en s = 1. On pose donc, suivant Dedekind :

ζK(s) =∑

I idéal de OK

1N(I)s .

Si K = Q, alors on retrouve bien la fonction ζ définie ci-dessus. Pour un corps de nombresK, on peut montrer (et on va le faire pour [K : Q] = 2) que la série qui définit ζK(s)converge pour Re(s) > 1 et que ζK(s) se prolonge en une fonction méromorphe sur {s ∈ Ctels que Re(s) > 1− 1/[K : Q]} avec un pôle simple en s = 1 de résidu :

κ = 2r1(2π)r2hKRK

ωK√|disc(K)|

,

où hK = card Cl(OK), RK est le régulateur et ωK est le nombre de racines de l’unitécontenues dans K.

Si f(n) est le nombre d’idéaux I de OK tels que N(I) = n, alors ζK(s) = ∑n≥1 f(n)n−s

et la première étape est de comprendre comment f varie. Si C ∈ Cl(OK) est une classed’idéaux, soit iC(t) le nombre d’idéaux I non nuls tels que I ∈ C et tels que N(I) ≤ t.

Proposition 13.1. — On a :

iC(t) = 2r1(2π)r2RK

ωK√|disc(K)|

· t+O(t1−1/[K:Q]).

Démonstration. — Si K = Q, alors iC(t) = btc et la proposition est immédiate. Nousallons la démontrer pour [K : Q] = 2, le cas général étant similaire mais plus difficileà suivre. Remarquons que si J est un idéal dont la classe est C−1, alors l’application« multiplication par J » donne une bijection entre {I de classe C tels que N(I) ≤ t} et{(α) ⊂ J tels que N((α)) ≤ tN(J)}. On se ramène donc à compter des idéaux principaux(α), c’est-à-dire des α à unité près.

Premier cas : K = Q(√−d) est un corps quadratique imaginaire. Le plongement σ :

K → R2 défini au §8 est donné par σ(a + b√−d) = (a, b

√d). Le nombre de α ∈ J

tels que |NK/Q(α)| ≤ tN(J) est égal aux nombres de σ(α) = (x, y) ∈ σ(J) tels que

34 LAURENT BERGER

x2 + y2 ≤ tN(J) et c’est donc le nombre de points dans σ(J)∩D(0,√tN(J)). Si δ est le

diamètre d’un domaine fondamental de σ(J), alors :

π(r − δ)2 ≤ vol(J) · card(D(0, r) ∩ σ(J)) ≤ π(r + δ)2,

et donc card(D(0, r) ∩ σ(J)) = πr2/ vol(J) + O(r) ce qui fait que le nombre de σ(α) =(x, y) ∈ σ(J) tels que x2 + y2 ≤ tN(J) vaut :

πtN(J)vol(J) +O(

√t) = 2πt√

|disc(K)|+O(

√t).

puisque l’image de OK est un réseau de volume vol(OK) =√|disc(K)|/2 et vol(J) =

N(J) vol(OK). Reste à constater que deux α qui diffèrent par une unité engendrent lemême idéal, et donc que pour obtenir le nombre d’idéaux il faut diviser par ωK , et queRK = 1 car r1 + r2 − 1 = 0 (voir le chapitre 9).

Deuxième cas : K = Q(√d) est un corps quadratique réel. Le plongement σ : K → R2

est donné par σ(a + b√−d) = (a + b

√d, a − b

√d) ce qui fait que si σ(α) = (x, y), alors

N(α) = xy. Par ailleurs, si l’on appelle uK l’unité fondamentale de K, alors σ(αuK) =(xuK , y · ±u−1

K ) et donc on peut toujours multiplier α par une puissance de uK pour que1 ≤ |y/x| < u2

K . Le volume de la région délimitée par les équations 1 ≤ |y/x| < u2K et

|xy| ≤ tN(J) (cf le dessin page 168 du livre de Marcus) vaut 4tN(J) log(uK) ce qui faitque comme ci-dessus, le nombre de α ∈ J qui vérifient 1 ≤ |y/x| < u2

K et |N(α)| ≤ tN(J)est égal à :

4tN(J) log uKvol(J) +O(

√t)

Deux tels α engendrent le même idéal si et seulement si ils diffèrent par ±1 ce qui faitque comme vol(J) = N(J) vol(OK) avec vol(OK) =

√|disc(K)| et comme ωK = 2 et

RK = log uK on trouve la bonne formule.

Lemme 13.2. — Si {ak}k≥1 est une suite de nombres complexes telle que ∑k≤t ak =O(tr), alors ∑n≥1 an/n

s converge si Re(s) > r et définit une fonction holomorphe sur{s ∈ C, Re(s) > r}.

Démonstration. — Posons Ak = a1 + · · ·+ ak de telle sorte que |Ak| ≤ Ckr. On a :

amms

+ · · ·+ am+`

(m+ `)s = Am − Am−1

ms+ · · ·+ Am+` − Am+`−1

(m+ `)s =

Am+`

(m+ `)s −Am−1

ms+ Am

(1ms− 1

(m+ 1)s

)+ · · ·+ Am+`−1

(1

(m+ `− 1)s −1

(m+ `)s

)

INTRODUCTION À LA THÉORIE DES NOMBRES 35

En utilisant le fait que |1/ks − 1/(k + 1)s| ≤ |s|/kRe(s)+1 on trouve que :∣∣∣∣∣amms+ · · ·+ am+`

(m+ `)s

∣∣∣∣∣ ≤C

(m+ `)Re(s)−r + C

mRe(s)−r + |s|C(

1mRe(s)−r+1 + · · ·+ 1

(m+ `− 1)Re(s)−r+1

),

qui tend vers 0 uniformément quand m → ∞ si s est dans un compact fixé de {s ∈C, Re(s) > r}. Par les propriétés usuelles des fonctions holomorphes, cela implique lelemme.

On en déduit le théorème ci-dessous, dû à Hecke.

Théorème 13.3. — Si K est un corps de nombres, alors ζK(s) se prolonge en unefonction méromorphe sur {s ∈ C tels que Re(s) > 1− 1/[K : Q]} avec un pôle simple ens = 1 de résidu :

κ = 2r1(2π)r2hKRK

ωK√|disc(K)|

.

Démonstration. — Si f(n) est le nombre d’idéaux I de OK tels que N(I) = n, alorsζK(s) = ∑

n≥1 f(n)n−s et par ailleurs f(1) + · · ·+ f(n) = ∑C iC(n) ce qui fait que si l’on

pose an = f(n)−κ, alors la proposition 13.1 nous dit que a1 + · · ·+an = O(n1−1/[K:Q]) etdonc par le lemme 13.2 que la série∑n≥1(f(n)−κ)n−s définit une fonction holomorphe sur{s ∈ C tels que Re(s) > 1−1/[K : Q]} ce qui fait que ζK(s)−κζ(s) y est holomorphe, etcela implique le théorème étant donnés les rappels qu’on a fait au début du chapitre.

Enfin, on a toujours une décomposition de ζK(s) en produit eulérien qui reflète l’exis-tence et l’unicité de la décomposition des idéaux en produit d’idéaux premiers :

ζK(s) =∏

p premier

11− N(p)−s

si Re(s) > 1.

14. Fonctions L

Un caractère de Dirichlet mod n est un homomorphisme χ : (Z/nZ)× → C×. Il se peutqu’il existe m divisant n tel que χ se factorise par χ : (Z/nZ)× → (Z/mZ)× → C× et leplus petit m tel que χ se factorise par (Z/mZ)× est appelé le conducteur de χ noté fχ.On étend χ en une fonction χ : Z→ C par χ(a) = χ(a mod fχ) si a∧ fχ = 1 et χ(a) = 0sinon. Si m ∈ Z, alors on définit la somme de Gauss G(m,χ) = ∑

a mod f χ(a)ζamf .

Proposition 14.1. — On a G(m,χ) = χ(m)G(1, χ) et G(1, χ)G(1, χ) = χ(−1)f .

36 LAURENT BERGER

Démonstration. — Si m ∧ f = 1 alors :

G(m,χ) =∑

a mod fχ(a)ζamf = χ(m)

∑a mod f

χ(am)ζamf = χ(m)G(1, χ).

Si m ∧ f = d > 1, alors χ(m) = 0 et :

G(m,χ) =∑

a mod fχ(a)ζam/df/d =

∑b mod f/d

ζbm/df/d

∑a=b mod f/d

χ(a) = 0

car ∑a=1 mod f/d χ(a) = 0. Ensuite :

G(1, χ)G(1, χ) = G(1, χ)∑

b mod fχ(b)ζbf =

∑b mod f

G(b, χ)ζbf

=∑

a,b mod fχ(a)ζabf ζbf =

∑a mod f

χ(a)∑

b mod fζb(a+1)f = χ(−1)f.

On dit que χ est un caractère quadratique si l’image de χ est incluse dans {±1}. Ondit qu’un caractère χ est pair si χ(−1) = 1 et impair si χ(−1) = −1. Si χ est un caractèrequadratique de conducteur f , alors on a G(1, χ) ∈ Q(ζf ) et la proposition 14.1 impliqueque G(1, χ)2 = χ(−1)f ce qui fait que Q(

√χ(−1)f) ⊂ Q(ζf ).

Montrons que tout corps quadratique de discriminant D est inclus dans Q(ζ|D|). Sip est un nombre premier impair, alors le symbole de Legendre (·/p) est un caractèrequadratique χp de conducteur p. On peut de même construire χ4 de conducteur 4 etdeux caractères χ±8 de conducteur 8, l’un pair et l’autre impair. Si l’on écrit K = Q(

√d)

où d = ±p1 · · · pr est sans facteur carré, alors D = 4d si d = 2, 3 mod 4 et D = d sid = 1 mod 4. Si D est impair, alors on pose χ = χp1 · · ·χpr . Si D = 4d avec d impair,alors on pose χ = χ4χp2 · · ·χpr et sinon on pose χ = χ±8 χp2 · · ·χpr où le signe est choisipour que χ ait la bonne parité. Dans tous les cas, on vérifie que χ est de conducteur |D|et a la bonne parité, de sorte que K ⊂ Q(ζ|D|).

Proposition 14.2. — Si K, D et χ sont comme ci-dessus, alors on a

χ(p) =

0 si p est ramifié dans K,1 si p est décomposé dans K,−1 si p est inerte dans K.

Démonstration. — La proposition dit que χ(p) =(Dp

). Si par exemple D est impair, alors

D = ±p1 · · · pr et χ = χp1 · · ·χpr . On a donc χ(p) =(pp1

)· · ·

(ppr

)et la loi de réciprocité

quadratique implique que( pp1

)· · ·

( ppr

)=(p1

p

)· · ·

(prp

)· (−1)

p−12∑r

i=1pi−1

2 .

INTRODUCTION À LA THÉORIE DES NOMBRES 37

Si D > 0, alors D ≡ 1 mod 4 et donc ∑ri=1

pi−12 est pair ce qui fait que χ(p) =

(Dp

). Si

D < 0, alors ∑ri=1

pi−12 est impair et on trouve alors que

χ(p) =(|D|p

)(−1)

p−12 =

(|D|p

)(−1p

)=(D

p

).

Le cas où D est pair se traite de la même manière.

Si χ est un caractère de Dirichlet modulo n non trivial, alors χ(1) + · · ·+ χ(n) = 0 etdonc ∑k≤t χ(k) = O(1) ce qui fait que par le lemme 13.2, la série :

L(s, χ) =∑n≥1

χ(n)ns

converge pour Re(s) > 0 et définit une fonction holomorphe dans ce demi-plan. Cettefonction se décompose en produit Eulérien :

L(s, χ) =∏

p premier

11− χ(p)p−s .

Une application classique de la théorie des fonctions L est la démonstration du théorèmede Dirichlet : si n ≥ 3 et a ∈ Z est premier avec n, alors il existe une infinité de nombrepremiers p avec p ≡ a mod n. Donnons le principe de la démonstration pour n = 4. Soitχ4 le caractère de conducteur 4, étendu à Z.

Lemme 14.3. — Si χ est un caractère et s > 1, alors logL(s, χ) = ∑p χ(p)p−s +Rχ(s)

où Rχ(s) est borné quand s→ 1.

Démonstration. — On a pour s > 1 :

logL(s, χ) = −∑p

log(1− χ(p)p−s) =∑p

χ(p)p−s +∑p

∑m≥2

m−1χ(p)mp−ms.

et donc

|Rχ(s)| =

∣∣∣∣∣∣∑p

∑m≥2

m−1χ(p)mp−ms∣∣∣∣∣∣ ≤

∑p

∑m≥2

p−ms ≤∑p

p−2s(1− p−s)−1 ≤ 2ζ(2).

Théorème 14.4. — Il existe une infinité de nombres premiers p avec p ≡ 1 mod 4 etune infinité de nombres premiers p avec p ≡ 3 mod 4.

Démonstration. — Si s > 1, alors par le lemme 14.3, on a log ζ(s) = ∑p p−s + R1(s)

et logL(s, χ4) = ∑p χ4(p)p−s + R4(s) avec R1(s) et R4(s) bornés quand s → 1. Par

38 LAURENT BERGER

ailleurs, logL(s, χ4) est bornée quand s → 1 car L(s, χ4) est holomorphe si s > 0 etL(1, χ4) = π/4 6= 0. On a

log ζ(s) + logL(s, χ4) = 2∑

p≡1 mod 4p−s +R1(s) +R4(s) + 2−s

log ζ(s)− logL(s, χ4) = 2∑

p≡3 mod 4p−s +R1(s)−R4(s) + 2−s

Comme ζ(s) → ∞ quand s → 1, on en déduit que ∑p≡1 mod 4 p−s et ∑p≡3 mod 4 p

−s

divergent quand s→ 1, ce qui implique le théorème.

La démonstration du théorème de Dirichlet pour n arbitraire est similaire. Une manièrede faire consiste à montrer tout d’abord que ζQ(ζn)(s) = ζ(s) ·∏χ:(Z/nZ)×→C×,χ 6=1 L(s, χ),d’en déduire que L(1, χ) 6= 0 pour tout χ 6= 1, puis à raisonner comme ci-dessus.

Passons à une autre application, les formules analytiques de nombre de classe. Soit Kune extension quadratique de Q et f = |disc(K)|. Par la proposition 14.2, le caractèrequadratique χ : (Z/fZ)× → {±1} associé à K s’étend en une fonction donnée par

χ(p) =

0 si p est ramifié dans K,1 si p est décomposé dans K,−1 si p est inerte dans K.

Corollaire 14.5. — Si p est premier, alors ∏p|(p)(1−N(p)−s) = (1−p−s)(1−χ(p)p−s).

Démonstration. — Si p est ramifié, alors (p) = p2 et N(p) = p et χ(p) = 0. Si (p) estdécomposé, alors (p) = p1p2 et N(pi) = p et χ(p) = 1. Si p est inerte, alors (p) = p etN(p) = p2 et χ(p) = −1. Dans les trois cas, on vérifie la formule.

Théorème 14.6. — Si K est un corps quadratique et si χ est le caractère quadratiquequi lui est attaché, alors :

L(1, χ) =

2πhKωK√f

si K est imaginaire,

2hK log uK√f

si K est réel.

Démonstration. — Par le corollaire 14.5, on a ζK(s) = ζ(s)L(s, χ). En particulier, lerésidu en s = 1 de ζK(s) vaut L(1, χ) et le théorème suit du théorème 13.3.

Par exemple, si K = Q(√−1) alors χ = χ4 et donc χ(a) = (−1)(a−1)/2 si a est impair

et 0 sinon ce qui fait que :

L(1, χ) = 1− 13 + 1

5 − · · · =π

4

INTRODUCTION À LA THÉORIE DES NOMBRES 39

et donc que hK = 1. On peut trouver des formules closes générales pour L(1, χ). Remar-quons que par le théorème 14.6, on a L(1, χ) ∈ R>0.

Proposition 14.7. — Si K est un corps quadratique et si χ est le caractère quadratiquequi lui est attaché, alors :

L(1, χ) =

π

f√f

∣∣∣∣∣∣∑

a∧f=1χ(a)a

∣∣∣∣∣∣ si K est imaginaire,

1√f

∣∣∣∣∣∣∑

a∧f=1χ(a) log sin

(aπ

f

)∣∣∣∣∣∣ si K est réel.

Démonstration. — Rappelons qu’on a les sommes de Gauss G(n, χ) = ∑a mod f χ(a)ζanf

et que χ = χ comme χ est quadratique. Comme G(n, χ) = χ(n)G(1, χ), on a :

G(1, χ)L(1, χ) =∑n≥1

G(n, χ)n

=∑

a mod fχ(a)

∑n≥1

ζanfn

= −∑

a mod fχ(a) log(1− ζaf ),

car ∑n≥1 zn/n = − log(1 − z) si |z| ≤ 1 et z 6= 1, où log(r exp(iθ)) = r + iθ avec

−π/2 < θ < π/2. On a alors 1− ζaf = − exp(iπa/f)(2i sin(πa/f)) et donc :

log(1− ζaf ) = iπa

f− iπ

2 + log(2) + log sin(aπ

f

).

La proposition résulte alors du fait que ∑a mod f χ(a) = 0 car χ est non trivial et que∑a mod f χ(a) log sin(πa/f) = 0 si χ est impair et que ∑a mod f χ(a)πa/f = 0 si χ est pair

ainsi que du fait que |G(1, χ)| =√f par la proposition 14.1.

Comme conséquence, on trouve des « formules analytiques de nombre de classe ».

Corollaire 14.8. — Si K est un corps quadratique et si χ est le caractère quadratiquequi lui est attaché, alors :

hK =

1f

∣∣∣∣∣∣∑

a∧f=1χ(a)a

∣∣∣∣∣∣ si K 6= Q(√−1),Q(

√−3) est imaginaire,

1log(uK)

∣∣∣∣∣∣∣∣∑

a∧f=1a<f/2

χ(a) log sin(aπ

f

)∣∣∣∣∣∣∣∣ si K est réel.

La première formule permet de calculer hK et la deuxième u±hKK .

40 LAURENT BERGER

Références[Bou] N. Bourbaki – Eléments d’histoire des mathématiques[Cox] D. Cox – Primes of the form x2 + ny2

[Gau] C.-F. Gauss – Disquisitiones Arithmeticae[IR] K. Ireland & M. Rosen – A classical introduction to modern number theory[Mar] D. Marcus – Number fields[Neu] J. Neukirch – Algebraic number theory

Laurent Berger, UMPA, ENS de Lyon, UMR 5669 du CNRSE-mail : [email protected] • Url : http://perso.ens-lyon.fr/laurent.berger/