55
THEORIE ERGODIQUE ET APPLICATIONS TER de Master 1 ROUSSEAUX Emmanuel VOISIN Nathalie 15 juin 2007 Mouvement Brownien (vue d’artiste) 1

THEORIE ERGODIQUE ET APPLICATIONS

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: THEORIE ERGODIQUE ET APPLICATIONS

THEORIE ERGODIQUE ET APPLICATIONSTER de Master 1

ROUSSEAUX Emmanuel VOISIN Nathalie

15 juin 2007

Mouvement Brownien (vue d’artiste)

1

Page 2: THEORIE ERGODIQUE ET APPLICATIONS

2

Page 3: THEORIE ERGODIQUE ET APPLICATIONS

1 INTRODUCTION 3

1 Introduction

En mécanique classique on étudie l’évolution au cours du temps de certainssystèmes physiques, comme une toupie, un gaz, une étoile et ses planètes... Si, autemps initial t = 0, le système est représenté par un point x de l’espace des phasesX, alors au temps t ce système est représenté par un point f t(x).

Lorsque l’on ne dispose pas de formule explicite pour f t, on cherche à comprendrele comportement de f t(x) pour t grand. Une telle étude qualitative a été initiée parPoincaré. Dans les exemples issus de la mécanique céleste, il arrive souvent grâce àla conservation de l’énergie, que l’espace des phases soit compact, et qu’il existe surX une mesure finie invariante par f t.

Pour clarifier les phénomènes, certains mathématiciens sont sortis du cadre deséquations différentielles en ne gardant que l’espace X et le groupe à un paramètrede transformation ({f t, t ∈ R}, ◦) (système dynamique continu), ou encore quel’espace X et une transformation f (pas toujours inversible) de l’espace X (systèmedynamique discret). Dans ce dernier cas on s’interesse au comportement asympto-tique des itérations fn de f . Pour mener l’étude qualitative du comportement def t(x) pour t grand, deux cadres s’avèrent particulièrement bien adaptés : celui dela topologie (systèmes dynamiques topologiques) et celui de la théorie de la mesure(théorie ergodique).

Nous nous placerons ici dans le cadre de la théorie de la mesure.La théorie de la mesure est une branche récente des mathématiques qui étudie les

formes linéaires sur certains espaces vectoriels de fonctions numériques. Le conceptde mesure est beaucoup plus général que celui de mesure au sens usuel utilisé enmétrologie dans les autres sciences expérimentales et techniques et qui consiste àaffecter à certains sous-ensembles d’un ensemble E un nombre réel positif satisfaisantà certaines conditions (mesure d’un segment, d’un angle, etc.).

La théorie de la mesure est aujourd’hui pratiquement synonyme de théorie del’intégration. Elle comprend comme application importante la théorie des probabi-lités.

Ce TER sera conduit par deux axes : après un bref rappel de notions élémentairesen théorie de la mesure et en topologie, nous étudierons les applications préservant lamesure, dans le but d’accéder à quelques résultats de la théorie ergodique, dont nousfournirons quelques applications ; puis dans un second temps nous nous focaliseronssur les applications mélangeantes.

Nous fournissons en fin de document un récapitulatif des principaux résultats dela théorie de l’intégration de Lebesgue, le lecteur pourra s’y référer en cas de doute.

Remerciements : Nous remercions M. Wang, professeur au département de ma-thématiques à Nantes, pour son suivi tout au long du semestre, ses conseils et aidesqui ont permis la réalisation de ce projet.

Page 4: THEORIE ERGODIQUE ET APPLICATIONS

TABLE DES MATIÈRES 4

Table des matières1 Introduction 3

2 Préambule 52.1 Introduction à L’ergodicité . . . . . . . . . . . . . . . . . . . . . . . . 52.2 Notions préliminaires . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.2.1 Mesure de Haar . . . . . . . . . . . . . . . . . . . . . . . . . . 72.2.2 Notions topologiques . . . . . . . . . . . . . . . . . . . . . . . 8

3 Applications préservant la mesure 123.1 Définitions et exemples . . . . . . . . . . . . . . . . . . . . . . . . . . 123.2 Isométries associées . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153.3 Récurrence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

3.3.1 Exemple 1 : interprétation de la divergence. . . . . . . . . . . 19

4 Ergodicité 214.1 Résultats préliminaires . . . . . . . . . . . . . . . . . . . . . . . . . . 214.2 Le théorème ergodique . . . . . . . . . . . . . . . . . . . . . . . . . . 24

4.2.1 Application 1 : Les nombres normaux . . . . . . . . . . . . . . 314.2.2 Application 2 : Le théorème ergodique Lp de Von Neumann . 334.2.3 Application 3 : Caractérisation d’une application ergodique . . 35

5 Mélange : 375.1 Transformations mélangeantes . . . . . . . . . . . . . . . . . . . . . . 375.2 Fractions continues . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

5.2.1 Préliminaires . . . . . . . . . . . . . . . . . . . . . . . . . . . 445.2.2 La transformation de Gauss . . . . . . . . . . . . . . . . . . . 44

5.3 Transformation linéaire du tore . . . . . . . . . . . . . . . . . . . . . 46

A Notations : 47

B Rappels de théorie de la mesure 48B.1 Résultats élémentaires en théorie de la mesure. . . . . . . . . . . . . . 48

B.1.1 Tribus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48B.1.2 Fonctions mesurables . . . . . . . . . . . . . . . . . . . . . . . 50B.1.3 Mesures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

B.2 Principaux résultats de la théorie de l’intégration de Lebesgue . . . . 52

Page 5: THEORIE ERGODIQUE ET APPLICATIONS

2 PRÉAMBULE 5

2 Préambule

2.1 Introduction à L’ergodicitéErgodicité : Historiquement, le mot ergodique (εργoµ = énergie, oδoσ = che-

min) reflète l’idée, due à Boltzmann, que, le plus souvent, un système physique décritau cours du temps un chemin sur l’hypersurface à énergie constante, chemin qui estdense sur cette hypersurface. De nos jours, le concept mathématique d’ergodicité nefait plus référence à la physique ou à la topologie.

Les phénomènes d’ergodicité et les hypothèses, postulats, principes, théorèmeset théories qui s’y rattachent sont d’abord apparus en physique.

Débarrassé de son appareil mathématique formel, on peut définir l’ergodicitécomme la propriété d’un système qui tend, aux divers sens possibles du calcul desprobabilités, vers un état limite indépendant de la situation initiale.

Un exemple simple d’ergodicité est fourni par le battage d’un paquet de cartesà jouer, problème qui a été étudié par H. Poincaré. Un battage peut être considérécomme une suite de permutations ; la probabilité de passage d’un état du paquet àun autre état apparaît comme une matrice M = (pij) où pij est la probabilité pourqu’après une opération de battage la carte qui était à la i-ème place vienne occuper laj-ème. Si M satisfait à des conditions très générales, la probabilité p(n)

ij pour qu’aprèsn opérations la carte initialement à la i-ème place vienne occuper la j-ième tendvers une limite ωj, indépendante de i. Autrement dit la probabilité pour qu’aprèsun battage assez long une carte occupe une place donnée est indépendante de laposition qu’elle occupait initialement. C’est parce qu’ils admettent cette ergodicitéque les joueurs font confiance au battage (sans tricherie) des cartes pour rétablirune situation de "hasard" avant de commencer une nouvelle partie.

François Le Lionnais.

Théorie ergodique : Branche de la mécanique statistique née au début dusiècle de l’étude de systèmes dynamiques constitués par un grand nombre de par-ticules (mouvement brownien). Son cadre naturel devient aujourd’hui la théorie dela mesure. L’un de ses principes de base revient à substituer à la notion de "mesureinstantée" du physicien une certaine moyenne. Les applications de la théorie ergo-dique maintenant diverses vont des mathématiques appliquées jusqu’à la théorie desnombres.

Chaos : Dès 1899, H. Poincaré émettait l’hypothèse que d’infimes incertitudessur l’état initial d’un système sont amplifiées au cours du temps, de sorte qu’il estimpossible de prévoir l’évolution du système à long terme. A partir des années 60 denombreux scientifiques ont repris cette hypothèse. Edward Lorenz, sous la termino-logie d’"effet papillon", l’illustre ainsi : le vol d’un papillon provoque un déplacementd’air qui, dans six mois ou un an, aura une influence sur le temps à un endroit dela planète. Avec l’aide prépondérante de l’ordinateur, l’étude mathématique de cer-tains sytèmes dynamiques d’équations a permis de simuler de tels phénomènes quivont à l’encontre de l’opinion de nombreux scientifiques qui pensaient, avant Ed-ward Lorenz, que des causes simples entraînent des effets simples. La solution detels sytèmes est attirée par un attracteur étrange géométriquement très complexe

Page 6: THEORIE ERGODIQUE ET APPLICATIONS

2 PRÉAMBULE 6

(objet fractal) et l’évolution de la solution vers cet attracteur a un comportementerratique imprévisible. De plus, elle est très sensible aux conditions initiales : d’in-fimes modifications de ces dernières provoque une évolution très différente de lasolution vers l’attracteur. On dit que le comportement de la solution est cahotiqueou que le système engendre le chaos. Ce chaos, qui reflète le manque d’informationsur l’attracteur et sur l’évolution de la solution, est néanmoins déterministe puisqueengendré par un sytème d’équations parfaitement connu.

L’étude du chaos, en plein essor actuellement, s’appuie à la fois sur des théoriesmathématiques puissantes et sur les observations de simulations en laboratoire ousur ordinateurs et intéresse pratiquement toutes les branches des sciences (physique,chimie, géologie, économie, sociologie, psychologie...).

Page 7: THEORIE ERGODIQUE ET APPLICATIONS

2 PRÉAMBULE 7

2.2 Notions préliminaires2.2.1 Mesure de Haar

SoitG un groupe topologique compact. On peut définir naturellement une mesurede probabilité, liée à la structure de groupe de G. Cette mesure est définie sur la tribuB(G) des boréliens de G. Cette mesure possède de plus la propriété de régularité.

Définition 2.2.1 (Régularité) Soit X un espace topologique compact.Soit m une mesure définie sur la tribu de Borel de X. On dit que m est régulière

si :

∀ ε > 0, ∀ E ∈ B(X),∃ M compact,∃ U ouvert avec M ⊂ E ⊂ U, m(U\M) < ε(1)

Remarque 2.2.1 Pour justifier qu’une mesure est régulière, il suffit de vérifier :

∀ε > 0, ∀E ∈ B(X),∃M compact, avec M ⊂ E, m(E\M) < ε (2)

Preuve.Soit une mesure vérifiant (2).Soit ε > 0, E ∈ B.Appliquons (2) àX\E : ∃M compact deX tel queM ⊂ X\E etm((X\E)\M) <

ε2. Posons alors M = X\M qui est un ouvert de X, étant le complémentaire d’un

fermé.On a alors : m(M\E) = m((X\M)\E) = m((X\E)\M) < ε

2.

Rappelons que : pour Y un ensemble quelconque, ∀A,B ⊂ Y, A ⊂ B ⇒ X\B ⊂X\A. Donc ici on a E ⊂ M.

De plus toujours d’après (2), ∃ N compact de X, N ⊂ E et m(E\N) < ε2.

Alors on a : N ⊂ E ⊂ M et

m(M\N) = m(M\E) +m(E\N) <ε

2+ε

2= ε.

Remarque 2.2.2 SiX est métrisable, alors toute mesure de probabilité sur (X,B(X))est régulière.

Heuristique : La notion de régularité vient partiellement remédier à l’impossi-bilité de décrire précisement la tribu borélienne : on encadre alors avec une précisonarbitraire la mesure de tout borélien par celle d’un ouvert plus grand et d’un fermé(ou d’un compact) plus petit, ce qui est généralement possible.

Définition 2.2.2 (Mesure de Haar) Soit G un groupe topologique compact. Ondéfinit une mesure de probabilité m sur la tribu B(G) des boréliens de G vérifiant :

m(xE) = m(E) ∀ x ∈ G, ∀ E ∈ B(G) et de plus m est régulière. Cette mesureest appelée mesure de Haar.

Page 8: THEORIE ERGODIQUE ET APPLICATIONS

2 PRÉAMBULE 8

Théorème 2.2.3 La mesure de Haar ainsi définie existe et est unique.

Théorème donné dans [1].Remarquons que nous définissons la mesure de Haar comme une mesure de pro-

babilité.La mesure de Haar m vérifie de plus m(Ex) = m(E) ∀ x ∈ G, ∀ E ∈ B(G)car pour chaque x ∈ G fixé, la mesure mx définie par mx(E) = m(Ex) est

invariante par rotation et régulière et de plus égale à m.L’invariance par rotation de m peut aussi s’exprimer :Z

Gf(xy)dm(y) =

ZGf(y)dm(y) ∀ f ∈ L1(m), ∀x ∈ G

Si U est un ensemble ouvert non vide de parties de G, alors U possède une mesurede Haar, car G = ∪g∈G gU = g1U ∪ g2U ∪ . . . ∪ gkU par compacité.

Pour le groupe S1 = {z ∈ C | |z| = 1} la mesure de Haar est la mesure deLebesgue circulaire normalisée.

Pour le n-tore Tn la mesure de Haar est le produit direct de la mesure de Haarsur T.

Si mi est la mesure de Haar sur Gi, i ∈ Z, alors le produit direct des mesures

mi est la mesure de Haar sur le produit direct∞Y

i=−∞Gi.

La mesure de Haar sur le groupe à deux éléments Z\2Z = {0, 1} donne à chaque

point la mesure 12. Alors la mesure sur le produit direct

∞Yi=−∞

Z\2Z est le produit

direct de ces mesures.Sur un groupe compact métrisable G, il existe une distance ρ qui est invariante

par rotation, dans le sens où ρ(gx, gy) = ρ(x, y) = ρ(xg, yg) ∀ g, x, y ∈ G. Si dest une distance quelconque sur G et m une mesure de Haar, nous pouvons prendreρ(x, y) =

Z �Zd(gxh, dyh)dm(g)

�dm(h).

2.2.2 Notions topologiques

Nous noterons d, sauf mention contraire, la distance associée à un espace mé-trique X, noté aussi (X, d).

Rappelons que : ∀A, B ∈ X∂(A\B) ⊂ ∂A ∪ ∂B∂(A ∩B) ⊂ ∂A ∪ ∂B∂(A ∩B) ⊂ ∂A ∪ ∂B

Nous nous intéresseront plus particulièrement aux espaces métriques compacts,pour lesquels nous donnons quelques résultats importants :

Théorème 2.2.4 Soit X un espace topologique compact. Les assertions suivantessont équivalentes :

(i) X est métrisable.

Page 9: THEORIE ERGODIQUE ET APPLICATIONS

2 PRÉAMBULE 9

(ii) X possède une base d’ouverts dénombrables.(iii) C0(X) est séparable.

Preuve.(i) =⇒ (ii)Soit X un espace métrisable. Notons alors d une distance sur X. Posons, pour

x0 ∈ X, ε > 0, Bd(x0, ε) := {x ∈ X | d(x0, x) < ε}.Alors l’ensemble

�Bd

�x,

1

n+ 1

�| x ∈ X, n ∈ N

�forme une base d’ouvert de

(X, d).

(ii) =⇒ (iii)

Lemme 2.2.5 (Lemme d’Urysohn) Soit X un espace topologique séparé locale-ment compact, U un ouvert de X, K un compact de X inclus dans U . Alors il existeune fonction f continue de X dans [0, 1] telle que

x ∈ K ⇒ f(x) = 1.x 6∈ U ⇒ f(x) = 0.

Soit alors (Ui)i∈I une base d’ouverts de X. Soit (Ki)i∈I une famille de compactstelle que Ki ⊂ Ui, ∀i ∈ I. D’après Urysohn, il existe une fonction χi continue,positive, égale à 1 sur Ki avec support compact dans Ui. Alors l’ensemble des com-binaisons rationnelles de ces χi est dénombrable et dense dans C(X).

(iii) =⇒ (i) : admis.

Théorème 2.2.6 Soit (E, ‖.‖) un espace vectoriel normé.Soient A et B deux parties non vide de E. On a :(i) A, B compacts de E ⇒ A+B compact de E.(ii) A compact de E, B fermé de E ⇒ A+B fermé de E.

Preuve.(i) Approche élégante : Soient A, B deux compacts de E. Alors A× B est aussi

un compact de E. Posons f : E × E → E, (a, b) 7→ a+ b.f est une application continue car polynômiale, et A + B = f(A× B). L’image

continue d’un compact étant compact, A+B est un compact de E.Approche plus intuitive : Soient A, B deux compacts de E. E étant un espace

vectoriel donc métrique, nous utilisons la caractérisation des compacts par Bolzaro-Weierstrass. Soit (an + bn) une suite de C = A + B. Montrons que cette suitepossède au moins une valeur d’adhérence dans C. (an) étant une suite de A, et Aétant compact, ∃ (ank

) une sous suite de (an) convergente dans A. Considérons alorsla sous suite (ank

+ bnk) de C. (bnk

) étant une suite de B, et B étant compact,∃ (bnkp

) une sous suite de (bnk) convergente dans B. Alors la sous suite (ankp

+ bnkp)

de (an + bn) converge dans C, par convexité de la norme.

Page 10: THEORIE ERGODIQUE ET APPLICATIONS

2 PRÉAMBULE 10

(ii) Soient A un compact de E, B un fermé de E. Soit (an + bn) une suite deC = A + B convergent vers x ∈ E. (an) étant une suite de A, et A étant compact,∃ (ank

) une sous suite de (an) convergente vers un a ∈ A, i.e. ‖ank− a‖E −→

k→∞0.

Alors ‖bnk− (x− a)‖E ≤ ‖bnk

+ ank− x‖E + ‖ank

− a‖E −→k→∞

0 + 0 = 0. Donc lasuite (bnk

) converge vers b := x− a ∈ B par fermeture de B.On a ‖ank

+bnk−(a+b)‖E ≤ ‖ank

−a‖E +‖bnk−b‖E −→

k→∞0+0 = 0. Donc a+b est

une valeur d’adhérence de (an + bn), alors par unicité de la limite x = a+ b ∈ A+B.

Remarque 2.2.3 ATTENTION : A, B fermés de E 6⇒ A+B fermé de E. ExempleE = R, A = Z, B =

√2Z, A et B sont fermés, et

√2 étant irrationnel, le sous groupe

dénombrable A + B = Z[√

2] est dense dans R et différent de R (donc non fermédans R).

Théorème 2.2.7 Soit (G,+G, 0G) un groupe topologique abélien.Soient A et B deux parties non vide de G. On a :(i) A, B compacts de G ⇒ A+B compact de G.(ii) A compact de E, B fermé de E ⇒ A+B fermé de E.

Preuve de (i).Soient A, B deux compacts de G. Alors A×B est aussi un compact de G. A+B

est l’image continue du compact A × B par (a, b) 7→ a +G b (qui est par définitionune application continue).

Nous rappelons que lorsque K est un espace topologique compact, (C0(X), ‖.‖∞)est une algèbre de Banach.

En pratique nous utiliserons pour les démonstrations la caractérisation des com-pacts par les recouvrements (propriété de Borel-Lebesgue), le résultat suivant estalors interessant :

Théorème 2.2.8 (Lemme ε de Lebegue) : Soit (X, d) un espace métrique com-pact.

Soit (Oi)i∈I un recouvrement ouvert de X. Alors :

∃ ε réel > 0 tel que ∀x ∈ X, ∀r ≤ ε, ∃ ix,r ∈ I tel que B(x, r) ⊂ Oi.

Preuve. X étant compact, nous pouvons extraire de (Oi)i∈I un sous recouvre-ment fini.

Notons le (Ui)i∈J1,pK, p ∈ N∗.Supposons que le théorème soit faux, i.e.pour chaque n ≥ 1, ∃ xn ∈ X, tel que ∀i ∈ J1, pK, B(xn, 1/n) 6⊂ Ui.

Page 11: THEORIE ERGODIQUE ET APPLICATIONS

2 PRÉAMBULE 11

Considérons la suite (xn)n∈N∗ , comme X est un espace métrique compact, onpeut extraire une sous suite (xni

) convergente, vers un certain x ∈ X.(Ui)i∈J1,pK étant un recouvrement de X, ∃ j ∈ J1, pK tel que x ∈ Uj.Soit a = d(x,X\Uj) > 0. Prenons un ni tel que ni > 2/a et d(xni

, x) < a/2,alors :

∀y ∈ B(xni, 1/ni), d(y, x) ≤ d(y, xni

) + d(xni, x) <

1

ni

+a

2< a.

Alors B(xni, 1/ni) ⊂ Uj ⇒ contradiction.

Sur un espace métrique compact (X, d) se définit de manière naturelle une tribuB(X), appelée tribu de Borel, définie comme étant la plus petite (pour l’inclusion)tribu contenant les ouverts de X.

Toute application f : X → C continue est mesurable pour cette tribu.

Page 12: THEORIE ERGODIQUE ET APPLICATIONS

3 APPLICATIONS PRÉSERVANT LA MESURE 12

3 Applications préservant la mesure

3.1 Définitions et exemplesDéfinition 3.1.1 Soient (X1,B1,m1) et (X2,B2,m2) deux espaces probabilisés.

(a) Soit T : X1 → X2 une application, on dit que :T est mesurable si (B2 ∈ B2 ⇒ T−1(B2) ∈ B1)

(ce que l’on note par abus : T−1(B2) ⊂ B1).(b) Soit T : X1 → X2 une application, on définit :

T préserve la mesure si T est mesurable et ∀B2 ∈ B2 m1(T−1(B2)) = m2(B2)

(c) Soit T : X1 → X2 une application préservant la mesure, on définit :T est inversible si T est bijective et T−1 préserve aussi la mesure.

Remarques 3.1.1(1) Nous devrions écrire T : (X1,B1,m1) → (X2,B2,m2), la propriété de préser-

ver la mesure étant relative aux tribus et mesures définies sur les ensembles X1 etX2.

(2) Si T : X1 → X2 et S : X2 → X3 sont deux applications préservant la mesure,alors

S ◦ T : X1 → X3 est aussi une application préservant la mesure.

Preuve. Soit B ∈ B3, S préservant la mesure, on a m2(S−1(B)) = m3(B), et

m1((S ◦ T )−1(B)) = m1((T−1 ◦ S−1)(B)) = m1(T

−1(S−1(B))) = m2(S−1(B)) =

m3(B), car T préserve la mesure par hypothèse.

(3) Les applications préservant la mesure sont les applications preservant lesstructures d’espaces mesurés.

(4) Nous seront interessé par le cas (X1,B1,m1) = (X2,B2,m2), notamment lorsde l’étude des itérées T n d’une fonction T . Lorsque T : X −→ X est une applicationpréservant la mesure d’un espace (X,B,m) , on dit que T préserve m ou que T estm-invariante.

En pratique, pour montrer qu’une application donnée préserve la mesure, il n’estpas interessant d’utiliser la définition précédente, pour la simple raison que nousn’avons pas une connaissance explicite de tous les membres de la tribu. Cependantnous aurons souvent la connaissance explicite d’une semi-algèbre S générant la tribuB. Par exemple :

- Si X est l’intervalle unité [0, 1], S peut être la semi-algèbre de tous les sous-intervalles de X.

- Si X est un produit cartésien de R, S peut être l’ensemble de tous les pavés.Le théorème suivant est alors interessant pour déterminer si une application

préserve la mesure ou non.

Page 13: THEORIE ERGODIQUE ET APPLICATIONS

3 APPLICATIONS PRÉSERVANT LA MESURE 13

Théorème 3.1.2 Soient (X1,B1,m1), (X2,B2,m2) deux espaces de probabilité, etT : X1 → X2 une application.

Soit S2 une semi-algèbre générant B2.Si pour chaque A2 ∈ S2, T−1(A2) ∈ B1 et m1(T

−1(A2)) = m2(A2)Alors T est une application préservant la mesure.

Preuve.Notons C2 = {B ∈ B2 | T−1(B) ∈ B1, m1(T

−1(B)) = m2(B)}. Nous voulonsmontrer que C2 = B2. Par définition C2 ⊂ B2, et comme chaque membre de l’algèbreA(S2) générée par S2 s’écrit comme une union finie disjointe d’éléments de S2 (théo-rème B.1.3, page 48), nous avons A(S2) ⊂ C2. De plus C2 est trivialement une classemonotone. Or la tribu générée par A(S2) est la classe monotone générée par A(S2)(théorème B.1.13). Donc B2 = 〈B2〉.

Exemples d’applications préservant la mesure :

(1) L’application identité de (X,B,m) est trivialement une application préser-vant la mesure.

(2) Soit S1 := {z ∈ C | |z| = 1}. Soit B la tribu des boréliens de S1 etsoit m la mesure de Haar. Définissons, pour a ∈ S1, l’application T : S1 −→ S1 parT (z) = az. T est alors une application préservant la mesure pour l’espace (S1,B,m).T est appelée rotation de S1.

(3) La transformation T : G −→ G définie par T (x) = ax, où G est un groupetopologique compact et a un élément fixé de G, préserve la mesure de Haar. Cesapplications sont appelées rotations de G.

(4) Tout endomorphisme continu surjectif d’un groupe compact G préserve lamesure de Haar.

Preuve. Soit A : G −→ G un endomorphisme continu et soit m la mesure deHaar sur G. On définit alors une mesure de probabilité sur la tribu des boréliens deG par la formule µ(E) = m(A−1(E)). Cette mesure est régulière (car m l’est).

Alors µ(Ax·E) = m(A−1(Ax·E)) = m(x·A−1E) = µ(E). Or A est surjectif.Doncµ est invariante par rotation pour tout élément, alors µ = m par l’unicité de lamesure de Haar. Ceci montre que A préserve la mesure.

Exemple : l’application T (z) = zn, définie de S1 dans lui-même, est surjective,et donc préserve la mesure de Haar. (pour n ∈ N∗)

Définition-proposition 3.1.3 (produit direct) Soient Ti : Xi → Xi des appli-cations préservant la mesure définie sur un espace de probabilité (Xi,Bi,mi), pouri = 1, 2.

Le produit direct T1×T2 est l’application préservant la mesure de (X1×X2,B1×B2,m1 ×m2) définie par :

T1 × T2(x1, x2) = (T1(x1), T2(x2)).

Page 14: THEORIE ERGODIQUE ET APPLICATIONS

3 APPLICATIONS PRÉSERVANT LA MESURE 14

Preuve.Soient Ti : Xi → Xi une application préservant la mesure définie sur un espace

de probabilité (Xi,Bi,mi), pour i = 1, 2. Soit T = T1 × T2 le produit direct. Cetteapplication préserve la mesure des pavés :

Soit A×B ∈ B1 × B2, on a T−1(A×B) = (T−11 (A), T−1

2 (B)).De plus on a : (m1 × m2)(T

−1(A × B)) = (m1 × m2)(T−11 (A), T−1

2 (B)) =m1(T

−11 (A).m2(T

−12 (B)) = m1(A).m2(B) = (m1 ×m2)(A×B).

Or les pavés forment une semi-algèbre de X1 × X2 qui engendre B1 × B2, alorsd’après le théorème 3.1.2, l’application T est une application préservant la mesure.

Remarque 3.1.2 On peut de la même manière définir le produit direct d’applica-tions préservant la mesure pour un nombre infini dénombrable d’applications (nousn’en aurons pas l’utilité ici).

Page 15: THEORIE ERGODIQUE ET APPLICATIONS

3 APPLICATIONS PRÉSERVANT LA MESURE 15

3.2 Isométries associéesA tout espace mesuré (X,B,m) on associe les espaces de Banach suivant :Lp(X,B,m) = {f : X → C | f est mesurable et

Z|f |pdm <∞}/∼ (p ≥ 1)

où ∼ est la relation d’équivalence : f ∼ g ⇐⇒ {x ∈ X | f(x) 6= g(x)} estnégligeable (⇐⇒ est de mesure nulle).

Ces espaces font partie des outils les plus performants pour la résolution desproblèmes prenant place sur des espaces mesurés.

Nous savons qu’une application préservant la mesure T est un morphisme entreespaces mesurés. Il serait donc interessant de pouvoir associer à T un morphismeentre espaces Lp. C’est ce que nous allons définir dans ce qui suit.

Soit L0(X,B,m) l’espace quotient (par la relation d’équivalence définie précé-demment) des fonctions mesurables à valeurs dans C.

Soit L0R(X,B,m) l’espace quotient (par la relation d’équivalence définie précé-

demment) des fonctions mesurables à valeurs dans R.

Définition 3.2.1 Soit (Xi,Bi,mi) deux espaces de probabilité, i = 1, 2.Si T : X1 → X2 est une application préservant la mesure, on définit :l’opérateur induit UT : L0(X2,B2,m2) → L0(X1,B1,m1) par :

UTf(x) = f(Tx), f ∈ L0(X2,B2,m2), x ∈ X1.

On a :- UT (L0

R(X2,B2,m2)) ⊂ L0R(X1,B1,m1).

- UT est linéaire :

Soient f et g ∈ L0(X2,B2,m2), alors UT (λf + µg) = (λf + µg)(Tx)

= λ.f(Tx) + µ.g(Tx)

= λ.f(Tx) + µ.g(Tx)

= λ.UTf(x) + µ.UTg(x)

- UT (f.g) = (UTf)(UTg) : UT (f.g)(x) = f.g(Tx) = f(Tx).g(Tx) = (UTf)(UTg)(x).- Soit c une fonction constante, on a UT c = c(Tx) = c.- f ≥ 0 ⇒ UTf = f(Tx) ≥ 0. (On dit que UT est un opérateur positif).

Lemme 3.2.2 Soit (Xi,Bi,mi) deux espaces de probabilité, i = 1, 2.Soit T : X1 → X2 est une application préservant la mesure, on a :

F ∈ L0(X2,B2,m2) ⇒ZUTF dm1 =

ZF dm2

(où si l’une des intégrales n’existe pas ou vaut l’infini, il en est de même pourl’autre).

Preuve.

Page 16: THEORIE ERGODIQUE ET APPLICATIONS

3 APPLICATIONS PRÉSERVANT LA MESURE 16

On peut ne considérer que les fonctions à valeurs réelles (si F ∈ L0(X2,B2,m2)est à valeurs complexes, il suffit de considérer sa partie réelle et sa partie imaginaireséparemment).

On se place dans le cas où F est positive : si F est quelconque, on pose F (x) =F+(x) − F−(x) où : F+(x) = max(0, x) et F−(x) = max(0,−x). F+ et F− sontmesurables positives etZ

Fdm2 =ZF+dm2 −

ZF+dm2.

Supposons donc F ≥ 0. On veut montrer queZUTF dm1 =

ZF dm2

Si F est une fonction simple alors le résultat est vrai.En effet, F est simple ⇐⇒def F s’écrit sous la forme :

F (x) =∞X

n=1

ai1Ai(x) avec ai ∈ R, Ai ∈ B2.

On a alorsZFdm2 =

∞Xn=1

aim2(Ai) etZUTF dm1 =

ZF ◦ Tdm1

=Z ∞X

n=1

ai1Ai(T )dm1

=∞X

n=1

ai

Z1T−1(Ai) dm1

=∞X

n=1

aim1(T−1(Ai))

Or T préserve la mesure, donc m2(Ai) = m1(T−1(Ai)), ∀i ∈ N, donc :Z

UTF dm1 =∞X

n=1

aim2(Ai) =ZFdm2

Si F n’est pas simple, alors F étant mesurable, F est limite de fonctions simples.Comme F est positive, la limite peut être choisie croissante. On choisit donc une

suite de fonctions (Fn)n∈N qui croît vers F . Notons : Fn(x) =∞Xi=1

bn,i1Bn,i

Alors UTFn =∞Xi=1

bn,i1T−1(Bn,i) (avec T−1(Bn,i) ∈ B1) donc UTFn est aussi une

fonction simple.De plus ∀x ∈ X1, Fn(Tx) −→

n→+∞F (Tx) donc UTFn −→

n→+∞UTF .

Le théorème de convergence monotone nous donne alors :ZUTFdm1 = lim

n→∞

ZUTFndm1.

OrZUTFndm1 =

ZFndm2 car Fn fonction simple ∀n.

On applique de nouveau le théorème de convergence monotone pour la suite(Fn) :

limn→∞

ZFndm2 =

ZFdm2.

Page 17: THEORIE ERGODIQUE ET APPLICATIONS

3 APPLICATIONS PRÉSERVANT LA MESURE 17

Théorème 3.2.3 Soit p ≥ 1. On a :(i) UTL

p(X2,B2,m2) ⊂ Lp(X1,B1,m1).(ii) ‖UTf‖p = ‖f‖p∀f ∈ Lp(X2,B2,m2).En particulier : UTL

pR(X2,B2,m2) ⊂ Lp

R(X1,B1,m1).

Preuve.Soit f ∈ Lp(X2,B2,m2).Posons F (x) = |f(x)|p. On a

Z|f |pdm2 < ∞ donc

ZFdm2 < ∞ d’où F ∈

L0(X2,B2,m2).On peut donc appliquer le lemme précédent. on obtient :ZUT |f |pdm1 =

Z|f |pdm2. Or UT |f |p = (UT |f |)p et UT |f | = |f |(Tx) = |f(Tx)| =

|UTf |.donc UT |f |p = (|UTf |)p et finalement on obtient :Z

(|UTf |)pdm1 =Z|f |pdm2, soit ‖UTf‖p = ‖f‖p.

Par conséquent, une transformation T : X1 → X2 préservant la mesure induitune isométrie linéaire de Lp(X2,B2,m2) dans Lp(X1,B1,m1) (p ≥ 1).

En particulier, si T : X → X est une application préservant la mesure, inversible,d’un espace de probabilité (X,B,m) , alors UT est un opérateur orthogonal deL2(X,B,m). L’étude de UT est appelée l’étude spectrale de T . Nous verrons lors dela formulation des concepts d’ergodicité et d’applications mélangeante l’efficacité decette notion.

De plus, si T1 : X1 → X2, T2 : X2 → X3 préservent la mesure alors UT1◦T2 =UT2 ◦ UT1 . En effet,

UT1 ◦ UT2f(x) = UT1(UT2f(x))

= UT1(f(T2(x))) = f(T2(T1(x)))

= f(T2 ◦ T1(x))

= UT2◦T1f(x)

En particulier, pour T : X → X une transformation préservant la mesure, on a :∀N ∈ N, UT N = (UT )N .

Page 18: THEORIE ERGODIQUE ET APPLICATIONS

3 APPLICATIONS PRÉSERVANT LA MESURE 18

3.3 RécurrenceUne propriété vérifiée par toute les applications préservant la mesure est la pro-

priété de récurrence :La récurrence est une propriété de l’orbite d’un point, qui consiste à revenir une

infinité de fois vers son point de départ, un peu comme une comète qui revient assezrégulièrement près de la Terre.

Définition 3.3.1 (point récurrent, point périodique) Soit f une applicationcontinue d’un espace topologique X dans lui-même. Un point x de X est dit ré-current (pour f) s’il existe une suite strictement croissante d’entiers nk telle que

limk→∞

fnk(x) = x

Un point x est dit périodique pour f s’il existe n ≥ 1 tel que fn(x) = x.

Théorème 3.3.2 (Théorème de récurrence de Poincaré) Soit (X,B,m) un es-pace de probabilité, f : X → X une application préservant la mesure m, et A ∈ Btel que m(A) > 0.

Alors, pour m-presque tout point x de A, l’orbite (fn(x))n∈N repasse une infinitéde fois dans A.

Preuve.Notons An =

[k≥n

f−k(A) l’ensemble des points de X qui passent dans A lorsqu’on

itère f au moins n fois. Notons A∞ =\

n∈NAn l’ensemble des points de X qui passent

une infinité de fois dans A. Notons A = A ∩ A∞ l’ensemble des points de A quipassent une infinité de fois dans A.

Montrons d’abord que tout point de A repasse une infinité de fois dans A : soitx ∈ A, il existe une suite 0 < n1 < n2 < . . . d’entiers naturels tels que fni ∈ A, ∀i.Pour chaque i, nous avons fni(x) ∈ A car fnj−ni(fni(x)) ∈ A, ∀j.

Nous allons maintenant montrer que m(A) = m(A) :On a m(An+1) = m(f−1(An)) = m(An) puisque f préserve la mesure, alors

m(An) = m(A0) pour tout n. La suite (An)n∈N est décroissante (pour l’inclusion),Donc m(A∞) = m(

\n∈N

An) = limn→+∞

m(An) = m(A0).

De plus A ⊂ A0, donc m(A) = m(A0

\A) = m(A).

Corollaire 3.3.3 Soit X un espace métrisable séparable, m une mesure de proba-bilité borélienne sur X et f : X → X une application continue préservant m.

Alors m-presque tout point de X est réccurent pour f .

Preuve.Soit C une base dénombrable d’ouverts dans X (par exemple l’ensemble des

boules centrées en un point d’une partie dénombrable dense de X, et de rayonrationnel strictement positif).

Page 19: THEORIE ERGODIQUE ET APPLICATIONS

3 APPLICATIONS PRÉSERVANT LA MESURE 19

Pour tout élément B de C, le théorème de récurrence de Poincaré fournit unensemble m-négligeable NB tel que tout point de B−NB repasse une infinité de foisdans B.

La réunion N =S

B∈C NB est encore m-négligeable. Or, par construction, toutpoint du complémentaire de N est récurrent.

3.3.1 Exemple 1 : interprétation de la divergence.

Soit U un ouvert de Rn, F : U → Rn un champ de vecteur C1.On définit la divergence du champ F par :

divF (x) := traceDF (x)

Nous pouvons donner au mot "divergence" (inspiré de la mécanique des fluides)un sens intuitif :

divF > 0 ⇒ le flot ϕt défini par le champ de vecteurs F "diverge" : les trajectoiresdes points x ∈ U s’écartent les unes des autres et le volume d’un élément de fluide(volume n-dimensionnel) croît avec le temps t.

divF < 0 ⇒ le flot ϕt défini par le champ de vecteurs F "converge" : les trajec-toires des points x ∈ U de rapprochent les unes des autres et le volume d’un élémentde fluide décroît avec le temps t.

Théorème de Liouville : divF = 0 ⇒ le flot ϕt préserve le volume n-dimensionnel.

Ceci se voit facilement pour un champ linéaire.Cela s’explique par le fait que si F est à divergence nulle, Dϕt(x) est un endo-

morphisme de déterminant 1 en tout point :Soit F : Rn → Rn, une fonction C1 telle que div F = 0.On considère l’équation différentielle : f(t) = F (f(t)), f(0) = x.

Soit J(t) =

�∂fi

∂xj

�1≤i,j≤n

(matrice de Jacobi).

On pose D(t) = detJ(t).La différentielle d’un déterminant donne : D(t) = tr(tcom(J(t)) ∗ J(t)).

Et ∂fi

∂xj

(t) =nX

k=1

∂xkFi(f)∂xk

fk.

J(t) = ∇J(t) ∗ (∇F )(f) où ∇F =�

∂Fi

∂xj

�1≤i,j≤n

.D(t) =detJ(t) tr(∇F ) = D(t)divF (f(t, x)) = 0.Donc D(t) = 1, ∀t.

Dans ce cas particulier le théorème de réccurence de Poincarré donne un résultatintéressant :

Page 20: THEORIE ERGODIQUE ET APPLICATIONS

3 APPLICATIONS PRÉSERVANT LA MESURE 20

Proposition 3.3.4 Soit F un champ de vecteurs à divergence nulle sur un ouvert deRn. Soit ϕt son flot. Soit K un compact positivement invariant : ϕt(K) ⊂ K, t ≥ 0.

Alors, quel que soit t0 ≥ 0, presque tout x ∈ K est un point récurrent de ϕt0 .(i.e. la trajectoire de presque tout point de K revient arbitrairement près de x :lim infn→∞

‖ϕnt0(x)− x‖ = 0).

Preuve.L’application ϕ1 : K → K donnée par le temps t0 du flot préserve la mesure de

Lebesgue d’après le théorème de Liouville. Comme K est compact, sa mesure totaleest finie. On peut donc appliquer le théorème de récurrence de Poincaré.

Des situations où s’appliquent le principe de récurrence de Poincaré se ren-contrent fréquemment en dynamique hamiltonienne.

Dynamique hamiltonienne.Le formaliste hamiltonien de la mécanique classique, dans le cas conservatif (sans

frottements), conduit à une équation différentielle sur R2n du type suivant. Lescoordonnées de R2n sont groupées par paires (x1, y1), (x2, y2), etc. Les variablesd’une même paire sont appelées des variables conjuguées (par exemple : position -moment). On se donne une fonction H (le plus souvent C∞, appelée l’hamiltoniendu problème, définie sur un ouvert U de R2n. on considère le système différentielci-dessous, où i varie de 1 à n :

xi = +∂H

∂yi

yi = −∂H∂xi

Théorème 3.3.5(1) La fonction H est constante le long des orbites (préservation de l’énergie).(2) Le champ de vecteurs correspondant est à divergence nulle (préservation du

volume).

Ce théorème est admis. Voir [3] pour une preuve.

Page 21: THEORIE ERGODIQUE ET APPLICATIONS

4 ERGODICITÉ 21

4 Ergodicité

4.1 Résultats préliminairesSoit (X,B,m) un espace de probabilité et T : X −→ X une transformation

préservant la mesure. Si T−1B = B, B ∈ B, alors T−1(X\B) = X\B. L’étude de Tse ramène alors à l’étude des deux transformations T|B et T|X\B. Si 0 < m(B) < 1,nous avons simplifié l’étude de T . Si m(B) = 0 ou m(X\B) = 0, l’étude de Tn’est pas significativement simplifiée (car nous pouvons toujours en théorie de lamesure négliger un ensemble de mesure nulle) , cependant nous pouvons ignorerB ou X\B. Ceci nous mène donc vers l’étude des transformations qui ne peuventêtre décomposées comme précédemment, et aux façons d’exprimer toute applicationpréservant la mesure en terme de ces applications indécomposables. Nous qualifieronspar la suite ces applications indécomposables d’ergodiques.

Définition 4.1.1 Soit (X,B,m) un espace de probabilité.Soit T une application de (X,B,m) préservant la mesure, on dit que :

T est ergodique si les seuls éléments B ∈ B tels que T−1B = B satisfontm(B) = 0 ou m(B) = 1.

La condition d’ergodicité pour une application peut se vérifier de plusieurs façons,nous donnons quelques uns de ces outils dans les deux théorèmes suivants :

Théorème 4.1.2 Soit (X,B,m) un espace de probabilité.Soit T : X → X une application préservant la mesure.Les assertions suivantes sont équivalentes :(i) T est ergodique.(ii) Les seuls éléments B ∈ B tels que (T−1B∆B) = 0 vérifient m(B) = 0 ou

m(B) = 1.

(iii) ∀A ∈ B avec m(A) > 0, nous avons m(∞[

n=0

T−nA) = 1.

(iv) ∀A,B ∈ B avec m(A) > 0, m(B) > 0, ∃ n > 0 avec m(T−n(A ∩B)) > 0.

Ce théorème est admis. Voir [1] pour une preuve.

Théorème 4.1.3 Soit (X,B,m) un espace de probabilité.Soit T : X → X une application préservant la mesure.Les assertions suivantes sont équivalentes :(i) T est ergodique.(ii) f mesurable et ∀x ∈ X (f ◦T )(x) = f(x) ⇒ f est constante presque partout.(iii) f mesurable et presque pour tout x ∈ X (f◦T )(x) = f(x) ⇒ f est constante

presque partout.(iv) f ∈ L2(X,B,m) et ∀x ∈ X (f ◦ T )(x) = f(x) ⇒ f est constante presque

partout.(v) f ∈ L2(X,B,m) et presque pour tout x ∈ X (f ◦ T )(x) = f(x) ⇒ f est

constante presque partout.

Page 22: THEORIE ERGODIQUE ET APPLICATIONS

4 ERGODICITÉ 22

Preuve.Trivialement :(iii) ⇒ (ii).(ii) ⇒ (iv).(v) ⇒ (iv).(iii) ⇒ (v).Il reste alors à montrer (i) ⇒ (iii) et (iv) ⇒ (i).

Montrons d’abord (i) ⇒ (iii) :Supposons T ergodique et f mesurable telle que f ◦ T = f presque partout.Nous pouvons supposer que f est numérique (Pour f : X → C, il suffit de

considérer séparemment la partie réelle de la partie imaginaire).Définissons, pour k ∈ Z et n ∈ N, X(k, n) := f−1([k/2n, (k + 1)/2n]).Nous avons : T−1(X(k, n))∆X(k, n) ⊂ {x ∈ X | (f ◦T )(x) 6= f(x)} qui est par

hypothèse négligeable.Donc T−1(X(k, n))∆X(k, n) est aussi négligeable, i.e.m(T−1X(k, n)∆X(k, n)) =

0, et comme T est ergodique on a m(X(k, n)) = 0 ou 1.Pour chaque n fixé,

[k∈Z

X(k, n) = X est une union disjointe, donc par additivité

de m, ∃! kn avec m(X(kn, n)) = 1.

Soit Y =∞\

n=0

X(kn, n), alors on am(X\Y ) = m(∞[

n=0

X\X(kn, n)) ≤∞X

n=0

m(X\X(kn, n)) =

0. Donc m(Y ) = 1.De plus f est constante sur Y .Donc f est constante presque partout.(iv) → (i)Supposons que T−1E = E, , E ∈ B. Alors 1E ∈ L2(m) et (1E ◦ T )(x) = 1E(x)

pour tout x ∈ X, donc par (iv) 1E est constante presque partout. Donc 1E = 0p.p.

ou 1p.p. et m(E) =Z

X1E dm = 0 ou 1.

Exemples d’applications ergodiques :1. L’application identité de (X,B,m) est ergodique ⇐⇒ ∀B ∈ B, m(B) = 0 ou

1.

2. La rotation T (z) = az sur le cercle unité est ergodique ⇐⇒ a n’est pas uneracine de l’unitéPreuve.Nous avons vu précédemment que l’application préserve la mesure de Haar.Supposons que a soit une racine de l’unité, alors ap = 1 pour un certain p 6= 0.

Soit f(z) = zp. Alors f ◦ T (z) = apzp = zp = f(z), donc f ◦ T = f et f n’estpas constante p.p. Donc T n’est pas ergodique d’après le théorème précédent.

Réciproquemnt, supposons que a ne soit pas une racine de l’unité. Soit f ∈L2(m) vérifiant f ◦ T = f .

Page 23: THEORIE ERGODIQUE ET APPLICATIONS

4 ERGODICITÉ 23

Soit f(z) =+∞X

n=−∞cn(f)e2iπnz. Avec cn(f) =

Z]0,1[

e−2iπntf(e2iπt) dt. la théorie de

Fourier assure que la transformée de Fourier f 7→ (cn(f))n∈Z est une isométriede L2(m) dans l2(m). Posons a = e2iπθ, θ ∈]0, 1[. On a cn(f ◦T ) = e2iπnθcn(f)par changement de variable, et e2iπnθ 6= 1, ∀n 6= 0, donc pour tout n ∈ Z∗

on a (1 − e2iπnθ)cn(f) = 0, donc cn(f) = 0. Donc f est constante et T estergodique.

3. Soit G un groupe compact et T (x) = ax une rotation de G. On considère lamesure de Haar normalisée m. Alors T est ergodique ssi {an}+∞

−∞ est densedans G. En particulier, si T est ergodique, alors G est abélien.

Page 24: THEORIE ERGODIQUE ET APPLICATIONS

4 ERGODICITÉ 24

4.2 Le théorème ergodiqueLe résultat le plus important de la théorie ergodique fut établi par G.D. Birkhoff,

en 1931.

Théorème 4.2.1 (Théorème ergodique de Birkhoff) :Soit (X,B,m) un espace mesuré.Soit f : X → X une application mesurable qui préserve m.∀ϕ ∈ L1(X,m) on note :

Snϕ(x) :=1

n

n−1Xk=0

ϕ(fk(x)).

Alors on a :(i) La limite ϕ(x) = lim

n→∞Snϕ(x) existe pour m-presque tout x.

(ii) ϕ ◦ f = ϕ presque partout.(iii) ‖ϕ‖L1 ≤ ‖ϕ‖L1 .(iv) Si la mesure m est finie, alors la convergence a lieu dans L1, i.e.

limn→∞

‖Snϕ− ϕ‖L1 = 0.

(v) Pour toute partie A dans B, de mesure finie, telle que f−1(A) = A, on a :ZAϕ dm =

ZAϕ dm.

(vi) En particulier, si m est une mesure de probabilité ergodique, alors ϕ estconstante p.p. :

ϕ(x) =Z

Xϕ dm.

pour m-presque tout x.

Définition 4.2.2Snϕ(x) s’appelle une moyenne de Birkhoff de ϕ.La limite (lorsqu’elle existe) lim

n→∞Snϕ(x) s’appelle la moyenne orbitale (ou tem-

porelle) de ϕ.L’intégrale

ZXϕdm s’appelle la moyenne spatiale de ϕ.

Heuristique : Ce théorème est une version "quantitative" de la "densité" desorbites. Pour une application ergodique, il exprime que, pour toute partie mesurableA, la proportion de temps passé dans A par presque toutes les orbites est égale àm(A).

Le (vi) du théorème traduit que si m est une probabilité ergodique, alors presquetoutes les moyennes temporelles d’une fonction intégrable coïncident avec sa moyennespatiale.

Ceci traduit une propriété "d’équirépartition" de (presque toute) orbite, au sensque l’on peut calculer les intégrales des fonctions en prenant des moyennes desvaleurs de cette fonctions sur les orbites.

Page 25: THEORIE ERGODIQUE ET APPLICATIONS

4 ERGODICITÉ 25

Si m est une mesure de probabilité ergodique, en prenant pour ϕ la fonctioncaractéristique 1A d’un élément A de B, le résultat précédent dit que la proportionde temps

limn→∞

1

nCard{k ≤ n | fn(x) ∈ A}

que l’orbite de x passe dans A est égale à m(A), pour m-presque tout point x de X.

Afin d’effectuer la démonstration du théorème de Birkhoff, nous aurons besoindes théorèmes suivants :

On dit qu’un opérateur U : L1R(m) −→ L1

R(m) est positif si : ∀f positive, U(f)est une application positive.

Théorème 4.2.3 (Théorème ergodique maximal) : Soit U : L1R(m) → L1

R(m)un opérateur linéaire positif tel que ‖U‖ ≤ 1.

Soit N ∈ N∗.Soit f ∈ L1

R(m).On définit f0 = 0, fn = f + Uf + U2f + · · ·+ Un−1f, ∀n ≥ 1et FN(x) = max

0≤n≤Nfn(x) ≥ 0.

AlorsZ{x | FN (x)>0}

f dm ≥ 0.

Preuve.On a FN ∈ L1

R(m) car ∀p ∈ N, fp ∈ L1R(m) :Z

X|fp| dm ≤

p−1Xi=0

ZX|U if | dm ≤

p−1Xi=0

‖U‖iZ

X|f | dm ≤

p−1Xi=0

‖U‖i‖f‖1 <∞.

∀n ∈ J0, NK, on a : FN ≥ fn, donc FN − fn ≥ 0, alors U(FN − fn) ≥ 0 car U estun opérateur positif, alors U(FN) ≥ U(fn) par linéarité. Donc UFN +f ≥ Ufn+f =fn+1, ∀n ∈ J0, NK.

Donc, si FN(x) > 0, on a UFN + f ≥ max1≤n≤N

fn(x) = max0≤n≤N

fn(x) = FN(x) car(f0 = 0).

Alors f ≥ FN − UFN sur A = {x | FN(x) > 0}Donc

ZAf dm ≥

ZAFN dm−

ZAUFN dm

Or FN ≥ 0 donc X\A = {x | FN(x) = 0} EtZ

XFN dm =

ZAFN dm ≥Z

AFN dm+

ZX\A

FN dm =Z

AFN dm

DoncZ

Af dm =

ZXFN dm−

ZAUFN dm, or FN ≥ 0 donc UFN ≥ 0 ( U positif)

AlorsZ

XUFN dm ≥

ZAUFN dm (A ⊂ X), et −

ZXUFN dm ≤ −

ZAUFN dm

On aZ

Af dm ≥

ZXFN dm−

ZXUFN dm, or ‖U‖ ≤ 1, i.e. ‖U(FN)‖1 ≤ ‖FN‖1

D’oùZ

XUFN dm ≤

ZXFN dm

DoncZ

Af dm ≥ 0 i.e

Z{x | FN>0}

f dm ≥ 0.

Page 26: THEORIE ERGODIQUE ET APPLICATIONS

4 ERGODICITÉ 26

Corollaire 4.2.4 Soit T : X → X une application préservant la mesure. Soit g ∈L1

R(m).

Soit Bα =

(x ∈ X | sup

n≥1

1

n

n−1Xi=0

g(T i(x)) > α

).

AlorsZ

Bα∩Ag dm ≥ αm(Bα ∩ A), si T−1A = A et m(A) <∞.

Preuve.Supposons pour l’instant que m(X) <∞ et A = X.On considère l’opérateur UT défini précédemment. On rappelle que ‖UT‖ = 1, et

∀n ∈ N, UT n = UnT .

On a 1

n

n−1Xi=0

g(T i(x)) =1

n

n−1Xi=0

(UT ig)(x) =1

n

n−1Xi=0

(U iTg)(x).

Donc 1

n

n−1Xi=0

g(T i(x)) =1

ngn(x), en utilisant les notations du théorème précédent.

Posons f = g − α, on a :

Bα =

(x ∈ X | sup

n≥1

1

n

n−1Xi=0

f(T i(x)) > 0

)

=

(x ∈ X | sup

n≥1

n−1Xi=0

f(T i(x)) > 0

)

=

¨x ∈ X | sup

n≥1fn(x) > 0

«=

¨x ∈ X | sup

n≥0fn(x) > 0

«

=∞[

N=0

�x ∈ X | max

0≤n≤Nfn(x) > 0

=∞[

N=0

{x ∈ X | FN(x) > 0}

Or d’après le théorème précédent, on aZ{x | FN (x)>0}

f dm ≥ 0

DoncZ

f dm =ZS∞

N=0{x∈X | FN (x)>0}

f dm ≥ 0

i.e.Z

g − α dm ≥ 0

DoncZ

g dm ≥ αm(Bα)

Cas général : nous appliquons le même raisonnement à T|A pour obtenirZ

Bα∩Ag dm ≥

αm(Bα ∩ A).

Pour effectuer la démonstration du théorème ergodique de Birkhoff, nous allonsl’énoncer de la manière suivante, réduite à l’essentiel.

Page 27: THEORIE ERGODIQUE ET APPLICATIONS

4 ERGODICITÉ 27

Théorème 4.2.5 (Le théorème ergodique de Birkhoff) On suppose que T :(X,B,m) → (X,B,m) préserve la mesure, X fini ou σ-fini et f ∈ L1(m).

Alors 1

n

n−1Xi=0

f(T ix) converge p.p. vers une fonction f ∗ ∈ L1(m).

On a alors f ∗ ◦ T = f ∗ p.p et, si m(X) < +∞, on aZ

Xf ∗ dm =

ZXf dm

Preuve.(a) Montrons qu’il existe une application f ∗ vérifiant : 1

n

n−1Xi=0

f(T ix) → f ∗(x)

p.p.

Supposons d’abord que m(X) < +∞ et que f ∈ L1R(m).

(si f est à valeurs complexes, il suffit d’étudier les parties réelle et imaginaireséparément).

On considère les lim sup et inf car elles existent toujours :

Notons f ∗ = lim supn→+∞

1

n

n−1Xi=0

f(T ix) et f∗ = lim infn→+∞

1

n

n−1Xi=0

f(T ix)

Posons an(x) =1

n

n−1Xi=0

f(T ix). Alors an+1(x) =1

n+ 1

nXi=0

f(T ix).

Et an(Tx) =1

n

n−1Xi=0

f(T i+1x) =1

n

nXi=1

f(T ix).

D’où n+ 1

nan+1(x)− an(Tx) =

1

n

nXi=0

f(T ix)− 1

n

nXi=1

f(T ix) =1

nf(x).

Or lim supn→+∞

an(x) = f ∗(x) et lim infn→+∞

an(x) = f∗(x).Donc en passant à la lim sup on obtient :lim supn→+∞

an+1(x)− lim supn→+∞

an(Tx) = lim supn→+∞

1

nf(x) = 0 i.e f ∗(x)− f ∗(Tx) = 0p.p.

donc f ∗ ◦ T = f ∗p.p..De même en passant à la lim inf, on obtient : f∗ ◦ T = f∗.Montrons que f ∗ = f∗ p.p.Soient α, β ∈ R, on définit Eα,β = {x ∈ X | f∗(x) < β et α < f ∗(x)}.On a alors : {x ∈ X | f∗(x) < f ∗(x)} =

[α,β∈Q | β<α

Eα,β.

Montrons que m(Eα,β) = 0 si β < α :On a : T−1Eα,β = Eα,β :En effet, T−1Eα,β = {x ∈ X | Tx ∈ Eα,β} = {x ∈ X | f∗(Tx) < β et

α < f ∗(Tx)}.Or on a vu que f ∗ ◦ T = f ∗ et f∗ ◦ T = f∗.Donc T−1Eα,β = {x ∈ X | f∗(x) < β et α < f ∗(x)} = Eα,β.

Posons maintenant Bα =

(x ∈ X | sup

n≥1

1

n

n−1Xi=0

f(T ix) > α

).

On a Eα,β ∩Bα = Eα,β : en effet, Eα,β ⊂ Bα.

Soit x ∈ Eα,β alors α < limn→+∞

supm≥n

1

n

n−1Xi=0

f(T ix) ≤ supn≥1

1

n

n−1Xi=0

f(T ix).

Donc x ∈ Bα. De plus m(Eα,β) < +∞ car Eα,β ⊂ X et m(X) < +∞.

Page 28: THEORIE ERGODIQUE ET APPLICATIONS

4 ERGODICITÉ 28

Et on a supposé f ∈ L1R(m).

Donc on peut appliquer le corollaire précédent, et on obtient :ZEα,β∩Bα

f dm ≥ αm(Eα,β ∩Bα), i.eZ

Eα,β

f dm ≥ αm(Eα,β).

De plus, Eα,β = {x ∈ X | f∗(x) < β et α < f ∗(x)} = {x ∈ X | − f∗(x) > −βet −α > −f ∗(x)}.

Or −f∗ = − lim infn→+∞

1

n

n−1Xi=0

f(T i)(x) = lim supn→+∞

1

n

n−1Xi=0

−f(T ix) = (−f)∗.

De même −f ∗ = (−f)∗.Donc Eα,β = {x ∈ X | − α > (−f)∗(x) et (−f)∗(x) > −β} = {x ∈

X|(−f)∗(x) < −α et −β < (−f)∗(x)}.

Comme précédemment, en posant Bβ = {x ∈ X | supn≥1

1

n

n−1Xi=0

f(T i(x)) > −β}.

Et en appliquant le corollaire précédent, on obtient :ZEα,β∩Bβ

−f dm ≥ −βm(Eα,β∩Bβ), i.e−Z

Eα,β

f dm ≥ −βm(Eα,β), i.eZ

Eα,β

f dm ≤

βm(Eα,β)Finalement, on a obtenu :αm(Eα,β) ≤

ZEα,β

f dm ≤ βm(Eα,β).

Donc si β < α : αm(Eα,β) ≤ βm(Eα,β) ⇒ m(Eα,β) = 0.Or {x ∈ X | f∗(x) < f ∗(x)} =

[α,β∈Q|β<α

Eα,β.

Donc m({x ∈ X | f∗(x) < f ∗(x)} ≤X

α,β∈Q|β<α

m(Eα,β) = 0.

⇒ m({x ∈ X | f∗(x) = f ∗(x)}) = 1 (car f∗ ≤ f ∗)).

Donc f ∗ = f∗ p.p. ⇒ limn→+∞

1

n

n−1Xi=0

f(T ix) existe et vaut f ∗ = f∗.

On a montré que 1

n

n−1Xi=0

f(T ix) → f ∗(x) p.p.

(b) Montrons que f ∗ ∈ L1(m).

Soit gn(x) = | 1n

n−1Xi=0

f(T ix)|.

∀n ∈ N, gn(x) ≥ 0.

EtZgndm =

Z| 1n

n−1Xi=0

f(T i)|dm ≤Z 1

n

n−1Xi=0

|f(T i)|dm ≤ 1

n

n−1Xi=0

Z|f(T i)|dm

Or ‖f(T i)‖1 = ‖f‖1

DoncZgndm ≤ 1

n

n−1Xi=0

Z|f |dm = ‖f‖1 < +∞ car f ∈ L1(m).

Donc ∀n ∈ N,Zgndm < +∞

Donc lim infZgndm < +∞

Donc on peut appliquer le lemme de Fatou et on obtient :Zlim

n→+∞gndm ≤ lim inf

Zgndm < +∞

Page 29: THEORIE ERGODIQUE ET APPLICATIONS

4 ERGODICITÉ 29

Or limn→+∞

gn(x) = limn→+∞

| 1n

n−1Xi=0

f(T ix)| = | limn→+∞

1

n

n−1Xi=0

f(T ix)| = |f ∗|

⇒Z|f ∗|dm < +∞ i.e f ∗ ∈ L1(m).

(c) Montrons queZ

Xf ∗ dm =

ZXf dm si m(X) < +∞ :

On définit Dnk = {x ∈ X | k

n≤ f ∗(x) < k+1

n} où k ∈ Z, n ≥ 1.

On a : T−1(Dnk ) = Dn

k

En effet, T−1(Dnk ) = {x ∈ X | k

n≤ f ∗(Tx) ≤ k+1

n} = {x ∈ X | k

n≤ f ∗(x) ≤

k+1n}(car f ∗ ◦ T = f ∗) = Dn

k .De plus,∀ε > 0, Dn

k ∩B kn−ε = Dn

k

En effet, Dnk ⊂ B k

n−ε.

Soit x ∈ Dnk alors k

n≤ lim sup

n→+∞

1

n

n−1Xi=0

f(T ix) ≤ supn≥1

1

n

n−1Xi=0

f(T ix)

Donc k

n− ε < sup

n≥1

1

n

n−1Xi=0

f(T ix)

Donc x ∈ B kn−ε.

De plus, m(Dnk ) < +∞ car Dn

k ⊂ X et m(X) < +∞Donc on peut appliquer le corollaire précédent, et on obtient :Z

Dnk∩B k

n−ε

f dm =Z

Dnk

f dm ≥ (k

n− ε)m(Dn

k ∩B kn−ε) = (

k

n− ε)m(Dn

k )∀ε > 0.

⇒Z

Dnk

f dm ≥ k

nm(Dn

k )

On a : f ∗(x) ≤ k+1n

sur Dnk

DoncZ

Dnk

f ∗ dm ≤Z

Dnk

k + 1

ndm =

k + 1

n

ZDn

k

1 dm =k + 1

nm(Dn

k ) =k

nm(Dn

k )+

1

nm(Dn

k ) ≤Z

Dnk

f dm+1

nm(Dn

k )

Or on remarque que X =[k∈Z

, Dnk∀n ≥ 1 et les Dn

k sont disjoints (à cause de

l’inégalité stricte).Donc m(X) = m(

[k∈Z

Dnk ) =

Xk∈Z

m(Dnk )

EtZ

Xf∗ dm =

Xk∈Z

ZDn

k

f∗ dm

DoncZ

Dnk

f ∗ dm ≤Z

Dnk

f dm+1

nm(Dn

k )

⇒Xk∈Z

ZDn

k

f∗ dm ≤Xk∈Z

ZDn

k

f dm+1

n

Xk∈Z

m(Dnk

⇒Z

Xf ∗ dm ≤

ZXf dm+ (m(X)/n)

Et en faisant tendre vers +∞ on obtient :ZXf ∗ dm ≤

ZXf dm.(1)

On remplace f par −f et on applique ces résultats, cela nous donne :

Page 30: THEORIE ERGODIQUE ET APPLICATIONS

4 ERGODICITÉ 30

ZX

(−f)∗ dm ≤Z

X−f dm.

or (−f)∗ = −f∗ ⇒ −Z

Xf∗ dm ≤ −

ZXf dm.⇒

ZXf∗ dm ≥

ZXf dm.(2)

(1) et (2) ⇒Z

Xf ∗ dm ≤

ZXf dm ≤

ZXf∗ dm

or on a vu que f ∗ = f∗ p.p i.eZ

Xf ∗ dm =

ZXf∗ dm⇒

ZXf ∗ dm =

ZXf dm

Donc si m(X) < +∞ alorsZ

Xf ∗ dm =

ZXf dm

(d) Supposons maintenant que X soit σ-fini et m(X) = ∞.

Pour pouvoir appliquer le corollaire, nous devons montrer que m(Eα,β) < +∞pour β < α

Supposons d’abord que α > 0.Rappelons que X σ-fini ⇒ ∃An ∈ B tq X =

[n∈N

An et ∀n ∈ N,m(An) < +∞

On peut donc prendre C ∈ B tq C ⊂ Eα,β etm(C) < +∞ (carX =[

α,β∈Q|β<α

Eα,β)

Considérons la fonction h = f − α1CZX|f − α1C | dm ≤

ZX|f | dm+ α

ZX1C dm ≤ +∞

car f ∈ L1(m) et m(C) < +∞Donc h ∈ L1(m)

posons h0 = 0, hn =n−1Xi=0

h(T ix), HN = max0≤n≤N

fn

alors d’après théorème ergodique maximal, on a :Zx|HN>0

h dm ≥ 0 ∀N ≥ 1

On a : C ⊂ Eα,β ⊂∞[

N=0

x | HN(x) > 0 (par le même raisonnement que précé-

demment).Donc en appliquant le corollaire avec C, on obtient :

ZX|f | dm ≥

ZXf dm ≥

αm(C).i.e m(C) ≤ 1

α

ZX|f | dm < ∞, ∀C ∈ B avec m(C) < ∞ (car α > 0 et f ∈

L1(m)).Or X est σ-fini, donc on peut passer au sup et ainsi : m(Eα,β) <∞.Si α ≤ 0 alors β < 0 et on peut alors appliquer le même raisonnement à −f et

−β au lieu de f et α.Donc ∀α, m(Eα,β) <∞.Donc on peut appliquer le corollaire pour obtenir le résultat souhaité.

Page 31: THEORIE ERGODIQUE ET APPLICATIONS

4 ERGODICITÉ 31

4.2.1 Application 1 : Les nombres normaux

Définition 4.2.6 (Nombre normal) : Depuis E. Borel, on appelle nombre nor-mal par rapport à la base 10 tout nombre dont la répartition des chiffres de sondéveloppement décimal satisfait à la "loi du hasard". Plus généralement et plus pré-cisement : soit Pn≥1

bn

qn , avec bn < q, la partie fractionnaire d’un réel x écrit en baseq. Pour tout entier k > 0 et toute suite s = bibi+1 . . . bi+k−1 de k chiffres consé-cutifs de la partie fractionnaire de x, notons N(s, n) le nombre d’occurence de sdans b0b1 . . . bn. On dit que x est normal par rapport à la base q (ou en base q) silimn→+∞N(s, n)/n = q−k pour toute suite s de longueur k. A cause de la périodicitéde leur développement en base q, aucun nombre rationnel n’est normal en base q.

Le nombre de Champernowne (0,123456789101112131415..., irrationnel, trans-cendant, non nombre de Liouville) est normal en base 10. Par contre on ignore si√

2, e ou π sont normaux. On ne connaît pas d’exemple explicite de nombre algé-brique normal.

Définition 4.2.7 (Nombre absolument normal) : Un nombre réel est dit ab-solument normal s’il est normal par rapport à toute base.

Un nombre absolument normal est irrationnel.On ignore si le nombre de Champernowne est absolument normal. On sait que

l’ensemble des nombres qui ne sont pas absolument normaux est négligeable, et pour-tant on ne connaît aucun nombre dont on peut prouver la normalité dans toute base !

Théorème 4.2.8 (Théorème de Borel des nombres normaux) : Presque tousles nombres de [0, 1[ sont normaux en base 2, i.e. pour presque tout x ∈ [0, 1[, lafréquence d’apparition du chiffre 1 dans le développement binaire de x est 1

2.

Preuve. SoitT : [0, 1[ → [0, 1[

x 7→ 2x mod 1

T préserve la mesure de Lebesgue m : L’ensemble des sous-intervalles de [0, 1[forme une semi-algèbre de [0, 1[, il suffit donc de montrer que pour tout [c, d[⊂[0, 1[, m(T−1([c, d[)) = m([c, d[). En effet, soit [a, b[⊂ [0, 1[. Alors T ([a, b[) = 2([a, b[∩[0, 1

2[)∪

[2([a, b[∩[12, 1[)− 1[

Alors soit [c, d[⊂ [0, 1[, on a T−1([c, d[) = 12[c, d[∪1

2([c, d[+1).

Donc m(T−1([c, d[)) = m(12[c, d[)+m(1

2([c, d[+1)) = 2m(1

2[c, d[) = m([c, d[) donc

T préserve la mesure.De plus T est ergodique : il suffit de montrer que pour tout [c, d[⊂ [0, 1[ tq

T−1([c, d[) = [c, d[ on a m([c, d[) = 0 ou 1.Soit [c, d[( [0, 1[, cela signifie que soit c 6= 0, alors c

2∈ T−1([c, d[), mais c

26∈ [c, d[,

ou que d 6= 1, alors d2

+ 12∈ T−1([c, d[), mais d

2+ 1

26∈ [c, d[.

Donc les seuls intervalles vérifiant T−1([c, d[) = [c, d[ sont [0, 1[ et ∅, qui sontrespectivement de mesure 1 et 0. T est donc ergodique.

Soit Y l’ensemble des points de [0, 1[ qui ont une unique décomposition binaire.On peut écrire alors le complémentaire comme une union dénombrable de points

(de mesure de Lebesgue nulle) donc la mesure du complémentaire est nulle.

Page 32: THEORIE ERGODIQUE ET APPLICATIONS

4 ERGODICITÉ 32

Donc m(Y ) = 1.Soit x ∈ Y alors x a une décomposition binaire unique et on peut écrire x sous

la forme :x =

a1

2+a2

22+a3

23+ ... avec ai = 0 ou 1, ∀i.

Donc T (x) = T (a1

2+a2

22+a3

23+ ...) = (a1 +

a2

2+a3

22+ ...) mod 1 =

a2

2+a3

22+ ...

Soit f(x) = 1[1/2,1[(x).Alors

f(T i(x)) = f(ai+1

2+ai+2

22+ ...) =

¨1 si ai+1

2+ ai+2

22 + ... ≥ 12

0 sinon

Doncf(T i(x)) =

¨1 ⇐⇒ ai+1 = 10 ⇐⇒ ai+1 = 0

Donc si x ∈ Y,n−1Xi=0

f(T i(x)) représente le nombre 1 dans les n-premiers chiffres

de la partie fractionnaire de la décomposition binaire de x.Or d’après le théorème de Birkhoff, comme T est ergodique, on a :

f ∗(x) = limn→∞

1

n

n−1Xi=0

f(T i(x)) =1

m(Y )

ZYf dm p.p

Or m(Y ) = 1 donc limn→∞

1

n

n−1Xi=0

f(T i(x)) =Z

Y1[1/2,1[(x) dm = 1− 1

2p.p

Donc la fréquence de 1 dans la décomposition binaire de presque tout point de[0, 1[ est 1

2

Page 33: THEORIE ERGODIQUE ET APPLICATIONS

4 ERGODICITÉ 33

4.2.2 Application 2 : Le théorème ergodique Lp de Von Neumann

Corollaire 4.2.9 (Théorème ergodique Lp de Von Neumann) : Soit 1 ≤p < ∞ et soit T une application préservant la mesure de (X,B,m) un espace deprobabilité (donc de mesure finie).

Si f ∈ Lp, alors il existe f ∗ ∈ Lp tq f ∗ ◦T = f ∗ p.p. et 1

n

n−1Xi=0

f(T i)− f ∗

p

→ 0.

Preuve.Supposons que g soit bornée et mesurable, alors g ∈ Lp (car L∞ ⊂ Lp et notam-

ment g ∈ L1).Donc on peut appliquer le théorème de Birkhoff, et on obtient :1n

n−1Xi=0

g(T ix) −→n→∞

g∗(x) p.p

Or |g∗(x)| = | −→n→∞

1

n

n−1Xi=0

g(T ix)| ≤ ‖g‖∞ ≤ 1

nn|g(x)| <∞p.p. car g ∈ L∞

Donc g∗ ∈ L∞ et ‖g∗‖∞ ≤ ‖g‖∞

On a | 1n

n−1Xi=0

g(T i)− g∗|p −→n→∞

0 car 1n

n−1Xi=0

g(T ix) −→n→∞

g∗(x) p.p

De plus, |g∗(x) − 1

n

n−1Xi=0

g(T ix)|p ≤ |‖g∗‖∞ +1

n

n−1Xi=0

‖g ◦ T i‖∞|p ≤ 2p‖g‖p∞qui est

intégrable car m(X) est finie et g ∈ L∞ et | 1n

n−1Xi=0

g(T i)− g∗|p −→n→∞

0p.p.

donc par le théorème de convergence dominée :

limn→+∞

ZX|g∗(x)− 1

n

n−1Xi=0

g(T ix)|p dm =Z

Xlim

n→+∞|g∗(x)− 1

n

n−1Xi=0

g(T ix)|p dm = 0.

donc ‖ 1

n

n−1Xi=0

g(T i)− g∗‖p −→n→∞

0

Donc 1

n

n−1Xi=0

g(T ix) converge dans Lp donc elle est de Cauchy dans Lp :

Soit ε > 0, on peut choisir N0 tq ∀n > N0, k > 0,

‖ 1

n

n−1Xi=0

g(T ix)− 1

n+ k

n+k−1Xi=0

g(T ix)‖ < ε

3

Prenons maintenant f ∈ Lp et Sn(f)(x) =1

n

n−1Xi=0

f(T ix).

Nous devons montrer que Sn(f) converge dans Lp vers f ∗.Comme Lp est complet, montrons que Sn(f) est une suite de Cauchy dans Lp.Or ‖Sn(f)− Sn+k(f)‖p ≤ ‖Sn(f)− Sn(g)‖p + ‖Sn(g)− Sn+k(g)‖p + ‖Sn+k(g)−

Sn+k(f)‖p

De plus, L∞ est dense dans Lp.Soit ε > 0, on peut choisir g ∈ L∞ tq ‖f − g‖p <

ε3

Et ‖Sn(f)‖p = ‖ 1

n

n−1Xi=0

f(T ix)‖p ≤1

n

n−1Xi=0

‖f(T ix)‖p ≤ ‖f‖p

Donc ‖Sn(f)− Sn(g)‖p ≤ ‖f − g‖p <ε

3

Page 34: THEORIE ERGODIQUE ET APPLICATIONS

4 ERGODICITÉ 34

Et de même ‖Sn+k(g)− Sn+k(f)‖p <ε

3On a montré précemment que ‖Sn(g)− Sn+k(g)‖p <

ε

3si n > N0 et k > 0

Finalement, ‖Sn(f)− Sn+k(f)‖p ≤ε

3+ε

3+ε

3si n > N0 et k > 0

Donc Sn(f) est une suite de Cauchy dans Lp donc elle converge et ‖Sn(f) −f ∗‖p →n→∞ 0.

Il reste maintenant à montrer que :f ∗ ◦ T = f ∗ p.p

f ∗(Tx) = limn→+∞

1

n

n−1Xi=0

f(T i(Tx)) = limn→+∞

1

n

nXi=0

f(T ix)− 1

nf(x)

= limn→+∞

n+ 1

n

1

n+ 1

nXi=0

f(T ix)− limn→+∞

1

nf(x)

= limn→+∞

1

n+ 1

nXi=0

f(T ix) = f ∗(x).

Donc f ∗ ◦ T = f ∗ p.p

Page 35: THEORIE ERGODIQUE ET APPLICATIONS

4 ERGODICITÉ 35

4.2.3 Application 3 : Caractérisation d’une application ergodique

Corollaire 4.2.10 Soit (X,B,m) un espace de probabilité, soit T : X −→ X unetransformation préservant la mesure, on a alors :

T est ergodique ⇐⇒ ∀A, B ∈ B, 1

n

n−1Xi=0

m(T−iA ∩B) −→n→∞

m(A)m(B)

Preuve.Si T est ergodique et si m(X) <∞ alors ∀f ∈ L1(m),

f ∗ = limn→∞

1

n

n−1Xi=0

f(T ix) =1

m(X)

ZXf dm p.p.

En effet, T est ergodique ⇒ f ∗ est constante p.p d’après le théorème 3.5.3 carf ∗ ◦ T = f ∗

Or le théorème de Birkhoff ⇒Z

Xf ∗ dm =

ZXf dm

⇒ f ∗Z

X1 dm =

ZXf dm p.p

⇒ f ∗m(X) =Z

Xf dm p.p i.e f ∗ = 1

m(X)

ZXf dm p.p

Donc si X est un espace de probabilité alors : ∀f ∈ L1(m), f∗ =Z

Xf dm p.p

On prend f = 1A alors f ∈ L1(m)

Et 1

n

n−1Xi=0

1A(T ix) −→n→∞

ZX1A dm = m(A) p.p

Donc 1

n

n−1Xi=0

1A(T ix)1B(x) −→n→∞

m(A)1B(x) p.p

Or | 1n

n−1Xi=0

1A(T ix)1B(x)| ≤ 1

n

n−1Xi=0

|1A(T ix)||1B(x)| ≤ 1

n

n−1Xi=0

1 = 1

Et m(X) = 1 < ∞ donc 1 est intégrable. Donc par le théorème de convergencedominée, on a :

limn→∞

ZX

1

n

n−1Xi=0

1A(T i)1B dm =Z

Xlim

n→∞

1

n

n−1Xi=0

1A(T i)1B dm

⇒ limn→∞

1

n

n−1Xi=0

ZX1A(T i)1B dm =

ZXm(A)1B dm

⇒ limn→∞

1

n

n−1Xi=0

ZX1T−iA1B dm = m(A)m(B)

⇒ limn→∞

1

n

n−1Xi=0

ZX1T−iA∩B dm = m(A)m(B)

⇒ limn→∞

1

n

n−1Xi=0

m(T−iA ∩B) = m(A)m(B)

Page 36: THEORIE ERGODIQUE ET APPLICATIONS

4 ERGODICITÉ 36

Réciproquement, supposons que l’on ait ∀A, B ∈ B, 1

n

n−1Xi=0

m(T−iA ∩ B) −→n→∞

m(A)m(B). Soit E ∈ B tel que T−1E = E. On remplace A et B par E dans

l’équation précédente pour obtenir 1

n

n−1Xi=0

m(E) −→n→∞

m(E)2, i.e. m(E) = m(E)2,

donc m(E) = 0 ou 1 et T est ergodique.

Page 37: THEORIE ERGODIQUE ET APPLICATIONS

5 MÉLANGE : 37

5 Mélange :Le mélange est une propriété d’un système dynamique plus forte que l’ergodicité.

5.1 Transformations mélangeantesDéfinition 5.1.1 (application mélangeante) : Soit (X,B,m) un espace de pro-babilité.

Soit f : X → X une application mesurable qui préserve m, on définit :f est mélangeante si ∀ A,B ∈ B, limn→∞m(A ∩ f−n(B)) = m(A)m(B).On dit aussi que f est fortement mélangeante.

Définition 5.1.2 (application faiblement mélangeante) : Soit (X,B,m) unespace de probabilité.

Soit f une application préservant la mesure. On définit :f est faiblement mélangeante si limn→∞

1n

Pn−1i=0 |m(A∩f−iB)−m(A)m(B)| = 0.

La différence entre le mélange fort et le mélange faible réside dans la méthode deconvergence.

Remarques 5.1.1

1. Une application mélangeante est ergodique.En effet, si A = f−1(A), alors m(A) = m(A ∩ f−n(A)) et doncm(A) = lim

n→∞m(A ∩ f−n(A)) = m(A)2.

Donc m(A) vaut 0 ou 1, et f est ergodique.2. Lorsque f est sous-entendue, on dit aussi que la mesure m est mélangeante.

L’interprétation L2 du mélange est la suivante.

Théorème 5.1.3 Soit (X,B,m) un espace de probabilité.Soit f : X → X une application mesurable qui préserve m, on a

f est mélangeante ⇐⇒ ∀ ϕ, ψ ∈ L2(X,B,m), limn→∞

ZXϕ.(ψ◦fn) dm = (

ZXϕ dm)(

ZXψ dm)

En outre, il suffit de vérifier cette égalité pour ϕ, ψ dans un sous espace H ′ densede L2 pour qu’elle soit vraie pour tout ϕ, ψ dans L2.

Théorème admis

Théorème 5.1.4 Soit (X,B,m) un espace de probabilité, et soit S une semi-algèbregénérant B.

Soit T : X → X une application préservant la mesure. On a :

1. T est ergodique ⇐⇒ limn→∞

1

n

n−1Xi=0

m(T−iA ∩B) = m(A)m(B).

Page 38: THEORIE ERGODIQUE ET APPLICATIONS

5 MÉLANGE : 38

2. T est faiblement mélangeante ⇐⇒ limn→∞

1

n

n−1Xi=0

|m(T−iA∩B)−m(A)m(B)| = 0.

3. T est fortement mélangeante ⇐⇒ limn→∞

m(T−nA ∩B) = m(A)m(B).

Théorème admis

Théorème 5.1.5 Si {an} est une suite réelle bornée alors sont équivalents :

(i) limn→+∞

1

n

n−1Xi=0

|ai| = 0

(ii) il existe un sous-ensemble J de N de densité zero,

i.e |J ∩ {0, 1, ..., n− 1}|n

→ 0 tq limn→+∞

an = 0 si n /∈ J

(iii) limn→+∞

1

n

n−1Xi=0

|ai|2 = 0

Preuve.Si M ⊂ N, on définit par αM(n)le cardinal de {0, 1, ..., n− 1} ∩M(i) ⇒ (ii)

On a : limn→+∞

1

n

n−1Xi=0

|ai| = 0

Soit Jk := {n ∈ N | |an| ≥1

k}, (k > 0).

Alors J1 ⊂ J2 ⊂ . . . .

Comme on a une somme de termes positifs, 1

n

n−1Xi=0

|ai| ≥1

n

Xi∈Jk∩{0,...,n−1}

|ai|.

Or pour n ∈ Jk, |an| ≥1

kdonc 1

n

n−1Xi=0

|ai| ≥1

n

1

kαJk

(n).

Or limn→+∞

1

n

n−1Xi=0

|ai| = 0 donc 1n

1kαJk

(n) → 0.

Donc ∀ε > 0 (donc on peut prendre 1k+1

),∃0 = l0 < l1 < ...

tq ∀n ≥ lk,1nαJk+1

(n) < ε = 1k+1

. (*)

On définit maintenant J :=∞[

k=0

[Jk+1 ∩ [lk, lk+1)].

Nous allons montrer que J est de densité 0 ( et alors on aura montré qu’il existeun sous-ensemble (=J) qui vérifie le (ii)).

Si lk ≤ n < lk+1, alors J ∩ [0, n) = [J ∩ [0, lk] ∪ [J ∩ [lk, n)].Or J1 ⊂ J2 ⊂ ... ⊂ Jk et comme on prend l’intersection avec [0, lk], on peut

enlever les termes de l’union avec Jn>k.Donc [J ∩ [0, lk] ⊂ [Jk ∩ [0, lk)]. par un raisonnement analogue,[J ∩ [lk, n)] ⊂

[Jk+1 ∩ [0, n)].et donc, en passant au cardinal, on obtient :1

nαJ(n) ≤ 1

n[αJk

(lk) + αJk+1(n)] ≤ 1

n[αJk

(n) + αJk+1(n)] (car lk ≤ n)

Donc 1

nαJ(n) <

1

k+

1

k + 1(d’après (*))

Page 39: THEORIE ERGODIQUE ET APPLICATIONS

5 MÉLANGE : 39

Donc 1

nαJ(n) −→

n→∞0. Donc J est de densité 0.

Montrons que si n /∈ J alors limn→+∞

an = 0

Si n > lk et n /∈ J alors n /∈ Jk+1 (d’après la def de J) et donc |an| < 1k+1

Donclim

n→+∞an = 0 si n /∈ J

(ii) ⇒ (i) :

On a {an} bornée donc ∃K tq |an| ≤ K, ∀n.On a : lim

n→+∞an = 0 si n /∈ J ⇐⇒

∀ε > 0,∃Nε tq ∀n ≥ Nε,1, n /∈ J ⇒ |an| < ε

et comme J est de densité nulle, on a aussi ∀n ≥ Nε,2,αJ (n)

n< ε.

On prend Nε = max(Nε,1, Nε,2).donc ∀n ≥ Nε,

1

n

n−1Xi=0

|ai| =1

n

24 X

i∈J∩{0,..n−1}|ai|+

Xi/∈J∩{0,..n−1}

|ai|

35 < K

nαJ(n) +

n

< (K + 1)ε donc limn→+∞

1

n

n−1Xi=0

|ai| = 0.

(i) ⇐⇒ (iii) :

Il suffit de remarquer que limn/∈J→∞

|an| = 0 ⇐⇒ limn/∈J→∞

|an|2 = 0.

Théorème 5.1.6 Soit T une transformation préservant la mesure d’un espace deprobabilité (X,B,m), alors on a les équivalences suivantes :

1. T est faiblement mélangeante2. ∀A,B ∈ B, il esiste un sous-ensemble J(A,B) de N de densité zero tq :

limn/∈J(A,B)→∞

m(T−nA ∩B) = m(A)m(B)

3. ∀A,B ∈ B, on a :

limn→∞

1

n

n−1Xi=0

|m(T−iA ∩B)−m(A)m(B)|2 = 0

Preuve. Il suffit d’appliquer le théorème précédent avec an = m(T−nA ∩ B) −m(A)m(B).

Page 40: THEORIE ERGODIQUE ET APPLICATIONS

5 MÉLANGE : 40

Théorème 5.1.7 Soit (X,B,m) un espace de probabilité et T : X → X une appli-cation préservant la mesure. On a :

(i) Les assertions suivantes sont équivalentes :(1) T est ergodique.

(2) ∀f, g ∈ L2(m), limn→∞

1

n

n−1Xi=0

< U iTf, g > = < f, 1 >< 1, g >.

(3) ∀f ∈ L2(m), limn→∞

1

n

n−1Xi=0

< U iTf, f > = < f, 1 >< 1, f >.

(ii) Les assertions suivantes sont équivalentes :(1) T est faiblement mélangeante.

(2) ∀f, g ∈ L2(m), limn→∞

1

n

n−1Xi=0

| < U iTf, g > − < f, 1 >< 1, g > | = 0.

(3) ∀f ∈ L2(m), limn→∞

1

n

n−1Xi=0

| < U iTf, f > − < f, 1 >< 1, f > | = 0.

(iii) Les assertions suivantes sont équivalentes :(1) T est fortement mélangeante.(2) ∀f, g ∈ L2(m), lim

n→∞< Un

T f, g > = < f, 1 >< 1, g >.(3) ∀f ∈ L2(m), lim

n→∞< Un

T f, f > = < f, 1 >< 1, f >.

Preuve :La méthode est la même pour prouver (i), (ii) et (iii). Nous allons détailler (iii)

pour illustrer les idées. De légères modifications sont nécéssaires pour adapter cettepreuve au cas (i) et (ii).

(2) =⇒ (1) :Soient A, B ∈ B. Prenons f = 1A, g = 1B. On a :lim

n→∞< Un

T f, g > = < f, 1 >< 1, g >, i.e. limn→∞

Z1T−nA1B dm = m(A)m(B).

i.e. limn→∞

Z1T−nA∩B dm = m(A)m(B), i.e. lim

n→∞m(T−nA ∩B) = m(A)m(B).

(1) =⇒ (3) :

On fixe B. Soit h une fonction simple telle que : h(x) =nX

i=1

ai1Ai

∀1 ≤ i ≤ n, on a : limn→∞ < UnT1Ai

,1B > = < 1Ai, 1 >< 1,1B > (comme

prédemment)

Donc limn→∞

< UnT

nXi=1

ai1Ai,1B > = lim

n→∞

nXi=1

ai < UnT1Ai

,1B >

=nX

i=1

ai < 1Ai, 1 >< 1,1B >=<

nXi=1

ai1Ai, 1 >< 1,1B >=< h, 1 >

Puis en fixant h, et par la même méthode, on obtient : limn→∞

< UnTh, h > = <

h, 1 >< 1, h >Donc on a montré (3) pour une fonction simple. Supposons maintenant que

f ∈ L2(m).Soitε > 0. On peut choisir h une fonction simple telle que ‖f − h‖2 < ε.Comme on a : lim

n→∞< Un

Th, h > = < h, 1 >< 1, h >,∃Nε tel que ∀n ≥ Nε,

| < UnTh, h > − < h, 1 >< 1, h > | < ε

Alors si n ≥ Nε,

Page 41: THEORIE ERGODIQUE ET APPLICATIONS

5 MÉLANGE : 41

| < UnT f, f > − < f, 1 >< 1, f > | ≤

| < UnT f, f > − < Un

Th, f > |+ | < UnTh, f > − < Un

Th, h > |+| < Un

Th, h > − < h, 1 >< 1, h > |+ | < h, 1 >< 1, h > − < f, 1 >< 1, h > |+| < f, 1 >< 1, h > − < f, 1 >< 1, f > |≤ | < Un

T (f −h), f > |+ | < UnTh, f −h > |+ ε+ | < 1, h > || < h−f, 1 > |+ | <

f, 1 > || < 1, h− f > |≤ ‖f − h‖2‖f‖2 + ‖f − h‖2‖h‖2 + ε+ ‖h‖2‖f − h‖2 + ‖f‖2‖h− f‖2 (inégalité de

Cauchy-Schwartz)≤ ε‖f‖2 + ε(‖f‖2 + ε) + ε+ (‖f‖2 + ε)ε+ ε‖f‖2

Or f ∈ L2(m) donc ‖f‖2 < +∞ donc limn→+∞

< UnT f, f >=< f, 1 >< 1, f >

(3) =⇒ (2) :Soit f ∈ L2(m) et soit Hf le plus petit sous-espace de L2(m) contenant f et les

fonctions constantes et tel que UTHf ⊂ Hf

On définit Ff = {g ∈ L2(m) | limn→+∞

< UnT f, g >=< f, 1 >< 1, g >}

Ff est alors un sous-espace de L2(m) qui contient f et les fonctions constantes.On remarque que Ff est invariante par UT donc Hf ⊂ Ff

Si g ∈ H⊥f alors < Un

T f, g >= 0, ∀n ≥ 0 et < 1, g >= 0 et donc H⊥f ⊂ Ff . Donc

Ff = L2(m)

Définition 5.1.8 Soit T une transformation préservant la mesure d’un espace deprobabilité (X,B,m).

On dit qu’un nombre complexe λ est une valeur propre de T si c’est une valeurpropre de l’isométrie UT : L2(m) → L2(m).

i.e s’il existe f ∈ L2(m), f 6= 0 tq UTf = λf soit f(Tx) = λf(x)p.p.Une telle fonction est appelée fonction propre associée à λ.

Remarques :1. Si λ est une valeur propre de T alors |λ| = 1

En effet, ‖f‖2 = ‖UTf‖2 = (UTf, UTf) = (λf, λf) = |λ|2‖f‖2

2. λ = 1 est toujours une valeur propre pour une transformation préservant lamesure. Les fonctions propres associées sont les fonctions constantes non nulles.

Définition 5.1.9 Une transformation préservant la mesure d’un espace de probabi-lité (X,B,m) a un spectre continu si 1 est la seule valeur propre de T et si les seulesfonctions propres associées sont les constantes.

Théorème 5.1.10 (Théorème spectral pour les opérateurs unitaires) On sup-pose que U est un opérateur unitaire dans un espace de Hilbert complexe H. Alorspour toute fonction f ∈ H,

il existe une unique mesure de Borel finie µf sur K telle que :(Unf, f) =

ZKλn dµf (λ∀n ∈ Z

Si T est inversible alors UT est unitaire et si T a un spectre continu et < f, 1 > =0 alors µf n’a pas d’atomes (i.e ∀x ∈ K,µf (x) = 0)

Page 42: THEORIE ERGODIQUE ET APPLICATIONS

5 MÉLANGE : 42

Ce théorème sera admis. Une preuve est donnée dans Introduction to HilbertSpace and the theory of Spectral Multiplicity de P.Halmos.

Théorème 5.1.11 Si T est une transformation préservant la mesure inversible d’unespace de probabilité (X,B,m) alors T est faiblement mélangeante ⇐⇒ T a unspectre continu.

Preuve.Supposons que T est faiblement mélangeante. et soit UTf = λf, f ∈ L2(m).Si λ 6= 1 alors < f, 1 > = 0.En effet, on a : UTf = λf ⇒

ZUTf dm =

Zλf dm

Or on a vu queZUTf dm =

Zf dm d’où R

f dm = λRf dm ⇒ < f, 1 > = 0 si

λ 6= 1et d’après les propriétes des applicatons faiblement mélangeantes, on a :1

n

n−1Xi=0

|(U iTf, f)− (f, 1)(1, f)| = 1

n

n−1Xi=0

|(U iTf, f)| = 1

n

n−1Xi=0

|(λif, f)| → 0

Or 1

n

n−1Xi=0

|(λif, f)| = 1

n

n−1Xi=0

|λi||(f, f)| = 1

n

n−1Xi=0

|λ|i|(f, f)|

=1

n

n−1Xi=0

|(f, f)| = |(f, f)| (car |λ| = 1)

Donc (f, f) = 0 ⇒ f = 0 p.pSi λ = 1 alors comme T est ergodique, f ◦ T = f ⇒ f est constante p.p.Réciproquement, supposons que T a un spectre continu. On veut montrer que

∀f ∈ L2(m), on a :1

n

n−1Xi=0

|(U iTf, f)− (f, 1)(1, f)|2 → 0 (*)

Si f est constante p.p alors f vérifie bien (*). Il reste à montrer que (f, 1) = 0 ⇒1

n

n−1Xi=0

|(U iTf, f)|2 → 0

D’après le théorème spectral, il suffit de montrer que si µf est une mesure conti-nue sur K alors :

1

n

n−1Xi=0

|Zλi dµf (λ)|2 → 0

Or on a : 1

n

n−1Xi=0

|Zλi dµf (λ)|2 =

1

n

n−1Xi=0

(Zλi dµf (λ)

Zλ−i dµf (λ))

=1

n

n−1Xi=0

(Zλi dµf (λ)

Zτ−i dµf (τ))

=1

n

n−1Xi=0

(Z

K∗K(λτ)i d(µf ⊗ µf )(λ, τ) (d’après Fubini)

=Z

K∗K(1

n

n−1Xi=0

(λτ)i) d(µf ⊗ µf )(λ, τ)

Or si (λ, τ) n’est pas dans la diagonale de K ×K alors :1

n

n−1Xi=0

(λτ)i =1

n

�1− (λτ)n

1− (λτ)

�−→n→∞

0

Page 43: THEORIE ERGODIQUE ET APPLICATIONS

5 MÉLANGE : 43

Or µf n’a pas d’atome donc la mesure pour µf ⊗ µf de la diagonale vaut 0.

Donc 1

n

n−1Xi=0

(λτ)i → 0 p.p

De plus, | 1n

n−1Xi=0

(λτ)i| ≤ 1

n

n−1Xi=0

(|λτ |)i ≤ 1

Donc par le théorème de convergence dominée, on obtient :

limn→∞

1

n

n−1Xi=0

|Zλi dµf (λ)|2 = 0

Exemple :Une rotation T (z) = az, a ∈ C, a 6= 1 du cercle unité S1 n’est jamais faiblement

mélangeante.En effet, on a UT (IdS1)(z) = IdS1(T (z)) = IdS1(az) = a.IdS1(z).a est donc une valeur propre 6= 1 de T.

Page 44: THEORIE ERGODIQUE ET APPLICATIONS

5 MÉLANGE : 44

5.2 Fractions continues5.2.1 Préliminaires

Il est facile d’approcher tout réel x par un rationnel pq

de dénominateur q = N

avec une erreur d’au plus 12N

. Mieux, si on autorise un dénominateur q ≤ N , on peutl’approcher avec une erreur d’au plus 1

q2 (c’est un théorème de Dirichlet). Cela résultedu lemme des tiroirs : on découpe l’intervalle [0, 1] en N intervalles Ik = [ k

N, k+1

N] ;

parmi les valeurs de {nx} pour 0 ≤ n ≤ N , deux d’entre elles {n1x} et {n2x} sontdans le même intervalle et (n2 − n1)x diffère d’un entier p par au plus 1

N. Donc (en

supposant n2 > n1) avec q = n2 − n1, on a

|x− p

q| ≤ 1

qN≤ 1

q2.

Le développement en fraction continue est une méthode qui permet de trouver ra-pidement cette meilleure approximation. Voici cette méthode :

Soit u est un nombre réel, on note [u] la partie entière de u et {u} = u− [u] sapartie fractionnaire.

Pour x ∈]0, 1], on pose a1(x) = [ 1x], et f(x) =

�1

x

�.

Pour n ∈ N∗, on pose, lorsque c’est défini, an = an(x) = a1(fn−1(x)). Remar-

quons que an ≥ 1. Comme y = 1a1(y)+f(y)

pour tout y ∈]0, 1], on a l’égalité :

x =1

a1 +1

a2 +1

. . .

an−1 +1

an + fn(x)

En réduisant au même dénominateur, on obtient une expression de la formepn + pn−1xn

qn + qn−1xn

. avec xn = fn(x) ∈ [0, 1]. Les entiers pn et qn sont obtenus par leségalités :�

p1 q1p0 q0

�=

�1 a1

0 1

�et

¨pn+1 = an+1pn + pn−1

qn+1 = an+1qn + qn−1(∗)

Tout ceci est bien défini tant que fn(x) ne s’annule pas.

Proposition 5.2.1 Le développement en fraction continue x 7→ (a1, a2, . . .) s’arrête⇐⇒ x est rationnel.

5.2.2 La transformation de Gauss

Soit X l’espace topologique [0, 1] − Q. L’application f : X −→ X, définie parf(x) = { 1

x}, est appelée la transformation de Gauss. Pour tout irrationnel x, on a,

en posant an = an(x− [x]),

Page 45: THEORIE ERGODIQUE ET APPLICATIONS

5 MÉLANGE : 45

x = limn→+∞

[x] +1

a1 +1

a2 +1

. . .

an−1 +1

an

L’intérêt de la mise en place de la transformation de Gauss est, bien que nousn’en parlerons pas ici, que l’étude des fractions continues est intimement liée à celledu système dynamique mesurable (X, f).

Définition 5.2.2 (Mesure de Gauss) La mesure de Gauss est l’application µ =1

log 2

�dx

1+x

�.

Proposition 5.2.3 La transformation de Gauss préserve la mesure de Gauss.

Preuve :Pour toute fonction positive mesurable ϕ sur [0, 1] on a :Z]0,1[

ϕ(f(t)) dt

1 + t=

∞Xn=1

Z] 1n+1

, 1n

[ϕ(

1

t−n) d

t

1 + t=

∞Xn=1

Z]0,1[

ϕ(s)1

(s+ n)2(s+ 1s+n

)ds =

Z]0,1[

ϕ(s)∞X

n=1

1

(s+ n)(s+ n+ 1)ds =

Z]0,1[

ϕ(s) ds

1 + s.

Proposition 5.2.4 La transformation de Gauss est ergodique pour la mesure deGauss.

Preuve : admise.On en déduit la propriété suivante sur la fréquence d’apparition d’un entier l

dans le développement en fractions continues d’un réel x.

Corollaire 5.2.5 Pour presque tout x ∈ [0, 1], pour tout l dans N∗, on a :

limn→∞

1

nCard{k ≤ n | ak(x) = l} = log2(1 +

1

l(l + 2)).

Preuve :Le théorème ergodique de Birkhoff, appliqué à la transformation de Gauss f et

à la fonction intégrable ϕ = 1{x | a1(x)=l} affirme que, pour presque tout x, cettelimite existe et est égale à :

Zϕ dµ =

1

log 2

Z] 1l+1

, 1l[d

x

1 + x=

1

log 2

�log(1 +

1

l)− log(1 +

1

l + 1)�

= log2(1+1

l(l + 2)).

Proposition 5.2.6 La transformation de Gauss est mélangeante pour la mesure deGauss.

Page 46: THEORIE ERGODIQUE ET APPLICATIONS

5 MÉLANGE : 46

5.3 Transformation linéaire du toreSoit n > 0.On note Tn de tore de Rn+1 que l’on peut définir par : Tn ≈ S1 × . . .× S1| {z }

n fois

.

Et on définit :

p : Rn → Tn

x 7→ x = x mod Zn ∈ [0, 1]n

Les transformations linéaires du tore Tn sont des exemples particulièrement im-portants. D’une part, ils se prêtent bien aux calculs. D’autre part, la complexité deleur dynamique est assez représentative de situations plus générales. Nous donnonsquelques résultats sans démonstration.

Soit M = (mij)1≤i,j≤N une matrice N ×N à coefficients dans N. On définit :

fM : Tn → Tn

(θi)1≤θ≤N 7→ M.θ = (PN

j=1mijθj)1≤θ≤N

De sorte que le diagramme suivant commute :

RN M−−−→ RN

p

???y???yp

TN fM−−−→ TN

Lemme 5.3.1

detM 6= 0 ⇒

8><>:

1. fM est surjective.2. fM préserve la mesure de Haar λ = dθ sur TN .3. ∀ θ ∈ TN , ]f−1

M (θ) = | detM |.

Proposition 5.3.2 Soit fM : TN → TN l’application donnée par une matrice Mà coefficients entiers et telle que detM est non nul. Les assertions suivantes sontéquivalentes :

(i) fM est mélangeante (pour dθ).(ii) fM est ergodique (pour dθ).(iii) aucune valeur propre de M n’est racine de l’unité, i.e.

∀ n ∈ N\{0}, det(Mn − 1) 6= 0.

Remarque 5.3.1 En prenant N = 1, on retrouve le fait que les rotations g : θ 7→ pθde R\Z dans R\Z sont ergodiques pour tout p ∈ N\{0, 1}.

Page 47: THEORIE ERGODIQUE ET APPLICATIONS

A NOTATIONS : 47

A Notations :

Pour X un ensemble quelconque, A,B deux parties de X :A∆B := A\B ∪B\A (la différence symétrique).

Pour (X, δ) un espace topologique, A une partie de X, nous noterons :A := l’adhérence de A dans X.◦A (resp.

◦AAA) := l’intérieur de A (resp. de AAA) dans X.

∂A := la frontière de A dans X.

B(x0, r) := {y ∈ X | d(x0, y) < r}, où (X, d) est un espace métrique, r ∈ R∗+.C0(X) := {f : X → C | f continue}, où X est un espace topologique.diam(A) := supx,y∈A d(x, y), où (X, d) un espace métrique.diam((Oi)i∈J1,pK) := supi∈J1,pK diam(Oi), où (Oi)i∈J1,pK est un recouvrement fini

d’un espace métrique (X, d).

1A := fonction caractéristique de l’ensemble A.‖f‖∞ := sup

x∈X|f(x)| pour f : X → C ∈ R ∪ {∞}.

Page 48: THEORIE ERGODIQUE ET APPLICATIONS

B RAPPELS DE THÉORIE DE LA MESURE 48

B Rappels de théorie de la mesure

B.1 Résultats élémentaires en théorie de la mesure.Nous donnons ici sans démonstration quelques résultats de base en théorie de la

mesure, utilisés dans ce TER.

B.1.1 Tribus

Définition B.1.1 (Semi-algèbre de parties d’un ensemble) Soit X un ensemble.Une semi-algèbre sur X est un sous-ensemble S des parties de X tel que :

- ∅ ∈ S.- ∀A, B ∈ S, A ∩B ∈ S. (stabilité par intersection finie)

- ∀A ∈ S, si X\A =n[

i=0

Ei, avec Ei ∈ S, X\A ∈ S.

Définition B.1.2 (Algèbre de parties d’un ensemble) Soit X un ensemble. Unealgèbre sur X est un sous-ensemble A des parties de X tel que :

- ∅ ∈ A.- ∀A, B ∈ A, A ∩B ∈ A.- ∀A ∈ A, X\A ∈ A.

Théorème B.1.3 Soit S une semi-algèbre de X. L’algèbre A(S) générée par S estconstituée des sous-ensembles de X s’écrivant comme une réunion finie disjointed’éléments de S.

Définition B.1.4 (Tribu de parties d’un ensemble E) Synonyme de σ-algèbrede parties de E.

Une partie non vide B de l’ensemble P(E) des parties de E est une tribu si :(i) ∅ ∈ B.(ii) A ∈ B ⇒ A ∈ B.(iii) (An)n≥0 ⊂ B ⇒ ∪n≥0 An ∈ B.Il en résulte que la partie ∩n≥0 An ∈ B.

Les éléments d’une tribu T sont appelés les parties T -mesurables, ou simplementsparties mesurables.

(X,T ) est appelé ensemble mesurable.

Proposition B.1.5 Une tribu est stable par union finie, intersection dénombrableet différence.

Exemples de tribus :1. La famille T = P(X) des parties de X est appelée la tribu discrète.2. T = {∅, X} est appelée la tribu grossière.3. X = {a, b, c, d} et T = {∅, X, {a, b}, {c, d}}.

Page 49: THEORIE ERGODIQUE ET APPLICATIONS

B RAPPELS DE THÉORIE DE LA MESURE 49

Définition B.1.6 (Tribu trace) Soit (X,B) un espace mesurable et Y une partiequelconque de X ; alors B|Y = {B ∩ Y | B ∈ B} est une tribu sur Y appelée tributrace de B sur Y .

Comme une intersection de tribus sur X est encore une tribu, nous pouvonsposer :

Définition B.1.7 (Tribu engendrée par une famille de parties) Soit C unefamille de parties de X, l’ensemble des tribus de X qui contiennent C, muni de larelation d’ordre partiel ⊂, admet un plus petit élément, noté t(C) qui est l’inter-section de toutes les tribus contenant C (c’est la plus petite (pour l’inclusion) tribucontenant C), que l’on appelle la tribu engendrée par C.

Définition B.1.8 (Tribu Borélienne de Rd) Si X = Rd, la tribu borélienne deRd, notée B(Rd), est la tribu engendrée par l’ensemble des ouverts de Rd.

Les éléments de B(Rd) sont appelés les boréliens de Rd.

Définition B.1.9 (Tribu produit) soit X = X1×X2×. . .×Xn, avec Bi des tribussur Xi, i ∈ J1, nK. La tribu produit des tribus B1, . . . , Bn est la tribu B1 ⊗ . . .⊗ Bn

sur X engendrée par les pavés B1 ×B2 × . . .×Bn où Bi ∈ Bi, i ∈ J1, nK.

Proposition B.1.10 Soit C une famille de parties de X et Y une partie quelconquede X, alors la tribu trace de t(C) sur Y est engendrée par

C|Y = {c ∩ Y | c ∈ C}

Corollaire B.1.11 En particulier nous avons : la tribu borélienne de [a, b] définiepar B([a, b]) = B(R)|[a,b] est la tribu engendrée par les parties A ⊂ [a, b] qui sont lestraces des ouverts de R sur [a, b].

Il est pratique dans de nombreuses preuves de décrire la tribu B(A) générée parune algèbre A, celle-ci étant l’intersection de toutes les tribus contenant A. Nousaurons besoin pour cela de la définition suivante :

Définition B.1.12 (Classe monotone) Soit X un ensemble. Une classe mono-tone sur X est un sous-ensemble M des parties de X tel que :

- ∀ E0 ⊂ E1 ⊂ E2 ⊂ . . . suite croissante d’éléments de M ,∞[

n=0

En ∈M.

- ∀ F0 ⊃F 1 ⊃ F2 ⊃ . . . suite décroissante d’éléments de M ,∞\

n=0

En ∈M.

Comme l’intersection d’une famille quelconque de classes monontones sur X estencore une classe monotone sur X, nous pouvons parler de classe monotone généréepar un sous-ensemble des parties de X.

Théorème B.1.13 Soit A une algèbre de X. La tribu B(A) générée par A est égaleà la classe monotone générée par A.

Page 50: THEORIE ERGODIQUE ET APPLICATIONS

B RAPPELS DE THÉORIE DE LA MESURE 50

B.1.2 Fonctions mesurables

Définition B.1.14 (Application mesurable) Soient (X,B) et (Y, C) deux es-paces mesurables et f : X −→ Y une application. On dit que f est (B, C)-mesurable(ou mesurable) si :

∀c ∈ C, f−1(c) ∈ B

Définition B.1.15 (Application borélienne) Une application f : Rp −→ Rq quiest (B(Rp), B(Rq))-mesurable sera dite borélienne.

Proposition B.1.16(i) Une composée d’applications mesurables est mesurable(ii) Si f : X −→ Y est (B, C)-mesurable et X0 ⊂ X, alors f|X0 est (B|X0 , C)-

mesurable.(iii) (principe de recollement) : soit (Ti)i∈I une partition dénombrable de X en

éléments mesurables. Une application f : X −→ Y est (B, C)-mesurablessi chaque restriction f|Ti

est (B|Ti, C)-mesurable.

Théorème B.1.17 (critère de mesurabilité) Soient (X,B), et (Y, C) deux es-paces mesurables et F une famille de parties telle que t(F) = C. Alors une applica-tion f : X −→ Y

est mesurable ssi pour toute partie C-mesurable F, f−1(F ) est B-mesurable.

Corollaire B.1.18(i) Une application f : X −→ R est (B,B(R))-mesurable si ∀a ∈ R, {f < a} est

B-mesurable.(ii) Une application f : Rp −→ Rq est borélienne si f est continue.(iii) Soient (X,B) et (Yi, Ci), i ∈ {1..., n}, des espaces mesurables et fi : X −→

Yi, i ∈ {1.., n}, n applications.

Alors f = (f1, ..., fn) : X −→nY

i=1

Yi est (B,⊗ni=1Ci)-mesurable ssi ∀i ∈ {1, ..., n}, fi

est (B, Ci)-mesurable.

Corollaire B.1.19(i) Si f, g : X −→ R sont (B,B(R))-mesurables, il en sera de même pour λf(λ ∈

R), fg, max(f, g), min(f, g), f+, f− et pour 1f

et f + g si ces deux fonctions sontbien définies partout.

(ii) Si (fn)n∈N est une suite de fonctions de X −→ R(B,B(R))-mesurables, alorsil en sera de même pour : sup

n∈Nfn, inf

n∈Nfn, lim sup

n∈Nfn, lim inf

n∈Nfn.

B.1.3 Mesures

Définition B.1.20 (Application σ-additive sur une tribu B d’un ensemble E)Une application m : B −→ R est dite σ-additive si pour toute suite (An)N∈N d’élé-ments de B deux à deux disjoints, la suite (m(An))N∈N est sommable et vérifie :

m([n≥0

An) =Xn≥0

m(An).

Page 51: THEORIE ERGODIQUE ET APPLICATIONS

B RAPPELS DE THÉORIE DE LA MESURE 51

Lorsque l’application vérifie la formule seulement pour des sommes finies, on ditque l’application est additive.

Définition B.1.21 (Mesure sur un ensemble non vide E (ou sur une tribu B))Application σ-additive m définie sur une tribu B de E à valeurs dans R+, non iden-tiquement égale à +∞ et vérifiant m(∅) = 0.

On dit que la mesure m est finie si m(X) < ∞ et que la mesure m est σ-

finie s’il existe des parties mesurables X0 ⊂ X1 ⊂ . . . telles que∞[

n=0

Xn = X et

m(Xn) <∞, ∀n ∈ N.Exemples :- La mesure de Lebesgue sur (Rn,B(Rn)) est une mesure σ-finie.- Toute mesure de probabilité est σ-finie.Exemples de mesures :(1) La mesure de Lebesgue sur R : µ(]a, b]) = µ([a, b]) = b− a.(2) La mesure de dirac sur un ensemble (X,B) en un point x ∈ X est la mesure :

δx(T ) = 1x∈T = 1 si x ∈ T, 0 sinon.(3) La mesure de dénombrement est définie par : md(T ) = card(T ).(4) Si (X,B,m) est un espace mesuré et si Y est une partie mesurable de X,

alors la mesure induite par m sur Y , notée m|Y est définie, pour B ∈ BY , par :m|Y (B) = m(B)(5) Soient (X,B,m) un espace mesuré, (Y, C) un espace mesurable et f : X −→ Y

une application mesurable.L’application mf : C −→ R+ ∪ {+∞} telle que ∀C ∈ C, mf (C) = m(f−1(C))

est une mesure sur (Y, C) appelée mesure image de m par f .Les parties mesurables de R pour la mesure de Lebesgue sont les boréliens de R.

Proposition B.1.22 (propriétés des mesures) Soit (X,B) un espace mesurable,(Ai)i∈N ⊂ X des parties mesurables, et m une mesure sur X.

(i) A1 ⊂ A2 ⇒ m(A1) ≤ m(A2). [croissance](ii) m(

[i∈N

Ai) ≤X

i ∈ Nm(Ai). [σ-sous-addidivité]

(iii) si Ai ⊂ Ai+1, m([i∈N

Ai) = limi→+∞

m(Ai). [stabilité par limite croissante]

(iv) si Ai+1 ⊂ Ai et ∃ i0,m(Ai0) ≤ +∞ alors m(\i∈N

Ai) = limi→+∞

m(Ai). [sta-

bilité par limite croissante](v) m(A1 ∪ A2) +m(A1 ∩ A2) = m(A1) +m(A2).

Page 52: THEORIE ERGODIQUE ET APPLICATIONS

B RAPPELS DE THÉORIE DE LA MESURE 52

B.2 Principaux résultats de la théorie de l’intégration deLebesgue

Nous rappelons ici les principaux résultats de la théorie de l’intégration de Le-besgue.

L’intégrale de Riemann est satisfaisante pour les fonctions continues ou pour cer-taines fonctions f discontinues mais satisfaisant à des conditions exprimant que surtout intervalle ]xi, xi+1[ la variation de f reste "raisonnable". L’idée de Lebesgue estde renverser le problème ; au lieu de partager l’ensemble de départ de f , l’intégrationde Lebesgue partage l’ensemble d’arrivé de f et pour chaque intervalle ]yi, yi+1[ onconsidère l’ensemble des x tels que yi < f(x) < yi+1. La fonction f est intégrableau sens de Lebesgue lorsque l’image réciproque de tout intervalle est mesurable. Lanotion d’intégrale ainsi obtenue est plus générale que celle de Riemann : toute fonc-tion Riemann-intégrable est Lebesgue-intégrable et les deux intégrales coïncident.Par contre la fonction de Dirichlet (indicatrice de Q dans R) est Lebesgue-intégrable(et son intégrale est nulle) mais n’est pas Riemman-intégrable.

La supériorité de l’intégrale de Lebesgue sur celle de Riemann est particulière-ment mise en lumière dans les problèmes de convergence, l’étude des séries trigono-métriques et la théorie des distributions.

Nous nous placerons ici dans un espace mesuré (X,B,m) .Une fonction f : X −→ C pouvant être considérée comme la somme de deux

fonctions X −→ R (sa partie réelle et sa partie imaginaire), nous ne considéreronsici uniquement des fonctions X −→ R.

Pour f : X −→ R une fonction intégrable, nous noteronsZ

Xf dm son intégrale

sur X et pour A ∈ B nous définissons l’intégrale de f sur A commeZ

Xf.1A dm.

Les trois théorèmes suivants sont les trois théorèmes clefs de l’intégration desfonctions positives.

Théorème B.2.1 (Théorème de convergence monotone de Beppo-Levi) Soit(fn)n∈N une suite croissante de fonctions X −→ R m-mesurables et positives de li-mite une fonction f . Alors

(i) f est mesurable, positive.(ii)

ZXf dm = lim

n→∞

ZXfn dm.

Théorème B.2.2 (permutationX

etZ

) Soit (X,B,m) un espace mesuré.Soit (fn)n∈N une suite de fonctions X −→ R m-mesurables et positives. Alors

ZX

+∞Xn=0

fn

!dm =

+∞Xn=0

ZXfn dm.

Théorème B.2.3 (Lemme de Fatou) Soit (fn)n∈N une suite de fonctions X −→R m-mesurables et positives.

Alors 0 ≤Z

Xlim inf

n∈Nfn dm ≤ lim inf

n∈N

ZXfn dm.

Page 53: THEORIE ERGODIQUE ET APPLICATIONS

B RAPPELS DE THÉORIE DE LA MESURE 53

Théorème B.2.4 (Théorème de convergence dominée) Soit (fn)n∈N une suitede fonctions X −→ R m-mesurables. On suppose qu’il existe g : X −→ R fonctionmesurable et N une partie mesurable de mesure nulle telle que :

(i) La suite (fn)n∈N converge simplement sur X\N vers une fonction f .(ii) supn |fn(w)| ≤ g(w)m− pp.(iii) g est intégrableAlors f est intégrable et

ZX|fn − f | dm→ 0. et

ZXf dm = lim

n→∞

ZXfn dm.

Soient (X,B,m) et (Y, C, s) deux espaces mesurés. Il existe une unique mesure surl’espace mesurable produit (X×Y,B⊗C), notée m⊗s, et appelée mesure produit desmesures m et s, vérifiant la condition m⊗ s(B×C) = m(B).s(C), ∀B ∈ B, C ∈ C.Il existe deux énoncés du théorème de Fubini qui permet de calculer les intégralessur l’espace produit X × Y : pour les fonctions positives (Fubini-Tonelli), et pourles fonctions de signe quelconque.

le premier énoncé est simple d’application puisque les hypothèses à vérifier sontquasi inexistantes. Par contre le deuxième énoncé demande de vérifier que l’in-tégrande est m ⊗ s-intégrable. Cette vérification se fera en général en calculantZZ

X×Y|f | dm⊗ s à l’aide du premier énoncé, puisque |f | est une fonction positive.

Théorème B.2.5 (Fubini-Tonelli) Soit f : X × Y −→ R+ une fonction (B ⊗C,B(R))-mesurable. Alors les fonctions

x 7→Z

Yf(x, y) ds(y)

y 7→Z

Xf(x, y) dm(x)

sont positives et mesurables et on a les égalités :ZZX×Y

f dm⊗ s =Z

X

�ZYf(x, y) ds(y)

�dm(x) =

ZY

�ZXf(x, y) dm(x)

�ds(y)

.

Théorème B.2.6 (Fubini) Soit f : X × Y −→ R+ une fonction (B ⊗ C,B(R))-intégrable. Alors les fonctions

x 7→Z

Yf(x, y) ds(y)

y 7→Z

Xf(x, y) dm(x)

sont définies p.p. et égales p.p. à des fonctions L1 et à nouveaux les égalités précé-dentes sont vraies.

Page 54: THEORIE ERGODIQUE ET APPLICATIONS

RÉFÉRENCES 54

Références[1] P. Walters. (1982). An Introduction to Ergodic Theory. Springer-Verlag. Gra-

duate texts in mathematics ; 79.

[2] A. Bouvier, M. George, F. Le Lionnais. (2005). Dictionnaire des mathématiques.PUF.

[3] Y. Benoist, F. Paulin. (2003). Systèmes dynamiques élémentaires.URL : http ://

[4] H. Queffélec. (2002). Topologie. Dunod.

[5] F. Laudenbach. (2000). Calcul différentiel et intégral. Editions de l’école poly-technique.

[6] F. Rouvière. (2003). Petit guide de calcul différentiel à l’usage de la licence etde l’agrégation. Cassini.

[7] J. Benoist, A. Salinier. (2001). Exercices de calcul intégral, avec rappels de cours.Dunod.

Page 55: THEORIE ERGODIQUE ET APPLICATIONS

IndexA

Algèbre de parties d’un ensemble. . . . .48Application σ-additive . . . . . . . . . . . . . . . 50

BBirkhoff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24Borélienne

Application . . . . . . . . . . . . . . . . . . . . . . 50

CChampernowne

Nombre de . . . . . . . . . . . . . . . . . . . . . . . 31Chaos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5Classe monotone . . . . . . . . . . . . . . . . . . . . . 49

DDivergence

D’un champ de vecteur. . . . . . . . . . .19Dynamique hamiltonienne . . . . . . . . . . . 20

EErgodicité . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5Espace probabilisable . . . . . . . . . . . . . . . . 48

HHasard . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5, 31

LLebesgue

Lemme ε de. . . . . . . . . . . . . . . . . . . . . .10Liouville

Théorème . . . . . . . . . . . . . . . . . . . . . . . . 19

MMesurable

Application . . . . . . . . . . . . . . . . . . . . . . 50Mesure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

De haar . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

NNormal

Nombre . . . . . . . . . . . . . . . . . . . . . . . . . . 31Nombre absolument . . . . . . . . . . . . . 31

OOpérateur induit . . . . . . . . . . . . . . . . . . . . . 15

PPériodique

Point . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18Partie mesurable . . . . . . . . . . . . . . . . . . . . . 48Poincaré

Théorème de récurrence . . . . . . . . . . 18Positif

Opérateur. . . . . . . . . . . . . . . . . . . . . . . .25Produit direct . . . . . . . . . . . . . . . . . . . . . . . 13

RRécurrent

Point . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18Régularité . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7Rotation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

SSemi-algèbre de parties d’un ensemble48Simple

Fonction . . . . . . . . . . . . . . . . . . . . . . . . . 16Spectral

Théorème . . . . . . . . . . . . . . . . . . . . . . . . 41

TTribu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

Borélienne . . . . . . . . . . . . . . . . . . . . . . . 49Engendrée . . . . . . . . . . . . . . . . . . . . . . . 49Produit . . . . . . . . . . . . . . . . . . . . . . . . . . 49Trace . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

UUrysohn

Lemme. . . . . . . . . . . . . . . . . . . . . . . . . . . .9

55