Villani Equations Champ Moyen

Embed Size (px)

Citation preview

  • 8/8/2019 Villani Equations Champ Moyen

    1/58

    Limite de champ moyen

    Cours de DEA, 2001-2002

    Cedric Villani

    UMPA, ENSL

    46 allee dItalie

    69364 Lyon Cedex [email protected]

  • 8/8/2019 Villani Equations Champ Moyen

    2/58

    2 CHAPITRE 0

    Ce document constitue le support ecrit pour un cours de DEA enseigne a lENSLyon durant le premier semestre de lannee universitaire 20012002. Le theme enetait les limites de champ moyen, une des operations fondamentales en physique eten modelisation. Le probleme consiste a passer dune description microscopique dunphenomene physique, a une description macroscopique, dans un regime ou chaqueparticule ressent linfluence de toutes les autres, aussi eloignees soient-elles. Lesmodeles de champ moyen interviennent dans la description dun nombre considerable

    de situations physiques ; lun de leurs champs dapplication les plus importants estcertainement la physique des plasmas.

    Le style de ces notes est resolument mathematique : je ne consacrerai que trespeu de temps a la modelisation. Dautre part, jai privilegie laspect pedagogique surla rigueur ou le caractere auto-contenu. Le style de ces notes est donc assez informelet les preuves seront souvent seulement esquissees. Jai egalement limite a dessein labibliographie ; les quelques references que jai citees contiennent infiniment plus surle sujet.

    C.V.

  • 8/8/2019 Villani Equations Champ Moyen

    3/58

    Table des matieres

    Chapitre 1. Position du probleme 51. Modeles microscopiques 52. Limite de champ moyen : discussion informelle 113. Quelques rappels sur les mesures 134. Mesure empirique 155. Modele macroscopique 166. Formulation precise de la limite macroscopique 197. Notes bibliographiques 21

    Chapitre 2. Equations de transport, avec ou sans diffusion 23

    1. Terminologie 232. Theoreme des caracteristiques 243. Formule dIto et ses consequences 274. Couplages non lineaires 305. Statut mathematique de ces equations 316. References bibliographiques 32

    Chapitre 3. Distances de transport 35

    Chapitre 4. Preuve de la limite de champ moyen 371. Lexemple des equations de Vlasov 372. Un exemple aleatoire : McKean-Vlasov 43

    3. Remarques et references 47

    Chapitre 5. Propagation du chaos 511. Definition et motivations historiques 512. Propagation du chaos pour lequation de McKean-Vlasov 563. Commentaires et references 58

  • 8/8/2019 Villani Equations Champ Moyen

    4/58

    4 CHAPITRE 0

    References principales

    Spohn, H. Large scale dynamics of interacting particles, chap. 5, coll. Texts andmonographs in physics, Springer-Verlag (1991). Cest un ouvrage de reference sur leprobleme du passage des equations microscopiques aux equations macroscopiques.Le chapitre 5 concerne lequation de Vlasov, un des exemples les plus importantsdequation de champ moyen.

    Neunzert, H. An introduction to the nonlinear Boltzmann-Vlasov equation. InKinetic theories and the Boltzmann equation, C. Cercignani, ed., p.60110, Lecturenotes in mathematics vol. 1048, Springer (1984). Cet article de synthese est bienecrit et interessant, meme si certains passages ont ete rendus obsoletes par les progresrealises depuis (la discussion sur le probleme de Cauchy en particulier).

    Sznitman, A.-S. Topics in propagation of chaos. Cours de lEcole dete deSaint-Flour, Lecture notes in mathematics vol. 1464, Springer (1989). Un cours tresconnu, tres axe sur des methodes probabilistes.

    Quelques articles de recherche recents

    Benachour, S., Roynette, B., Talay, D., et Vallois, P. Nonlinear self-stabilizing processes I : Existence, invariant probability, propagation of chaos (sec-tion 5). Stoch. Processes and their Appl. 75 (1998), 173201.

    Ben Arous, G., et Zeitouni, O. Increasing propagation of chaos for mean-field models. Ann. IHP 35, 1 (1999), 85102.

    Malrieu, F. Logarithmic Sobolev inequalities for some nonlinear PDEs. Prepublication,Laboratoire de Statistiques et Probabilites de lUniversite Paul-Sabatier, Toulouse(2001).

    Ces trois articles reposent sur un formalisme probabiliste, a des degres divers,

    le traitement le plus analytique en nature etant certainement celui de Malrieu, quenous expliquerons assez en detail dans ce cours.

  • 8/8/2019 Villani Equations Champ Moyen

    5/58

    CHAPITRE 1

    Position du probleme

    Dans ce chapitre, on va introduire les objets les plus importants et degager uneproblematique precise. On presentera de nombreux exemples de modeles dont letraitement rentre dans le cadre de la limite de champ moyen.

    1. Modeles microscopiques

    Dans ce cours, un modele microscopique est un modele mathematique pour unsysteme de N particules, ou N est grand mais fini, et ou linconnue est letat dechaque particule.

    Exemple : Si lon decide que letat dune particule est tout entier determine parsa position, disons x Rd, alors lespace des phases naturel pour le systeme de Nparticules est (Rd)N. Un point de cet espace permet de decrire completement letatdu systeme forme de toutes les particules ! Si en revanche letat dune particule faitintervenir position et vitesse (x Rd, v Rd), alors lespace des phases naturel pourune particule est (Rd Rd)N.Terminologie : On qualifie de cinetique un modele qui prend en compte les vitessesdes particules.

    Dans ce cours on sinteresse uniquement a des modeles donnes sous forme dequa-tions devolution : des equations qui determinent letat du systeme a un temps

    t > 0 si on le connat a linstant initial, t = 0. On adjoindra toujours une donneeinitiale a ces equations devolution. Il existe dautres categories de modeles, en par-ticulier variationnels, selon lesquels letat du systeme est solution dun probleme demaximisation ou de minimisation.

    Les equations devolution microscopique peuvent etre de nature assez variee.Certaines sont issus des axiomes generaux de la physique (principe de Newton,etc.) alors que dautres sont phenomenologiques, ou encore obtenues comme limitesdautres modeles microscopiques. Les modeles sont parfois stochastiques (faisantintervenir des parametres aleatoires), parfois deterministes.

    Aleatoire : Un modele est dit aleatoire sil depend de la valeur dun parametre , espace des aleas, que lon naime pas trop decrire avec precision. Cet espace estmuni dune mesure de probabilite P, cest-a-dire une fonction -additive densemblesde , defini sur une -algebre (famille de parties de , stable par union denombrableet passage au complementaire) A de lensemble des parties de , et satisfaisant auxaxiomes

    A A, P(A) 0; P() = 1;P(iNAi) =

    iN

    P(Ai) si les Ai sont deux a deux disjoints.

  • 8/8/2019 Villani Equations Champ Moyen

    6/58

    6 CHAPITRE 1

    Les elements de A sont dits mesurables. On ne se preoccupera pas dans ce coursdes questions de mesurabilite, qui peuvent par ailleurs etre tres importantes dansdautres sujets lies (etude fine de processus stochastiques...).

    Dans une description aleatoire, on ne cherche jamais a expliciter ou a fairedes hypotheses sur sa forme, mais on tente de tout exprimer en fonction de P. Parexemple, on cherchera a estimer la probabilite pour que la dynamique verifie telleou telle relation a pres...

    ATTENTION ! Comme nous allons le voir sur des exemples, le caractere aleatoirepeut se situer a deux niveaux distincts :

    - dans les equations devolution : il influence alors la dynamique des particules ;- dans les donnees initiales, qui peuvent etre non connues avec certitude.

    Dans le deuxieme cas, on a donc un alea meme si les equations devolution elles-meme sont deterministes.

    La suite de ce chapitre est consacree a une galerie dexemples.

    Exemple 1 : Equations de Newton pour des particules classiques en in-

    teraction :

    Dans ce modele, chaque particule exerce une force sur les autres. La force quuneparticule exerce sur une autre depend des positions relatives de ces deux particules.Lacceleration dune particule est (a un facteur pres) egale a la somme des forces quisexercent sur elles. On sinteresse seulement a decrire les positions des particules,lespace des phases est donc a priori Rd, espace des positions. On note Xit (1 i N)la position de la particule numero i au temps t 0. On a donc lequation devolution

    d2

    dt2Xit = F(Xit ), 1 i N,

    ou F(x) est la force ressentie au point x Rd. Supposons que la force exercee aupoint x par une particule situee au point y est de la forme F(x

    y), ou F : Rd

    Rd est une fonction donnee (on utilisera dans ce cours la convention de noter encaracteres gras les parametres essentiels qui interviennent dans un modele). On aalors

    (1)d2

    dt2Xit =

    Nj=1

    F(Xit Xjt ), 1 i N.

    Il est naturel de reecrire ce systeme de N equations differentielles du second ordre,sous la forme dun systeme de 2N equations differentielles du premier ordre, enintroduisant la vitesse des particules. Cela conduit donc a elargir lespace des phasesen introduisant les vitesses (V1t , . . . , V

    Nt ) des N particules. On trouve

    (2)

    ddt

    Xit = Vi

    t ,

    d

    dtVit =

    Nj=1

    F(Xit Xjt ).

    On ajoute a cette equation devolution les conditions initiales : (X10 , . . . , X N0 ) les

    positions initiales, et (V10 , . . . , V N0 ) les vitesses initiales.

  • 8/8/2019 Villani Equations Champ Moyen

    7/58

    CHAPITRE 1 7

    Si F C1(Rd,Rd), le theoreme de Cauchy-Lipschitz assure lexistence et lunicitede la solution maximale de (2), lintervalle de temps sur lequel cette solution estdefinie dependant a priori de la donnee initiale. Dans de nombreux cas, on peutprouver lexistence dune solution globale (definie pour tout temps positif).

    Attention : Dans de nombreux cas interessants, F nest pas de classe C1. Ainsi,dans la modelisation de linteraction Coulombienne entre particules chargees, il estnaturel de choisir F(x) = x/

    |x|3, x

    R3. La force presente donc une singularite a

    lorigine, et une solution classique des equations de Newton nest definie que dansle cas ou les positions de deux particules quelconques ne concident jamais. On nediscutera pas de ce probleme ici...

    Cas particulier important de lexemple 1 : il sagit du cas ou la force F derivedun potentiel, au sens ou il existe une fonction V : Rd R telle que F = V.Ainsi, dans le cas Coulombien, on choisira V(x) = 1/|x|.Operateur gradient : On notera

    =

    x1, . . . ,

    xd

    loperateur gradient dans Rd.

    Indices : Attention aux notations : x1, . . . xd designent les coordonnees du vecteurx Rd, alors que les indices en haut feront reference aux numeros des particules :x1 = (x11, . . . , x

    1d) est un vecteur de R

    d qui vit dans lespace des phases associe a laparticule numero 1. Par ailleurs, on notera X = (X1, . . . , X N) et V = (V1, . . . , V N).

    Systemes hamiltoniens : Dans le cas ou la force F derive dun potentiel, lequation (2)se reecrit

    (3)

    d

    dtXit = V

    it

    d

    dtVit =

    Nj=1

    V(Xit Xjt );

    il sagit dun cas particulier de systeme hamiltonien, i.e. de la forme

    (4)

    d

    dtXit =

    H

    vi(Xt, Vt)

    d

    dtVit =

    H

    xi(Xt, Vt).

    La fonction H : (Rd

    Rd

    )N

    R est appelee Hamiltonien du systeme ; dans notrecas elle prend la forme simple

    H(x1, v1, . . . , xN, vN) =N

    i=1

    |vi|22

    +1

    2

    1i,jN

    V(xi xj ),

    ou lon note |x| la norme euclidienne du vecteur x Rd.Le Hamiltonien est une certaine energie associee au systeme : les termes en |vi|2/2

    sinterpretent comme des termes denergie cinetique, ceux en V(xi xj ) comme des

  • 8/8/2019 Villani Equations Champ Moyen

    8/58

    8 CHAPITRE 1

    termes denergie dinteraction. On pourra verifier que la valeur du Hamiltonien estpreservee par levolution (4), i.e. (d/dt)H(Xt, Vt) = 0.

    Exemple 2 : modele de Newton avec condition initiale aleatoire :

    Il sagit des memes equations (2) que precedemment, mais avec une donnee ini-tiale aleatoire : (X10 , V

    10 , . . . , X

    N0 , V

    N0 ) nest plus un element de (R

    2d)N que lon sedonne au depart, mais une variable aleatoire, cest-a-dire une application (mesu-

    rable) de lespace des aleas dans (R2d

    )N

    . Ce qui compte dans cette description, cenest pas la forme explicite de cette application, mais sa loi L(X10 , V10 , . . . , X N0 , VN0 ).Dans le cadre de la limite de champ moyen, on suppose toujours que cette loi est

    symetrique, i.e. invariante par permutation des coordonnees (ou permutation desparticules).

    Loi : Soit Y : Y une variable aleatoire. On appelle loi de Y la mesure deprobabilite = L(Y) = LY, definie sur Ypar

    [A] = P{ ; Y() A}.

    On notera simplement [A] = P[Y

    A], et on ecrira souvent Y

    pour signifier

    que est la loi de Y. La notion de loi est un cas particulier de celle de mesure image,dont on rappellera la definition plus loin dans le cours.

    Exemple 3 : Flot gradient : Pour nous, un systeme de particules prendra la formedun flot gradient sil est de la forme

    (5)d

    dtXit =

    E

    xi(Xt), 1 i N.

    Ici encore, E joue le role dune energie ; mais, contrairement a ce que lon avaitobserve dans le cas du systeme hamiltonien, on verifie facilement que lenergie E estdissipee au cours de levolution par (5) : (d/dt)E(Xt)

    0.

    Les systemes gradients apparaissent souvent dans la modelisation de phenomenesdissipatifs (avec friction, etc.) Supposons par exemple une equation de Newton avecfriction, se mettant sous la forme

    d2

    dt2Xt = d

    dtXt V(Xt).

    Ici mesure lintensite du frottement. Si les conditions physiques dans lequel onobserve ce systeme sont telles que lacceleration d2Xt/dt

    2 est negligeable devant cha-cun des deux termes du membre de droite (ce que lon appelle parfois approximationquasi-statique), alors on a une equation approchee de la forme

    dXtdt

    = V(Xt).

    Lenergie E peut contenir des termes denergie potentielle, denergie cinetique silespace des phases est un espace de vitesse, denergie interne, ou denergie dinter-action... Un exemple typique est

    E(x) =1

    2

    1i,jN

    W(xi xj ),

  • 8/8/2019 Villani Equations Champ Moyen

    9/58

    CHAPITRE 1 9

    ou W est symetrique : W(z) = W(z), pour tout z Rd. Le flot gradient associea cette energie est

    d

    dtXit =

    Nj=1

    W(Xit Xjt ).

    Comme precedemment, on peut considerer ces modeles avec donnee initialedeterministe ou stochastique.

    Terminologie : Chaque fois que lon a une equation de mouvement faisant intervenirla vitesse (dX/dt) au lieu de lacceleration (d2X/dt2), on parlera de terme de deriveou de drift (par opposition a un terme de force). Ainsi, dans lexemple precedentj W(Xit Xjt ) est un terme de derive.Exemple 4 : modeles devolution stochastiques : Cette fois, ce sont les trajec-toires qui dependent dun parametre aleatoire.

    Lexemple fondamental est le mouvement Brownien, qui apparat naturelle-ment comme limite de marches aleatoires avec des pas tres courts et tres rapprochesen temps. Le mouvement Brownien est une famille de trajectoires aleatoires,

    (Bt)t0 = Bt(),ou t est la variable de temps et Bt() Rd la position au temps t, etant lavaleur de lalea. Par convention on fait partir ces trajectoires de 0 Rd : B0() = 0.

    Ce que lon choisit pour nest pas tres important : ce qui compte cest laloi des trajectoires. On choisit typiquement = C(R+,Rd), lespace de toutes lestrajectoires continues a valeurs dans Rd, et on definit

    Bt() = (t),

    ... ce qui semble mener a une trivialite ! Le point important est bien sur de savoirquelle mesure de probabilite on definit sur . Il sagit en loccurrence de la celebremesure de Wiener, definie sur tous les cylindres, cest-a-dire les ensembles qui

    ne dependent que des positions Bt en un nombre fini de temps.De maniere plus precise, la mesure de Wiener est definie par les conditions ci-

    apres :

    (6) P[B0 = 0] = 1

    (a coup sur, on part de lorigine au temps 0) ; et pour tout K 1, pour toute suitestrictement croissante de temps, 0 < t1 < .. . < tK, pour tous ensembles mesurablesA1, . . . , AK de R

    d on a

    (7) P[Bt1 A1, . . . , BtK AK] =A1...AK

    ePKk=1

    |xkxk1|2

    2(tktk1)

    Kk=1(2)d(tk tk1)dx1 . . . d xK,

    ou on pose par convention t0 = 0, x0 = 0. Attention, dans cette ecriture chaque xkvit dans Rd... Pour comprendre cette definition plus intuitivement, faisons quelquesnouveaux rappels elementaires de probabilites.

    Rappel : Variables independantes : On dit que deux variables aleatoires X etY sont independantes si la loi du couple (X, Y), vu comme variable aleatoire, estegale au produit tensoriel de la loi de X par la loi de Y :

    L(X, Y) = L(X) L(Y).

  • 8/8/2019 Villani Equations Champ Moyen

    10/58

    10 CHAPITRE 1

    Cela equivaut a :

    A, B, P[X A, Y B] = P[X A]P[Y B].Si la loi de X a une densite f(x) et la loi de Y a une densite g(y) (cest-a-direL(X)[A] = A f(x) dx, etc.) alors la loi de (X, Y) aura pour densite f(x)g(y).Rappel : Variables aleatoires gaussiennes : Ce sont des variables aleatoires,

    a valeurs dansR

    d

    , dont la loi est une distribution gaussienne, de la forme [A] =A

    g(x) dx avec

    g(x) = gC,x0(x) =e

    12C1(xx0),(xx0)

    (2)d/2

    det C.

    Ici x0 Rd joue le role dune valeur moyenne, et C est une matrice definie po-sitive, dite matrice de covariance. Cette loi est notee N(x0, C). Les distributionsgaussiennes jouent un role capital en physique statistique, statistique tout court, eten probabilites de facon generale, en particulier du fait du theoreme central limite.

    Rappel : comportement de la loi par changement de variables : En utilisantle theoreme de changement de variables, on montre (exercice) que si Y est unevariable aleatoire dont la loi L(Y) a pour densite f, et si est un C1 diffeomorphisme,alors L((Y)) a une densite g definie par f(x) = g((x)) det D(x).Exercice : En utilisant les trois rappels precedents, montrer que la definition dumouvement Brownien peut se reformuler comme suit : B0 = 0, et les accroissementsBt1 0, Bt2 Bt1, . . ., BtK BtK1 sont des variables aleatoires independantes deloi gaussienne :

    Btk Btk1 N(0, (tk tk1)Id),Id designant la matrice identite de R

    d. En particulier, si lon connat la position Bt,alors lincertitude sur la position Bs crot proportionnellement a s t... Par ailleurs,lindependance des accroissements successifs peut etre vue comme un processus deperte de memoire : une fois arrivee a une certaine position, la particule Brownienneoublie le chemin quelle a suivi pour y arriver.

    On montre que les trajectoires Browniennes sont en general (cest-a-dire avecgrande probabilite) tres heurtees (en gros : pas plus regulieres que Holder-1/2) ;en particulier, avec probabilite 1 ces trajectoires ne sont nulle part differentiables.

    Un exemple plus general de dynamique aleatoire : Soit une particule partantde la position X0 = x0, evoluant suivant une trajectoire Brownienne, on aura doncXt = x0 + Bt. Si lon interprete cela comme le resultat de derives aleatoires infi-nitesimales, il est naturel de reecrire cette equation sous la forme dXt/dt = dBt/dt,et de la generaliser en ajoutant dautres termes de derive, sous la forme

    (8)dXtdt

    =dBtdt

    + (Xt).

    Mais cela na guere de sens car dBt/dt nexiste pas en general... La theorie desequations differentielles stochastiques a pour but de donner un sens a desequations de ce type, et detudier les proprietes de leurs solutions. Par convention,on reecrit (8) sous la forme

    (9) dXt = dBt + (Xt) dt,

  • 8/8/2019 Villani Equations Champ Moyen

    11/58

    CHAPITRE 1 11

    le sens a donner a cette equation etant :

    t 0, Xt = X0 + Bt +t0

    (Xs) ds,

    les fonctions Xs et Bs etant bien sur aleatoires !Le calcul stochastique concerne egalement des objets plus complexes que le mou-

    vement Brownien, mais dans ce cours nous nen aurons pas besoin.

    Voici quelques modeles simples devolution stochastiques pour des systemes departicules :

    dXit = dBit, 1 i N

    (toutes les particules evoluent selon des trajectoires Browniennes independantes) ;

    dXit = dBit V(Xit ) dt, 1 i N

    (les particules subissent en plus une derive deterministe qui depend de leur positionet derive dun potentiel) ;

    dXit = dBit V(Xit ) dt

    N

    j=1W(Xit Xjt ) dt

    (les particules subissent en outre une derive deterministe qui depend des positionsdes autres particules !)

    Plus generalement, on peut considerer des equations de la forme

    dXit = dBit + F(X

    it ) dt +

    Nj=1

    G(Xit , Xjt ) dt...

    Exemple 5 : Autres modeles stochastiques : Il y a beaucoup, beaucoup dautresmodeles stochastiques dans la litterature (modeles avec saut, avec exclusion, etc.etc.) Decrivons par exemple le modele imagine par Kac dans les annees 50, pour

    modeliser (de maniere simpliste) les collisions entre particules dans un gaz rarefie.On dispose de N particules, chacune ayant une vitesse V R determinee. Letatdu systeme etant connu au temps t, on regarde quelle est la valeur T dune variablealeatoire exponentielle (cest-a-dire une variable aleatoire a valeurs dans R+, de loiex1x0 dx pour un certain > 0). Au temps t + T on decide quil y a collisionentre deux particules. On choisit au hasard deux particules parmi les N presentes(chaque couple ayant une probabilite 2/N(N1) detre choisi), et on choisit alors unangle aleatoire [0, 2[, de loi uniforme. Au temps t + T, on remplace les vitessesVi et Vj des deux particules qui rentrent en collision, par de nouvelles vitesses V

    i

    et Vj calculees selon la regle

    (Vi, V

    j ) = R(Vi, Vj),

    ou R designe la rotation dangle dans le plan. Puis on recommence...

    2. Limite de champ moyen : discussion informelle

    La problematique generale des limites macroscopiques est detudier le comporte-ment des solutions dun systeme microscopique dans lequel le nombre de particulesest tres grand, et eventuellement dans lequel certaines grandeurs caracteristiques(intervenant par des valeurs de constantes physiques, etc.) sont tres petites, ou tres

  • 8/8/2019 Villani Equations Champ Moyen

    12/58

    12 CHAPITRE 1

    grandes. Le plus souvent, ce regime asymptotique setudie au moyen dun change-ment dechelle. Dans ce cours, nous supposerons que ces operations ont deja eteeffectuees, de sorte que le seul parametre asymptotique sera le nombre de particules,N.

    La limite de champ moyen est une limite dans laquelle N est tres grand (ceque lon formalise par letude de lasymptotique N ), mais dans lequel lesinteractions entre particules sont suffisamment faibles pour que les forces/influences

    sexercant sur une particule donnees restent finies a la limite et dans lequel toutesles particules continuent dinteragir. Un exemple typique est le systeme

    dXit = dBit

    Nj=1

    W(Xit Xjt ), 1 i N.

    Si lon effectue N dans ce systeme, linfluence combinee de toutes les particulesXj a toutes les chances de diverger. Il convient donc de changer les echelles dedescription microscopiques en de nouvelles echelles, dites macroscopiques, telles quelequation soit sous la forme (par exemple)

    dXi

    t = dBi

    t 1

    N

    N

    j=1 W(X

    i

    t Xj

    t ), 1 i N.On peut alors esperer que le membre de droite va rester O(1) dans la limite ouN .

    La question naturelle est donc : connaissant les positions des particules au tempsinitial (ou la loi de ces positions, dans une description aleatoire), est-ce que lonconnat les positions de ces particules a un temps t ulterieur ? et ce, dans la limiteou N .

    Une variante (qui entrane un formalisme plus complexe) est : a quoi ressemblentles trajectoires (X1t , . . . , X

    Nt ) quand N ?

    Une deuxieme question naturelle, et en fait tres liee a la precedente, concerne

    la propriete dite de chaos moleculaire : supposons que les etats des particules autemps initial t = 0 soient independants, disons

    L(X10 , . . . , X N0 ) = L(X10) L(XN0 ),et meme, pour ne travailler quavec des lois symetriques,

    L(X10 , . . . , X N0 ) = N0pour une certaine mesure de probabilite 0 (on designe par

    N le produit tensorielde 0 par lui-meme, N fois). Cette propriete reste-t-elle vraie aux temps ulterieurs,ou au moins approximativement vraie, dans la limite ou N ? Autrement dit,lindependance dans les etats des particules (chaos) est-elle preservee par la dy-namique, ou detruite ?

    Dans les deux problemes ci-dessus, on se heurte tout de suite a des difficultesconsiderables, dues a ce que lespace des phases dans lequel vit linconnue (X1t , . . . , X

    Nt )

    est (Rd)N, dont la dimension tend vers linfini avec N! Si lon sinteresse au com-portement des trajectoires, cest encore pire : linconnue vit dans C(R+, (Rd)N)...Quant a la loi jointe des N particules, cest une mesure de probabilite sur un espacedont la dimension tend vers linfini. Pour resoudre ces problemes, nous allons etreamenes a introduire le concept fondamental de mesure empirique dune part, etdautre part a nous interesser a des outils danalyse en dimension infinie.

  • 8/8/2019 Villani Equations Champ Moyen

    13/58

    CHAPITRE 1 13

    3. Quelques rappels sur les mesures

    A partir de maintenant, tous nos problemes feront intervenir des mesures. Com-mencons par faire quelques rappels generaux sur ces objets.

    Soit Yun ensemble. On appelle -algebre de parties de Yune famille de parties deYqui soit stable par union denombrable, passage au complementaire, et comprenneY. Les elements de la -algebre (ou tribu) sont dits mesurables.

    On appelle mesure positive, ou mesure de Borel, une mesure definie sur une-algebre, qui a tout ensemble mesurable associe un nombre positif (eventuellement+) (A) = [A] 0, et satisfait a laxiome daddition denombrable :

    (iNAi) =iN

    [Ai]

    si tous les ensembles mesurables Ai sont deux a deux disjoints.Une mesure de probabilite est une mesure positive de masse totale egale a 1 :

    [Y] = 1. On notera P(Y) lespace des mesures de probabilite sur Y.Si X et Y sont munis respectivement de mesures et , on definit le produit

    tensoriel sur X Ypar [A B] = [A][B].Dans le cas ou

    Y= Rd, on appelle -algebre des Boreliens la plus petite -algebre

    contenant tous les ouverts de Rd. Sur Rd, toutes nos mesures seront definies sur latribu des Boreliens.

    Toujours dans le cas ou Y= Rd, on parle de mesure de Borel reguliere si pourtout K compact, [K] < +. On a alors automatiquement, pour tout Borelien A,

    [A] = inf[O] = sup [F],

    ou O decrit lensemble des ouverts contenant A, et F decrit lensemble des fermescontenus dans A. Toutes les mesures que nous rencontrerons sont de ce type.

    On peut construire une mesure privilegiee, dite mesure de Lebesgue sur la tribudes Boreliens, notee | |. La mesure de Lebesgue est caracterisee par son invariancepar translation (

    |x+A

    |=

    |A

    |) et par le volume des boules (volume euclidien classique

    tel quon le calcule par des methodes elementaires).On peut completer la tribu des Boreliens en tribu des ensembles Lebesgue-

    mesurables. Cette tribu verifie la propriete dite de completion : pour tout A Lebesgue-mesurable tel que |A| = 0, pour tout B A, on a B Lebesgue-mesurable avec|B| = 0.

    On appelle mesure (de masse finie) la difference de deux mesures positives : = + , ou sont des mesures positives (de masse finie).

    On definit alors sa variation totale par

    V T = inf{+[Rd] + [Rd]},ou linfimum est pris sur tous les couples de mesures positives (+, ) tels que = + .

    Si est une mesure de variation totale bornee, on peut definir lintegrale dunefonction continue par rapport a : cest un reel que lon note

    d. Lintegrale

    d definit alors une forme lineaire continue, de norme majoree par V T.De facon generale, quand est une fonction positive et une mesure positive,

    on peut definir

    d comme un element de R+ +. Si ce nombre est fini, ondit que est integrable (on note L1(d)). Dans le cas ou nest pas forcementpositive, on dit que L1(d) si || L1(d), et on peut alors definir d.

  • 8/8/2019 Villani Equations Champ Moyen

    14/58

    14 CHAPITRE 1

    Le theoreme de Riesz identifie precisement le dual de lespace de BanachC0(R

    d), espace des fonctions continues tendant vers 0 a linfini, muni de la norme dela convergence uniforme fg = supxRd |f(x)g(x)|, avec lespace des mesuressur Rd, norme par la variation totale, que lon notera M(Rd). En outre, les formeslineaires continues positives sont exactement les mesures positives de variation totalefinie. Le theoreme de Riesz utilise de maniere cruciale le fait que Rd soit un espacelocalement compact, i.e. tout point de Rd admet un voisinage compact.

    La topologie naturelle sur lespace des mesures M(Rd) est donc la topologiefaible-, induite par lespace des fonctions continues. En particulier, une suite demesures n converge (au sens faible-) vers une mesure si pour toute fonction C0(Rd),

    dn n

    d.

    Notons quil existe dautres notions naturelles de convergence faible quand on consideredes mesures de probabilite, en particulier en remplacant lespace C0(R

    d) par lespaceCb(R

    d) des fonctions continues bornees. Cette derniere notion est la bonne quandon considere un espace non localement compact. Dun autre cote, dans le cas dunespace localement compact, les deux notions concident sur lespace des mesures de

    probabilite (pas sur lespace des mesures).Dans ce cours on considerera la convention definie par C0(R

    d). On verra enoutre que, sur lespace P(Rd) des mesures de probabilites, la topologie faible- estmetrisable, de sorte quil est equivalent de parler de topologie faible- ou de conver-gence faible- (cela est un fait general, egalement vrai pour des espaces metriquesseparables complets arbitraires).

    Mesure image : Il sagit dun concept fondamental ! Supposons donne deux espacesX et Y, ainsi quune mesure sur X et une application T : X Y. On peutalors definir une mesure sur Y, dite mesure image de par T, en imposant queles ensembles mesurables sur Y soient les ensembles A Y tels que T1(A) soitmesurable ; et en definissant naturellement

    [A] = [T1(A)].

    On notera = T#,

    et on retiendra la regle fondamentale qui exprime la mesure image en termes dintegralesde fonctions continues :

    Y d(T#) =

    X

    ( T) d.

    Cette formule est valable des que T est integrable pour la mesure .On note que la loi dune variable aleatoire X definie sur un espace de probabi-

    lites nest autre que la mesure image par X de la mesure de probabilite P. Enparticulier, on a la formule

    (10)

    (X()) dP() =

    (x) dLX (x),

    valable des que X L1(dP). La quantite de gauche est appelee esperance dela variable aleatoire (X), et notee E(X).

    Les deux exemples fondamentaux de mesures sur Rd que nous utiliserons sont

  • 8/8/2019 Villani Equations Champ Moyen

    15/58

    CHAPITRE 1 15

    - les mesures a densite : il existe une fonction f(x), Lebesgue-integrable, telleque

    [A] =

    A

    f(x) dx,

    la quantite de droite etant definie par la theorie de lintegrale de Lebesgue. On noterapour abreger d = f(x) dx. Dans le cadre des mesures a densite, la variation totaleconcide avec la norme L1.

    - les masses de Dirac : ce sont des mesures de la forme

    x0[A] = 1x0A.

    Il faut imaginer une masse concentree sur un point x0... En termes dintegrales defonction continue, la masse de Dirac en x0 est la fonctionnelle qui a toute fonctioncontinue associe le reel (x0).

    Noter que la variation totale x0 y0V T est egale a 2 des que x0 = y0, et enparticulier ne tend pas vers 0 quand x0 se rapproche de y0. Cest un indice de ce quela variation totale est un objet peu adapte a letude de systemes de particules...

    4. Mesure empirique

    Nous pouvons maintenant introduire un des acteurs principaux de letude.

    Definition 1. Une configuration X = (X1, . . . X N) de particules etant donnee,on appelle mesure empirique associee a la configuration X la mesure de probabilite

    (11) X = NX = 1NN

    i=1

    Xi.

    Si les Xi sont des variables aleatoires, bien sur la mesure empirique devient unemesure aleatoire, cest-a-dire une variable aleatoire a valeurs dans lespace desmesures.

    Attention : si lespace des phases est de type (position, vitesse), la mesure empi-

    rique associee a une configuration (X1, V1, . . . , X N, VN) est bien

    N(X,V) = 1NN

    i=1

    Xi Vi.

    La mesure empirique ne determine pas uniquement la configuration microsco-pique, bien sur : elle est invariante par permutation des particules. Plus precisement,pour toute permutation de {1, . . . , N }, si lon pose X = (X(1), . . . , X (N)),alors on a NX = NX . Dans tout ce cours, nous nous considerons des particulesechangeables (que nous ne voulons pas distinguer), et la mesure empirique est doncun objet naturel pour cette etude.

    Quel est lavantage de travailler avec la mesure empirique plutot quavec la confi-guration microscopique ? En particulier, il reside dans ce que tous les NX vivent dansun meme espace (de dimension infinie) : lespace des mesures de probabilite sur Rd.Il devient alors possible de se demander si NX converge vers quelque chose, alors quecela ne serait pas evident du tout pour les configurations microscopiques, qui viventtoutes dans des espaces differents quand on fait varier N.

    Quel est le sens physique de la mesure empirique ? Dans le cas deterministe, onpeut penser que cest une une bonne definition de la densite de particules sur Rd :NX [A] compte le nombre de particules, parmi la configuration X, qui se trouvent

  • 8/8/2019 Villani Equations Champ Moyen

    16/58

    16 CHAPITRE 1

    dans lensemble A de Rd. Nous allons voir maintenant que dans le cas aleatoire,lesperance de la mesure empirique fournit une bonne notion de densite

    de particules.Soit une particule quelconque, disons numerotee 1 (par symetrie de la loi, cela

    na pas dimportance), quelle est la probabilite de la trouver a telle ou telle positiondans Rd ? En dautres termes, quelle est la loi de sa position ? Il est facile de voir quecette loi est la mesure image de N =

    L(X1, . . . , X N) par lapplication de projection

    (x1, . . . , xN) x1 Rd. Cette mesure image, que nous noterons 1, est appeleemarginale de la loi jointe sur son premier facteur, et par definition de la mesureimage on a, pour toute application continue bornee sur Rd,

    d1 =

    (x1) dN(x

    1, . . . , xN)

    =1

    N

    [(x1) + . . . + (xN)] dN(x

    1, . . . , xN)

    =

    Rd

    d

    Nx

    dN(x

    1, . . . , xN)

    = ERd dNX=

    Rd

    d(ENx ).

    Ici nous avons utilise successivement la definition de la mesure image, la symetriede la loi jointe des N particules, la definition de la mesure empirique, la definitionde la loi de (X1, . . . , X N) via la formule (10), et finalement le theoreme de Fubini.De ce calcul on deduit que la loi de X1 est

    L(X1) = E

    NX .

    5. Modele macroscopique

    Pour nous, un modele macroscopique sera une equation aux derivees partielles(EDP) portant sur la densite de particules, a comprendre comme la limite de lamesure empirique (ou de son esperance) quand N tend vers linfini. Dans cettesection, nous allons nous borner a donner quelques exemples.Exemple 1 : Equation de la chaleur : Cette equation et ses variantes sontomnipresentes en physique et en mathematiques. Lequation de la chaleur secrit

    (12)f

    t= f,

    ou est loperateur Laplacien,

    f = (f) = i=1d

    2f

    x2i .

    Dans cette ecriture represente loperateur de divergence,

    J =d

    i=1

    J

    xi.

    Ici f(t, x) doit etre compris comme la densite de particules au point x, a untemps t donne. Plus precisement, la densite de particules au temps t serait dt(x) =

  • 8/8/2019 Villani Equations Champ Moyen

    17/58

    CHAPITRE 1 17

    f(t, x) dx : f est donc une densite de probabilite dans la variable x (pas t !). Nousavons ecrit lequation pour une fonction, mais nous aurions du ecrire

    t= ,

    ou serait une mesure de probabilite arbitraire, et loperateur est defini pardualite (au sens des distributions) par la formule

    d() = dpour toute fonction C a support compact.

    Lequation de la chaleur (12) est ecrite avec la convention des analystes ; la formecourante en vigueur chez les probabilistes est plutot

    f

    t=

    1

    2f.

    Nous verrons pourquoi dans le prochain chapitre !

    Exemple 2 : Equation de McKean-Vlasov : Ce sont des equations de la forme

    f

    t = f + (fW),ou W est un potentiel de la forme

    W(x) =

    f(t, y)W(x, y) dy,

    un cas typique etant bien sur

    W(x) = fx Wpour un certain potentiel W : Rd R.

    Ce type dequation se rencontre frequemment, et dans des contextes tres varies.Ainsi, lequation de Navier-Stokes bidimensionnelle, en formulation tourbillon, est

    de cette forme :

    t= + (u),

    ou (scalaire) est le rotationnel du champ de vitesse u : R2 R2, que lon peutreconstruire a partir de par la loi de Biot-Savart,

    u =x

    2|x|2 , x = (x2, x1).

    Citons un autre exemple : un modele de milieu granulaire propose par McNamaraet Young en dimension d = 1, et etudie par certains mathematiciens :

    f

    t

    = f +

    f| |3

    3 f .

    Dans ces differents cas, on peut aussi considerer la variante sans diffusion, i.e.sans le terme en f.

    Exemple 3 : Equation de Vlasov : Il sagit dune equation cinetique ; linconnueest donc une densite de particules dans lespace des phases (Rd Rd), qui dependdu temps. Lequation de Vlasov secrit

    f

    t+ v xf + F(t, x) vf = 0,

  • 8/8/2019 Villani Equations Champ Moyen

    18/58

    18 CHAPITRE 1

    ou

    v x =d

    j=1

    vj

    xj,

    et la force F est donne par un produit de convolution,

    F(t, x) = Rd

    F(x y) (t, y) dy,

    ou (t, x) est la densite locale de particules au point x (sans tenir compte de leursvitesses),

    (t, x) =

    Rd

    f(t,x,v) dv.

    Un cas particulier tres important est lequation de Vlasov-Poisson, dans laquelleF(x) = V(x) pour V(x) = 1/(4|x|) en dimension d = 3. On peut alors reecrirelequation sous la forme

    (13)

    ft

    + v xf (t, x) vf = 0,

    (t, x) = (t, x) =R3

    f(t,x,v) dv.

    Lequation de Vlasov-Poisson est sans doute lequation la plus importante detoute la physique des plasmas. Sa variante gravitationnelle, ou V est egal a lopposede la formule ci-dessus, est egalement une equation fondamentale en astrophysique.

    Exemple 4 : Equation de Vlasov-Fokker-Planck : Il sagit de la meme que

    precedemment, mais avec une diffusion et une derive (la combinaison de ces deuxtermes est souvent appelee operateur de Fokker-Planck) dans la variable de vitesse :

    f

    t+ v xf + F vf = vf + v (f v).

    Des variantes de cette equation sont egalement tres utilisees en physique des plasmaset en astrophysique, quand on sinteresse a de grandes echelles de temps.

    Exemple 5 : Le modele de Kac : Il prend la forme

    f

    t

    = 1

    2 2

    0

    d R dy [f(x)f(y)] f,ou (x, y) = R(x, y). Cest un modele macroscopique extremement simplifie pourdecrire des collisions dans un gaz dilue.

    Lequation de Boltzmann, pour les lecteurs qui la connaissent, est une equationmacroscopique, mais pas une equation de champ moyen : seules interagissent lesparticules qui sont suffisamment proches lune de lautre, alors que dans une limitede champ moyen, chaque particule ressent linfluence de toutes les autres.

  • 8/8/2019 Villani Equations Champ Moyen

    19/58

    CHAPITRE 1 19

    6. Formulation precise de la limite macroscopique

    Nous pouvons maintenant enoncer clairement le probleme de la limite de champmoyen. En fait, les definitions que nous allons donner ici valent pour la plupartdes limites macroscopiques, pas necessairement de champ moyen. Il y a deux in-terpretations possibles : une deterministe, une aleatoire. La formulation aleatoireest moralement plus generale, meme si a strictement parler elle ne comprend pas la

    formulation deterministe, car dans la formulation aleatoire on a coutume de suppo-ser que la loi jointe des particules est symetrique, ce qui est visiblement impossibledans le cas deterministe.

    Formulation deterministe : On se donne un modele microscopique deterministe,ou plutot une famille de tels modeles, indexes par N. On en deduit une mesureempirique (N0 ) au temps t = 0, et plus generalement (Nt ) au temps t. On supposeque N0 wM

    N0 (au sens faible-),

    est-il vrai que pour tout temps t > 0 on ait

    Nt wMN t,ou (t)t0 est la solution dun modele macroscopique a preciser ?

    Formulation aleatoire : On se donne cette fois un modele microscopique stochas-tique, soit de par ses regles devolution, soit de par sa donnee initiale. On lui associela mesure empirique (Nt ), maintenant une mesure aleatoire. On suppose quil existeun 0 fixe (non aleatoire !) tel que

    N0 est proche de 0, au sens faible, en mesure ;

    cela signifie que pour tout C0(Rd) et pour tout > 0,

    P

    d

    N0

    d0

    N

    0.

    Le probleme est alors de montrer que pour tout t 0, pour tout C0(R

    d

    ), etpour tout > 0,

    P

    dNt dt N 0.Idealement, on voudrait obtenir des taux de convergence !

    Determinisme : Soit une famille de mesures empiriques (N) telle quil existe telle que C0(Rd), > 0,

    P

    d

    N

    d

    N

    0.

    Dans ces conditions, on dit que cette famille de mesures est asymptotiquement,

    ou macroscopiquement deterministe. Le resultat precedent est donc un resultat depropagation du determinisme.

    Autre formulation : probabilites sur lespace des chemins : Une autre faconde gerer la variable de temps consiste a introduire lapplication

    t Nt ,qui definit un chemin aleatoire dans lespace des mesures de probabilite, i.e. unelement aleatoire de C(R+, M(Rd)). Le probleme consiste alors a montrer que la loi

  • 8/8/2019 Villani Equations Champ Moyen

    20/58

    20 CHAPITRE 1

    de cette variable aleatoire converge vers la masse de Dirac concentree sur luniquesolution du modele macroscopique.

    Probleme de la particule marquee : Un autre probleme, que nous ne considereronspas ici, consiste a etudier les trajectoires dune particule, que lon suit pour toujours,par exemple la premiere. Quand le nombre de particules, N, tend vers linfini, onsattend a ce que les N 1 autres particules agissent sur la particule 1 de manieredeterministe. Si la dynamique est aleatoire, cette action deterministe ne va pasempecher la particule 1 davoir une trajectoire stochastique. Le probleme consistealors a determiner la loi de cette tra jectoire.

    Autres theoremes limites : Le probleme de la limite macroscopique, enonce ci-dessus, correspond a un theoreme de type loi des grands nombres : quand lenombre de particules devient tres grand, en premiere approximation les fluctuationsde la loi dune particule disparaissent et il y a une limite deterministe. On peutaussi etudier des equivalents du theoreme central limite (etude de petites fluc-tuations stochastiques autour de la limite deterministe), ou bien du principe degrandes deviations (etude de deviations importantes). Nous ne considererons pasces questions ici !

    Dans le prochain chapitre, on expliquera comment deviner le modele macro-scopique naturel a partir du systeme microscopique, pour les cas les plus simples etimportants.

  • 8/8/2019 Villani Equations Champ Moyen

    21/58

    CHAPITRE 1 21

    7. Notes bibliographiques

    Beaucoup de references peuvent etre utilisees pour illustrer ce chapitre. Le livredArnold, Mathematical methods of classical mechanics, Graduate texts in mathema-tics 60 (1989), Springer, contient beaucoup plus que ce dont nous aurons besoin surles equations differentielles de la mecanique classique et les systemes hamiltoniens.

    Pour une introduction elementaire aux probabilites, on peut consulter Jacod et

    Protter, Probability essentials, Universitext (2000), Springer. Une reference classi-queet tres complete est louvrage de Feller, An introduction to probability theoryand its applications, vol. II, Wiley series in probability and mathematical statistics(1971), Wiley.

    Il existe de nombreux ouvrages sur le mouvement Brownien et les equationsdifferentielles stochastiques. Pour une introduction (amplement suffisante pour nosbesoins), je recommande les notes de cours de J.-F. Le Gall, pedagogiques et auto-contenues (je peux fournir une version .ps en cas de besoin).

    Le modele cinetique de Kac apparat dans larticle Foundations of kinetic theory,Proceedings of the Third Berkeley Symposium on Mathematical Statistics and Pro-bability, 19541955, vol. III, 171197, publie en 1956 par University of California

    Press. Cest egalement dans cet article que Kac introduisit la notion de propagationdu chaos.Pour les notions de theorie de la mesure rappelees dans ce cours, on pourra

    se reporter, par exemple, au cours de Rudin, Real and complex analysis, 3rd ed.(1987), McGraw Hill, qui fournit des preuves completes. On trouvera egalement unrecapitulatif des notions importantes au debut de louvrage de Lieb et Loss, Analy-sis, 2nd ed. (1991), Graduate studies in mathematics 14, American MathematicalSociety.

    Les references donnees au debut du cours (ouvrages de Spohn, notes de Neunzertet de Sznitman) contiennent beaucoup plus dinformations sur les limites de champmoyen.

  • 8/8/2019 Villani Equations Champ Moyen

    22/58

  • 8/8/2019 Villani Equations Champ Moyen

    23/58

    CHAPITRE 2

    Equations de transport, avec ou sans diffusion

    1. Terminologie

    Transport : Nous appellerons equation de transport toute equation se mettant sousla forme

    (14)f

    t+ (f) = 0.

    Ici linconnue est une densite de probabilite f(t, x) 0, t R ou R+, x Rd,f(t, x) dx = 1. La fonction = (t, x) est un champ de vecteurs dependant du

    temps ; elle est donc a valeurs dans Rd. Noter que (f) =

    i (if)/xi.

    Il sera plus naturel pour nous dinterpreter de telles equations avec des mesures

    de probabilite (dependant du temps) pour inconnues, et non des fonctions. On ecriradonc

    t+ () = 0.

    Les deux formulations concident quand dt(x) = f(t, x) dx ; la deuxieme est plusgenerale.

    Cette equation est lineaire si est donne independamment de f (ou ), nonlineaire dans les autres cas.Diffusion : Nous appellerons equation de transport avec diffusion une equation semettant sous la forme

    (15)

    f

    t + (f) = f,avec > 0 ; ou plus generalement

    (16)f

    t+ (f) = (Af),

    ou A = A(t, x) est une application a valeurs dans lespace des matrices symetriquesde taille d, dite matrice de diffusion. Nous considererons seulement le cas ou cettematrice est constante ; dans un traitement plus general on pourrait considerer unematrice de diffusion dependant de x, de t, ou encore des valeurs de f, auquel cas onaurait un couplage non lineaire au niveau de la diffusion.

    De meme que precedemment, il vaut mieux pour nous ecrire cette equation avec

    une mesure comme inconnue :

    t+ () = (A).

    Les equations de transport/diffusion apparaissent naturellement comme les equationsque verifient les densites de particules evoluant de maniere deterministe ou stochas-tique ; cest ce que nous allons voir dans ce chapitre.Remarque importante : Cest une question de convention de savoir si une equationest une equation de transport ou une equation de diffusion... cela depend de la facon

  • 8/8/2019 Villani Equations Champ Moyen

    24/58

    24 CHAPITRE 2

    dont on veut la traiter. Considerons par exemple lequation de la chaleur lineaire,archetype dune equation de diffusion (sans transport) :

    f

    t= f.

    Il est possible, moyennant un petit peu de regularite (pas dannulation de f) de lareecrire comme une equation de transport non lineaire :

    ft

    + (f) = 0,

    = ff

    = log f.Et ce point de vue savere parfois utile !

    2. Theoreme des caracteristiques

    Les caracteristiques sont une notion fondamentale dans letude des equationsde transport, aussi bien du point de vue theorique que du point de vue pratique(simulation numerique...).

    Definition 2. Soit (t, x) un champ de vecteurs de classe C1 :

    C1(RRd;Rd). Les caracteristiques associees a sont les solutions maximales des equations

    d

    dtx(t) = (t, x(t)).

    Pour x0 Rd, on appelle caracteristique issue de x0 la caracteristique satisfai-sant x(0) = x0 ; on notera x(t) = Ttx0 ; bien sur T0 = id. Dans la pratique, onse restreindra aux temps positifs. Le theoreme de Cauchy-Lipschitz assure que lacaracteristique issue de x0 est definie sur un intervalle non vide [0, T

    (x0)[.Theoreme 1. Soit (t, x) un champ de vecteurs de classe C1 surR Rd, et

    (Tt) la famille des caracteristiques associee a ce champ. On suppose que les (Tt)definissent une famille de C1-diffeomorphismes pour 0

    t < T. On se donne une

    mesure de probabilite 0 P(Rd). Alors lunique solution (t)0t

  • 8/8/2019 Villani Equations Champ Moyen

    25/58

    CHAPITRE 2 25

    Si cette condition est satisfaite, on a alors automatiquement injectivite de Tt. Maisce nest pas suffisant ! Il faut aussi assurer la surjectivite ; intuitivement cela revienta dire quaucune trajectoire narrive de linfini en temps inferieur a T, ou encoreque si on resout lequation caracteristique dans le sens des temps negatifs en partantdun x0 Rd au temps T < T, alors on peut prolonger cette trajectoire jusquautemps 0.

    3. Une condition particulierement simple qui assure que les (Tt) forment unefamille de C1 diffeomorphismes, pour tout t, est < +.

    4. Attention : Cest la mesure qui est transportee. Si les t ont tous une densite,dt(x) = ft(x) dx, alors, quand ft est de classe C

    1 la formule de changement devariables montre que

    f0(x) = ft(Ttx) det(DTt(x)).

    En particulier, ft(Ttx) nest pas egal, en general, a f0(x).

    5. Un cas particulier important est celui ou la divergence du champ de vecteursest nulle : = 0. Dans ce cas, on a la relation dincompressibilite det Tt = 1.Une consequence importante est que, si t a une densite, alors les valeurs de cette

    densite sont transportees par le flot : lequation de la remarque precedente devientft(Ttx) = f0(x).

    Pour le voir, il suffit de noter que lequation (17) se reecrit

    f

    t+ f = 0,

    soit

    tf(t, Ttx) = 0.

    Un exemple important est celui de lequation de Vlasov, ou lon a (x, v) = (v, F(x)).

    6. Des que lon cherche a travailler avec des champs qui ne sont pas locale-ment Lipschitziens, les choses se compliquent enormement... Il existe des theoriesmathematiques pour les champs peu reguliers : en particulier, la theorie de Filip-pov sinteresse aux champs qui verifient une condition de Lipschitz dun seul cote :typiquement,

    x y (x) (y), x y C|x y|2,et la theorie de DiPerna-Lions qui considere des champs W1,q pour q 1.

    Preuve du theoreme 1. On ne donnera pas une preuve parfaitement completeici... On note dabord que est bien defini au sens des distributions des que, parexemple, C(RRd;Rd) et C(R; P(Rd)). Ceci permet donc de definir (t)au sens des distributions. Dans la suite, on interpretera lequation (17) au sens desdistributions, cest-a-dire en lintegrant apres multiplication par une fonction testa support compact. Normalement on devrait prendre des fonctions tests dependantdes variables x et t ; comme tout est continu par rapport a la variable de temps onse bornera a utiliser des fonctions tests en x, etant entendu que les derivations en tdoivent etre comprises aussi au sens des distributions.

  • 8/8/2019 Villani Equations Champ Moyen

    26/58

    26 CHAPITRE 2

    1. Montrons que t = Tt#0 est solution de (17). Par definition, pour tout C0 (Rd) on doit verifier que

    d

    dt

    dt =

    (t)

    ( ) dt.

    Pour cela on ecrit

    dt = ( Tt) d0par definition de la mesure image, doud

    dt

    dt =

    t( Tt) d0 =

    ( Tt) Tt

    td0

    =

    ( Tt) ( Tt) d0

    =

    dt,

    ou lon a utilise a nouveau la definition de la mesure image. On remarquera quelhypothese de C1 diffeomorphisme ne nous a pas servi ici : on a seulement utilise le

    fait que Tt etait bien defini et regulier sur [0, T[.Exercice : Refaire la preuve en supposant que t admet pour densite ft, en utilisantla formule exprimant ft en fonction de f0 et de Tt.

    2. On prouve lunicite. Par linearite il suffit de montrer que pour tout T < T,si 0 = 0, alors T = 0. Pour cela on va utiliser la methode de dualite, qui estcertainement la deuxieme methode la plus populaire pour prouver unicite quandon na pas dapplication contractante sous la main (la premiere etant le lemme deGronwall). Supposons que lon sache construire une fonction (t, x) de classe C1, asupport compact en x, solution de

    (18)

    t

    =

    ,

    |t=T = T,ou T est une donnee finale arbitraire dans C

    0 (R

    d). Alors on aura

    d

    dt

    t dt =

    tt

    dt +

    t d

    tt

    =

    t t dt +

    t (tt) = 0,dou

    T dT = 0 d0 = 0.Comme T est arbitraire, on aura T = 0.

    Reste a construire une solution de (18), qui peut se reecrire /t + = 0,ou encore (d/dt)t(Ttx) = 0. On en tire

    t(Ttx) = T(TTx),

    soit encore

    t = T TTt.

  • 8/8/2019 Villani Equations Champ Moyen

    27/58

    CHAPITRE 2 27

    Par hypothese, TTt est un C1 diffeomorphisme, ce qui entrane que t est effecti-vement de classe C1 et a support compact en x.

    Exercice : Ecrire lequation de transport qui correspond aux equations de Newton.

    3. Formule dIto et ses consequences

    La formule dIto est un des piliers du calcul stochastique. Elle permet de voir

    quune equation de transport avec diffusion peut se resoudre egalement par la methodedes caracteristiques, pourvu que lon considere des caracteristiques stochastiques.Nous nutiliserons dans ce cours que le cas particulier suivant de la formule dIto :

    Proposition 2. Soit (t, x) un champ de vecteurs de classe C1, tel que lescaracteristiques associees soient definies sur [0, T[. Soit (Xt)t0 solution sur [0, T[de lequation differentielle stochastique

    dXt = dBt + (t, Xt) dt,

    ou > 0. Limportant ici est que la partie irreguliere de la variation de X soitprecisement donnee par la variation dun mouvement Brownien. Alors pour toute

    fonction

    C2(Rd,R),

    (19) (Xt) (X0) = t0

    (Xs) dXs + 2

    2

    t0

    (Xs) ds.

    On notera que le premier terme dans le membre de droite de (19) est precisementcelui que lon attendrait ; la presence du deuxieme terme provient precisement delirregularite des trajectoires de Xt.Variante matricielle : Dans le cas ou est une matrice ( Md(R)), la formuledIto se transforme en

    (Xt) (X0) =t0

    (Xs) dXs + T

    2:

    t0

    (Xs) ds,

    ou T designe la matrice transposee de , et on note A : B =ij Aij Bij.On ne demontrera pas la formule dIto dans ce cours (pour cela, voir un cours de

    calcul stochastique). Cependant, on va en donner une interpretation heuristique enapprochant les integrales par leurs versions discretisees (equivalent des sommes deRiemann). Il sagit dailleurs dune maniere standard de definir lintegrale stochas-tique par approximation.

    La formule dIto se comprend bien si lon garde en tete deux principes :

    1) la definition de lintegrale stochastique :t0

    Ys dXs

    kYtk(Xtk+1 Xtk),

    ou (tk) est une subdivision de [0, t] dont le pas est tres petit. Bien noter ici laconvention, dite convention dIto, ou les accroissements que lon regarde sont versle futur ; cette convention differe de la convention de Stratonovich. La formule dItoest fortement liee a la convention dIto.

    2) les proprietes dechelle du mouvement Brownien : ses trajectoires typiques sontsi irregulieres (en gros, pas mieux que Holder-1/2), que

    k(Btk+1 Btk)2 ne tend pas

    vers 0 quand le pas de la subdivision devient tres petit. Au contraire, cette quan-tite crot proportionnellement a t ! Pour comprendre intuitivement cette propriete,

  • 8/8/2019 Villani Equations Champ Moyen

    28/58

    28 CHAPITRE 2

    approchons formellement le mouvement Brownien (Bt), disons en dimension d = 1,par une marche aleatoire de pas > 0. On rappelle la definition de cette marchealeatoire : une particule se deplace sur le reseau Z. Au temps t = 0 elle se trouve ala position 0, et elle avance ensuite par pas ; a chaque pas elle choisit aleatoirementde se deplacer vers la droite ou vers la gauche, dune distance . On montre parune application du theoreme central limite quau bout de N pas, la distance typiqueparcourue par cette marche aleatoire est

    N . Si lon introduit maintenant une va-

    riable de temps t telle quen un temps t, la particule effectue environ N = t/2 pas,alors la distance parcourue est O(

    t), et dans la limite ou 0 les trajectoires de

    la particule sapprochent des trajectoires Browniennes. Et on trouve a la limite que(Btk+1 Btk)2 N2 t.

    Bien sur, si dXt = dBt + t(Xt) dt, avec assez regulier, alors la contributionde a la somme

    (Xtk+1 Xtk)2 disparat dans la limite ou le pas de la subdivision

    tend vers 0. On trouve donc en grosk

    |Xtk+1 Xtk |2 2

    k

    |Btk+1 Btk |2.

    Il sagit bien sur la dune approximation tres grossiere, seulement destinee a fairecomprendre lidee... La justification rigoureuse passe par la notion de variation qua-dratique dun processus stochastique.

    Dans le cas multidimensionnel, les accroissements selon une direction sont independantsdes accroissements selon une autre direction (au niveau du mouvement Brownien, lescoordonnees evoluent de maniere independante). En consequence, on peut justifierque si i = j,

    k

    (Bitk+1 Bitk)(Bjtk+1 Bjtk) 0.

    Et on en deduit que dans le cas ou est une matrice, si on introduit M une matricearbitraire (constante, ou variant peu avec Xt), alors, en gros

    k

    M[Xtk+1 Xtk ], [Xtk+1 Xtk ] k

    ij

    Mij ji(Btk+1

    Btk)2,

    qui ressemble atM : (T)

    quand le pas de la subdivision tend vers 0.On peut maintenant comprendre la formule dIto comme suit : introduisons une

    subdivision de lintervalle [0, t] et ecrivons la formule de Taylor a lordre 2 sur chaquesous-intervalle, on trouve alors formellement

    (Xt)

    (X0) = k [(Xtk+1) (Xtk)]

    k

    (Xtk) [Xtk+1 Xtk ] +1

    2

    k

    D2(Xtk) [Xtk+1 Xtk ], [Xtk+1 Xtk ]

    .

    Au vu des considerations heuristiques vues precedemment, le premier terme res-semble a

    (Xs) dXs, tandis que le second ressemble bien ak

    (T : D2)(Xtk) (tk+1 tk) t0

    (T : D2)(Xs) ds.

  • 8/8/2019 Villani Equations Champ Moyen

    29/58

    CHAPITRE 2 29

    Application : loi de solution de processus stochastique : Nous utiliserons laformule dIto sous la forme suivante.

    Theoreme 3. Soit de classe C1, tel que les trajectoires caracteristiques soientbien definies sur [0, T[. Si Xt est solution de lequation differentielle stochastique

    dXt = dBt + (Xt) dt,

    ou > 0, alors la loi de Xt est solution de lequation de transport avec diffusion

    (20)

    t+ () =

    2

    2.

    Plus generalement, dans le cas ou est une matrice de taille d, la loi de Xt satisfaita

    (21)

    t+ () =

    T

    2: D2.

    Remarques :

    1. On ne parle pas ici de lunicite. Sous lhypothese que les Tt definissent desdiffeomorphismes, on peut adapter largument de dualite vu precedemment, avec

    cependant quelques difficultes supplementaires, puisque les solutions de lequationduale ne peuvent avoir leur support borne, dune part, et que lon ne peut leurtrouver une representation aussi simple que dans le cas sans diffusion. Une methoderobuste pour obtenir des estimations a priori sur la regularite de la solution est ceque lon appelle la methode de Bernstein, qui consiste a appliquer un principe dumaximum (parabolique) a la fonction ||2.

    2. Pour = 0 on reconnat bien sur les formules du theoreme 1.

    3. On retrouve le fait que la loi t de (Bt) secrit

    dt(x) =e

    |x|2

    2t

    (2t)d/2dx,

    qui est solution de t/t = (1/2)t, avec donnee initiale 0 = 0. Cest la loriginede la convention probabiliste qui consiste a multiplier le Laplacien par un facteur1/2.

    4. Ce theoreme, comme le theoreme 1, se generalise a un cadre plus general queR

    d (ouverts de Rd avec une condition au bord ; surfaces...).

    Ebauche de preuve du theoreme 3. On considere le cas ou est scalaire,la preuve du cas general etant rigoureusement identique. Par definition de la loi, ona, pour toute fonction Cb(Rd) (continue bornee),

    dt = E(Xt).En utilisant la linearite de E, il vient

    dt

    d0 = E(Xt) E(X0)= E[(Xt) (X0)]

    = E

    t0

    (Xs) dXs + E2

    2

    t0

    (Xs) ds

  • 8/8/2019 Villani Equations Champ Moyen

    30/58

    30 CHAPITRE 2

    = E

    t0

    (Xs) dBs + Et0

    (Xs) s(Xs) ds + E2

    2

    t0

    (Xs) ds.

    La theorie des martingales assure que

    E

    t0

    (Xs) dBs = 0;

    cette propriete est facile a comprendre intuitivement, en effet cette quantite sap-proche formellement par

    k

    E(Xtk) (Btk+1 Btk),

    et comme Btk+1 Btk est independant de tout ce qui a pu arriver a la trajectoirejusquau temps tk, on a

    E(Xtk) (Btk+1 Btk) = E(Xtk) E(Btk+1 Btk) = 0,car E(Bt Bs) = 0.

    On a donc dt

    d0 =

    t0

    E((Xs) s(Xs) + 2

    2(Xs) ds

    =

    t0

    +

    2

    2

    ds ds,

    ce qui est exactement la formulation faible de lequation (20).

    Exercice : Ecrire lequation differentielle stochastique associee a lequation deMcKean-Vlasov ; a lequation de Vlasov-Fokker-Planck.

    4. Couplages non lineaires

    Les theoremes precedents sont tres souvent utilises dans letude des equations detransport (avec ou sans diffusion) lineaires. En presence dune situation non-lineaire,on essaie tres souvent de considerer lequation comme une equation lineaire danslaquelle un coefficient est couple a linconnue. Ainsi, lequation de Vlasov secrit-elle

    f

    t+ v xf + F(x) vf = 0,

    ou le coefficient F, qui determine le champ de caracteristiques, est couple a f viaF = F

    , = f dv. On peut donc interpreter cette equation comme decrivant laloi de particules qui satisferaient a

    d

    dt(Xt, Vt) = t(Xt, Vt) = (Vt, F(Xt)),

    avec F dependant de toute la loi des particules. Cest donc comme si chaque par-ticule subissait une action qui serait directement determinee par toutes les autresparticules : on est la exactement dans la situation typique de lapproximation dechamp moyen.

  • 8/8/2019 Villani Equations Champ Moyen

    31/58

    CHAPITRE 2 31

    5. Statut mathematique de ces equations

    On se demande ici quels sont les principaux resultats concernant lexistence,lunicite et le comportement qualitatif des solutions des equations passees en revuedans ce chapitre. Bien sur, il est hors de question de passer tout en revue sur cesequations qui ont ete extremement etudiees ! Comme on sy attend, les principauxproblemes se posent dans le cas non lineaire, cependant certaines questions gardent

    leur interet meme dans le cas lineaire : par exemple, le comportement asymptotiquedes solutions, etc.De maniere generale, les equations de transport (avec diffusion ou non) sont

    bien comprises dans le cas ou le champ de vitesses (et la matrice de diffusion) sontregulieres. Par exemple, considerons lequation de McKean-Vlasov sous la forme

    (22)f

    t=

    1

    2f + (f(f V)).

    Supposons pour fixer les idees que V soit tres regulier et a support compact ; alorsfV est egalement tres regulier, et des que lon a une estimation sur f(x)|x|2 dx,par exemple, on sait que fV decrot rapidement a linfini ; cela independammentde la regularite de f. Par theoremes de regularite parabolique, on en deduit quepour tout f C([0, T]; P(Rd)), la solution unique de lequation lineaire

    g

    t=

    1

    2g + (g(f V))

    avec donnee initiale g(0, ) = f0, est reguliere, plus precisement de classe C1 dansla variable t, et C dans la variable x. On a de plus des estimations sur g dansdivers espaces de Sobolev. Si lon suppose en outre que

    f0(x)|x|2 dx < +, alors

    on montre que

    d

    dt g(t, x)|x|2 dx C1 + g(t, x)|x|2 dx ,ce qui assure une borne uniforme sur

    g(t, x)|x|2 dx sur lintervalle [0, T]. Au total,

    on parvient a montrer que lapplication qui a f associe g est une application compactedu convexe C([0, T]; P(Rd)) dans lui-meme. Le theoreme de Leray-Schauder assurealors lexistence dune solution a lequation (22), avec donnee initiale f0.

    On peut ensuite appliquer divers theoremes de regularite parabolique, et boots-trapper pour en deduire que cette solution est en fait de classe C.

    Champs singuliers : : Tout se complique dramatiquement quand le champ devitesses est singulier.

    Par exemple, dans le cas de lequation dEuler 2D en formulation vorticite, ona = K , ou est linconnue et K un noyau de convolution tel que |K(x)| =C/|x|. On remarque que ce noyau est a divergence nulle, de sorte que les solutionseventuelles sont obtenues par transport de la densite initiale, et tLp = 0Lppour tout p [1, +]. Le delicat theoreme de Yudovich (annees 60) assure que si ladonnee initiale 0 est L

    , et que le probleme est pose dans un ouvert borne, alors ilexiste une unique solution faible a lequation dEuler 2D correspondante. La preuvea ete plus tard reecrite par Kato, et on a pu montrer que si la donnee initiale estreguliere, alors la solution est reguliere egalement.

  • 8/8/2019 Villani Equations Champ Moyen

    32/58

  • 8/8/2019 Villani Equations Champ Moyen

    33/58

    CHAPITRE 2 33

    (1996). Pour lapproche de Lions et Perthame, on pourra se reporter a leur articlePropagation of moments and regularity for the 3-dimensional Vlasov-Poisson system,Invent. Math. 105, 2 (1991), 415430. On pourra aussi consulter le cours de Bouchut,Introduction a la theorie mathematique des equations cinetiques, Session LEtat dela Recherche de la SMF, 1998, in Kinetic equations and asymptotic theory, F.Bouchut, F. Golse, M. Pulvirenti, Eds, coll. Series in Appl. Math., Gauthier-Villars, 2000.

  • 8/8/2019 Villani Equations Champ Moyen

    34/58

  • 8/8/2019 Villani Equations Champ Moyen

    35/58

    CHAPITRE 3

    Distances de transport

  • 8/8/2019 Villani Equations Champ Moyen

    36/58

  • 8/8/2019 Villani Equations Champ Moyen

    37/58

    CHAPITRE 4

    Preuve de la limite de champ moyen

    Dans ce chapitre on expose deux exemples classiques de preuve de limite dechamp moyen. Le premier est totalement deterministe, il sagit du passage desequations de Newton aux equations de Vlasov (pour des interactions regulieres) ;le deuxieme est aleatoire, il concerne les equations de McKean-Vlasov (pour desinteractions regulieres egalement).

    Dans les deux cas, on sattachera a ne presenter que des estimations explicites.Les distances de transport vont permettre de quantifier de maniere appropriee lesecarts entre mesures de probabilite.

    1. Lexemple des equations de Vlasov

    On considere un systeme de particules en interaction selon les lois de Newton :

    (23)d2

    dt2Xit = a

    Nj=1

    F(Xit Xjt ).

    avec F : Rd Rd, par exemple F = V, et a est une constante physique dimen-sionnelle (proportionnelle a la force de linteraction, divisee par la masse m duneparticule). Par exemple, si lon considere lattraction gravitationnelle, alors linten-site de linteraction est proportionnelle a Gm2 (G constante de gravitation), doua = Gm.Premiere etape : calibrage des echelles : On a coutume de presenter cette etape(cruciale) ainsi : on change les echelles physiques de facon a se ramener au probleme

    (24)d2

    dt2Xit =

    1

    N

    Nj=1

    F(Xit Xjt ).

    Quest-ce que cela veut dire ? A priori a est une constante physique, il ny a biensur aucune raison pour que sa valeur soit influencee par le nombre de particulespresentes !

    Une premiere interpretation possible est que lon change lechelle de tempsdun facteur

    Na (on regarde le film en accelere si Na > 1, au ralenti si Na < 1),

    on laisse lechelle de longueur inchangee, on renormalise lechelle de vitesses de facona conserver la coherence entre echelles de longueur, vitesse et temps. En resume, onsinteresse a Xt = Xt/

    Na. On verifie sans peine que si X verifie (23), alors

    d2

    dt2Xit =

    1

    N

    Nj=1

    F(Xit Xjt ).

    Cependant, ce nest pas du tout ce que lon entend dhabitude, du moins dans lecadre de la limite de champ moyen ! En effet, on na pas forcement envie de changer

  • 8/8/2019 Villani Equations Champ Moyen

    38/58

    38 CHAPITRE 4

    lechelle de temps... Voici une deuxieme interpretation, qui est le plus souvent labonne : reecrivons le systeme (23) sous la forme

    (25)d2

    dt2Xit =

    1

    N

    Nj=1

    NaF(Xit Xjt ),

    et posons, precisement,

    F(Xit X

    j

    t ) = NaF(Xit X

    j

    t ).Si les echelles physiques sont telles que N >> 1 et Na = O(1), alors on espereque la solution de (23) est proche de celle de

    (26)d2

    dt2Xit =

    1

    N

    Nj=1

    F(Xit Xjt ),

    ou cette fois F = F. Cependant, un probleme dordre logique se pose : afin dedemontrer que la solution de (26) est proche de celle qui est donnee par la limite dechamp moyen, on peut etre amene a supposer N tres tres grand, et en particulierbeaucoup plus grand que /a... Il y a (au moins) deux attitudes possibles pour

    resoudre cette contradiction : Soit on considere letude de (26) quand N comme un modele de letude

    de (23), et on ne cherche pas a relier lun a lautre ; cest lexamen des constantesphysiques qui incite (hypothese de modelisation) a remplacer (23) par (26).

    Soit on cherche des resultats quantitatifs qui sappliquent a N fixe, et peuventdonner des resultats pour (26) meme si F depend de N.

    Cest la deuxieme approche (bien sur beaucoup plus exigeante) que nous pri-vilegierons.

    Deuxieme etape : un meme cadre pour le probleme discret et le probleme

    continu : On peut ecrire les equations de Newton (26) et lequation de Vlasov dans

    le meme formalisme. Lobservation capitale est la suivante.Proposition 4. Soit F une fonction de classe C1(Rd,Rd), et soit (Xt) une

    solution de (26). Alors la mesure empirique dans lespace des phases,

    Nt = 1NN

    i=1

    (Xit ,Vit ) ( P(Rd Rd))

    est solution faible de lequation de Vlasov

    (27)

    t+ v x + F[] v = 0,

    ou la force macroscopique F[] est donnee par

    F[](x) = F(x) = RdRd

    F(x y) d(y, w).Remarque importante : Il ne faut pas confondre lequation non lineaire, de Vla-sov, suivie par la mesure empirique, et lequation lineaire, de transport (ou deLiouville) suivie par la loi (N) de Xt,

    (N)

    t+

    Ni=1

    vi xi(N) +N

    i=1

    F(xi xj) vi(N) = 0.

  • 8/8/2019 Villani Equations Champ Moyen

    39/58

    CHAPITRE 4 39

    Ce passage dune equation lineaire en grande dimension, a une equation non lineaireen petite dimension, est tres frequent en physique statistique.

    Demonstration. Definissons F par la formule ci-dessus, dans le cas ou = Nt .On trouve, grace a la definition de la mesure empirique,

    F(x) =1

    N

    N

    j=1F(x Xjt ).

    Il sensuit que lequation (26) peut se reecrire

    (28)

    dXit

    dt= Vit

    dVitdt

    = F(Xit ),

    soit encored

    dt(Xit , V

    it ) = (X

    it , V

    it ),

    ou le champ de vecteurs : R2d

    R2d est defini par

    (x, v) = (v, F(x)).

    Appelons Tt le semi-groupe des caracteristiques associe a ce champ de vecteurs. Ona donc (Xt, Vt) = Tt(X0, V0), ce qui implique immediatement (pourquoi ?)

    1

    N

    Ni=1

    (Xit ,Vit ) = Tt#

    1

    N

    Ni=1

    (Xi0,Vi0 )

    ,

    ou encore Nt = Tt#N0 .Par le theoreme des caracteristiques,

    Nt est solution faible de lequation

    t + x,v () = 0,ce qui correspond exactement a (27) si lon se rappelle la definition de .

    Remarque : La fin de largument precedent montre que lequation de Vlasov (27)equivaut a

    t = Tt[]#0,

    ou (Tt[])t0 est le semi-groupe de caracteristiques associe au champ de vecteurs(dans R2d)

    (29) t[](x, v) = (v, F[](x)),

    (30) F[](x) = R2d

    F(x y) d(y, w).Noter que t[] ne depend que de t, tandis que Tt depend de (s)0st.

    Conclusion de cette etape : On a ramene le probleme de limite macroscopiquea un probleme classique dEDP : la stabilite des solutions. En clair : sachant que(Nt )t0 et (t)t0 sont, respectivement une famille de solutions, et une solution delequation de Vlasov, est-il vrai que

    (31) [N0 0] = [t, Nt t] ?

  • 8/8/2019 Villani Equations Champ Moyen

    40/58

    40 CHAPITRE 4

    Remarque importante : Ce resultat de stabilite, sil est vrai, implique lunicite dela solution de lequation de Vlasov avec donnee initiale 0 (par unicite de la limite).

    Ecart entre mesures : La notion naturelle de limite dans (31) est la convergencefaible au sens des mesures. Comme nous cherchons a quantifier les resultats, les

    distances de transport vont fournir une maniere naturelle de mesurer lecart entremesures. Attention : nos mesures sont definies sur Rd Rd (espace des phases).On utilisera ici la distance de Monge-Kantorovich dordre 1, associee a la dis-

    tance euclidienne sur Rd Rd :W1(, ) = infE|X Y| = sup

    Lip1

    RdRd

    d( ),

    ou linfimum est pris sur tous les couples (X, Y) de variables aleatoires tels que la loide X est , la loi de Y est . En consequence, on supposera que 0 P1(Rd Rd),soit

    R2d(|x| + |v|) d0(x, v) < +.On peut se passer de cette hypothese en remplacant la distance euclidienne pard(X, Y) = max(|XY|, 1). En exercice, on pourra adapter a ce cas le theoreme ci-dessous, et sa preuve (le resultat est un peu plus restrictif car on est amene a supposerF L, et on est naturellement amene a introduire F dans les constantes).

    Le theoreme suivant date de la fin des annees 70 (travaux independants de Neun-zert, Braun et Hepp, Dobrushin).

    Theoreme 5. Soient t, t deux solutions de lequation de Vlasov (27), avecdonnees initiales respectives 0, 0 P1(Rd Rd). Alors

    t 0, W1(t, t) e2Ct W1(0, 0),

    ou C = max(

    FL

    , 1).Remarque 1 : Au niveau des notations, on ne fera aucun effort pour definir pro-prement les normes L de fonctions matricielles ; on laisse ce soin au lecteur.

    Remarque 2 : Ce resultat permet dillustrer a merveille comment des estimationsquantitatives permettent de ne pas perdre le modele physique de vue. Supposons,comme nous lavons fait dans le debut de cette section, que la force microscopiqueF est de taille Na, alors on voit dapres le theoreme 5 que lapproximation de t part est tres bonne (disons, moins de 1% derreur) si, par exemple, W1(0, 0) 103et e2(Na+1)t 10, par exemple t (Na + 1)1. Cela donne un intervalle de temps,en fonction des donnees physiques (nombre de particules, force de linteraction) sur

    lequel le theoreme permet de justifier lapproximation de champ moyen.Remarque 3 : Nous admettons ici lexistence des solutions t, t, deux donneesinitiales 0 et 0 etant choisies. En fait, les arguments utilises dans la preuve dutheoreme permettent de prouver lexistence de solutions, via un argument de typepoint fixe.

    Remarque 4 : Le cas, pourtant tres important, des potentiels dinteraction sin-guliers (penser a linteraction Coulombienne) est toujours ouvert, 25 ans plus tard.

  • 8/8/2019 Villani Equations Champ Moyen

    41/58

  • 8/8/2019 Villani Equations Champ Moyen

    42/58

    42 CHAPITRE 4

    Le premier terme se traite facilement : il vaut, grace a la definition de la mesureimage,

    supLip1

    R2d

    d

    Tt[]#0 Tt[]#0

    = supLip1

    R2d

    ( Tt[]) d(0 0).

    En appliquant les proprietes de Lip et le lemme 7, Tt[]Lip LipTt[]Lip eCtLip;

    on majore donc finalement le premier terme du membre de droite de (32) par

    (33) eCt supLip1

    RdRd

    d(0 0) = eCt W1(0, 0).

    Passons au deuxieme terme du membre de droite de (32). En utilisant encore ladefinition de la mesure image, on a

    W1(Tt[]#0, Tt[]#0) = supLip1

    Tt[] Tt[]

    d0.

    Mais pour tout de constante de Lipschitz inferieure ou egale a 1, Tt[] Tt[]

    d0

    Tt[] Tt[] d0 (t).Le deuxieme terme du membre de droite de (32) est donc majore par (t), que lonva estimer par un lemme de Gronwall.

    d(t)

    dt ddtTt[] ddtTt[]

    d0=

    t[] Tt[] t[] Tt[]

    d0

    t[] Tt[] t[] Tt[] d0 + t[] Tt[] t[] Tt[] d0.En utilisant le lemme 7 pour le premier terme, et la definition de la mesure imagepour le deuxieme terme, on a

    d(t)

    dt C

    Tt[] Tt[] d0 + t[] t[] dt C(t) + t[] t[]L.

    En appliquant le lemme 6, cette expression se majore par C(t) + CW1(t, t). Enconclusion,

    d(t)

    dt C(t) + W1(t, t),et comme (0) = 0, par Gronwall,

    (t) Ct0

    eC(t)W1(, ) d.

    En regroupant (33) avec cette derniere estimation, on trouve finalement

    W1(t, t) eCt W1(0, 0) + Ct0

    eC(t)W1(, ) d.

  • 8/8/2019 Villani Equations Champ Moyen

    43/58

    CHAPITRE 4 43

    Une derniere application de Gronwall amene a

    W1(t, t) e2Ct W1(0, 0),ce qui etait bien le but souhaite.

    2. Un exemple aleatoire : McKean-Vlasov

    Dans cette section nous examinons le cas du systeme de particules

    (34) dXit = dBit +

    1

    N

    Nj=1

    F(Xit Xjt ) dt (1 i N),

    ou les Bi sont des mouvements Browniens independants, et par exemple F = Wpour un certain potentiel dinteraction W. Nous avons deja procede a letape dajus-tement des echelles (le F de cette section correspond au F de la section precedente),et il faut maintenant etudier la limite N .

    Notons des le debut une difference considerable avec le traitement deterministe :on va supposer que la loi jointe de lensemble de particules au temps 0, X0, estsymetrique, au sens ou elle est invariante par permutation des particules. La

    symetrie du systeme fait que la loi de Xt sera egalement symetrique.Comment attaquer le probleme de la limite de champ moyen dans ce cas ? Une

    premiere idee nave serait de refaire largument de la section precedente, en esperantque la mesure empirique (Nt )t0 soit solution de lequation de McKean-Vlasov,(35)

    t=

    1

    2 ((F )),

    de la meme facon que la mesure empirique dans la section precedente etait solution delequation de Vlasov. Cependant, il est absurde desperer un tel miracle ! En effet,meme si les positions initiales sont fixees de maniere deterministe, levolution entemps de

    Nt depend de parametres aleatoires, a travers les mouvements Browniens.

    Or lequation (35) impose une evolution deterministe a ses solutions, au moins quandF est regulier, ce que nous supposons. En outre les solutions de cette equation sontregulieres (regularisation parabolique), alors que la mesure empirique est singuliere(combinaison de masses de Dirac).

    Lobjet deterministe dont il est naturel detudier le comportement limite esten fait la densite de particules, ENt , qui nest autre (par symetrie) que la loiL(X1t ) dune particule (nimporte laquelle). Il nest pas si immediat detablir uneequation verifiee par cette mesure. La methode la plus sure est la suivante : dansun premier temps, ecrire que le systeme Xt = (X

    1t , . . . , X

    Nt ) tout entier est solution

    dune equation differentielle stochastique dans (Rd)N,

    dXt = dBt + G(Xt),

    ou Bt est un mouvement Brownien dans RdN, et

    G(x1, . . . xN) =

    1

    N

    Nj=1

    F(x1 xj ), . . . , 1N

    Nj=1

    F(xN xj )

    .

    On en deduit que la loi (N) de Xt resout

    (N)

    t=

    1

    2(N) (G(N)),

  • 8/8/2019 Villani Equations Champ Moyen

    44/58

    44 CHAPITRE 4

    ou les operateurs et sont a comprendre dans RdN. Bien noter quil sagitdune equation lineaire ; comme dans la section precedente on retrouvera un passagedune equation lineaire en grande dimension, a une equation non lineaire en petitedimension. Enfin on en deduit lequation sur la loi de X1t en prenant la marginale,i.e. en integrant sur x2, . . . , xN (une methode equivalente passerait par lapplicationde la formule dIto avec la fonction (x1, . . . , xN) = (x1)). On trouve finalement,en notant =

    L(X1),

    (36)

    t=

    1

    2 F(x1 x2) d(2)(x1, x2) ,

    ou (2) = L(X1, X2) = L(Xi, Xj) (i = j) designe la loi jointe de deux particulesdistinctes.

    On constate donc que lequation (36) nest pas fermee. La loi de X1 nedetermine pas la loi du couple (X1, X2), sauf a supposer par exemple que toutes lesparticules sont independantes. Mais il est facile de se convaincre que, sauf cas trivial,les particules ne peuvent pas etre independantes pour tout t 0...

    Pourquoi navons-nous pas vu ce probleme dans le cas de lequation de Vlasov ?La reponse est simple : tout etait deterministe, et en particulier les positions des

    particules etaient independantes de tout alea.Ces considerations suggerent en tout cas que lon peut esperer des simplifications

    si les positions des particules sont independantes au temps initial. Supposons donc

    (37) L(X0) = L(X10) L(XN0 ) = N0 .On verra au chapitre suivant que, sous cette hypothese, dans la limite N , leslois de deux particules quelconques deviennent effectivement independantes (pro-pagation du chaos). Lequation (36) pourra donc etre fermee, asymptotiquementquand N .

    En attendant, nous allons utiliser une strategie directe pour prouver la limitede champ moyen, dite argument de couplage. Soit t la solution de lequation

    parabolique non lineaire

    (38)

    t=

    1

    2 [(F )]

    avec donnee initiale 0. On montre par des arguments dEDP (ou par un point fixe endistance de Monge-Kantorovich...) quil existe une unique solution a cette equation.Soit maintenant Zt solution de lequation differentielle stochastique dans R

    d

    (39) dZt = dBt + (F t)(Zt),avec

    (40)L

    (Z0) = 0.

    La theorie des EDS montre quil existe une unique solution a cette equation (pourles definitions de solution et dunicite, voir un cours de calcul stochastique !). Parformule dIto, on voit que la loi t de Zt est solution de lEDP lineaire

    (41)

    t=

    1

    2 [(F )], 0 = 0.

    Mais cette equation admet une unique solution. Comme est solution, il sensuitque = .

  • 8/8/2019 Villani Equations Champ Moyen

    45/58

  • 8/8/2019 Villani Equations Champ Moyen

    46/58

    46 CHAPITRE 4

    Preuve du theoreme. En utilisant les equations regissant levolution de Xtet Yt, on trouve

    d

    dt(Xit Yit ) =

    1

    N

    Nj=1

    b(Xit , Xjt )

    Rd

    b(Yit , y) dt(y).

    Noter en particulier que, grace au couplage, les mouvements Browniens nappa-

    raissent plus ! Prendre bien garde au fait que cette ecriture est formelle, car Xt et Ytne sont pas des fonctions derivables de t ! On laisse en exercice le soin de refaire lescalculs sous une forme plus propre.

    On decompose ensuite en trois morceaux :

    d

    dt(Xit Yit ) =

    1

    N

    Nj=1

    b(Xit , X

    jt ) b(Yit , Xjt )

    +1

    N

    Nj=1

    b(Yit , X

    jt ) b(Yit , Yjt )

    +1

    N

    Nj=1b(Yit , Yjt )

    Rdb(Yit , y) dt(y).

    Dou la majoration

    d

    dt|Xit Yjt | bLip|Xit Yit |

    +1

    N

    Nj=1

    bLip|Xjt Yjt |

    +

    1

    N

    N

    j=1b(Yit , Y

    jt )

    b(Yit , y) dt(y).

    Attention, ce serait une erreur strategique que de faire passer les normes a linterieurde la somme dans le dernier terme !

    Maintenant, on somme toutes ces estimations sur i et on prend la moyenne. Ontrouve (toujours au sens formel, puisque les fonctions en jeu ne sont pas derivables)

    d

    dt

    1

    N

    Ni=1

    |Xit Yit | 2bLip

    1

    N

    Ni=1

    |Xit Yit |

    +1

    N

    N

    i=1

    1

    N

    N

    j=1 b(Yit , Y

    jt )

    b(Yit , y) dt(y)

    .

    Si on prend lesperance de la formule precedente, il vient, grace a la symetrie,

    (45)d

    dtE|X1t Y1t | 2bLipE|X1t Y1t | + B(t),

    ou

    (46) B(t) = E

    1NN

    j=1

    b(Y1t , Yjt )

    b(Y1t , y) dt(y)

    .

  • 8/8/2019 Villani Equations Champ Moyen

    47/58

    CHAPITRE 4 47

    Puisque X0 = Y0, le lemme de Gronwall mene a

    E|X1t Y1t | t0

    e2bLip(ts)B(s) ds.

    On voit donc que pour conclure la preuve du theoreme il ne reste plus qua majorerB(t).

    La majoration de B(t) est un probleme de type loi des grands nombres : si on se

    donne Y1

    t , on se retrouve en gros a estimer lesperance dune expression aleatoire de laforme (1/N)

    j Z

    j z dL(Z), ou les Zj sont des variables aleatoires independanteset identiquement distribuees, de meme loi que Z; une telle expression tend bien vers 0quand N . La methode utilisee ici est tres classique, elle consiste a passer pardes expressions quadratiques, que lon developpe pour utiliser lindependance (Cf.,pour ceux qui lont deja vue, lestimation classique sur les variances de sommes devariables aleatoires independantes identiquement distribuees). On ecrit donc

    B(t)2 E

    1

    N

    Nj=1

    b(Y1t , Y

    jt )

    b(Y1t , y) dt(y)

    2

    (47)=

    1

    N2

    jk

    E

    b(Y1t , Yjt )

    b(Y1t , y) dt(y)

    b(Y1t , Y

    kt )

    b(Y1t , y) dt(y)

    .

    Ici on a utilise Cauchy-Schwarz, suivi de lidentite (

    Aj)2 =

    jk Aj Ak, ou la

    sommation est prise sur tous les indices j et k dans {1, . . . , N }.Maintenant, on note que tous les termes de cette somme, dans lesquels j = k,

    j = 1, k = 1, sont nuls (pour le voir, un moyen sur de ne pas se tromper est dedevelopper le produit qui apparat dans un terme (j,k), et de calculer lesperancede chacun des quatre morceaux ainsi obtenus, en utilisant les lois des Yt et leurindependance). La somme (47) contient donc au plus 3N 1 termes, chacun etantgrossierement majore par 4b

    2

    L. A laide du coefficient en 1/N

    2

    , on obtient doncfacilement des estimations sur B(t) en O(1/N). 3. Remarques et references

    Le tres efficace argument de couplage ci-dessus est tire du cours de Sznitman(Saint-Flour, 1989) ; la encore, lidee remonte aux annees 70 (Dobrushin par exemple).

    Quand les potentiels dinteraction sont singuliers, la limite est considerablementplus delicate. Comme il etait mentionne ci-dessus, dans le cas de Vlasov on ne saitrien dire. Dans le cas dEuler 2D (modele des vortex), le probleme a en revanche eteresolu ; consulter en particulier les references et preuves mentionnees dans louvragede Marchioro et Pulvirenti, Mathematical theory of incompressible nonviscous fluids,

    Springer-Verlag, New York, 1994. On pourra aussi se reporter a des articles recentsde Sylvie Meleard.

    Dans la section precedente, nous navons pas vraiment repondu a la questionnaturelle... Nous nous sommes contentes detablir le comportement limite de la den-site de particules, mesure deterministe obtenue en prenant lesperance de la mesureempirique. Il est legitime de chercher a majorer, en moyenne, lerreur commise enremplacant la mesure empirique par son esperence. Par exemple, peut-on estimer

    EW1(Nt , t) ?

  • 8/8/2019 Villani Equations Champ Moyen

    48/58

    48 CHAPITRE 4

    Ce probleme est nettement plus dur ! On peut esperer y arriver en etudiant un autreprobleme,