24
Rapport de MODAL Contrˆ ole optimal : th´ eorie et applications. T. Lefeuvre Ann´ ee 2014 - 2015

Rapport de MODAL - THIBAULT LEFEUVRE · 2016. 4. 8. · q(TRm) = Vect(Y i) donc G qest de rang maximal men 0 : c’est donc une immersion en 0. On sait alors par un th eor eme de

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

  • Rapport de MODAL

    Contrôle optimal : théorie et applications.

    T. Lefeuvre

    Année 2014 - 2015

  • Table des matières

    I Théorie du contrôle : principaux résultats étudiés 3

    1 Contrôlabilité et optimalité pour les systèmes linéaires 3

    2 Théorème de l’orbite et théorème de Chow-Rachevsky 62.1 Théorème de l’orbite . . . . . . . . . . . . . . . . . . . . . . . . . . 62.2 Théorème de Chow-Rashevsky . . . . . . . . . . . . . . . . . . . . . 10

    3 Contrôles réguliers et contrôles singuliers 113.1 Premières propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . 113.2 Théorèmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

    II Exercices 17

    4 Exercices d’introduction 174.1 Modèle simple de voiture . . . . . . . . . . . . . . . . . . . . . . . . 174.2 Exercice 2.3.3 dans [6] . . . . . . . . . . . . . . . . . . . . . . . . . 19

    5 Transfert de populations quantiques 20

    2

  • Première partie

    Théorie du contrôle : principauxrésultats étudiés

    1 Contrôlabilité et optimalité pour les systèmes

    linéaires

    Les résultats suivants ont été étudiés dans [6].

    On considère un système linéaire contrôlé de la forme :

    ẋ(t) = A(t)x(t) +B(t)u(t) + r(t), ∀t ∈ I

    x(0) = x0

    (1)

    On supposera queA,B, r sont L1loc, u est L∞(I,Ω) avecA ∈Mn(R), B ∈Mn,m(R), r ∈

    Rn et Ω ⊂ Rm.

    Définition 1 On définit l’ensemble accessible en temps T > 0 depuis x0 par :

    AccΩ(x0, T ) = {xu(T ) | u ∈ L∞([0, T ],Ω)} ,

    où xu(·) est solution de (1).

    On a le résultat important suivant dans le cas où Ω est compact.

    Théorème 1 Soit T > 0 et x0 ∈ Rn. Alors pour tout t ∈ [0, T ], AccΩ(x0, t) estcompact, convexe et varie continûment avec t. Et pour tout t ∈ [0, T ] :

    AccΩ(x0, t) = Acc∂Ω(x0, t) = AccConv(Ω)(x0, t)

    Dans le cas où Ω = Rm, x0 = 0 et r = 0, on a le résultat suivant :

    Théorème 2 Pour tout t > 0, AccRm(0, t) est un sous-espace vectoriel de Rn.

    On suppose désormais que A,B sont constantes, et Ω = Rm (pas de contraintessur le contrôle). On a alors la condition de Kalman permettant de décider si unsystème linéaire autonome est contrôlable.

    3

  • Théorème 3 Si un système linéaire autonome est contrôlable depuis x0 en tempsT , alors il l’est depuis n’importe quel point en temps quelconque. De plus, unsystème linéaire autonome est contrôlable si et seulement si la matrice C = (B,AB, ..., An−1B)est de rang n, c’est-à-dire de rang maximal.

    D’après la formule de la variation de la constante, on a :

    ∀t ≥ 0, x(t) = etAx0 +∫ t

    0

    e(t−s)Ar(s)u(s)ds+

    ∫ t0

    e(t−s)ABu(s)ds

    On peut montrer que la condition de Kalman est équivalente à la surjectivité de

    l’application u 7→∫ t

    0e(t−s)ABu(s)ds. Notons alors la propriété suivante dans le cas

    où 0 ∈ Ω̊ :

    Proposition 1 On suppose que r = 0, 0 ∈ Ω̊, et que la condition de Kalman estvérifiée, alors AccΩ(x0, t) contient un voisinage de e

    tAx0 pour tout t > 0.

    Démonstration : On fixe un temps t > 0. On sait que φ : u 7→∫ t

    0e(t−s)ABu(s)ds

    est surjective si l’on autorise u ∈ L∞([0, t],Rm). De plus, il existe � > 0 tel queBL∞([0,t],Rm)(0, �) = L

    ∞([0, t], B(0, �)) sont des contrôles admissibles. Or φ étantsurjective et linéaire, et L∞([0, t],Rm) et Rn étant complets, le théorème de l’appli-cation ouverte nous permet d’établir que φ(BL∞([0,t],Rm)(0, �)) est un ouvert conte-nant 0. Par conséquent, puisque x(t) = etAx0 + φ(u), on en déduit le résultat.

    Dans le cas m = 1 et r = 0, on a deux résultats essentiels pour les matrices (A,B)vérifiant la condition de Kalman :

    Théorème 4 Si 0 ∈ Ω̊, alors tout point de Rn peut être conduit à l’origine entemps fini si et seulement si (A,B) vérifient la condition de Kalman, et les valeurspropres de A sont de partie réelle inférieure ou égale à 0.

    Théorème 5 Si (A,B) vérifient la condition de Kalman, alors, le système estsemblable à (Ã, B̃) avec :

    Ã =

    0 1 · · · 0...

    . . . . . ....

    0 · · · 0 1

    −an −an−1 · · · −a1

    , B̃ =

    0

    ...

    0

    1

    4

  • où les (ai)1≤i≤n sont les coefficients du polynôme caractéristique de A : χA =Xn + a1X

    n−1 + ... + an−1X + an. Dans cette nouvelle base, le système est alorséquivalent à : x(n)(t) + a1x

    (n−1)(t) + ...+ an−1x′(t) + anx(t) = u(t). C’est la forme

    de Brunovski du système.

    Pour les systèmes instationnaires, la condition de Kalman, équivalente à l’inversi-bilité d’une certaine fonction, est remplacée par une condition similaire :

    Théorème 6 Si le système ẋ(t) = A(t)x(t) + B(t)u(t) + r(t) est contrôlable entemps T depuis x0, alors il l’est depuis un point quelconque (mais plus en tempsquelconque !). De plus, le système est contrôlable en temps T si et seulement si lamatrice suivante (dite Gramienne) est inversible :

    C(T ) =

    ∫ T0

    M(t)−1B(t)tB(t)tM(t)−1dt

    On défnit ensuite la notion de contrôle extrêmal :

    Définition 2 On dit que le contrôle u associé au système est extrêmal sur [0, T ]si la trajectoire associée à u vérifie x(T ) ∈ AccΩ(x0, T ). On vérifie alors que ∀t ∈[0, T ], x(t) ∈ AccΩ(x0, t).

    Si une trajectoire minimise le temps de parcours entre deux points (trajectoireoptimale), alors on peut montrer que le contrôle est nécessairement extrêmal. Leprincipe du maximum de Pontryagin donne une condition nécessaire et suffisantepour qu’un contrôle soit optimal.

    Théorème 7 On considère un système linéaire ẋ(t) = A(t)x(t) +B(t)u(t) + r(t)avec x(0) = x0 et Ω compact. Le contrôle u est optimal sur [0, T ] si et seulement siil existe un vecteur adjoint p(t) solution de ṗ(t) = −p(t)A(t) tel que pour presquetout t ∈ [0, T ] :

    p(t)B(t)u(t) = maxv∈Ω

    p(t)B(t)v

    En tout temps, le vecteur p(t) est normal à un hyperplan qui sépare le convexeAccΩ(x0, t) du reste de l’espace. On remarque que dans le cas m = 1 et Ω = [−a, a],le théorème donne immédiatement u(t) = a sgn(p(t)B(t)).

    5

  • 2 Théorème de l’orbite et théorème de Chow-

    Rachevsky

    Les résultats qui suivent ont notamment été étudiés dans [1].

    On se donne une variété différentielle M (l’espace des configurations) de dimensionn. Le système commandé est la famille d’équations différentielles :

    q̇ = Xu(q), q ∈M,u ∈ U,

    où U est l’ensemble des commandes, qui est un sous-ensemble de Rm, et les Xuforment une famille de champs de vecteurs sur M notée F , paramétrée par u. Onsupposera que les lois de commande u sont constantes par morceaux. On définitG(F), groupe des difféomorphismes engendrés par les flots des éléments de F , par :

    G(F) ={φXktk ◦ ... ◦ φ

    X1t1 | Xi ∈ F , ti ∈ R, k ∈ N

    }2.1 Théorème de l’orbite

    On ale théorème suivant :

    Théorème 8 Les orbites d’une famille F de champs de vecteurs sur M sontdes sous-variétés immergées (image d’une variété par une immersion injective)connexes de M . Le plan tangent en un point q de l’orbite est :

    TqOrbp(F) = Vect {φ?X(q) | φ ∈ G(F), X ∈ F}

    Démonstration : La démonstration se fait en plusieurs points.

    Etude de l’espace vectoriel Vect {φ?X(q) | φ ∈ G(F), X ∈ F} :On définit pour q ∈ Orbp(F) :

    Πq = Vect {φ?X(q) | φ ∈ G(F), X ∈ F}On va montrer dans un premier temps que la dimension de Πq est constante le longd’une orbite. Soit q ∈ Orbp(F) fixé. On sait qu’il existe ψ ∈ G(F) tel que q = ψ(p)et ψ est un difféomorphisme donc dψp : TpM −→ TqM est un isomorphisme. Soitφ?X(p) ∈ Πp. On a :

    dψp(φ?X(p)) = dψp◦dφ(X)◦φ−1(p) = dψp◦dφ(X)◦φ−1◦ψ−1(q) = (ψ◦φ)?X(q) ∈ Πq

    Par conséquent, puisque dψp est un isomorphisme, on a dim(Πp) ≤ dim(Πq) etdψp(Πp) ⊂ Πq. Or, Orbp(F) = Orbq(F) et les rôles de p et q étant symétriques,

    6

  • on peut effectuer le raisonnement en les inversant pour obtenir les inégalités dansl’autre sens. D’où : dim(Πp) = dim(Πq) et dψp(Πp) = Πq.

    Construction de coordonnées locales :On notera par la suite m = dim(Πp). On construit à présent des coordonnéeslocales pour l’orbite. Puisque dψp est un isomorphisme, on peut trouver Y1, ..., Ym,base de Πq de la forme ψ?Xi(q). On considère alors :

    Gq : Rm −→M

    (t1, ..., tm) 7→ φmtm ◦ ... ◦ φ1t1

    (q)

    où φiti est le flot engendré par le champ Yi. On va montrer que Gq est une immersionau voisinage de 0. Montrons tout d’abord que Gq est une immersion en 0. Pourcela, on calcule le rang de cette application en 0. On a :

    dtGq(∂

    ∂ti) =

    ∂Gq∂ti

    (t) = dφmtm ◦ ... ◦ dφi+1ti+1

    (Yi) ◦ φi−1ti−1 ◦ ... ◦ φ1t1

    (q)

    Or, pour un flot φt quelconque, on a φ0 = Id et dφ0 = Id. Par conséquent, il vient :

    ∂Gq∂ti

    (t = 0) = Yi

    Ainsi, d0Gq(TRm) = Vect(Yi) donc Gq est de rang maximal m en 0 : c’est donc uneimmersion en 0. On sait alors par un théorème de géométrie classique de Gq estégalement une immersion sur un voisinage Uq de 0. Par conséquent, Gq|Uq est uneimmersion et un homéomorphisme sur son image donc Gq(Uq) est une sous-variétéde M .

    De plus, on peut remarquer que Gq(Uq) ⊂ Orbp(F). En effet, puisque le flot setransporte par conjugaison, on sait que φYiti = ψ ◦ φ

    Xiti ◦ ψ

    −1 avec Xi ∈ F doncpar composition, φYiti ∈ G(F) et enfin Gq ∈ G(F) donc Gq(t) ∈ Orbp(F) pour toutt ∈ Uq ⊂ Rm.

    7

  • On détermine à présent l’espace tangent à la sous-variété Gq(Uq) ⊂ Orbp(F) ⊂M .On sait que pour q̄ = Gq(t) ∈ Gq(Uq),Tq̄Gq(Uq) = dtGq(TRm). Et :

    ∂Gq∂ti

    (t) = dφmtm ◦ ... ◦ dφi+1ti+1(Yi) ◦ φ

    i−1ti−1 ◦ ... ◦ φ

    1t1

    (q)

    = dφmtm ◦ ... ◦ dφi+1ti+1(Yi) ◦ (φ

    i+1ti+1)

    −1 ◦ ... ◦ (φmtm)−1 ◦ φmtm ◦ ... ◦ φ

    1t1

    (q)

    = dφmtm ◦ ... ◦ dφi+1ti+1(Yi) ◦ (φ

    i+1ti+1)

    −1 ◦ ... ◦ (φmtm)−1(Gq(t))

    = φ?Yi(Gq(t)) ∈ ΠGq(t)

    avec φ = φmtm◦...◦dφi+1ti+1 . On peut alors conclure par égalité des dimensions, puisque

    rg(dtGq) = m = dim(ΠGq(t)), que :

    TGq(t)Gq(Uq) = dtGq(TRm) = ΠGq(t),∀t ∈ UqAinsi, Gq(Uq) est une sous-variété deM dont l’espace tangent en un point q

    ′ est Πq′ .

    Topologie sur l’orbite :On montre à présent que T = {Gq(U) | q ∈ Orbp(F), U ⊂ Uq} est une base d’unetopologie sur Orbp(F). On rappelle qu’une topologie T sur un espace X est unensemble de parties vérifiant :– Toute réunion d’éléments de T est dans T .– ∅ et Orbp(F) sont dans T .– Toute intersection finie d’éléments de T est dans T .

    Une base d’une topologie est un ensemble d’ouverts tel que tout ouvert de latopologie est réunion d’éléments de cette base. On caractérise ainsi une base parles deux propriétés suivantes :– Orbp(F) est égale à la réunion des éléments de la base.– L’intersection finie d’éléments de la base est égale à la réunion d’éléments de la

    base.

    La première propriété étant évidente, il n’y a qu’à établir la seconde. Remar-quons pour cela qu’il suffit de montrer que pour q, U ⊂ Uq donnés, pour toutq′ ∈ Gq(U), il existe un voisinage U ′ tel que Gq′(U ′) ⊂ Gq(U). On pourra alorsécrire ∩jGqj(Uj) = A = ∪q′∈AGq(U ′).

    Fixons donc q′ ∈ Gq(U) et choisissons Y ′1 , ..., Y ′m des vecteurs de base de Πq′ dela forme φ?X

    ′i(q). On a ainsi : ∀q̄ ∈ Gq(U), Y ′i ∈ Πq̄. On définit à nouveau une

    application Gq′ : t 7→ φmtm′ ◦ ... ◦φ1t1

    ′(q′), où les φiti

    ′sont les flots des champs de vec-

    teurs Y ′i . Puisque Gq(U) 3 q′ est une sous-variété et que Y ′i ∈ Tq̄Gq(U) pour tout

    8

  • q̄ ∈ Gq(U), on sait par théorème que pour t1 suffisamment petit, φ1t1′(q′) ∈ Gq(U).

    On peut établir les même résultat pour les flots φiti′, de sorte que par composition,

    pour t suffisamment petit, Gq′(t) ∈ Gq(U). Notons U ′ l’ouvert correspondant à tsuffisamment petit. On a ainsi Gq′(U

    ′) ⊂ Gq(U).

    Ainsi, T définit une topologie sur Orbp(F). Par conséquent, si l’on arrive à établirque Orbp(F) a une structure de variété différentiable, alors nécessairement, ellesera de dimension m avec pour plan tangent en q le plan Πq.

    Structure de sous-variété immergée :Il est facile à présent de vérifier que les couples (Gq(U), Gq

    −1), pour q ∈ Orbp(F)et U ⊂ Uq, forment des cartes sur Orbp(F) qui sont compatibles entre elles. Au-trement dit, on a exhibé un atlas, qui permet de munir Orbp(F) d’une structuredifférentiable. Pour montrer que Orbp(F) est une variété différentiable, il resteà montrer que cet espace topologique est séparé et à base dénombrable. Le faitque cet espace est séparé est évident (deux points distincts ont des voisinages dis-tincts). Pour établir qu’il est à base dénombrable, on va en fait montrer que cetespace est connexe et métrisable. Dans [5], la démonstration de cette implicationest exhibée (cf. Chapter 1. Manifolds).

    La connexité de Orbp(F) est immédiate, puisque par définition, entre deux pointsq1, q2 ∈ Orbp(F), on peut trouver un chemin continu γ ⊂ Orbp(F) reliant cesdeux points. On sait déjà que toute variété différentielle M peut être munie d’unedistance riemanienne, c’est-à-dire d’une application continue qui à chaque pointx ∈M , associe une forme bilinéaire définie positive agissant sur TpM . Ceci permetde définir la longueur `(γ) d’un chemin γ qui relie deux points de la variété M . Onpeut à partir de là munir Orbp(F) d’une métrique en posant pour q1, q2 ∈ Orbp(F),d(q1, q2) = infγ⊂Orbp(F)`(γ) (*). Notons que ceci est bien défini puisqu’il existe aumoins un chemin de longueur strictement positive reliant deux points distincts.Le seul point qu’il reste à établir est le suivant : il faut montrer que la topologieinduite par cette distance (notée Td) sur Orbp(F) est équivalente à la topologie T ,autrement dit que pour tout ouvert X ∈ T , il existe un ouvert Xd ∈ Td tel queXd ⊂ X, et vice-versa. Par la suite, on indicera d’un M les distances riemaniennessur la variété et on n’indicera pas les distances induites par la définition (*) surl’orbite.

    Soit Gq(Uq) un ouvert de T . On veut montrer qu’un tel ouvert contient une bouleB(q, �) pour un � suffisamment petit. Il suffit pour cela de considérer un � > 0 telque d(q, ∂Gq(Uq)) > � car ceci signifie très exactement que B(q, �) ⊂ Gq(Uq). Onpeut toujours trouver un tel � > 0, car si � = 0, alors on a q ∈ ∂Gq(Uq), ce qui

    9

  • est absurde. Réciproquement, soit B(q, �) une boule centrée en q de rayon � > 0.Tout point de Gq(Uq) est atteint grâce à la composition des flots Gq en un temps

    |t1|+...+|tm|. Puisque ||∂φiti∂ti||M = ||Yi(φiti)||M ≤ C, où C = supGq(Uq),1≤i≤m ||Yi||M ,

    on sait par le lemme de Gromwall que tout chemin de Gq(Uq) est de longueur

    inférieure à C||t||. Posons U ={t ∈ Rm | ||t|| < �

    C

    }. On a alors bien Gq(U) ⊂

    B(q, �). Ces topologies sont donc bien équivalentes.

    Ainsi, Orbp(F) est une variété différentielle incluse dans M , dont le plan tangenten un point q est Πq.

    Pour montrer que Orbp(F) est une sous-variété immergée (qui est une structureplus riche qu’une variété différentiable), il reste à montrer que l’inclusion dans Mest une immersion. Pour cela on considère l’inclusion i : Orbp(F) −→ M , définiesur chaque Gq(Uq) par : i|Gq(Uq) = Gq ◦ G−1q |Gq(Uq) qui est bien une immersionpuisque c’est la composition d’un difféomorphisme à gauche par une immersion,et on a, par définition, Orbp(F) = i(Orbp(F)).

    2.2 Théorème de Chow-Rashevsky

    On établit à présent un résultat important dans la théorie du contrôle : le théorèmede Chow-Rashevsky (1938). On suppose que la famille de champ de vecteurs Fu estsymétrique. Quitte à restreindre M à sa composante connexe contenant le point pde départ du système, on peut également supposer M connexe.

    Théorème 9 Sous la condition suivante : dim(Lieq(Fu)) = dim(M), dite condi-tion de Hörmander, l’ensemble atteignable à partir du point p est M .

    Démonstration : On établit tout d’abord un résultat préliminaire.

    Lemme 1 Soit X, Y des champs de vecteurs sur une sous-variété N d’une variétéM . Alors le crochet de Lie [X, Y ] est également tangent à N .

    En effet, X|N , Y |N sont des champs de vecteurs sur N donc φXs (p) = φX|Ns (p) ∈ N

    pour s suffisamment petit. Si on écrit le crochet de Lie comme une dérivée de Lie,il vient :

    [X, Y ] = limt→0

    φXt ?Y (p)− Y (p)t

    = limt→0

    φX|Nt ?Y |N(p)− Y |N(p)

    t= [X|N , Y |N ] ∈ TpN

    10

  • Revenons à la démonstration du théorème. On sait que Orbp(F) est une sous-variété immergée de M , et localement, grâce aux paramétrages Gq(U) une sous-variété de M . Le résultat précédent étant uniquement local, on sait donc qu’entout point q ∈ Orbp(F),Lie(F) ⊂ TqOrbp(F) ⊂ TqM . Par conséquent, l’égalitédes dimensions permet ici de conclure que : Lie(F) = TqOrbp(F) = TqM . Ainsi,Orbp(F) est une variété incluse dans la variété M et de même dimension. Deplus, chaque orbite est ouverte dans M d’après la preuve du théorème de l’orbite.Puisque M est la réunion de toutes les orbites disjointes, le complémentaire deOrbp(F) est la réunion des orbites disjointes privées de Orbp(F) : c’est une réuniond’ouverts dans M donc c’est un ouvert. Ainsi Orbp(F) est fermé dans M et Métant connexe, on en déduit que Orbp(F) = M (car c’est un ensemble non vide).

    3 Contrôles réguliers et contrôles singuliers

    On se propose à présent d’étudier l’application entrée-sortie d’un système définisur une variété dont les contrôles sont dans L2. Les propriétés sont démontréesdans [3] à l’exception des théorèmes 10 et 11.

    On considère sur une variété M connexe de dimension n un système de la forme :

    ẋ(t) =

    p∑i=1

    ui(t)Xi(x(t)),

    où le contrôle u ∈ L2([0, T ], Rp) désormais. Etant donné un contrôle u, on no-tera xu ⊂ M la trajectoire dans M associée au contrôle u. On fait l’hypothèsesupplémentaire que les champs de vecteur (Xi)1≤i≤p sont libres.

    3.1 Premières propriétés

    On se donne un point x ∈M et un temps T > 0. On a alors la propriété suivante :

    Proposition 2 Il existe un ouvert Ux,T ⊂ L2([0, T ], Rp) tel que l’application demapping :

    u ∈ Ux,T 7→ xu ∈M,

    soit bijective.

    On définit à présent l’application entrée-sortie :

    11

  • Proposition 3 L’application entrée-sortie est définie par :

    Ex,T : Ux,T −→M

    u 7→ xu(T )

    Cette application est de classe C1 sur Ux,T .

    Définition 3 On note Im(u) = dEx,Tu (L2([0, T ], Rp)) ⊂ TEx,T (u)M et on définit le

    rang d’un contrôle par rg(u) = dim(Im(u)). On appelle contrôle régulier, uncontrôle de rang maximal, et contrôle singulier, un contrôle dont le rang n’estpas maximal.

    On a alors la proposition suivante :

    Proposition 4 Pour tout 1 ≤ i ≤ p et pour tout contrôle u ∈ Ux,T , on aXi(E

    x,T (u)) ∈ Im(u).

    Cela nous permet déjà d’établir que pour tout contrôle u, p ≤ rg(u) ≤ n.

    Proposition 5 Sous la condition de Hörmander, l’application Ex,T : Ux,T −→Mest ouverte, c’est-à-dire que l’image de tout ouvert de Ux,T est un ouvert M .

    On se donne à présent des contrôles u ∈ Ux,T , u′ ∈ Ux,T ′ pour T, T ′ > 0 et uneconstante λ > 0. Définissons :

    – (i) uλ ∈ L2([0, T/λ],Rp) tel que : ∀t ∈ [0, T/λ], uλ(t) = λu(λt)

    – (ii) ǔ ∈ L2([0, T ],Rp) tel que : ∀t ∈ [0, T ], ǔ(t) = −u(T − t)

    – (iii) u ? u′ ∈ L2([0, T + T ′],Rp) tel que :

    ∀t ∈ [0, T + T ′], u ? u′(t) =

    u(t), si t ∈ [0, T ]u′(t− T ), si t ∈ [T, T + T ′]On vérifie facilement que dans l’hypothèse où l’on se donne des contrôles dans L2

    sans contraintes (en particulier, les contrôles ne sont pas bornés et la famille dechamps de vecteurs est symétrique), et si Ex,T (u) = y, alors on a :– (i) est une contraction ou une dilatation du temps (i.e. le même chemin est

    parcouru plus ou moins rapidement) et Ex,T/λ(uλ) = y,

    12

  • – (ii) est un changement de sens de parcours du chemin, c’est-à-dire que Ey,T (ǔ) =x ,

    – (iii) est une concaténation de deux chemins, c’est-à-dire que Ex,T+T′(u ? u′) =

    EEx,T (u),T ′(u′).

    On a alors la proposition suivante :

    Proposition 6 – uλ ∈ Ux,T/λ et rg(uλ) = rg(u),– ǔ ∈ Uy,T et rg(ǔ) = rg(u),– u ? u′ ∈ Ux,T+T ′ et rg(u ? u′) ≥ max(rg(u), rg(u′))

    3.2 Théorèmes

    Théorème 10 Sous la condition de Hörmander, les contrôles réguliers sont densesdans Ux,T .

    Démonstration : On rappelle le résultat bien connu suivant pour les fonctionsdifférentiables :

    Lemme 2 Le rang d’une application différentiable f est semi-continu inférieurement.Autrement dit, au voisinage d’un point, le rang ne peut qu’augmenter. En parti-culier, si le rang de f est maximal en un point a, alors il l’est au voisinage de cepoint.

    Fixons un contrôle u0 et montrons que pour tout � suffisamment petit, B(u0, �)contient au moins un contrôle régulier. Deux cas se présentent à nous :– Si u0 est un contrôle régulier, alors le résultat est immédiat puisqu’il existe un

    voisinage U de u0 tel que pour tout u ∈ U , rg(u) soit maximal. Donc pour tout� tel que B(u0, �) ⊂ U , tout contrôle de B(u0, �) est régulier.

    – Si u0 est un contrôle singulier, alors remarquons qu’il suffit d’établir que pourtout � suffisamment petit, il existe un contrôle de rang strictement supérieur àrg(u0) dans B(u0, �). En effet, il suffira ensuite d’appliquer ce résultat de procheen proche dans B(u0, �) pour atteindre un contrôle régulier.

    On raisonne alors par l’absurde. Supposons qu’il existe � > 0 tel que B(u0, �) necontienne pas de contrôle de rang strictement supérieur. Autrement dit, pour toutcontrôle u ∈ B(u0, �), rg(u) = rg(u0) = d0 ≥ p. Soit v1, ..., vd0 ∈ B(0, �) tels que(dEx,Tu0 (vi))1≤i≤d0 forme une base de Im(u0). Considérons l’application :

    Ψ : ]− 1, 1[d0−→M

    (λ1, ..., λd0) 7→ Ex,T (u0 +∑d0

    i=1 λivi)

    13

  • Par construction, Ψ est une immersion en 0 (son rang est maximal en 0), donc c’estune immersion sur un voisinage U ⊂ Rd0 de 0 qui réalise un homéomorphisme entreU et son image. Pour tout contrôle u = u0 +

    ∑d0i=1 λivi, λ ∈ U , (dEx,Tu (vi))1≤i≤d0

    forme donc une base de Im(u). Ainsi Ψ est un paramétrage local car c’est une fonc-tion de classe C1, un homéomorphisme de U sur son image et une immersion sur U .

    Par conséquent, S = Ψ(U) est une sous-variété de dimension d0 de M dont lesplans tangents sont TEx,T (u)S = Im(u). Remarquons d’après la proposition 4 queles Xi (1 ≤ i ≤ p) définissent des champs de vecteurs sur S. On sait doncd’après le lemme 1 de la section 2.1 que Lie((Xi)1≤i≤p) ⊂ TEx,T (u)S = Im(u).Or, dim(Lie((Xi)1≤i≤p)) = n > dim(Im(u)) = d0, ce qui est absurde. Ainsi, lerang de Ex,T ne peut être constant sur B(u0, �) donc il existe nécessairement uncontrôle de rang strictement supérieur à u0 dans toute boule B(u0, �) dès que � > 0est assez petit. Ceci achève la démonstration.

    On démontre à présent un second résultat sur les contrôles réguliers. On sait par lethéorème de l’orbite que l’orbite d’un point x ∈M est une sous-variété immergéede M de dimension d ≤ n. On dira d’un contrôle qu’il est régulier ou o-régulier, sile rang de la différentielle de l’application de mapping est maximal, égal à d. Afinde faciliter la démonstration, on supposera qu’en tout point, Ux,T = L2([0, T ],Rp).Par exemple, c’est immédiatement le cas dès que M est compact.

    Théorème 11 Soit T > 0 et y ∈ Orbx(F). Alors, il existe un contrôle régulierreliant x à y en temps T .

    Démonstration : Remarquons qu’il suffit d’établir l’existence d’un contrôle régulieren temps quelconque pour une application entrée-sortie Ex,T0 avec T0 > 0. En ef-fet, si u0 est un contrôle régulier, i.e. rg(u0) = d, alors par définition de l’orbite onpeut toujours trouver un contrôle u′ reliant Ex,T0(u0) à y en temps quelconque. Lecontrôle concaténé u0 ? u

    ′ puis dilaté (afin de parcourir le trajet de x à y en tempsT ) aura alors pour rang le rang maximal de u0 et de u

    ′, c’est-à-dire d.

    On reprendra dans cette démonstration les notations et certains résultats démontrésdans la preuve du théorème de l’orbite. On se basera également sur la remarquesuivante :

    Lemme 3 Soit (t, x) 7→ φ(t, x) le flot du champ de vecteur X. Alors, le flot duchamp de vecteur λX (λ > 0) est (t, x) 7→ φ(λt, x).

    On sait que l’on peut trouver Y1, ..., Yd ∈ TxOrbx = Πx (de la forme (Ψi)?Xi, avecΨi ∈ G(F), Xi ∈ F), base de Πd tel que l’application

    14

  • G : Rd −→ Orbx

    (t1, ..., td) 7→ φYdtd ◦ ... ◦ φY1t1 (x)

    est un homéomorphisme d’un voisinage ouvert U ⊂ Rd de 0 sur un voisinageouvert G(U) contenant x de l’orbite. Fixons alors (t1, ..., td), tous non nuls dans Uet posons :

    Ψ : ]0, 1[d−→ Orbx

    (λ1, ..., λd) 7→ φλdYdtd ◦ ... ◦ φλ1Y1t1 (x) = φ

    Ydλdtd◦ ... ◦ φY1λ1t1(x)

    Fixons désormais λ ∈]0, 1[d. On a alors :

    ∂Ψ

    ∂λi(λ) = ti

    ∂G

    ∂ti(λ1t1, ..., λdtd) = tiΦ?Yi(Ψ(λ)) ∈ ΠΨ(λ),

    où Φ = φλmYmtm ◦ ... ◦ φλi+1Yi+1ti+1 ∈ G(F). D’après la preuve du théorème de l’orbite,

    on sait que les∂G

    ∂ti(t) pour 1 ≤ i ≤ d forment une base de ΠG(t) donc les

    ∂Ψ

    ∂λi(λ)

    forment une base de ΠΨ(λ) car ti 6= 0.

    On rappelle qu’en tout temps, le système s’écrit : ẋ(t) =∑p

    i=1 ui(t)Xi(x(t)) et on

    écrit u = (u1, ..., up) et F = {X1, ..., Xp}. Le point φYdtd ◦ ... ◦ φY1t1 (x) est obtenu par

    un contrôle ux à partir du point x. En effet, chaque φYiti est dans G(F) donc il existe

    un entier pi, des champs de vecteurs Xim1, ..., X impi ∈ F et des temps t

    im1, ..., timpi

    avec ti =∑pi

    j=1 tmj tels que :

    φYiti = φXimpitmpi

    ◦ ... ◦ φXim1

    tm1

    Et on a :

    φλiYiti = φλiX

    impi

    tmpi◦ ... ◦ φλiX

    im1

    tm1

    Par conséquent ux s’obtient ainsi :

    ∀i ∈ {1, ..., d} , j ∈ {1, ..., pi} ,∀t ∈ [i−1∑k=1

    tk+

    j−1∑l=1

    timl ,

    i−1∑k=1

    tk+

    j∑l=1

    timl [,

    (ux)mj(t) = 1(ux)k(t) = 015

  • pour k 6= mj. Et de même, le point Ψ(λ) = φλdYdtd ◦ ... ◦φλ1Y1t1 (x) est obtenu à partir

    de x par un contrôle uλx tel que :

    ∀i ∈ {1, ..., d} , j ∈ {1, ..., pi} ,∀t ∈ [i−1∑k=1

    tk+

    j−1∑l=1

    timl ,i−1∑k=1

    tk+

    j∑l=1

    timl [,

    (ux)mj(t) = λi(ux)k(t) = 0pour k 6= mj. Posons alors pour 1 ≤ i ≤ d, vi défini par :

    ∀t ∈ [i−1∑k=1

    tk,i∑

    k=1

    tk[, vi(t) = ux(t),

    et vi = 0 en dehors de cet intervalle. Enfin, notons T0 =∑d

    i=1 ti. On a alors :

    Ex,T0(uλx + hvi) = φλdYdtd◦ ... ◦ φ(λi+h)Yiti ◦ ... ◦ φ

    λ1Y1t1 (x)

    Par conséquent :

    limh→0

    Ex,T0(uλx + hvi)− Ex,T0(vi)h

    =∂Ψ

    ∂λi(λ) = dEx,T0

    uλx(vi)

    Puisque les∂Ψ

    ∂λi(λ) sont libres, on en déduit que le rang du contrôle uλx est maxi-

    mal, égal à d. Par conséquent, uλx est un contrôle régulier reliant x à Ex,T0(uλx). On

    conclut alors immédiatement par la remarque d’introduction à cette démonstration.

    16

  • Deuxième partie

    Exercices

    4 Exercices d’introduction

    4.1 Modèle simple de voiture

    On se donne le système d’équation suivant :ẋ(t) = u1(t) cos θ(t)

    ẏ(t) = u1(t) sin θ(t)

    θ̇(t) = u2(t)

    Ici, u1, u2 ∈ L∞(R,R) sont les fonctions de contrôle du système considéré. Oncherche à étudier la contrôlabilité sous différentes contraintes.

    Théorème 12 Le système est contrôlable sans contrainte (i) et sous les contraintessuivantes : |u1|, |u2| ≤ 1 (ii) et |u1| = 1 (iii).

    Démonstration : On va établir le point (ii), qui donne immédiatement le point (i).Nous montrerons le point (iii) dans une second temps.

    Commençons d’abord par la remarque suivante : si on a un couple (u11, u12) reliant

    t(x0, y0, θ0) àt(x1, y1, θ1) en temps T1 et un couple (u

    21, u

    22) reliant

    t(x1, y1, θ1) àt(x2, y2, θ2) en temps T2, alors le couple (u1, u2) défini par u1(t) = u

    11(t), u2(t) =

    u12(t) pour t ∈ [0, T1] et u1(t) = u21(t− T1), u2(t) = u22(t− T1) pour t ∈ [T1, T2] reliet(x0, y0, θ0) à

    t(x2, y2, θ2) en temps T1 + T2.

    Point (ii) : Le mobile peut se déplacer en ligne droite en posant u2 = 0 et u1 = 1(1). Il peut pivoter sur lui-même d’un angle quelconque sans se déplacer en posantu2 = 1, u1 = 0 (2). On décrit alors facilement, à l’aide de la remarque précédente,un chemin reliant deux points quelconques X0 et X1. On considère d’abord lepremier cas où les droites portées par les vecteurs t(x0, y0, θ0) et

    t(x1, y1, θ1) s’in-tersectent ou sont confondues. Quitte à pivoter en temps fini par (2), on peutsupposer que le vecteur t(x0, y0, θ0) est orienté vers le point A, et que

    t(x1, y1, θ1)est orienté vers l’opposé du point A. Il suffit alors de rejoindre en temps fini A par(1), de pivoter en temps fini, puis de rejoindre X1 à nouveau grâce à (1). Mis boutà bout, on obtient bien ainsi un chemin reliant X0 à X1 en temps fini. Remarquons

    17

  • ici qu’on a bien réalisé la condition |u1|, |u2| ≤ 1. Dans le cas où les deux droitessont parallèles, il suffit de rejoindre depuis X0 un point intermédiaire X

    ′0 qui brise

    l’alignement, puis de relier X ′0 à X1.

    Point (iii) : Concernant la contrainte u1 = 1, remarquons que l’on peut effec-tuer un pivot d’angle quelconque (différent de π, c’est-à-dire d’un retournement)dans une boule de rayon � aussi petite que l’on veut. Ici on suppose sans perte degénéralité que θ1 ∈ [θ0, θ0 + π[ (le cas θ1 ∈]θ0 + π, θ0 + 2π[ se traite de la mêmemanière en plaçant le vecteur d’arrivée ”sous” la droite (∆0)). La vitesse étantchoisie constante, égale à 1, le temps de parcours T de l’arc de cercle est égal àsa longueur L, c’est-à-dire à T = L = |θ| × a = |θ1 − θ0| × a = (θ1 − θ0) × a. Onprend alors u2 =

    θ1 − θ0T

    = 1/a, de sorte que θ(t) =t

    a+ θ0, ce qui nous donne

    bien θ(T ) = θ1 et par construction x(T ) = x1, y(T ) = y1.

    Grâce à cela nous pouvons relier tous les points où les droites (∆0) et (∆1) s’in-tersectent en un point A avec X0 orienté vers A et X1 orienté vers l’opposé deA. Ensuite, il suffit de remarquer qu’à partir d’une configuration quelconque (saufune configuration pathologique qui est X0, X1 alignés mais qui peut alors se traiterpar deux point intermédiaires) , on peut toujours se ramener à cette configurationvia l’introduction d’un point intermédiaire X ′0. Enfin, dans le cas où les droites ini-tiales sont parallèles, il suffit encore d’introduire un point intermédiaire X ′0 pour

    18

  • briser l’alignement.

    4.2 Exercice 2.3.3 dans [6]

    On suppose que le système stationnaire ˙x(t) = Ax(t) +Bu(t) est contrôlable.

    Théorème 13 Soit f ∈ C∞(R,R) et A(t) = A + f(t)I. Alors ˙x(t) = A(t)x(t) +Bu(t) est contrôlable en temps quelconque.

    Démonstration : On rappelle le théorème suivant :

    On note M la résolvante du système ẋ(t) = A(t)x(t) + B(t)u(t) + r(t). Il estcontrôlable en temps T depuis x0 si et seulement si la matrice Gramienne estinversible :

    C(T ) =

    ∫ T0

    M(t)−1B(t)tB(t)tM(t)−1dt

    La résolvante du système est M(t) = e∫ t0 f(s)dsetA, de sorte qu’il suffit de montrer

    que la matrice

    C(T ) =

    ∫ T0

    e−2∫ t0 f(s)dse−tABtBe−t

    tAdt

    19

  • est inversible pour tout T > 0. On sait déjà que

    C̃(T ) =

    ∫ T0

    e−tABtBe−ttAdt

    l’est pour tout T > 0 puisque le système autonome est contrôlable. Soit donc T > 0tel que C(T ) ne soit pas inversible et x 6= 0 tel que txC(T )x = 0. On rappelle queC(T ) est symétrique positive. On a donc :∫ T

    0

    ‖txe−∫ t0 f(s)dse−tAB‖2dt = 0

    Par conséquent, ‖txe−∫ t0 f(s)dse−tAB‖2 = 0 presque partout donc txe−

    ∫ t0 f(s)dse−tAB =

    0 presque partout, puis txe−tAB = 0 presque partout. En intégrant, il vient alorsque txC̃(T )x = 0, ce qui est absurde puisque le système autonome est contrôlable.Donc le système est contrôlable en tout temps.

    5 Transfert de populations quantiques

    On s’intéresse à un système quantique à 3 niveaux d’énergie notés E1, E2 et E3.Ce système est commandé au moyen de deux lasers, c’est-à-dire de deux champsmonochromatiques de fréquences ω1 = E2 − E1 et ω2 = E3 − E2 que l’on peutactiver entre les instants t0 et t1. Dans un système d’unités tel que } = 1, l’équationde Schrödinger s’écrit :

    i∂ψ

    ∂t= Hψ

    Ici, ψ(t) ∈ C3 est un vecteur normalisé (fonction d’onde) et :

    H =

    E1 u1(t)e

    iω1t 0

    u1(t)e−iω1t E2 u2(t)e

    iω2t

    0 u2(t)e−iω2t E3

    On suppose que les lois de commandes u1 : R −→ R et u2 : R −→ R sont continuespar morceaux. On cherche à amener le système d’un niveau d’énergie à un autre :c’est le problème du transfert de population. Ici, on suppose que |ψ1(t)|2 = 1 pourt < t0 et on cherche à établir l’existence de contrôles u1, u2 tels que |ψ3(t)|2 = 1pour t > t1.

    20

  • Théorème 14 Il existe un contrôle amenant le système de l’état E1 à l’état E3entre t0 et t1.

    Démonstration : On va d’abord chercher à se ramener à un système plus facile àétudier, avant de s’intéresser aux crochets de Lie des champs de vecteurs.

    Etude du système : On va dans un premier temps chercher à simplifier lesystème. Remarquons dès à présent que ψ(t) = (ψ1(t), ψ2(t), ψ3(t)) est solution

    de i∂ψ

    ∂t= Hψ si et seulement si φ(t) = (eiE1tψ1(t), e

    iE2tψ2(t), eiE3tψ3(t)) est solu-

    tion de i∂φ

    ∂t= H̃φ, où :

    H̃ =

    0 u1(t) 0

    u1(t) 0 u2(t)

    0 u2(t) 0

    Ceci permet de rendre le système à étudier autonome. On remarque qu’on a alorstoujours |ψi(t)|2 = |φi(t)|2. Notons également qu’en posant φ1 = x1 + ix2, φ2 =x3 + ix4, φ3 = x5 + ix6, X1 = x4

    ∂x1− x3

    ∂x2+ x2

    ∂x3− x1

    ∂x4, et X2 = x6

    ∂x3−

    x5∂

    ∂x4+ x4

    ∂x5− x3

    ∂x6, on est ramené au système commandé sur la sphère S5 :

    ẋ = u1X1 + u2X2, x ∈ S5, u ∈ R2

    La condition initiale est dans S1in = {x ∈ S5 | x21 + x22 = 1} et nous cherchonsl’existence d’une trajectoire dans S5 pour atteindre S1but = {x ∈ S5 | x25 + x26 = 1}.Notons enfin que la famille de vecteurs est symétrique.

    Étude des sous-algèbres de Lie : On détermine dans un premier temps Lie(X1, X2).Introduisons S0

    2 = {x ∈ S5 | x12 + x42 + x62 = 1}. On vérifie facilement queX1|S02 ,X2|S02 sont des champs de vecteurs sur S0

    2 en montrant que X1(x), X2(x) ∈ker dFx = TxS0

    2 en un point x ∈ S02 tel que F (x) = 0, avec F : x 7→ x12 +x4

    2 + x62 − 1. Notons que S02 est une sous-variété de dimension 2 donc ses plans

    tangents sont de dimension 2 et contiennent Liex(X1, X2). Pour x ∈ S02 avecx4 6= 0, on remarque que X1|S02 et X2|S02 sont libres et forment donc une base duplan tangent à S0

    2. Aux points x ∈ S02 tels que x4 = 0, on note que [X1, X2] et X1sont libres, donc dans tous les cas, sur S0

    2, on a : Liex(X1, X2) = TxS02. On sait

    donc par théorème que Ax = S02 et tout point de S02 est atteignable en tempsquelconque. Ainsi, si l’on suppose que x ∈ S02 ∩ S1in = {x ∈ S5 | x1 = ±1}, on a

    21

  • Ax = S02. En particulier, S02 ∩ S1but = {x ∈ S5 | x6 = ±1}, de sorte qu’il est pos-sible d’atteindre les deux vecteurs d’états x6 = ±1 en partant de S02 ∩ S1in. Nousavons donc établi la faisabilité partielle du problème de transfert de populationsdans le cas où on part d’un état précis dans S1in.

    Étude de la faisabilité du transfert de populations : On définit pour α ∈ Rl’application φα : S

    5 −→ S5 par :

    φα(x) =

    Rα 0 0

    0 Rα 0

    0 0 Rα

    x1

    x2

    x3

    x4

    x5

    x6

    avec Rα =

    cosα 00 sinα

    On peut facilement vérifier qu’il s’agit bien d’un groupe de difféomorphisme car :pour tout α ∈ R, φα est un difféomorphisme (c’est une application linéaire enfait), l’application α 7→ φα est différentiable et vérifie φ0 =Id, et enfin ∀α, β ∈ R,φα+β = φα ◦ φβ. Son générateur infinitésimal est le vecteur :

    X =∂φα∂α|α=0(x) =

    x2

    −x1

    x4

    −x3

    x6

    −x5

    On vérifie en outre que le flot de X commute avec les flots de X1 et X2 en calculantles crochets de Lie [X,X1] et [X,X2] qui valent effectivement 0. Ainsi le flot de X

    22

  • commute avec tous les flots de la forme u1X1 + u2X2. Par conséquent :

    Axα = Aφα(x0)

    ={φY1t1 ◦ ... ◦ φ

    Yntn ◦ φα(x0) | n ∈ N, t1, ..., tn ∈ R, Y1, ..., Yn ∈ F(U)

    }=

    {φα ◦ φY1t1 ◦ ... ◦ φ

    Yntn (x

    0) | n ∈ N, t1, ..., tn ∈ R, Y1, ..., Yn ∈ F(U)}

    = φα(Ax0)

    On a établi précédemment que Ax0 ∩ S1but = {x ∈ S5 | x6 = ±1}. Par conséquent,puisque tout x ∈ S1in est de la forme x = xα = φα(x0), il vient que :

    Ax ∩ S1but = Axα ∩ S1but = φα(Ax0) ∩ S1but ={t(0, 0, 0, 0,± cosα,± sinα)

    }En partant d’un état quelconque de S1in, on peut donc atteindre un état quel-conque t(0, 0, 0, 0, cosα, sinα) de S1but. Pour cela, il suffit d’effectuer une rotationpour rejoindre l’état t(cosα, sinα, 0, 0, 0, 0) = xα de S1in, puis d’appliquer le résultatprécédent. Le problème du transfert de population a donc toujours une solution.

    23

  • Références

    [1] Frédéric Jean. Géométrie Différentielle et Application au ContrôleGéométrique. Notes de cours, 2011/2012.

    [2] Joseph Le Potier. Géométrie Différentielle. Notes de cours, 1995/1996.

    [3] Ludovic Rifford. Sub-Riemannian Geometry and Optimal Transport. Springer,2014.

    [4] R. W. Sharpe. Differential Geometry, Cartan’s Generalization of Klein’s Er-langen Program. Springer, 1991.

    [5] Michael Spivak. A Comprehensive Introduction to Differential Geometry, Vol.1, 3rd Edition. Publish or Perish, 1999.

    [6] Emmanuel Trélat. Contrôle optimal : théorie et applications, Seconde Edition.Vuibert, 2008.

    24