Upload
mireio-boulanger
View
108
Download
0
Embed Size (px)
Citation preview
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 1
Commande optimale des systèmes dynamiques hybrides
C.Iung P.Riedinger
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 2
La commande optimale
Pour définir un problème de commande optimale, nous devons avoir
• Un système dynamique i.e– Un espace de temps T– Un espace d’état X– Un espace de commandes U– Une fonction de transition d’état t,t0,x0,u)– Quelques axiomes de bon sens
• Un critère additif– J(t0,tf,x0,u)= J(t0,ti,x0,u)+ J(ti,tf,xi,u)
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 3
Commande optimale
2 classes de méthodes :• Méthodes variationelles
la commande optimale û est caractérisée par le fait qu’une commande u=û+u doit donner un critère supérieur en exprimant en fonction de u on peut espérer trouver des caractérisations de û
• Programmation dynamiquel’application du théorème de Bellman
peut donner une équation sur les critères dont la solution conduira au critère optimal
)),,(̂),,,((min),,(̂ 0000 ifiiiu
f xttJuxttJxttJi
JJJJ ˆ
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 4
Méthodes variationnelles
• Elles s’appliquent lorsqu’il est possible d’évaluer la variation du critère en fonction de la variation de la commande.Ceci suppose des hypothèses de continuité voire de dérivabilité du critère optimal en fonction de u.
• Le théorème de référence est le théorème de Pontriaguine.
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 5
Théorème de Pontriaguine
• Soit – le système dynamique :
où f est continue sur – Le critère est
Si sont optimales alors il existe une fonction et une constante 0 <0, telles que
– x et vérifient les équations canoniques de Hamilton
– et û(t) maximise la fonction hamiltonienne sur [t0 tf]
n x t ux f x ), , , (
UX)),(()),(),((
0f
t
tf ttxdtttutxLJ
f
xetu ˆˆ
xHHx
),ˆ(),ˆ(),ˆ,,( 00 uxfuxLuxH T
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 6
Théorème de Pontriaguine, remarques
• Sous des conditions assez faibles, s’il existe des commandes satisfaisant aux conditions aux extémités, alors il existe une commande optimale.
• La recherche des trajectoires optimales et un problème de tir de dimension 2n. En effet s’ajoutent les conditions de tranversalité :
)()()()()()( 0000 fCfCff txNttxNtCtxCtx fO alorssi
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 7
( , , )
( , , )
( , , )
x f x u t
y g x u t
z h x u t
k
k
k
d
k z
yu
Interfacecontinu/discret
Interfacediscret/continu
s
k
z
SYSTEME DYNAMIQUE HYBRIDE =
SYSTEME FORME PAR LE COUPLAGE DE SYSTEMES DYNAMIQUES CONTINUS ET DISCRETS
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 8
Quelques phénomènes hybrides
Le champ de vecteurs f et/ou l’état x(.) changent de façon discontinues en réponse à une commande de contrôle.
Le saut autonome
-
1
-1
f
Le saut commandé
Conséquence
Changement de dimension de l’état
f
t
Exemples : • chocs, • hystérésis, • seuils, • saturations, ...
Exemple : • Circuit électrique avec interrupteurs
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 9
Sauts de l’état
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 10
Hypothèse :À tout instant on peut choisir le mode parmi tous les
modes existants
La commande d(t) a un nombre fini de valeurs
Extension aux systèmes commutés 1
J L x t u t t dti ik
k kk
k
z
( ( ), ( ), )
1
0
d t D d dN
kk
N
( ) , : RST
UVW0 1 1
1
l q ( , , )x d f x u tk kk
N
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 11
Extension aux systèmes commutés 2
• Le théorème de Pontriaguine s’applique
• Aux instants de commutation
H x u t H x v t
where m x k i t
ki D v U
mm
( , , , , ) max ( sup ( , , , , ))
( , , , )
0 0
xH H
xk k
H H
H x u t f x u t L x u tf x u t
L x u tk kT
k k k k
T
k k
k k
( , , , , ) ( , , ) ( , , )( , , )
( , , )
0 0
0
LNM
OQPLNM
OQP
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 12
Extension aux systèmes commutés 3
• On convexifie le problème et on cherche les commandes bang-bang
Avec
• Un problème : comme la commande est plus « pauvre » que dans le cas continu, il peut exister des commandes, mais pas de commande optimale.
• C’est le cas lorsque les fonctions hamiltoniennes sont égales pour une valeurs de la commande discrète convexifiée, sur un intervalle non nul.
),()(),,( uxftuxfx i
i
i
1,0)(1)( tt i
i
i
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 13
Hamiltonien
Critère
H A x kkT
k , ,0 1
( )
( )
t si H H
t si H H
1
01 0
1 0
M o d e 0x A x 0
M o d e 1x A x 1
G v r a i:
G v r a i:
A A0 1
0 2 1 4
0 8 0 7
0 4 0 3
1 3 1 1
FHG
IKJ
FHG
IKJ
. .
. .
. .
. .
J dtt
t fz
0
Données :
Loi de commande
( )
,
x A x A x
1 01
0 1l q Dynamique
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 14
Trajectoire quelconque obtenue Trajectoire quelconque obtenue pour un temps T1=1.4pour un temps T1=1.4
-1.1 -1 -0.9 -0.8 -0.7 -0.6
-0.7
-0.6
-0.5
-0.4
-0.3
-0.2 x0
xf
A0A1x0
-1.4 -1.2 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
xf
x2
x1
Ensemble des trajectoires candidates Ensemble des trajectoires candidates à l ’optimalité joignant le point final en à l ’optimalité joignant le point final en
un temps T < T1un temps T < T1
Conclusion : il n ’existe pas de chemin optimalConclusion : il n ’existe pas de chemin optimal
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 15
M o d e 0
x A x 0
M o d e 1x A x 1
G v r a i:
G v r a i:
( )
,
x A x A x
1 01
0 1
Question : Existe-t-il un intervalle de
temps non nul tel que P t H H( ) 1 0 0
Loi de commande
( )
( )
( )
t si H H
t si H H
t si H H
1
01 0
1 0
1 0?
La solution sous optimaleLa solution sous optimale
dim ( , ). .
x nx D
oux D
RST
1
1
2
2
0 5059 0 2963
Le système étendu
Réponse : oui
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 16
-0.82 -0.8 -0.78 -0.76 -0.74 -0.72 -0.7
-0.58
-0.56
-0.54
-0.52
-0.5
-0.48
-1.1 -1 -0.9 -0.8 -0.7 -0.6
-0.7
-0.6
-0.5
-0.4
-0.3
-0.2 x0
xfA0A1 D1
1
1
0 5059
.
x D
T1=1.4035 sT1=1.4035 s T3=1.3489 sT3=1.3489 s
T5=1.3446 sT5=1.3446 s T17=1.3435 sT17=1.3435 s
TT=1.3404 s=1.3404 s
xx11
xx22
xx11
xx22
La solution sous optimaleLa solution sous optimale
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 17
Systèmes avec sauts autonomes 1
Extension du théorème
Par intégration d ’un critère
terminal au PM
par application du principe
d’optimalité de Bellman
sous la contrainte
C x tk ( , )0
( , , )x f x u tk
( , , )x f x u tj
J L x u s ds x t tu t
t
f f
f
zmin ( , , ) ( ( ), )0
C xk ( ( ), ) 0
( ( ), ) min ( , , ) ( ( ), )J x t t L x u s ds J xku
kt j0 00
FH IKz
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 18
Systèmes avec sauts autonomes 3
• Le recherche des solutions se complique car– On ne peut savoir à l’avance si une frontière sera
franchie– Ni laquelle– Tous les cas doivent être envisagés
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 19
Système avec sauts autonomes 2
• Une extension est nécessaire :– f n’est plus continue en x (au passage des frontières)– ne peut donc plus être solution de
– Cette condition est remplacée par la condition de transversalité sur la frontière, en tenant compte du critère terminal : il existe un vecteur
xH
H HC
t
C
x
T T
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 20
Un exemple hystérésis 1
( )x f x u
Automate associé
Critère
J qx u e dtt z 2 2
0d i
x u
x
1
x u
x
1
x
x
( , ) , ,x f x u i u ii 1 1
x
f(x)
-
On peut réécrire le
système
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 21
Un exemple hystérésis 2
H x u t f x u qx u eiT
it( , , , ) ( , ) ( ) 1
22 2
( , ) xH
f x uH
xqxei
ii t
H
uu ei t0
i i ii
t
i i ii
t
C
x
H HC
t
( ) ( )
( ) ( )
Aux instants de commutation
C x t t x ii ( ( ), ) 0
u u
u u i
i i
i i
( ) ( )
( ) ( )
2
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 22
Un exemple hystérésis 3• Il est impossible de savoir au départ quel est le nombre
optimal de commutations;• Seul le calcul du coût permet de conclure
– Vers un point limite– Ou vers un cycle
0 100 200 300 400 500 600 700 8000
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
q
cost
k 0
k
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
-1
-0.5
0
0.5
1
1.5
2
2.5
3
3.5
4
t
u
q=200 , q=400 , q=800
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 23
La programmation dynamique et les équations HJB
• Théorème 1: Si une trajectoire admissible ( )( ) déterminée par la donnée de la condition initiale ( 0 0 )( ) et de la commande ( )( ) , est optimale alors les conditions suivantes sont vérifiées :pour presque tout 2 [ ]–
–
),,(),,,(),,(inf),,,( tuxfxbtqxVtuxL
tbtqxV
q
T
qu
),,','(),),(),(( btqxVbttqtxV
),),(),((' tdtqtxq ),,,(' tdqxx
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 24
En pratique 1
• Pour résoudre ces équations, il est obligatoire de discrétiser (cf Hedlung & Rantzer).
• Une approche intéressante consiste à discrétiser le problème dès le départ. Deux voies apparaissent intéressantes– Approche MLD (Bemporad, Morari)
– Approche RPD (Lincoln and Rantzer CDC2002, ADSH2003)
• Des commandes sous optimales sont recherchées par encadrement– Systèmes affines par morceaux, partition de l’espace d’état
EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 25
En pratique 2• Avec le PM :
– Problème aux frontières multiples (Conditions partagées aux instants initial et final et aux instants de commutations)
– Bifurcation dans la trajectoire dès qu'une transition discrète est autorisée ) Résolution par la programmation dynamique
– Notons que le PM revient également à résoudre HJB mais dans des directions privilégiées correspondant aux trajectoires optimales et pour lesquelles la continuité de V est assurée
• Conclusion :– Des C.N. bien établies– Des efforts à mener pour parvenir à des algorithmes de
résolution efficaces