EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 1 Commande optimale des systèmes dynamiques hybrides C.Iung P.Riedinger

EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 1

Commande optimale des systèmes dynamiques hybrides

C.Iung P.Riedinger


La commande optimale

Pour définir un problème de commande optimale, nous devons avoir

• Un système dynamique i.e– Un espace de temps T– Un espace d’état X– Un espace de commandes U– Une fonction de transition d’état t,t0,x0,u)– Quelques axiomes de bon sens

• Un critère additif– J(t0,tf,x0,u)= J(t0,ti,x0,u)+ J(ti,tf,xi,u)


Commande optimale

2 classes de méthodes :• Méthodes variationelles

la commande optimale û est caractérisée par le fait qu’une commande u=û+u doit donner un critère supérieur en exprimant en fonction de u on peut espérer trouver des caractérisations de û

• Programmation dynamiquel’application du théorème de Bellman

peut donner une équation sur les critères dont la solution conduira au critère optimal

)),,(̂),,,((min),,(̂ 0000 ifiiiu

f xttJuxttJxttJi

JJJJ ˆ


Méthodes variationnelles

• Elles s’appliquent lorsqu’il est possible d’évaluer la variation du critère en fonction de la variation de la commande.Ceci suppose des hypothèses de continuité voire de dérivabilité du critère optimal en fonction de u.

• Le théorème de référence est le théorème de Pontriaguine.


Théorème de Pontriaguine

• Soit – le système dynamique :

où f est continue sur – Le critère est

Si sont optimales alors il existe une fonction et une constante 0 <0, telles que

– x et vérifient les équations canoniques de Hamilton

– et û(t) maximise la fonction hamiltonienne sur [t0 tf]

n x t ux f x ), , , (

UX)),(()),(),((

0f

t

tf ttxdtttutxLJ

f

xetu ˆˆ

xHHx

),ˆ(),ˆ(),ˆ,,( 00 uxfuxLuxH T


Théorème de Pontriaguine, remarques

• Sous des conditions assez faibles, s’il existe des commandes satisfaisant aux conditions aux extémités, alors il existe une commande optimale.

• La recherche des trajectoires optimales et un problème de tir de dimension 2n. En effet s’ajoutent les conditions de tranversalité :

)()()()()()( 0000 fCfCff txNttxNtCtxCtx fO alorssi


( , , )

( , , )

( , , )

x f x u t

y g x u t

z h x u t

k

k

k

d

k z

yu

Interfacecontinu/discret

Interfacediscret/continu

s

k

z

SYSTEME DYNAMIQUE HYBRIDE =

SYSTEME FORME PAR LE COUPLAGE DE SYSTEMES DYNAMIQUES CONTINUS ET DISCRETS


Quelques phénomènes hybrides

Le champ de vecteurs f et/ou l’état x(.) changent de façon discontinues en réponse à une commande de contrôle.

Le saut autonome

-

1

-1

f

Le saut commandé

Conséquence

Changement de dimension de l’état

f

t

Exemples : • chocs, • hystérésis, • seuils, • saturations, ...

Exemple : • Circuit électrique avec interrupteurs


Sauts de l’état


Hypothèse :À tout instant on peut choisir le mode parmi tous les

modes existants

La commande d(t) a un nombre fini de valeurs

Extension aux systèmes commutés 1

J L x t u t t dti ik

k kk

k

z

( ( ), ( ), )

1

0

d t D d dN

kk

N

( ) , : RST

UVW0 1 1

1

l q ( , , )x d f x u tk kk

N



• Le théorème de Pontriaguine s’applique

• Aux instants de commutation

H x u t H x v t

where m x k i t

ki D v U

mm

( , , , , ) max ( sup ( , , , , ))

( , , , )

0 0

xH H

xk k

H H

H x u t f x u t L x u tf x u t

L x u tk kT

k k k k

T

k k

k k

( , , , , ) ( , , ) ( , , )( , , )

( , , )

0 0

0

LNM

OQPLNM

OQP



• On convexifie le problème et on cherche les commandes bang-bang

Avec

• Un problème : comme la commande est plus « pauvre » que dans le cas continu, il peut exister des commandes, mais pas de commande optimale.

• C’est le cas lorsque les fonctions hamiltoniennes sont égales pour une valeurs de la commande discrète convexifiée, sur un intervalle non nul.

),()(),,( uxftuxfx i

i

i

1,0)(1)( tt i

i

i


Hamiltonien

Critère

H A x kkT

k , ,0 1

( )

( )

t si H H

t si H H

1

01 0

1 0

M o d e 0x A x 0

M o d e 1x A x 1

G v r a i:

G v r a i:

A A0 1

0 2 1 4

0 8 0 7

0 4 0 3

1 3 1 1

FHG

IKJ

FHG

IKJ

. .

. .

. .

. .

J dtt

t fz

0

Données :

Loi de commande

( )

,

x A x A x

1 01

0 1l q Dynamique


Trajectoire quelconque obtenue Trajectoire quelconque obtenue pour un temps T1=1.4pour un temps T1=1.4

-1.1 -1 -0.9 -0.8 -0.7 -0.6

-0.7

-0.6

-0.5

-0.4

-0.3

-0.2 x0

xf

A0A1x0

-1.4 -1.2 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

xf

x2

x1

Ensemble des trajectoires candidates Ensemble des trajectoires candidates à l ’optimalité joignant le point final en à l ’optimalité joignant le point final en

un temps T < T1un temps T < T1

Conclusion : il n ’existe pas de chemin optimalConclusion : il n ’existe pas de chemin optimal


M o d e 0

x A x 0

M o d e 1x A x 1

G v r a i:

G v r a i:

( )

,

x A x A x

1 01

0 1

Question : Existe-t-il un intervalle de

temps non nul tel que P t H H( ) 1 0 0

Loi de commande

( )

( )

( )

t si H H

t si H H

t si H H

1

01 0

1 0

1 0?

La solution sous optimaleLa solution sous optimale

dim ( , ). .

x nx D

oux D

RST

1

1

2

2

0 5059 0 2963

Le système étendu

Réponse : oui


-0.82 -0.8 -0.78 -0.76 -0.74 -0.72 -0.7

-0.58

-0.56

-0.54

-0.52

-0.5

-0.48

-1.1 -1 -0.9 -0.8 -0.7 -0.6

-0.7

-0.6

-0.5

-0.4

-0.3

-0.2 x0

xfA0A1 D1

1

1

0 5059

.

x D

T1=1.4035 sT1=1.4035 s T3=1.3489 sT3=1.3489 s

T5=1.3446 sT5=1.3446 s T17=1.3435 sT17=1.3435 s

TT=1.3404 s=1.3404 s

xx11

xx22

xx11

xx22

La solution sous optimaleLa solution sous optimale


Systèmes avec sauts autonomes 1

Extension du théorème

Par intégration d ’un critère

terminal au PM

par application du principe

d’optimalité de Bellman

sous la contrainte

C x tk ( , )0

( , , )x f x u tk

( , , )x f x u tj

J L x u s ds x t tu t

t

f f

f

zmin ( , , ) ( ( ), )0

C xk ( ( ), ) 0

( ( ), ) min ( , , ) ( ( ), )J x t t L x u s ds J xku

kt j0 00

FH IKz


Systèmes avec sauts autonomes 3

• Le recherche des solutions se complique car– On ne peut savoir à l’avance si une frontière sera

franchie– Ni laquelle– Tous les cas doivent être envisagés


Système avec sauts autonomes 2

• Une extension est nécessaire :– f n’est plus continue en x (au passage des frontières)– ne peut donc plus être solution de

– Cette condition est remplacée par la condition de transversalité sur la frontière, en tenant compte du critère terminal : il existe un vecteur

xH

H HC

t

C

x

T T


Un exemple hystérésis 1

( )x f x u

Automate associé

Critère

J qx u e dtt z 2 2

0d i

x u

x

1

x u

x

1

x

x

( , ) , ,x f x u i u ii 1 1

x

f(x)

-

On peut réécrire le

système


Un exemple hystérésis 2

H x u t f x u qx u eiT

it( , , , ) ( , ) ( ) 1

22 2

( , ) xH

f x uH

xqxei

ii t

H

uu ei t0

i i ii

t

i i ii

t

C

x

H HC

t

( ) ( )

( ) ( )

Aux instants de commutation

C x t t x ii ( ( ), ) 0

u u

u u i

i i

i i

( ) ( )

( ) ( )

2


Un exemple hystérésis 3• Il est impossible de savoir au départ quel est le nombre

optimal de commutations;• Seul le calcul du coût permet de conclure

– Vers un point limite– Ou vers un cycle

0 100 200 300 400 500 600 700 8000

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

q

cost

k 0

k

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2

-1

-0.5

0

0.5

1

1.5

2

2.5

3

3.5

4

t

u

q=200 , q=400 , q=800


La programmation dynamique et les équations HJB

• Théorème 1: Si une trajectoire admissible ( )( ) déterminée par la donnée de la condition initiale ( 0 0 )( ) et de la commande ( )( ) , est optimale alors les conditions suivantes sont vérifiées :pour presque tout 2 [ ]–

–

),,(),,,(),,(inf),,,( tuxfxbtqxVtuxL

tbtqxV

q

T

qu

),,','(),),(),(( btqxVbttqtxV

),),(),((' tdtqtxq ),,,(' tdqxx


En pratique 1

• Pour résoudre ces équations, il est obligatoire de discrétiser (cf Hedlung & Rantzer).

• Une approche intéressante consiste à discrétiser le problème dès le départ. Deux voies apparaissent intéressantes– Approche MLD (Bemporad, Morari)

– Approche RPD (Lincoln and Rantzer CDC2002, ADSH2003)

• Des commandes sous optimales sont recherchées par encadrement– Systèmes affines par morceaux, partition de l’espace d’état


En pratique 2• Avec le PM :

– Problème aux frontières multiples (Conditions partagées aux instants initial et final et aux instants de commutations)

– Bifurcation dans la trajectoire dès qu'une transition discrète est autorisée ) Résolution par la programmation dynamique

– Notons que le PM revient également à résoudre HJB mais dans des directions privilégiées correspondant aux trajectoires optimales et pour lesquelles la continuité de V est assurée

• Conclusion :– Des C.N. bien établies– Des efforts à mener pour parvenir à des algorithmes de

résolution efficaces

Documents

EEA 20/03/2003 Claude Iung Centre de Recherche en Automatique de Nancy 1 Commande optimale des systèmes dynamiques hybrides C.Iung P.Riedinger