170
Université de Technologie de Belfort-Montbéliard École Doctorale Sciences Pour l’Ingénieur et Microtechniques THÈSE Présentée pour obtenir le grade de Docteur de l’Université de Technologie de Belfort- Montbéliard en Sciences pour l’Ingénieur Spécialité : Automatique et Informatique Présentée le 28-03-2014 par HUIDE ZHOU Concepts thermodynamiques et d’entropie pour la modélisation et la régulation d’un réseau de transport Président : Alain Oustaloup (Professeur, Université Bordeaux 1) Rapporteurs : Dimitri Lefebvre (Professeur, IUT du Havre) Najib Essounbouli (Professeur, IUT Troyes) Examinateurs Mohamed Benrejeb (Professeur, ENIT Tunisie) Abdellah EL Moudni (Professeur, UTBM Belfort) Directeur Rachid Bouyekhf (Maître de conférences HDR, UTBM Belfort)

Concepts thermodynamiques et d'entropie pour la

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Concepts thermodynamiques et d'entropie pour la

Université de Technologie de Belfort-Montbéliard

École Doctorale Sciences Pour l’Ingénieur et

Microtechniques

THÈSE

Présentée pour obtenir le grade de

Docteur de l’Université de Technologie de Belfort-Montbéliard en Sciences pour l’Ingénieur

Spécialité : Automatique et Informatique

Présentée le 28-03-2014 par

HUIDE ZHOU

Concepts thermodynamiques et d’entropie pour la

modélisation et la régulation d’un réseau de transport

Président : Alain Oustaloup (Professeur, Université Bordeaux 1)

Rapporteurs : Dimitri Lefebvre (Professeur, IUT du Havre)

Najib Essounbouli (Professeur, IUT Troyes)

Examinateurs Mohamed Benrejeb (Professeur, ENIT Tunisie)

Abdellah EL Moudni (Professeur, UTBM Belfort)

Directeur Rachid Bouyekhf (Maître de conférences HDR, UTBM Belfort)

Page 2: Concepts thermodynamiques et d'entropie pour la

2

Page 3: Concepts thermodynamiques et d'entropie pour la

TABLE DES MATIÈRES

Liste des figures vii

Liste des tableaux ix

Introduction générale xiii

Chapitre 1 Généralités 11.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Description d’un réseau de carrefours . . . . . . . . . . . . . . . . . . . 2

1.2.1 Caractéristiques d’un carrefour à feux . . . . . . . . . . . . . . . 2

1.2.2 Caractéristiques des feux d’un carrefour . . . . . . . . . . . . . . 5

1.2.3 Caractéristiques du mouvement du trafic . . . . . . . . . . . . . . 8

1.2.4 Infrastructures de mesure . . . . . . . . . . . . . . . . . . . . . . 10

1.3 Régulation des feux de signalisation . . . . . . . . . . . . . . . . . . . . 11

1.3.1 Boucle de régulation d’un réseau de carrefours . . . . . . . . . . 11

1.3.2 Modes de régulation d’un réseau de carrefours . . . . . . . . . . 12

1.3.3 Stratégies de régulation d’un réseau de carrefours . . . . . . . . . 14

1.3.3.1 Stratégies fixes . . . . . . . . . . . . . . . . . . . . . . 15

1.3.3.2 Stratégies adaptatives . . . . . . . . . . . . . . . . . . 17

1.4 Conclusion et objectif de la thèse . . . . . . . . . . . . . . . . . . . . . . 21

Page 4: Concepts thermodynamiques et d'entropie pour la

ii TABLE DES MATIÈRES

Chapitre 2 Modélisation thermodynamique des réseaux de transport 232.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.2 Quelques notions sur les systèmes thermodynamiques . . . . . . . . . . . 25

2.2.1 Le système, la chaleur et la température . . . . . . . . . . . . . . 25

2.2.2 Premier principe de la thermodynamique . . . . . . . . . . . . . 27

2.2.3 Deuxième principe : notions d’entropie et disentropie . . . . . . 28

2.3 Sur la représentation mathématique des systèmes thermodynamiques . . . 29

2.3.1 Formulation de l’entropie . . . . . . . . . . . . . . . . . . . . . 32

2.3.2 Formulation de la disentropie . . . . . . . . . . . . . . . . . . . 33

2.4 Modélisation thermodynamique d’un réseau de carrefours . . . . . . . . . 34

2.4.1 Conservation des véhicules (premier principe) . . . . . . . . . . . 37

2.5 Entropie du transport . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

2.5.1 Justification de l’entropie du transport . . . . . . . . . . . . . . . 41

2.5.2 Equilibre thermique = Equilibre du taux d’occupation . . . . . . 46

2.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

Chapitre 3 Commande dissipative des réseaux de transport 533.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

3.2 Rappels mathématiques et résultats préliminaires . . . . . . . . . . . . . 55

3.3 Définition des systèmes discrets dissipatifs . . . . . . . . . . . . . . . . . 59

3.3.1 Commande dissipative des systèmes discrets . . . . . . . . . . . 62

3.3.2 Avantages et inconvénients . . . . . . . . . . . . . . . . . . . . . 62

3.4 Spécialisation aux systèmes de transport . . . . . . . . . . . . . . . . . . 63

3.4.1 Commande dissipative des réseaux de transport . . . . . . . . . . 66

3.4.2 Cas d’un modèle non-linéaire . . . . . . . . . . . . . . . . . . . 67

3.4.3 Cas d’un modèle linéaire . . . . . . . . . . . . . . . . . . . . . . 80

3.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

Chapitre 4 Commande H∞ des réseaux de transport 914.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

4.2 Rappels mathématiques et résultats préliminaires . . . . . . . . . . . . . 92

4.2.1 Sur l’optimisation sous contraintes inégalités . . . . . . . . . . . 92

4.2.2 Sur le problème H∞ . . . . . . . . . . . . . . . . . . . . . . . . 94

4.3 Commande H∞ des réseaux de transport . . . . . . . . . . . . . . . . . . 96

Page 5: Concepts thermodynamiques et d'entropie pour la

TABLE DES MATIÈRES iii

4.3.1 Position du problème de la commande . . . . . . . . . . . . . . . 98

4.3.2 Solution du problème de la commande . . . . . . . . . . . . . . . 101

4.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

Chapitre 5 Applications 1135.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

5.2 Application à un réseau artériel . . . . . . . . . . . . . . . . . . . . . . . 114

5.2.1 Caractéristiques du réseau simulé . . . . . . . . . . . . . . . . . 114

5.2.2 Solutions des commandes . . . . . . . . . . . . . . . . . . . . . 117

5.2.3 Étude en simulation . . . . . . . . . . . . . . . . . . . . . . . . 118

5.2.3.1 Résultats de la commande dissipative . . . . . . . . . . 118

5.2.3.2 Résultats de la commande H∞ . . . . . . . . . . . . . 121

5.2.3.3 Comparaison avec la commande LQ . . . . . . . . . . 122

5.3 Application à un réseau en grille . . . . . . . . . . . . . . . . . . . . . . 126

5.3.1 Caractéristiques du réseau simulé . . . . . . . . . . . . . . . . . 126

5.3.2 Scénario 1 : Perturbations sinusoïdales . . . . . . . . . . . . . . 128

5.3.3 Scénario 2 : Perturbations à distribution de Gauss . . . . . . . . . 137

5.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

Conclusion générale 143

Références 152

Page 6: Concepts thermodynamiques et d'entropie pour la

iv TABLE DES MATIÈRES

Page 7: Concepts thermodynamiques et d'entropie pour la

TABLE DES FIGURES

1.1 Intersection à quatre branches avec mouvement tourne-à-gauche à priorité

à droite (sans déplacements pédestres) . . . . . . . . . . . . . . . . . . . 3

1.2 Courants de flux dans un carrefour élémentaire . . . . . . . . . . . . . . 4

1.3 Ensemble des éléments d’un tronçon . . . . . . . . . . . . . . . . . . . . 5

1.4 Le premier feu de signalisation électrique à Cleveland . . . . . . . . . . . 6

1.5 Exemple de séquence de phases . . . . . . . . . . . . . . . . . . . . . . 8

1.6 Boucle de régulation d’une intersection isolée . . . . . . . . . . . . . . . 12

1.7 Bande passante maximale d’une artère [1] . . . . . . . . . . . . . . . . . 17

1.8 Simplification du modèle "stocker-et-transférer" . . . . . . . . . . . . . . 21

2.1 Système thermodynamique . . . . . . . . . . . . . . . . . . . . . . . . . 30

2.2 L’écoulement du trafic des deux intersections . . . . . . . . . . . . . . . 35

2.3 L’ordre thermodynamique . . . . . . . . . . . . . . . . . . . . . . . . . 40

2.4 L’ordre du transport . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

2.5 Le diagramme fondamental . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.1 Intersection à deux phases . . . . . . . . . . . . . . . . . . . . . . . . . 67

3.2 Intersection à trois phases . . . . . . . . . . . . . . . . . . . . . . . . . . 68

4.1 Problème H∞ standard . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

4.2 Problème H∞ du système de transport . . . . . . . . . . . . . . . . . . . 100

Page 8: Concepts thermodynamiques et d'entropie pour la

vi TABLE DES FIGURES

5.1 Réseau artériel incluant quatre intersections . . . . . . . . . . . . . . . . 114

5.2 Évolution des taux d’occupation en utilisant la commande dissipative

pour le réseau artériel . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

5.3 Évolution de Sω et ∆ψ(x) en utilisant la commande dissipative pour le

réseau artériel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

5.4 Évolution de la commande u en utilisant la commande dissipative pour le

réseau artériel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

5.5 Évolution des taux d’occupation en utilisant la commande H∞ pour le

réseau artériel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

5.6 Évolution de ‖zc‖2‖ω‖2 en utilisant la commande H∞ pour le réseau artériel . . 122

5.7 Évolution de la commande u en utilisant la commande H∞ pour le réseau

artériel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

5.8 Évolution de l’entropie de transport pour le réseau artériel . . . . . . . . . 124

5.9 Évolution du retard total des véhicules par cycle pour le réseau artériel . . 125

5.10 Évolution du temps de calcul pour le réseau artériel . . . . . . . . . . . . 125

5.11 Réseau en grille incluant 12 intersections . . . . . . . . . . . . . . . . . 127

5.12 Évolution des taux d’occupation en utilisant la commande dissipative

pour le réseau en grille . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

5.13 Évolution des taux d’occupation en utilisant la commande dissipative

pour le réseau en grille . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

5.14 Évolution de Sω et ∆ψ(x) en utilisant la commande dissipative pour le

réseau en grille . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

5.15 Évolution de la commande u en utilisant la commande dissipative pour le

réseau en grille . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

5.16 Évolution des occupations en utilisant la commande H∞ pour le réseau

en grille . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

5.17 Évolution des taux d’occupation en utilisant la commande H∞ pour le

réseau en grille . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

5.18 Évolution de ‖zc‖2‖ω‖2 en utilisant la commande H∞ pour le réseau en grille . 134

5.19 Évolution de la commande u en utilisant la commande H∞ pour le réseau

en grille . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

5.20 Évolution de l’entropie du transport pour le réseau en grille . . . . . . . . 135

5.21 Évolution du retard total de véhicules par cycle pour le réseau en grille . . 136

Page 9: Concepts thermodynamiques et d'entropie pour la

TABLE DES FIGURES vii

5.22 Évolution du temps de calcul pour le réseau en grille . . . . . . . . . . . 136

5.23 Perturbations aux heures de pointe . . . . . . . . . . . . . . . . . . . . . 137

5.24 Évolution des taux d’occupation en utilisant la commande dissipative

avec les perturbations aux heures de pointe . . . . . . . . . . . . . . . . . 138

5.25 Évolution des taux d’occupation en utilisant la commande H∞ avec les

perturbations aux heures de pointe . . . . . . . . . . . . . . . . . . . . . 139

5.26 Évolution des taux d’occupation en utilisant la commande LQ avec les

perturbations aux heures de pointe . . . . . . . . . . . . . . . . . . . . . 139

5.27 Évolution de l’entropie du transport avec les perturbations aux heures de

pointe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140

5.28 Évolution du retard total des véhicules par cycle avec les perturbations

aux heures de pointe . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140

Page 10: Concepts thermodynamiques et d'entropie pour la

viii TABLE DES FIGURES

Page 11: Concepts thermodynamiques et d'entropie pour la

LISTE DES TABLEAUX

2.1 Correspondances des concepts de base . . . . . . . . . . . . . . . . . . . 36

5.1 Proportions des flux d’échange λi,j . . . . . . . . . . . . . . . . . . . . . 115

5.2 Performances pour le réseau artériel . . . . . . . . . . . . . . . . . . . . 126

5.3 Performances pour le réseau en grille (scénario 1) . . . . . . . . . . . . . 135

5.4 Performances face aux perturbations à distribution de Gauss . . . . . . . 140

Page 12: Concepts thermodynamiques et d'entropie pour la

x LISTE DES TABLEAUX

Page 13: Concepts thermodynamiques et d'entropie pour la

LISTE DES PUBLICATIONS

Journals

1. Huide Zhou, Rachid Bouyekhf, Abdellah El Moudni. Modeling and entropy based

control of urban transportation network. Control Engineering Practice, Volume 21,

Issue 10, pp. 1369-1376, 2013.

2. Huide Zhou, Rachid Bouyekhf, Abdellah El Moudni. ConstrainedH∞ control of ur-

ban transportation network. Journal of Advanced Transportation, Published online

in Wiley Online Library (wileyonlinelibrary.com). DOI : 10.1002/atr.1281, 2014.

Conférences

1. Huide Zhou, Rachid Bouyekhf, Abdellah EL Moudni. Modelling and H∞ Control

of Urban Transportation Network Control in Transportation Systems. 13th IFAC

Symposium on Control in Transportation Systems, Sofia, Bulgaria, Septembre 2012.

2. Huide Zhou, Rachid Bouyekhf, Abdellah EL Moudni. Modeling and Constrained

Control of Transportation Network. 10th IEEE International Conference on Net-

working, Sensing, and Control, Paris, France, April 2013.

3. Huide Zhou, Rachid Bouyekhf, Abdellah EL Moudni. An Approach of Model Pre-

dictive Control for Urban Transportation Network. 13th IFAC Symposium on Large

Scale Complex Systems, Shanghai, China, July 2013.

Page 14: Concepts thermodynamiques et d'entropie pour la

xii LISTE DES TABLEAUX

4. Huide Zhou, Rachid Bouyekhf, Abdellah EL Moudni. Concept of Transportation

Entropy and Its Application in Traffic Signal Control. 1st IFAC Workshop on Ad-

vances in Control and Automation Theory for Transportation Applications, Istan-

bul, Turkey, September 2013.

Page 15: Concepts thermodynamiques et d'entropie pour la

INTRODUCTION GÉNÉRALE

Les systèmes de transport sont des systèmes complexes en raison non seulement

du nombre élevé d’acteurs qui y participent, mais aussi à cause de leurs structures très

maillées sur lesquelles le trafic se déroule. Cette complexité a engendré un besoin gran-

dissant d’outils et de méthodes pour la modélisation, la régulation ainsi que l’évaluation

des performances de tels systèmes.

Les approches largement utilisées dans la modélisation des systèmes de transport sont

la théorie de files d’attente, l’approche de la mécanique des fluides, les automates cellu-

laires, les réseaux de Petri etc. Ces méthodes ont été mises au point au cours des dernières

décennies et ont été appliquées dans de nombreuses stratégies de contrôle de la signali-

sation routière. Cependant, bien que ces approches soient efficaces pour la modélisation

du trafic, elles sont souvent confrontées à la complexité du modèle obtenu. En effet, si le

réseau routier étudié est de grande taille, l’utilisation de ces méthodes devient rapidement

problématique et très coûteuse en terme de temps de calcul.

Ce travail se propose d’aborder le problème de la modélisation et la régulation du trafic

des réseaux de carrefours signalisés par une nouvelle approche, qui, à notre connaissance,

n’a pas encore été explorée. Nous nous intéressons tout particulièrement à la manière dont

les liens se tissent entre les systèmes de transport et les systèmes thermodynamiques. En

effet, en considérant les véhicules comme étant l’énergie fournie au réseau de transport,

nous pouvons considérer le réseau d’intersections comme un système thermodynamique

où il y a des échanges ou transferts de l’énergie (véhicules) entre les sous-systèmes (in-

tersections signalisées) qui transitent entre différents états : stable (non congestionné),

Page 16: Concepts thermodynamiques et d'entropie pour la

xiv Introduction

instable (congestionné) et en équilibre (fluide). Nous pouvons ainsi, comme dans le cas

thermodynamique, produire une régulation de la circulation à partir d’énergie sous forme

d’information.

L’étude basée sur des concepts thermodynamiques permet d’ouvrir une nouvelle pers-

pective sur la dynamique et la gestion de flux de véhicules. En effet, l’approche énergé-

tique permet d’une part de modéliser les interactions entre différentes intersections rou-

tières et d’autre part, d’analyser l’énergie interne (véhicules) du système qui est l’un des

facteurs qui détermine l’état du trafic. De plus, elle permet d’étudier le problème de la

gestion dynamique basée sur un modèle de trafic qui a fait ses preuves en thermodyna-

mique.

Cependant, les systèmes de transport sont des systèmes dynamiques sujets à des in-

certitudes et des limitations d’ordre physique ou dictées par des impératifs de sécurité.

Ces limitations se traduisent dans la majorité des cas par des contraintes sur les variables

d’état et/ou de commande. La prise en compte de ces incertitudes et de ces contraintes

dans la conception du plan de feux est donc nécessaire. Notre travail s’inscrit dans ce

cadre pour la régulation des réseaux de carrefours.

La régulation du trafic dans un réseau de carrefours à feux concerne en général deux

objectifs distincts : la fluidification ou la résorption de congestion. Dans le premier cas,

on évite de se retrouver dans une situation de trafic très dense en essayant d’ajuster les

durées de commutation des feux en fonction de la demande d’affluence au carrefour :

c’est une action a priori. Dans le second cas, on est confronté à un trafic saturé (état de

congestion). Dans ce cas, il faudra agir a posteriori.Dans ce mémoire, nous nous intéressons essentiellement à un travail en amont (action

a priori) permettant d’éviter la congestion en forçant les files d’attente à ne pas dépasser

le niveau du trafic correspondant à l’optimum opérationnel des lignes.

Plan de la thèse

Ce mémoire est structuré en cinq chapitres.

Le premier chapitre présente tout d’abord les carrefours à feux ainsi que les différents

éléments les caractérisant. Les notions essentielles pour la régulation du trafic aux abords

des carrefours sont ensuite présentées. Une dernière partie est consacrée à la présentation,

non exhaustive, des méthodes développées pour la gestion et la régulation des carrefours.

Page 17: Concepts thermodynamiques et d'entropie pour la

xv

Enfin, nous terminons le chapitre par une conclusion et la formulation du problème de la

commande de ce travail.

Le deuxième chapitre est consacré à la modélisation des réseaux de transport signa-

lisés. Après avoir exposé une brève introduction aux systèmes thermodynamiques, nous

élucidons le lien étroit qui existe entre les systèmes de transport et la thermodynamique.

Nous montrons dans un premier temps, que certains concepts thermodynamiques tels que

la température, la capacité thermique, l’équilibre thermique, trouvent leurs similitudes

dans le cadre des systèmes de transport. Ensuite, nous présentons la notion d’entropie du

réseau de transport qui sert à mesurer le degré de désordre d’un système. Ce concept d’en-

tropie représente le visage thermodynamique de notre système et prend source et forme à

partir de l’énergie (véhicules) échangée ou transférée entre les sous-systèmes.

Le troisième chapitre est consacré à la solution de notre problème de la commande

par l’approche des systèmes dissipatifs avec contraintes sur l’état et la commande. Après

avoir exposé quelques définitions et résultats utiles donnés dans la littérature dont nous

aurons besoin dans la suite, nous donnons sous forme d’inégalités matricielles linéaires

(LMI) des conditions nécessaires et suffisantes pour qu’un réseau de transport soit dissi-

patif. Deux cas sont étudiés : celui, où le modèle du système est non-linéaire, est d’abord

analysé. Ensuite, nous nous intéressons au cas où le modèle de transport est linéaire.

Les inconvénients de l’approche de la commande dissipative dans le cas linéaire nous

ont amené à avoir recours à la commande H∞ dans le chapitre 4. Après avoir exposé

quelques résultats utiles, nous proposons des commandes par retour d’état basées sur le

concept d’invariance positive des ensembles et permettant d’atteindre notre objectif. Le

principe de cette approche implique que toutes les trajectoires issues d’un ensemble y

restent.

Le chapitre 5 se focalise sur la mise en place des stratégies de régulation proposées

sur deux types de réseaux de carrefours : artériel et en grille. Pour chaque type de ré-

seau, nous décrivons ses caractéristiques géométriques ainsi que les caractéristiques des

flux de véhicules. Une étude détaillée sur les performances des stratégies sera décrite en

comparaison avec la stratégie de commande linéaire quadratique (LQ).

Enfin, nous concluons ce mémoire en résumant les contributions de ce travail et en

présentant quelques perspectives de nos travaux.

Page 18: Concepts thermodynamiques et d'entropie pour la

xvi Introduction

Page 19: Concepts thermodynamiques et d'entropie pour la

CHAPITRE 1

GÉNÉRALITÉS SUR LES RÉSEAUX

DE CARREFOURS URBAINS

1.1 Introduction

Le transport a toujours été l’un des composants déterminants de la vie urbaine et de

son développement économique. A partir de la seconde moitié du siècle dernier, l’amé-

lioration du niveau de vie moyen et du taux d’équipement des ménages a permis au plus

grand nombre d’accéder au déplacement par véhicule particulier. Nous avons donc assisté

à une course entre la croissance du trafic routier et les progrès quantitatifs et qualitatifs de

la voirie. Cette quantité d’actions génère des problèmes au niveau de la fluidité du trafic,

d’où l’apparition de phénomènes de congestion.

La congestion se produit aujourd’hui de façon quasi-quotidienne dans les réseaux

routiers. Elle est source de perte de temps, augmentation de la consommation d’énergie,

nuisance et détérioration de l’environnement.

La solution aux problèmes de congestion routière ne passe pas toujours par la construc-

tion de nouvelles routes, comme cela se faisait dans un passé récent. Étant donné que

l’offre de terrains est épuisée et que le développement de l’infrastructure routière est coû-

teux, la tendance actuelle est plutôt à une meilleure utilisation des infrastructures exis-

tantes. En particulier, les feux de signalisation jouent un rôle important parmi les ap-

Page 20: Concepts thermodynamiques et d'entropie pour la

2 Chap 1. Généralités

proches qui permettent d’éviter la congestion. Avec le développement des infrastructures

de mesure et des nouvelles techniques numériques, la conception d’une meilleure com-

mande des feux de signalisation a fait l’objet de nombreuses recherches afin d’améliorer

la circulation au niveau du réseau à grande échelle.

Dans la suite de ce chapitre, nous décrivons d’une manière détaillée un réseau de car-

refours. Ceci passe par la définition des différents éléments le caractérisant. Une deuxième

partie est consacrée à la présentation, non exhaustive, des méthodes développées pour la

gestion et la régulation des carrefours.

1.2 Description d’un réseau de carrefours

En milieu urbain, l’infrastructure de transport se compose d’un ensemble d’éléments

structuraux interconnectés qui fournissent le réseau pour supporter la totalité de la struc-

ture du trafic. En particulier, les carrefours à feux sont des nœuds importants d’un réseau

routier permettant d’écouler ou de stocker des flux de véhicules selon la variation du tra-

fic. Ainsi, la description du réseau de transport urbain se concentre sur les caractéristiques

des carrefours et les composantes qui leurs sont liées.

1.2.1 Caractéristiques d’un carrefour à feux

D’après la définition donnée par le livre de référence en matière d’ingénierie du tra-

fic routier [2], un carrefour est situé à la rencontre de plusieurs routes déterminant des

couloirs d’entrée et de sortie. Plus précisément, un carrefour à feux constitue un terrain

sensible pour les conflits de trafic à partir des différentes routes. La mise en place d’un

système de feux à un carrefour réalise une séparation dans le temps du passage de dif-

férents flux de véhicules. Elle peut revêtir plusieurs schémas relatifs à la géométrie de

l’infrastructure et aux règles de franchissement.

Pour étudier une intersection routière, nous nous concentrons tout d’abord sur l’ana-

lyse d’une intersection routière à deux phases et à quatre branches que nous pouvons

qualifier comme étant un carrefour élémentaire (voir Figure 1.1). L’étude des autres types

d’intersection sera ramenée à ce type simple de carrefour. Ceci peut être réalisé, soit en

décomposant ceux qui sont complexes en plusieurs carrefours élémentaires, soit en ajou-

tant des tronçons fictifs pour les intersections à moins de quatre branches.

Page 21: Concepts thermodynamiques et d'entropie pour la

1.2 Description d’un réseau de carrefours 3

FIGURE 1.1 – Intersection à quatre branches avec mouvement tourne-à-gauche à priorité

à droite (sans déplacements pédestres)

Dans chaque intersection, nous pouvons identifier trois zones fonctionnelles :

– Zone de conflit : il s’agit de l’espace de croisement des routes. Autrement dit, c’est

la ressource critique partagée par tous les véhicules qui traversent l’intersection ;

– Zone de stockage : en amont de la zone de conflit, elle est l’entrée empruntée par

les véhicules ;

– Zone de sortie : en aval de la zone de conflit, elle permet le soulagement de cette

zone.

Pour bien comprendre le fonctionnement d’un carrefour, un certain nombre d’élé-

ments doivent être définis :

Page 22: Concepts thermodynamiques et d'entropie pour la

4 Chap 1. Généralités

Couloir et tronçon : Un couloir est caractérisé par sa longueur, son nombre de voies

ainsi que par les sens de circulation ; certaines de ces voies peuvent être affectées à un cou-

rant particulier appelées voies spéciales. Les courants de véhicules sont soit directs, soit

des courants de tourne-à-gauche ou tourne-à-droite (voir Figure 1.2). Une voie spéciale

pourrait être affectée à un courant tourne-à-gauche ou tourne-à-droite. Un tronçon d’un

carrefour représente chaque couloir d’entrée et de sortie. Ainsi, il peut contenir plusieurs

voies. Chaque voie écoule un mouvement de véhicules unidirectionnel et donc correspond

à une phase unique. Un tronçon est caractérisé par plusieurs paramètres, entre autres, sa

longueur qui représente la mesure en mètres de la distance séparant la ligne géométrique

où sont implantés les feux associés au tronçon (cette ligne est considérée comme la sortie

du tronçon) et la ligne géométrique en amont considérée comme l’entrée de ce tronçon

(voir Figure 1.3).

1 3

2

4

(1,2) Tourne-à-droite

(1,3) Tout droit

(1,4) Tourne-à-gauche

FIGURE 1.2 – Courants de flux dans un carrefour élémentaire

Concentration maximale et capacité de stockage d’une voie : La concentration ou

la densité donne le nombre de véhicules présents sur une section de longueur donnée.

La concentration maximale d’une voie est le nombre maximal de véhicules que l’on peut

stocker par mètre linéaire dans la voie. La capacité de stockage d’une voie représente le

nombre maximal de véhicules que l’on peut stocker sur toute sa longueur. En d’autres

termes, la capacité représente la concentration de la voie multipliée par sa longueur. Par

Page 23: Concepts thermodynamiques et d'entropie pour la

1.2 Description d’un réseau de carrefours 5

FIGURE 1.3 – Ensemble des éléments d’un tronçon

exemple, si la concentration maximale d’une voie est de 0.2 véh/m et, sachant que la

longueur de la voie est de 100m, alors la capacité de cette voie est de 100*0.2=20 véh.

Longueur des files d’attente : Cette variable correspond au nombre de véhicules arrê-

tés derrière la ligne d’arrêt à un feu de circulation. La longueur des files d’attente constitue

l’une des grandeurs majeures de l’évaluation d’une stratégie de régulation.

1.2.2 Caractéristiques des feux d’un carrefour

En raison de l’insécurité qui existe à l’approche des carrefours, notamment ceux des

grandes agglomérations, de nombreux carrefours sont équipés de feux tricolores (ou feux

de signalisation) qui permettent d’empêcher les conflits entre les flux à partir des diffé-

rentes directions.

Petit historique : Le premier feu de signalisation utilisé dans le domaine remonte au

sémaphore à commande manuelle implanté à Londres dès 1868 [3]. Le premier feu de

signalisation électrique aux Etats-Unis a été développé par James Hoge et installé à Cle-

veland, Ohio, en 1914 [4] (voir Figure 1.4).

Ceci a été suivi par l’introduction de feux inter-connectés en 1917 dans la ville de Salt

Lake, Utah [5]. A ce moment, la propriété et l’utilisation de l’automobile étaient en pleine

expansion et l’efficacité du contrôle des feux de signalisation a été reconnue. La circula-

tion automobile croissante dans les rues a conduit au développement et à l’implémentation

des signaux actionnés en 1928 [6].

Depuis, les technologies liées avec la commande des feux de signalisation ont connu

un développement rapide et les feux tricolores sont devenus un élément essentiel des sys-

Page 24: Concepts thermodynamiques et d'entropie pour la

6 Chap 1. Généralités

FIGURE 1.4 – Le premier feu de signalisation électrique à Cleveland

tèmes de contrôle et de gestion du trafic moderne. Du point de vue de l’application, les

feux de signalisation sont utilisés pour contrôler l’affectation du droit de passage des vé-

hicules ou des piétons aux endroits où des conflits potentiellement dangereux existent.

Un autre avantage des feux tricolores par rapport aux dispositifs passifs (panneaux, mar-

quages) est sa capacité à soutenir la commande adaptative du trafic.

États des feux : Un feu tricolore est un signal lumineux situé à la frontière de chaque

zone de stockage et de la zone de conflit. Il commande le passage libre (feu vert), toléré

(feu orange) ou interdit (feu rouge) du trafic des véhicules. Ces différentes couleurs sont

nommées les états de feux. Le changement de feu d’un état à l’autre est appelé commu-

tation. Pour la sécurité des usagers, le temps de passage par état doit au moins durer une

période minimale, fixée par les exploitants. Contrairement aux durées du feu vert ou du

feu rouge, la durée du feu orange est invariable. Notons que l’implantation des feux de

signalisation doit respecter la géométrie d’un carrefour.

Rappelons quelques concepts essentiels de la signalisation à feux :

Page 25: Concepts thermodynamiques et d'entropie pour la

1.2 Description d’un réseau de carrefours 7

– Cycle : Les indicateurs des feux - vert, orange, rouge - se succèdent à l’intérieur

d’un cycle, défini comme étant la durée constante séparant deux passages successifs

de l’ensemble des signaux par le même état.

– Phase : Le cycle est partagé en phases, temps pendant lequel un ou plusieurs cou-

rants sont admis dans le carrefour. Une phase est dite spéciale quand elle a pour

seul but de favoriser l’écoulement d’un mouvement tournant. Elle est dite saturéelorsqu’un véhicule au moins de cette phase est contraint d’attendre plus d’un cycle

pour franchir le carrefour. Le carrefour est lui-même saturé quand au moins une des

ses phases est saturée.

– Vert effectif : On appelle temps de vert effectif, la somme du temps de vert réel et

du temps de l’orange (qui est souvent de 3 à 5 secondes selon la vitesse d’approche

dans le cas d’un carrefour urbain ordinaire).

– Vert utile : On définit le temps de vert utile, en retranchant du temps de vert effectif

le temps perdu (somme des temps perdus au début du vert, c’est-à-dire au démar-

rage, et du temps perdu en fin de phase). Les temps perdus par phase se situent en

moyenne autour de 8 secondes [7].

– Rouge utile : On appelle rouge utile la différence entre la durée du cycle est celle

du vert utile. Pour des raisons de sécurité, à la fin de chaque phase, l’ensemble des

feux du carrefour est maintenu au rouge pendant une certaine durée, appelée rougeintégral. Dans le cas d’un carrefour simple à 4 branches par exemple, on adopte

une durée de rouge intégral de 2 secondes.

Le plan des feux d’un carrefour signalisé : Considérons l’intersection montrée dans

la Figure 1.1. On constate qu’il y a deux paires de courants en conflit, à savoir la paire de

courants provenant des rues R1 et R2 et la paire de courants provenant des rues R3 et R4.

En supposant que les mouvements dominants soient les mouvements directs (aller tout

droit) et que les mouvements de tourne-à-gauche soient soumis à la priorité à droite, nous

pouvons découper le cycle en 2 phases, i.e. Phase I et Phase II.

Supposons que les durées des phases I et II soient identiques et que la séquence des

phases soit fixe. Les feux installés aux rues R1 et R2 sont d’abord verts, puis rouges pour

que les feux aux rues R3 et R4 deviennent à leur tour verts ; et ainsi de suite. Les deux

phases se succèdent, constituant un cycle. Le plan des feux pour cette intersection est

illustré dans la Figure 1.5. Pour des raisons de sécurité, l’ensemble des feux de l’intersec-

Page 26: Concepts thermodynamiques et d'entropie pour la

8 Chap 1. Généralités

tion est maintenu au rouge pendant une certaine durée à la fin de chaque phase, appelée

rouge intégral. Ainsi, l’équation qui décrit le plan des feux dans cet exemple est donnée

par :

Cycle = Vert effectifPhase I + Vert effectifPhase II + 2× Rouge intégral (1.1)

Notons que le cycle et le rouge intégral sont fixes en général [8]. Par conséquent, la somme

des temps de vert effectifs d’un carrefour dans un cycle reste constante.

FIGURE 1.5 – Exemple de séquence de phases

La stratégie de régulation des feux dépend de l’état du trafic estimé grâce aux mesures

réalisées. Ainsi, la fluidité du trafic est généralement la mission du système de régulation

qui décide de la séquence des phases et de la durée de chaque phase.

1.2.3 Caractéristiques du mouvement du trafic

Un mouvement est défini par son origine et sa destination. Un courant de trafic est

l’ensemble des mouvements de véhicules qui proviennent de la même branche d’accès,

à savoir la même origine (voir Figure 1.2). Selon les similitudes avec la théorie de l’hy-

drodynamique, le courant routier peut être considéré comme un flux de trafic au niveau

d’un tronçon ou d’une route [9]. L’objectif des Théories de flux de trafic est de dé-

crire de façon mathématique précise les interactions entre les véhicules et l’infrastructure.

Les études scientifiques de flux de trafic sont nées dans les années 1930. En particulier,

Adams a appliqué la théorie des probabilités pour décrire le trafic routier [10] ; Bruce

D. Greenshields du Bureau du Trafic Routier de Yale a étudié des modèles de volume et

de la vitesse [11]. A partir des années 1950, des nouvelles études ont été élaborées dans

ce domaine sur la base des approches théoriques diverses, telles que le modèle de suivi

Page 27: Concepts thermodynamiques et d'entropie pour la

1.2 Description d’un réseau de carrefours 9

du véhicule [12, 13, 14], la théorie de l’onde cinétique (KWT : kinematic Wave Theory)

[15, 16, 17, 18] et la théorie des files d’attente (queuing theory) [19, 20], etc.

Dans cette section, on distingue trois grandeurs principales caractérisant les flux de

trafic dans le réseau de carrefours.

Débit des flux : Il correspond au nombre de véhicules observés en un point donné de

l’infrastructure pendant un intervalle de temps d’observation. En fonction de la méthode

de mesure utilisée, le débit peut être approximé soit en un point, soit sur un tronçon de la

route. Formellement, le débit moyen q(x, t1, t2) au point d’abscisse x entre les instants t1et t2 est défini par le rapport :

q(x, t1, t2) =N(x, t1, t2)

t2 − t1(1.2)

où N(x, t1, t2) désigne le nombre de véhicules qui passent par le point x entre les instants

t1 et t2. En particulier, deux débits importants sont considérés :

– Le débit d’entrée d’une voie est le débit de son flux d’entrée. Notons que les flux

d’entrée du milieu extérieur dépendent des activités humaines. Par conséquent, les

débits d’entrée sont évolutifs dans le temps et ils ne sont pas commandable par les

feux de signalisation. L’évolution des débits d’entrée exprime les incertitudes dans

la demande de trafic.

– Le débit de saturation d’une voie est le nombre maximum de véhicules pouvant

sortir de la voie et accéder à l’intersection en aval sans interruption par unité de

temps, le feu étant continuellement au vert. Pour chaque voie, il est exprimé en

unités de véhicules particuliers par heure de feu vert. On adopte souvent les va-

leurs de référence suivantes : s=1820 uvp/h/voie dans une agglomération impor-

tante, s=1650 uvp/h/voie dans une petite agglomération. Ces valeurs peuvent être

ajustées en fonction de divers facteurs liés à la géométrie de l’aménagement du

carrefour et à son environnement (taille de l’agglomération, visibilité,...). Puisque

ces facteurs ne changent pas en général, le débit de saturation est considéré fixe et

connu dans cette thèse.

Pour un carrefour à feux, nous partageons le débit en deux parties ; le débit d’entrée

et le débit de sortie. Notons que, contrairement aux arrivées, les départs sont dépendants

des durées de commutation de l’ensemble des feux d’un carrefour.

Page 28: Concepts thermodynamiques et d'entropie pour la

10 Chap 1. Généralités

Charge d’un carrefour : La charge Y d’une entrée est définie comme le rapport entre

le débit d’entrée mesuré q et le débit de saturation s. C’est donc le rapport de la demande

sur l’offre :

Y =q

s(1.3)

Cette définition s’étend à l’ensemble du carrefour. La charge globale du carrefour est la

somme des charges de chacune des phases :

Y =∑

yp (1.4)

La somme étant effectuée sur le nombre n de phases. yp représente la charge du courant

prépondérant de chaque phase définie par yp = Max(yc), où yc définit la charge des

courants admis simultanément dans le carrefour au cours de la phase. Chaque phase se

caractérise donc par une charge correspondant à celle de son entrée prédominante.

Remarque 1.1 Si le courant directionnel ayant la plus forte charge est commun à 2

phases, on prend la charge immédiatement inférieure. Toutefois, il convient de s’assu-

rer que la somme de la charge immédiatement inférieure et de la charge prédominante

de l’autre phase est supérieure à la charge du courant utilisant les 2 phases. Dans le cas

contraire, c’est cette dernière que l’on utilise. I

1.2.4 Infrastructures de mesure

Il existe de nombreux types de capteurs permettant les mesures directes ou indirectes

des variables de circulation. Les deux principaux types de capteurs que l’on peut rencon-

trer [21, 22] sont :

– Les capteurs enfouis dans la chaussée :– Boucles électromagnétiques : c’est aujourd’hui le dispositif de mesure des pa-

ramètres du trafic le plus répandu dans le monde, tant en ville que sur les voies

rapides et les autoroutes urbaines. Il permet de mesurer les débits, le taux d’oc-

cupation, la vitesse et l’écart de temps inter-véhiculaire. Le capteur est constitué

d’une boucle inductive, noyée dans le revêtement de la chaussée. Le passage de

la masse métallique d’un véhicule au-dessus de la boucle provoque une variation

du champ électromagnétique. Cette variation se traduit par un créneau de tension

dont la longueur est liée à celle du véhicule et du capteur et au temps de passage.

– Les détecteurs latéraux :

Page 29: Concepts thermodynamiques et d'entropie pour la

1.3 Régulation des feux de signalisation 11

– Capteurs à ultrasons et à effet Doppler : ce capteur est constitué d’une an-

tenne fixée sur un portique, lequel est positionné dans l’axe de la voie de circula-

tion. Cette antenne émet constamment des ondes qui se propagent à une vitesse

connue. Lors du passage d’un véhicule, l’onde émise rencontre un obstacle et est

réfléchie. A partir de la différence entre les fréquences de l’onde émise et de celle

reçue, la vitesse du véhicule peut être estimée.

– Capteurs optiques (vidéo) : le principe de ces capteurs consiste à utiliser une

caméra vidéo et à traiter de manière automatique les images fournies par cette

caméra afin de déduire les paramètres du trafic [23, 24].

1.3 Régulation des feux de signalisation

1.3.1 Boucle de régulation d’un réseau de carrefours

Le système de feux de signalisation associé à un réseau de carrefours urbains est

généralement un système complexe qui ne se limite pas aux signalisations verticales et

horizontales visibles par les conducteurs. En effet, des instruments de mesure, des postes

de contrôle, des liaisons filaires ou GPRS, etc., sont souvent requis pour assurer le fonc-

tionnement de la régulation. Si nous limitons notre étude à une intersection isolée, nous

pouvons au moins identifier trois éléments qui composent le système de feux de signali-

sation (voir figure 1.6). L’intégration de ces trois éléments à une intersection constitue la

boucle de régulation du trafic à son niveau. Ces éléments sont :

– Les dispositifs de signalisation : Il s’agit de l’ensemble des signaux verticaux

et horizontaux transmis aux conducteurs pour assurer la sécurité de passage des

véhicules. Ils visent à éviter la rencontre de mouvements conflictuels. Par la suite,

nous limiterons notre étude aux feux tricolores ;

– Les infrastructures de mesure : Elles reflètent l’état du trafic à travers ses diffé-

rentes grandeurs. Ces grandeurs sont mesurées par des capteurs installés au niveau

de l’infrastructure ;

– Le régulateur : Il est le cerveau de la boucle de régulation. Il précise en temps réel

les stratégies de régulation, en fonction des données issues de l’infrastructure de

mesure, afin d’atteindre des objectifs bien précis, comme par exemple minimiser la

longueur des files d’attente, le temps d’attente des véhicules, etc.

Page 30: Concepts thermodynamiques et d'entropie pour la

12 Chap 1. Généralités

Infrastructurede mesure

Régulateur

Dispositifs designalisation

Boucles électromagnétiques, ...

État du trafic

Plan de feux

Couleur des feuxFeux tricolores, Panneaux de signalisation, ...

FIGURE 1.6 – Boucle de régulation d’une intersection isolée

1.3.2 Modes de régulation d’un réseau de carrefours

La régulation du réseau de carrefours par les feux de signalisation peut fonctionner

sous divers modes. Outre le contrôle manuel, on distingue généralement le contrôle au-

tomatique, le contrôle adaptatif et le contrôle coordonné. Ces modes ne sont pas toujours

distincts et peuvent se combiner à plusieurs titres, voir se substituer l’un à l’autre.

Mode manuel : dans ce cas, c’est un individu qui actionne le changement d’état du

carrefour. C’était le cas des premiers feux de circulation, mais aujourd’hui encore, les

feux peuvent fonctionner en mode manuel si la situation l’exige, ou également en mode

semi-manuel (ou semi-automatique).

Page 31: Concepts thermodynamiques et d'entropie pour la

1.3 Régulation des feux de signalisation 13

Mode automatique : ce mode n’exige aucune intervention extérieure ; les états succes-

sifs d’un cycle se déroulent séquentiellement suivant les plans de feux en place dans le

contrôleur. On parle aussi de fonctionnement en cycles fixes.

Mode adaptatif : contrairement au mode automatique, ce mode permet l’adaptation de

la durée des intervalles des feux verts, et par conséquent la modulation de l’ensemble

des phases d’un cycle en fonction des variations du trafic. Ainsi, un feu vert peut être

allongé pour écouler le flux d’une voie où s’écoule un trafic plus important que dans les

voies adjacentes. Un autre exemple d’adaptation est la priorité donnée aux véhicules de

transport public : leur arrivée dans un carrefour déclenche soit l’allongement de l’état du

feu vert, soit la réduction de l’intervalle du feu rouge sur la voie qu’ils empruntent.

Mode coordonné : ce mode signifie que plusieurs contrôleurs, donc plusieurs carre-

fours, sont soumis à une même stratégie de régulation. Il existe deux grandes applications

du mode coordonné. La première est la régulation d’axes de circulation. Elle consiste à

coordonner les phases des différents carrefours d’un même axe routier afin de rendre plus

confortable et plus fluide la progression des véhicules, c’est-à-dire, d’éliminer leurs arrêts

aux carrefours (du moins s’ils respectent une vitesse moyenne, définie par le gestionnaire

des feux). La seconde application de la coordination est la régulation des zones. Dans ce

cas, ce sont les feux de l’ensemble d’un périmètre géographique déterminé (un quartier

urbain par exemple) qui sont coordonnés entre eux, afin d’optimiser les déplacements des

usagers, c’est-à-dire, de minimiser le temps qu’ils passent dans cette zone.

Les deux derniers modes (adaptatif, coordonné) évoqués soulèvent chacun des com-

plexités techniques que ne posent pas les deux premiers. Ces modes exigent de disposer

de moyens de détection des variations du trafic, c’est-à-dire de recueillir des informations

caractérisant la circulation en temps réel. D’où la nécessité d’utiliser des capteurs auto-

matiques. Il en existe de différentes sortes : pneumatiques, hydrauliques, acoustiques, à

boucles électromagnétiques, à ultrasons, à infrarouges, radars, caméras, etc... Ces capteurs

sont placés à une certaine distance du carrefour concerné, reliés par câble ou par ondes

au contrôleur qui reçoit et interprète l’information codée par le détecteur (un élément

électronique qui transforme l’information issue du capteur en signal électrique).

Notons également que les modes adaptatifs et coordonnés, ainsi que leur combinaison,

se trouvent aujourd’hui gérés à distance à partir d’un poste de contrôle. Cette télé-gestion

Page 32: Concepts thermodynamiques et d'entropie pour la

14 Chap 1. Généralités

repose évidemment sur des transmissions d’informations entre les feux et le poste de

contrôle. Les modes manuel et automatique entrent dans le cadre des systèmes de com-

mande en boucle ouverte. Ce sont des systèmes qui s’appuient sur des bases de données

prédéfinies. Dans ces conditions, le système marche sans prendre en considération les

problèmes brusques : la forte congestion, les incidents, etc. L’utilisation de ces systèmes

est désormais impossible pour répondre à la demande actuelle. Donc il est nécessaire

d’adopter des approches qui nous permettent d’en savoir plus sur l’état en temps réel et

qui agissent directement pour fluidifier le trafic. D’où l’utilisation actuelle dans les re-

cherches récentes des systèmes en boucle fermée dont nous pouvons inclure les modes

adaptatifs et coordonnés.

1.3.3 Stratégies de régulation d’un réseau de carrefours

La régulation des feux de signalisation dans un réseau de carrefours concerne en gé-

néral deux objectifs distincts : la fluidification ou la résorption de la congestion. Dans le

premier cas, on évite de se retrouver dans une situation de trafic très dense en essayant

d’ajuster les durées de commutation des feux en fonction de la demande d’affluence aux

carrefours : c’est une action a priori. Dans le second cas, on est confronté à un trafic

saturé (état de congestion). Dans ce cas, il faudra agir a posteriori. Notons qu’une stra-

tégie de régulation au niveau d’un réseau est appelée stratégie globale. Elle permet la

régulation des feux de tous les carrefours. Dans le cas d’un carrefour congestionné sur le

réseau étendu englobant ainsi plusieurs carrefours, une stratégie locale ne saurait résorber

cette forte densité de trafic. En effet, pour répondre au phénomène d’accumulation de vé-

hicules, une stratégie globale permettant la régulation simultanée de plusieurs carrefours

interdépendants pourrait atténuer ce phénomène.

La littérature concernant la régulation du trafic dans un réseau de carrefours est abon-

dante. Bien qu’une quelconque classification soit toujours partiellement arbitraire, il nous

semble qu’une des classifications consiste à séparer les travaux existants en deux catégo-

ries principales.

Une première catégorie de travaux est communément désignée sous le nom de straté-gie fixe ou pré-déterminée. Dans ce type de stratégie, tous les paramètres sont déterminés

et réglés à partir de données recueillies avant l’installation. Le principal inconvénient de

la stratégie fixe est qu’elle n’est pas capable de tenir compte de la demande du trafic en

Page 33: Concepts thermodynamiques et d'entropie pour la

1.3 Régulation des feux de signalisation 15

temps réel et nécessite une remise à jour régulière des plans de feux pour tenir compte de

l’évolution du trafic moyen.

Une deuxième catégorie de travaux est communément désignée sous le nom de stra-tégie adaptative ou temps réel. Cette stratégie est plus coûteuse, parce qu’elle néces-

site l’installation, l’exploitation et la maintenance d’un système de contrôle en temps réel

(capteurs, communications, salle de contrôle centrale, contrôleurs locaux). Grâce au déve-

loppement des techniques liées, la stratégie adaptative, si bien conçue, est potentiellement

plus efficace.

Dans la suite de ce chapitre, certaines stratégies populaires des deux catégories sont

présentées.

1.3.3.1 Stratégies fixes

Dans ce mode de régulation, tous les paramètres sont déterminés et réglés à partir de

données recueillies avant l’installation. Le rôle principal des plans de feux fixes est de

mettre en marche cycliquement une série de phases pendant des durées données. Cette

série de phases doit permettre de mieux répondre à la demande moyenne de la capacité

estimée du carrefour. Pour calculer le plan de feux, il est nécessaire de définir la notion

de phasage. Cette notion est définie comme étant l’ensemble des phases utilisées pour la

commande de l’intersection. Une fois le phasage est déterminé, le calcul du plan des feux

consiste en la détermination des trois paramètres suivants :

– la durée du cycle ;

– la répartition des verts : la durée du vert attribuée à chaque feu au cours du cycle ;

– les décalages entre les débuts des cycles dans le cas de plusieurs carrefours à coor-

donner.

Les commutations des feux de signalisation sont constantes d’un cycle à un autre. Ainsi,

on retrouve à chaque cycle la même longueur et la même durée des phases. Nous trouvons

dans ce mode de régulation les systèmes à base de plans de feux fixes.

Il est à noter que les plans de feux fixes ne sont pas fixés pour toutes les périodes

d’une journée ou pour tous les jours. Un choix doit être effectué entre les différents plans

disponibles au poste de commande selon la situation du trafic. Un opérateur peut réa-

liser ce choix manuellement ; c’est généralement le cas lorsqu’il détecte un événement

exceptionnel nécessitant une gestion adaptée du réseau.

Page 34: Concepts thermodynamiques et d'entropie pour la

16 Chap 1. Généralités

Nous présentons dans ce qui suit les systèmes de type fixe les plus utilisés dans les

grandes villes mondiales :

Méthode de Webster : A partir d’analyses en simulation et de campagnes de mesures

sur le terrain, [25] a donné le temps perdu moyen des véhicules dans la voie i pendant

leur traversée du carrefour sous la forme suivante :

Ri =c(1− gi

c)2

2(1− yi)+

(yicgi

)2

2qi(1− yi cgi )− 0.65(

c

q2i

)1/3(yic

gi)2+5

gic (1.5)

où c est la durée du cycle, gi, yi et qi sont le temps vert, la charge et le débit d’arrivée de la

voie i respectivement. De cette expression, Webster déduit alors la durée du cycle comme

suit :

c =1.5Tp + 5

1− Y(1.6)

où Tp est la somme des temps perdus entre les phases, Y est la charge globale du carrefour.

Cette formule reste la formule de référence jusqu’à aujourd’hui. Elle est communément

nommée durée de cycle optimale.

MAXBAND : En combinant la méthode de Webster et une formule proposée par Mor-

gan [26] et Little [27] pour maximiser la bande passante, Little dans [1] a publié une stra-

tégie nommée MAXBAND. Elle considère une artère à deux voies avec n intersections et

spécifie les décalages afin de maximiser le nombre de véhicules qui peuvent voyager avec

une vitesse donnée sans s’arrêter [28, 29, 30]. L’inconvénient majeur de MAXBAND est

que cette stratégie ne s’applique qu’aux situations sous-saturées.

TRANSYT : C’est l’un des logiciels les plus connus et utilisés qui permettent de pré-

parer les plans de feux fixes. Initialement développé par Transport Research Laboratory

[31], TRANSYT est un programme qui permet de fournir un plan optimal du point de vue

des durées des feux verts et de leurs décalages. Il sert souvent de stratégie de référence

pour évaluer la qualité de la commande des feux dans un réseau urbain. Durant la der-

nière décennie, TRANSYT a été substantiellement étendu et amélioré en de nombreuses

versions. En particulier, TRANSYT-7F développé et maintenu par l’University of Florida

est l’une des versions les plus importantes, qui s’appelle aussi la version des États-Unis

[32].

Page 35: Concepts thermodynamiques et d'entropie pour la

1.3 Régulation des feux de signalisation 17

FIGURE 1.7 – Bande passante maximale d’une artère [1]

TRANSYT utilise un modèle déterministe de trafic tenant compte du phénomène de

dispersion des pelotons de véhicules, et minimise un critère qui est fonction du temps

moyen perdu des véhicules et du nombre moyen d’arrêt (TRANSYT-7F utilise un algo-

rithme génétique) [33].

1.3.3.2 Stratégies adaptatives

Dans ce mode de régulation, la recherche actuelle s’est orientée vers la réalisation des

systèmes de régulation qui tiennent compte de l’évolution du trafic au cours du temps et

qui réagissent en temps réel. Selon [34], un système de contrôle en temps réel du trafic

doit répondre aux exigences suivantes :

– la stratégie doit répondre réellement à la demande actuelle et non pas à une demande

prédite ou historique.

– la stratégie ne doit pas être réduite à intervenir sur des périodes de contrôle fixées

arbitrairement.

Cette analyse est rendue possible grâce aux différents capteurs mis en place : des boucles

noyées dans la chaussée, radar etc. La mise en service d’une régulation aux feux d’un

réseau répond le plus souvent aux objectifs suivants : rendre crédible la signalisation

tricolore, assurer le confort de l’usager en minimisant son temps d’attente, diminuer le

nombre d’arrêts de véhicules et surtout minimiser la longueur des files d’attente.

Page 36: Concepts thermodynamiques et d'entropie pour la

18 Chap 1. Généralités

Du fait de la nécessité de coordination des différents carrefours, la commande en

temps réel d’un réseau d’intersections est un problème bien complexe. Les premiers sys-

tèmes de commande en boucle fermée d’un réseau sont apparus au début des années 60

et sont directement dérivés des méthodes fixes. Dans ces systèmes, une bibliothèque de

plans de feux est calculée hors ligne et appliquée ensuite, non plus sur la base de la période

de la journée, mais en fonction des débits et taux d’occupation mesurés par des capteurs.

Leur problème majeur est lié au vieillissement des plans. Ils doivent remettre à jour la

bibliothèque de manière à contenir des plans correspondants au mieux aux conditions

réelles.

Plus tard, on a vu ensuite apparaître une seconde génération de systèmes de commande

qui cherchent à recalculer, en ligne et à partir des informations collectées sur le réseau,

tous les paramètres des feux de signalisation. C’est dans cet esprit que plusieurs types de

systèmes ont été élaborés pour ce mode de régulation. Les plus connus sont :

SCATS : Sydney Coordinated Adaptative Traffic system : Ce système a été déve-

loppé dans les années 70s [35]. Il est mis en place dans plusieurs villes en Australie. En

1995, plus de 2500 carrefours de Sydney étaient commandés par SCATS. Le rôle essentiel

de ce système est la reconstitution en temps réel des plans de feux fixes disponibles dans

une base de données. Il comporte une architecture hiérarchisée en trois niveaux :

– Les contrôleurs de carrefours ont pour objectif de mettre en forme les signaux issus

des boucles électromagnétiques placées en ligne de feu pour les communiquer à

l’ordinateur régional dont ils dépendent.

– Les postes régionaux sont chargés de recalculer périodiquement, à partir des me-

sures transmises par les contrôleurs de carrefours, le plan de feux à appliquer.

– Le poste central de surveillance a pour but la visualisation en temps réel de l’état

du système ainsi que des éventuels problèmes détectés.

L’inconvénient majeur est que SCATS utilise des algorithmes de choix de stratégies

parmi une série de plans pré-calculés et non une procédure réelle d’optimisation de la

commande basée sur l’emploi d’un modèle de trafic.

SCOOT : Split Cycle and Offset Optimisation Technique : Ce système a été déve-

loppé en 1981 par le Traffic and Road Research Laboratory TRRL en Grande Bretagne.

Page 37: Concepts thermodynamiques et d'entropie pour la

1.3 Régulation des feux de signalisation 19

Ce système se base initialement sur un plan de feux fixes issu du système TRANSYT

avec un algorithme d’optimisation fourni pour l’application en ligne [36, 37, 38].

Le principe général de SCOOT est d’ajuster par petits incréments successifs les para-

mètres des plans de feux de manière à répondre au mieux à la situation de trafic actuelle.

Le réseau de carrefours commandé par SCOOT est subdivisé en plusieurs zones. Les

carrefours d’une même zone opèrent avec la même durée de cycle. Cette méthode ne né-

cessite qu’un capteur par voie pour mesurer le débit et l’occupation de la boucle. A partir

de l’enregistrement du profil de la demande, et grâce au modèle de TRANSYT, SCOOT

prédit l’évolution de la longueur de file d’attente. Un critère est alors créé pour l’optimi-

sation à partir de la somme des valeurs moyennes des files d’attente ainsi que le nombre

total d’arrêts de la région régulée.

L’optimisation de SCOOT considère trois types de réglages :

– Répartition des temps verts : Au niveau de chaque carrefour, cette méthode dé-

cide, peu avant le changement de phase, si la durée de ce changement doit être

maintenue, avancée ou reculée, afin de minimiser le degré de saturation des tron-

çons entrants.

– Décalages : Une fois par cycle et pour chaque carrefour, les décalages entre car-

refours sont légèrement modifiés pour améliorer la somme des performances des

carrefours adjacents.

– Durée de cycle : Périodiquement et pour certains cycles, SCOOT modifie la durée

du cycle de quelques secondes, afin que le degré de saturation du chaînon le plus

chargé se rapproche de 90%.

SCOOT conduit à une réduction de 12% du temps moyen perdu par rapport à une

méthode basée sur des changements de plans de feux fixes [39]. Cependant, à cause du

manque de coordination entre les différentes zones gérées par SCOOT, il s’avère souvent

difficile de partager un réseau en différentes zones. De plus, les performances de SCOOT

se détériorent en situations saturées.

OPAC : Optimization Policies for Adaptative Control : OPAC a été développé par

[40]. Il s’agit d’une stratégie de commande des feux en temps réel adaptée à la demande

en utilisant l’optimisation par la programmation dynamique (DP). OPAC utilise un niveau

de contrôle locale pour minimiser le délai total de chaque intersection et ensuite une

synchronisation pour le réseau global [41].

Page 38: Concepts thermodynamiques et d'entropie pour la

20 Chap 1. Généralités

Bien qu’OPAC fonctionne acycliquement dans le niveau local, il utilise des cycles

virtuels pour maintenir la synchronisation du réseau au niveau global. La longueur du

cycle virtuel varie selon les besoins d’une intersection ou d’une majorité des intersections.

Il faut noter qu’OPAC souffre d’une exigence informatique énorme. La mise en œuvre

en temps réel de la stratégie OPAC est toujours limitée aux intersections isolées en raison

de la complexité de calcul pour un réseau.

Régulation "stocker-et-transférer" : Le principe "stocker-et-transférer" ("store and

forward" en anglais) a été initialement proposé par Gazis et Potts [42, 43] en 1963. Ré-

cemment, ce principe est apparu séduisant car il permet de réguler un réseau d’inter-

sections à l’échelle d’une ville. L’idée principale est d’introduire une simplification du

modèle qui permet la description mathématique du processus de flux de trafic sans l’utili-

sation de variables discrètes. Cette dernière est d’une importance capitale, car elle ouvre

la voie à l’application des méthodes d’optimisation et de contrôle très efficaces (tels que

la programmation linéaire, la programmation quadratique, etc) avec une complexité po-

lynomiale, ce qui, à son tour, permet la régulation coordonnée du réseau à grande échelle

en temps réel, même dans les situations saturées.

Selon le fonctionnement réel des flux de trafic et des feux de signalisation, le flux

quittant une voie est positif seulement si cette voie a le feu vert, ce qui signifie que le

flux présente des interruptions dans un cycle. Le modèle "stocker-et-transférer" ignore

ces interruptions et considère le flux comme un processus continu (voir Figure 1.8). Ceci

revient théoriquement à supposer que :

η =g

cs (1.7)

où s est le débit de saturation, g est le temps vert, c est le cycle, η est le débit moyen. Les

conséquences de la simplification sont [44] :

– la discrétisation temporelle ne peut pas être inférieure à la durée d’un cycle, ce qui

limite l’observation de phénomènes locaux ;

– les oscillations des files d’attente en fonction des changements de phases ne peuvent

pas être décrites dans ce modèle ;

– la régulation dans cette approche ne peut pas contrôler les décalages entre carrefours

adjacents.

Grâce à cette simplification, quelques stratégies ont été développées ces dernières

années [45, 46, 47, 48, 49, 50, 51, 52]. En particulier, TUC (Traffic-responsive Urban

Page 39: Concepts thermodynamiques et d'entropie pour la

1.4 Conclusion et objectif de la thèse 21

Débit

Flux réel

Flux moyen

FIGURE 1.8 – Simplification du modèle "stocker-et-transférer"

Control), initialement développé pour le projet TABASCO d’European Telematics Ap-

plications [8], a été appliqué en Angleterre, en Grèce et en Allemagne [53] donnant des

résultats satisfaisants quand le trafic est fluide.

1.4 Conclusion et objectif de la thèse

Compte tenu de la complexité de l’implémentation des systèmes de régulation du

trafic, il n’existe pas de méthode parfaite pour contrôler le flux dans une intersection

routière. L’adéquation d’une méthode est très liée aux conditions du trafic (fluide, dense

et saturé, etc...). Les recherches qui ont été menées sur la régulation du trafic ont permis

de développer plusieurs stratégies de régulation. Toutefois, la plupart d’entre elles sont

destinées, de manière exclusive, aux méthodes d’optimisation en ligne pour minimiser

un critère formulé à partir d’un comportement idéal souhaité. La minimisation du critère

permet de déterminer la commande à appliquer pour mieux réaliser les objectifs de la

commande. Cependant, et indépendamment d’une quelconque comparaison, ces travaux

souffrent de trois inconvénients majeurs suivants :

– La faisabilité en temps réel de la commande.

– La robustesse vis-à-vis des perturbations qui sont inhérentes aux systèmes de trans-

port.

– La non prise en compte des changements brusques des flux.

Ce constat milite donc pour une résolution des problèmes de régulation des carrefours,

faisant d’avantage appel à des méthodes nouvelles.

Page 40: Concepts thermodynamiques et d'entropie pour la

22 Chap 1. Généralités

Objectifs de la thèse : Dans le cadre de notre travail, nous adoptons une stratégie diffé-

rente pour résoudre le problème de la modélisation et la régulation du trafic urbain par les

feux de signalisation. De point de vue de la modélisation, nous introduisons un nouveau

regard sur les systèmes de transport en proposant un premier travail sur la manière dont

les liens se tissent entre ces systèmes et la thermodynamique. Le point de vue dominant

est la considération des véhicules comme étant l’énergie fournie ou/et échangée entre les

intersections signalisées. Contrairement aux approches existantes, le modèle développé

se base sur la notion d’énergie au lieu du débit.

De point de vue de la régulation, nous nous intéressons essentiellement à un travail

en amont permettant d’éviter la congestion en forçant les files d’attente à ne pas dépasser

le niveau de trafic correspondant à l’optimum opérationnel des lignes. Pour ce faire, deux

approches sont utilisées, la théorie des systèmes dissipatifs et la synthèse H∞.

L’idée qui a guidé notre choix a été d’appliquer des techniques et des formulations qui

ont prouvé une efficacité certaine dans des applications industrielles. Elles mettent en jeu

des grandeurs et des caractéristiques concrètes qui s’interprètent clairement comme une

interconnexion entre le système et son environnement. En outre, elles se conforment le

plus aux objectifs fixés pour notre investigation, à savoir, l’obtention de commandes pour

la régulation du réseau des carrefours permettant :

– la faisabilité en temps réel ;

– une flexibilité dans son utilisation ;

– une prise en compte des perturbations instantanées affectant le système.

Page 41: Concepts thermodynamiques et d'entropie pour la

CHAPITRE 2

MODÉLISATION

THERMODYNAMIQUE DES

RÉSEAUX DE TRANSPORT

2.1 Introduction

La complexité sans cesse croissante des systèmes de grande dimension, tels que les

réseaux de transport, a engendré un besoin grandissant d’outils et de méthodes pour la

modélisation et l’évaluation des performances de tels systèmes. Cette situation a motivé

de nombreux chercheurs à développer différentes techniques pour la modélisation des

systèmes de transport en fonction de la complexité du problème.

Les approches largement utilisées dans la modélisation des systèmes de transport sont

la théorie de files d’attente, l’approche de la mécanique des fluides, les automates cellu-

laires, les réseaux de Petri etc. Ces méthodes ont été mises au point au cours des dernières

décennies et ont été appliquées dans de nombreuses stratégies de contrôle de la signali-

sation routière. Cependant, bien que ces approches soient efficaces pour la modélisation

du trafic, elles sont souvent confrontées à la complexité du modèle obtenu. En effet, si le

réseau routier étudié est de grande taille, l’utilisation de ces méthodes devient rapidement

problématique et très coûteuse en terme de temps de calcul.

Page 42: Concepts thermodynamiques et d'entropie pour la

24 Chap 2. Modélisation thermodynamique des réseaux de transport

Dans ce chapitre, nous proposons une nouvelle approche pour la modélisation d’un

réseau de transport signalisé, qui, à notre connaissance, n’a pas encore été explorée. Nous

nous intéressons tout particulièrement au lien existant entre les systèmes de transport et les

systèmes thermodynamiques. En effet, en considérant les véhicules comme étant l’énergie

fournie au réseau de transport, nous pouvons considérer le réseau d’intersections comme

étant un système thermodynamique où il y a des échanges ou transferts de l’énergie (vé-

hicules) entre les sous-systèmes (intersections signalisées) qui transitent entre différents

états : stable (non congestionné), instable (congestionné) et en équilibre (fluide). Nous

pouvons ainsi, comme dans le cas thermodynamique, produire une régulation de la circu-

lation à partir d’énergie sous forme d’information (travail).

L’étude basée sur des concepts thermodynamiques permet d’ouvrir une nouvelle pers-

pective sur la dynamique et la gestion de flux de véhicules. En effet, l’approche énergé-

tique permet d’une part de modéliser les interactions entre différentes intersections rou-

tières et d’autre part, d’analyser l’énergie interne (véhicules) du système qui est l’un des

facteurs qui détermine l’état du trafic. De plus, elle permet d’étudier le problème de la

gestion dynamique basée sur un modèle de trafic qui a fait ses preuves en thermodyna-

mique.

Ce chapitre est organisé de la manière suivante : la première partie présente une brève

introduction aux systèmes thermodynamiques. La deuxième partie porte sur le lien étroit

qui existe entre les systèmes de transport et les systèmes thermodynamiques. Nous mon-

trons dans un premier temps, que certains concepts thermodynamiques tels que la tem-

pérature, la capacité thermique, l’équilibre thermique, trouvent leurs similitudes dans le

cadre des systèmes de transport. Ensuite, nous présentons la notion d’entropie du réseau

de transport qui sert à mesurer le degré de désordre d’un système. Ce concept d’entro-

pie représente le visage thermodynamique de notre système et prend source et forme à

partir de l’énergie (véhicules) échangée ou transférée entre les sous-systèmes. Avec cette

fonction, nous pouvons définir le sens de l’évolution du trafic. En effet, plus l’entropie

est grande plus le système est désordonné. Elle peut donc être considérée non seulement

comme un très bon moyen d’évaluer les performances du réseau de transport mais aussi,

comme une source d’information pour remettre de l’ordre dans le système.

Page 43: Concepts thermodynamiques et d'entropie pour la

2.2 Quelques notions sur les systèmes thermodynamiques 25

2.2 Quelques notions sur les systèmes thermodynamiques

La thermodynamique est une branche de la physique qui étudie la science des échanges

d’énergie entre les systèmes, ou entre les systèmes et le milieu extérieur, lors de transfor-

mations de la matière. Ses applications sont nombreuses car l’énergie est un concept qui

s’applique dans tous les domaines. On l’utilise autant en physique qu’en chimie ou en

biologie, en s’appuyant notamment sur des outils mathématiques. Elle nous permet de

comprendre et de prévoir les variations d’énergie entre différents systèmes en interaction

grâce à des principes fondamentaux. Pour mieux utiliser les principes thermodynamiques

dans le contexte du transport, cette section est consacrée à l’introduction de quelques

notions thermodynamiques importantes.

2.2.1 Le système, la chaleur et la température

La résolution de tout problème thermodynamique commencera par la définition pré-

cise du système à étudier. Ceci nécessite de définir une frontière qui partage l’univers en

deux : le système d’une part, et le milieu extérieur (ou environnement) d’autre part. Par

conséquent, un système thermodynamique est défini comme un corps ou un ensemble

de corps délimité par une frontière matérielle ou fictive qui le sépare du milieu extérieur.

Les échanges d’énergie se font au travers cette frontière (surface délimitant le système).

Le système thermodynamique est la portion de l’univers qu’on choisit d’étudier, il peut

s’agir de n’importe quel objet, n’importe quel espace. Par exemple, imaginez une casse-

role sur le feu. Cette casserole, correspondant à notre système, reçoit de l’énergie de l’air

au-dessus de la bougie, donc sa température à l’intérieur augmente. Nous pouvons étudier

la variation de température de cette casserole, ainsi que la variation de pression, de quan-

tité de matière, de volume, d’entropie, etc., au cours du temps. Ces données mesurables

sont appelées "variables d’état", elles définissent l’état du système.

De plus, en thermodynamique nous pouvons également étudier l’interaction entre

deux systèmes ou plus. Par exemple, si deux enceintes sont accolées l’une à l’autre, de

différentes températures à un instant, et que le transfert de chaleur est possible, alors au

cours du temps, ces deux enceintes vont progressivement faire en sorte d’avoir la même

température.

On appelle transformation la succession temporelle d’états qu’un système parcourt

entre un état initial et un état final. Lors d’une transformation, l’état du système considéré

Page 44: Concepts thermodynamiques et d'entropie pour la

26 Chap 2. Modélisation thermodynamique des réseaux de transport

évolue car des échanges ont lieu, dans ce système s’il est composite et/ou entre ce système

et le milieu extérieur. L’énergie qui s’échange au cours de la transformation des systèmes

peut être sous deux formes :

1. l’énergie calorifique qui fait intervenir la chaleur ;

2. l’énergie mécanique qui prise au sens large, incluant toutes les autres formes d’éner-

gie connues, notamment le travail mécanique.

Dans ce chapitre, nous nous intéressons plus particulièrement à la chaleur. Générale-

ment, l’échange de chaleur est la conséquence d’une différence de température (des corps

chauds vers les corps froids). Les notions de chaleur et de température sont les plus fon-

damentales de la thermodynamique. En effet, on peut définir la thermodynamique comme

la science de tous les phénomènes qui dépendent de la température et de ses changements.

Chaleur et température

La définition précise de la température est difficile. Chacun a une connaissance in-

tuitive de la notion de température. Un corps est chaud ou froid, selon que sa température

est plus ou moins élevée. En effet, il existe plusieurs échelles de température : les de-

grés Celsius (°C), les degrés Fahrenheit (°F), etc. Si on prend le 0 °C, cette valeur ne fait

qu’indiquer le passage de l’eau de l’état liquide à l’état solide (c’est-à-dire que de l’eau

liquide va se transformer en glace). L’un des grands succès de la thermodynamique clas-

sique au dix neuvième siècle, est d’avoir donné une définition de la température absolue

d’un corps, qui a mené à la création de l’échelle kelvin. Celle-ci donne la température

minimale pour tous les corps : zéro kelvin, soit -273,15 °C. Il s’agit du zéro absolu, dont

le concept apparaît pour la première fois en 1702 avec le physicien français Guillaume

Amontons.

De l’autre côté, la chaleur est un transfert d’énergie qui ne découle pas du déplace-

ment du point d’application d’une force. Généralement, on considère que la chaleur est

également une énergie, ou précisément une forme d’énergie qu’on appelle alors "énergie

thermique". Un corps n’a pas une quantité de chaleur déterminée (contrairement à la tem-

pérature). Il perd ou gagne de la chaleur en fonction des corps avec lesquels il entre en

contact et en fonction du type d’expérience menée (on dira plutôt "transformation").

En général, si un système gagne de la chaleur du milieu extérieur, sa température aug-

mente, et la quantité de chaleur absorbée est proportionnelle à la variation de température,

Page 45: Concepts thermodynamiques et d'entropie pour la

2.2 Quelques notions sur les systèmes thermodynamiques 27

i.e.

∆T = E∗ ×Q

où ∆T est l’augmentation de température, Q est la quantité de chaleur que le système

gagne, et le coefficient E∗ s’appelle la capacité thermique qui dépend de la nature du

système.

2.2.2 Premier principe de la thermodynamique

Les transformations réelles sont généralement complexes, mais elles doivent respecter

quelque principes. En particulier, le premier principe de la thermodynamique, qui a été

énoncé pour la première fois par le médecin et physicien allemand Robert Von Mayer en

1845, traduit la conservation de l’énergie. Ce principe postule qu’il existe une fonction

des variables d’état, appelée énergie totale, qui est toujours conservée : sa variation est

égale à l’énergie reçue par le système du milieu extérieur, sous forme de travail et de

chaleur.

Plus précisément, pour tout système thermodynamique, on peut définir une fonction

U , appelée énergie interne définie à une constante près. Lors d’une transformation quel-

conque, la variation de l’énergie d’un système peut s’exprimer selon la relation suivante :

∆U = W +Q

où W est la partie de l’énergie qui correspond au travail échangé avec le milieu extérieur

et Q est la quantité d’énergie transférée par chaleur. En clair, pour que l’énergie d’un

système varie, il faut qu’il y ait un échange d’énergie entre celui-ci et le milieu extérieur.

Si le système ne fournit aucun travail avec le milieu extérieur, le premier principe peut

s’écrire :

∆U = Q

Le premier principe de la thermodynamique est aussi une loi générale pour toutes

les théories physiques (mécanique, électromagnétisme, physique nucléaire,...) On ne lui

a jamais trouvé la moindre exception, bien qu’il y ait eu des doutes parfois, notamment à

propos des désintégrations radioactives.

Page 46: Concepts thermodynamiques et d'entropie pour la

28 Chap 2. Modélisation thermodynamique des réseaux de transport

2.2.3 Deuxième principe : notions d’entropie et disentropie

Le premier principe indique que l’énergie totale est toujours conservée, elle ne peut

pas être créée ou détruite. Pourtant, ce principe ne précise en rien la possibilité et la di-

rection de la transformation de l’énergie. Le premier principe de la thermodynamique est

insuffisant pour décrire les transformations réelles. Il est nécessaire de prendre en compte

le sens de l’évolution et les irréversibilités. Par exemple, dans la réalité, la transmission

de chaleur entre les corps se fait toujours du corps chaud vers le corps froid. La transfor-

mation inverse est impossible sans l’apport d’énergie.

Le deuxième principe de la thermodynamique (également connu sous le nom de la

deuxième loi de la thermodynamique ou principe de Carnot) établit l’irréversibilité des

phénomènes physiques, en particulier lors des échanges thermiques. C’est un principe

d’évolution qui fut annoncé pour la première fois par Sadi Carnot en 1824. Il a depuis fait

l’objet de nombreuses généralisations et formulations successives.

En particulier, en 1865, Rudolf Clausius introduisit l’entropie dans le cadre du deuxième

principe de la thermodynamique. Etymologiquement parlant, l’entropie est synonyme de

transformation (du grec "entropê" signifiant "cause d’évolution" ou "action de se retour-

ner"). L’entropie d’un système est une fonction d’état. Elle peut être interprétée comme

la mesure du degré de désordre d’un système au niveau microscopique. Le deuxième

principe déclare que toute transformation d’un système thermodynamique s’effectue avec

augmentation de l’entropie globale incluant l’entropie du système et du milieu extérieur.

On dit alors qu’il y a création d’entropie. Il est associé à l’impossibilité du passage du

désordre à l’ordre sans intervention extérieure.

Soit ψ l’entropie d’un système thermodynamique. Sa variation, lors d’une transforma-

tion quelconque, peut être décrite comme la somme d’un terme d’échange et d’un terme

de création :

dψ = ψéchange + ψcréation

où ψéchange correspond à l’entropie échangée par le système avec le milieu extérieur, et

ψcréation est l’entropie que le système lui-même crée lors de la transformation. Clausius

a montré que

ψéchange =

∫dQ

T a

où dQ est la quantité de chaleur que le système gagne à un point de la frontière entre

le système et le milieu extérieur, et T a est la température absolue à ce point. D’un autre

Page 47: Concepts thermodynamiques et d'entropie pour la

2.3 Sur la représentation mathématique des systèmes thermodynamiques 29

côté, l’entropie de création, toujours positif ou nul, impose le sens de l’évolution de la

transformation

ψcréation ≥ 0

Donc, on a

dψ ≥∫dQ

T a(2.1)

L’expression ainsi obtenue a été formulée par Clausius. On l’appelle encore inégalité deClausius. C’est une autre façon d’exprimer le second principe.

Une autre notion, directement liée à l’entropie, est son contraire la disentropie (en-

tropie négative ou force de cohésion qui s’oppose à la tendance naturelle à la désorga-

nisation des systèmes). La disentropie (non-entropie) trouve son origine dans les travaux

du physicien autrichien Erwin Schrödinger en 1944, est développée par les américains

Claude Shannon et Warren Weaver en 1948, puis par le français Léon Brillouin en 1956.

A l’inverse de l’entropie qui a une tendance naturelle à la désorganisation, la disentropie

peut-être assimilée comme une entropie à croissance négative ou une croissance disentro-

pique positive. La disentropie est considérée en physique des systèmes comme un facteur

d’organisation.

Ainsi, le deuxième principe de la thermodynamique peut aussi être représenté par une

inégalité faisant intervenir la disentropie

dφ ≤∫dQ× T a (2.2)

où φ est la disentropie du système. Cette expression s’appelle l’inégalité inverse Clausius.

Contrairement à l’énergie, l’entropie et la disentropie sont deux notions non conserva-

tives. Particulièrement dans un système isolé, l’énergie totale est toujours constante, mais

l’entropie tend à augmenter, tandis que la disentropie a tendance à diminuer. Ces deux

notions jouent un rôle très important pour évaluer les performances d’un système.

2.3 Sur la représentation mathématique des systèmes ther-

modynamiques

La représentation mathématique des systèmes thermodynamiques a été largement dé-

veloppée par de nombreuses approches. En 2005 Haddad a proposé une représentation

discrète basée sur les systèmes compartimentaux [54]. C’est ce modèle qu’on propose

Page 48: Concepts thermodynamiques et d'entropie pour la

30 Chap 2. Modélisation thermodynamique des réseaux de transport

d’exploiter par la suite afin d’introduire la démarche thermodynamique présentée dans ce

chapitre.

Les modèles compartimentaux permettent d’étudier l’évolution au cours du temps

de quantités de substance au travers de blocs homogènes nommés compartiments, et ils

représentent le comportement du système à l’étude au moyen d’équations relatives aux

propriétés de ces compartiments. Ainsi, les variables d’état peuvent par exemple repré-

senter les tailles des compartiments ou les paramètres et les taux de transfert de substance

entre ces compartiments (l’énergie dans le cas des les systèmes thermodynamiques). Dans

un modèle compartimental, il est essentiel de faire l’hypothèse d’homogénéité dans les

compartiments ; c’est à dire que la matière dans un compartiment ne présente pas de

différence, et que toute unité de matière qui entre dans un compartiment se mélange ins-

tantanément au contenu du compartiment.

Un système thermodynamique peux être graphiquement représenté par un ensemble

de n boîtes (sous-systèmes), chacune étant un compartiment du modèle, et un système

d’arcs orientés reliant les compartiments (voir Figure 2.1). Chaque compartiment du ré-

seau représente un dispositif de stockage qui contient une quantité variable d’une espèce

matérielle ou immatérielle déterminée (masse, énergie, information...).

FIGURE 2.1 – Système thermodynamique

Page 49: Concepts thermodynamiques et d'entropie pour la

2.3 Sur la représentation mathématique des systèmes thermodynamiques 31

Soient Ei l’énergie stockée dans le sous-système Ψi, i ∈ 1, · · · , n et E∗i > 0 sa

capacité thermique. Alors la température du compartiment Ψi est donnée par :

Ti = Ei/E∗i , i ∈ 1, · · · , n (2.3)

Dans les systèmes thermodynamiques, il y a des échanges ou transferts d’énergie entre

les sous-systèmes. Ils peuvent se faire soit par des transports physiques d’une localisation

à l’autre, soit par des réactions chimiques. Les échanges d’énergie entre les sous-systèmes

sont symbolisées par σei,j , i 6= j (resp, σej,i) qui représente le flux d’énergie entrant à

l’instant k dans le compartiment i (resp, j) depuis le compartiment j (resp, i). Par ailleurs,

des arcs d’entrée et de sortie supplémentaires représentent les interactions du réseau avec

son environnement : soit des flux d’entrée notés rei injectés de l’extérieur dans le sous-

système i, soit des flux de sortie dei soutirés du sous-système i vers l’extérieur.

Un système thermodynamique est généralement caractérisé par des équations ma-

thématiques qui décrivent l’évolution au cours du temps des variables d’état du modèle

que sont les énergie stockées dans chaque sous-système. L’écriture de ces équations re-

pose sur le principe de conservation de la masse. Appliqué au sous-système i à l’ins-

tant k, ce principe traduit le fait que pendant l’intervalle de temps [k, k + 1] la variation

∆Ei(k) = Ei(k+ 1)−Ei(k) de la quantité d’énergie présente dans le sous-système i est

égale à la différence entre les sommes des flux entrants et sortants.

Plus précisément, si l’on considère le i-ème sous-système Ψi, l’équation régissant son

évolution au cours du temps s’écrit de la manière suivante :

∆Ei(k) = Ei(k+1)−Ei(k) =n∑

j=1,j 6=i

(σei,j(k)−σej,i(k)

)+rei (k)−dei (k), k ∈ N (2.4)

Notons tout de suite que dans cette équation, seuls sont explicités les termes correspondant

à des liens effectifs du système. En d’autres termes, les σei,j , rei et dei correspondant à des

liens inexistants n’apparaissent pas dans les équations.

Si l’on considère maintenant les n sous-systèmes, l’équation (2.4) peut s’écrire sous

la forme matricielle suivante :

E(k + 1) = E(k) + le(k) + re(k)− de(k) (2.5)

où E(k) = [E1(k), · · · , En(k)]T est le vecteur d’état du système à l’instant k, re =

[re1, · · · , ren]T est le vecteur des flux d’entrée, de = [de1, · · · , den]T est le vecteur des flux de

Page 50: Concepts thermodynamiques et d'entropie pour la

32 Chap 2. Modélisation thermodynamique des réseaux de transport

sortie et le = [le1, · · · , len]T représente tous les échanges d’énergie entre les sous-systèmes,

c’est à dire :

lei =n∑

j=1,j 6=i

(σei,j − σej,i), i ∈ 1, · · · , n (2.6)

2.3.1 Formulation de l’entropie

Pour formuler l’entropie, Haddad [54] a présenté la version discrète suivante de l’in-

égalité de Clausius pour le système (2.5)

ψ(E(k + 1)) ≥ ψ(E(k)) +n∑i=1

Qi(k)

T ai (k + 1),∀k ∈ N (2.7)

où ψ(E) est l’entropie du système thermodynamique, T ai (k+1) est la température absolue

du i-ème sous-système à l’instant k+ 1 et Qi(k) est l’énergie échangée par le i-ème sous-

système avec le milieu extérieur :

Qi(k) = rei (k)− dei (k), i ∈ 1, · · · , n

En se basant sur cette inégalité, Haddad a formulé l’entropie du système comme suit :

ψ(E) , E∗T ln(τε+ PeE)− εTE∗ ln τ (2.8)

où ln(x) = [ln(x1), · · · , ln(xn)]T , E∗ = [E∗1 , · · · , E∗n]T , ε = [1, 1 · · · , 1]T , τ est un

scalaire positif tel que T ai = τ + Ti, i ∈ 1, · · · , n, Ti est la température du système

donnée par l’équation (2.3) et Pe est une matrice diagonale dont les éléments diagonaux

sont 1/E∗i .

Notons tout de suite que la formulation de l’entropie (2.8) est identique avec celle

de Boltzmann en physique statistique. En effet, on sait que si le i-ième sous-système

thermodynamique est sans transition de phases, son entropie à des température absolues

différentes (T a1 , T a2 ) est donnée par [55] :

ψi(E1)− ψi(E2) = E∗i lnT a1T a2, (2.9)

Or T ai = τ + Ti et Ti = Ei

E∗i, il vient aussitôt que :

ψi(E1)− ψi(E2) = E∗i lnτ + E1

E∗i

τ + E2

E∗i

, ∀i ∈ 1, · · · , n (2.10)

Page 51: Concepts thermodynamiques et d'entropie pour la

2.3 Sur la représentation mathématique des systèmes thermodynamiques 33

Si maintenant T2 = 0 alors E2 = 0. Ainsi, l’équation (2.10) devient :

ψi(E1) = ψi(0) + E∗i lnτ + E1

E∗i

τ

= ψi(0) + E∗i ln(τ +E1

E∗i)− E∗i ln τ (2.11)

Par ailleurs, on sait que (théorème de Nernst) :

ψi(0) = limEi→0

ψi(Ei) = 0 (2.12)

Par conséquent, l’équation (2.11) devient :

ψi(E1) = E∗i ln(τ +E1

E∗i)− E∗i ln τ (2.13)

Ainsi, l’entropie du système global est donc donnée par :

ψ(E) =n∑i=1

E∗i ln(τ +EiE∗i

)− E∗i ln τ (2.14)

ce qui est exactement la formulation de Haddad (2.8).

Remarque 2.1 Pour un système isolé, i.,e, Qi(k) = 0,∀i ∈ 1, · · · , n, l’inégalité (2.7)

montre que ψ(E(k+ 1)) ≥ ψ(E(k)). Ceci montre que l’entropie définie par (2.8) est une

fonction croissante pour un système isolé. Ce qui traduit exactement le deuxième principe

de la thermodynamique (l’entropie d’un système isolé ne peut pas diminuer). Néanmoins,

la diminution d’entropie d’un système non isolé est possible si l’augmentation de l’entro-

pie du milieu extérieur fait plus que compenser la diminution d’entropie de ce système.

Le bilan entropique reste alors conforme à la deuxième loi de la thermodynamique et se

traduit par une augmentation globale de l’entropie, assimilée à une création d’entropie qui

est donc la caractéristique de toutes les transformations réelles. I

2.3.2 Formulation de la disentropie

La disentropie a la caractéristique précise d’entraîner un système en désordre vers

un niveau d’auto-organisation. Pour formuler cette fonction, Haddad a présenté dans un

premier temps l’inégalité inverse de Clausius suivante :

φ(E(k + 1))− φ(E(k)) ≤n∑i=0

Qi(k)Ti(k + 1), ∀k ∈ N (2.15)

Page 52: Concepts thermodynamiques et d'entropie pour la

34 Chap 2. Modélisation thermodynamique des réseaux de transport

où φ(E) est la disentropie du système thermodynamique, Qi(k) est l’énergie échangée

par le i-ème sous-système avec le milieu extérieur, Ti(k + 1) est la température absolue

du i-ème sous-système à l’instant k + 1. Ainsi, en se basant sur cette inégalité, Haddad à

formulé la disentropie du système comme suit :

φ(E) ,1

2ETPeE (2.16)

où Pe est une matrice diagonale dont les éléments diagonaux sont 1/E∗i .

Remarque 2.2 Pour un système isolé, i.,e,Qi(k) = 0,∀i ∈ 1, · · · , n, l’inégalité (2.15)

montre que φ(E(k + 1)) ≤ φ(E(k)). Ceci montre que la disentropie est une fonction

décroissante pour un système isolé. Par conséquent, l’entropie augmente si et seulement

si la disentropie diminue. Ceci montre la dualité entre l’entropie (mesure du désordre) et

la disentropie (mesure de l’ordre). I

Dans la section suivante, nous allons voir comment les liens se tissent entre les sys-

tèmes de transport et la thermodynamique. Pour cela, plusieurs paramètres et principes

thermodynamique vont trouvé leurs parallèles dans le cadre des systèmes de transport.

2.4 Modélisation thermodynamique d’un réseau de car-

refours

La mise en place d’un système de feux à un carrefour réalise une séparation dans le

temps de l’admission de différents courants de véhicules. Généralement, pour étudier un

réseau de carrefours routier, on se limite tout d’abord à l’analyse de deux intersections

routière (voir figure 2.2) . L’étude de plusieurs types d’intersections est similaire à ce type

simple de carrefours.

Généralement on associe à chaque carrefour des listes d’entrées et de sorties. Ces

listes sont décrites par des mouvements. Chaque mouvement est défini comme étant un

parcours des véhicules allant d’une entrée vers une sortie. Les courants de véhicules sont

soit directs, soit des courants de tourne-à-gauche ou tourne-à-droite.

Nous allons voir à présent comment les phénomènes observés en thermodynamique

s’apparentent avec ceux du trafic de ces deux intersections. En effet, chaque voie de circu-

lation (tronçon) peut contenir une certaine quantité de véhicules. Ces derniers se déplacent

Page 53: Concepts thermodynamiques et d'entropie pour la

2.4 Modélisation thermodynamique d’un réseau de carrefours 35

FIGURE 2.2 – L’écoulement du trafic des deux intersections

entre les voies ou quittent le tronçon vers l’extérieur. Ainsi, si nous effectuons une projec-

tion de la figure 2.2 sur la figure 2.1, nous pouvons considérer le tronçon i comme étant

un compartiment dont l’énergie stockée est représentée par le nombre des véhicules sur

le tronçon. Ainsi, les véhicules sont équivalents à l’énergie et les tronçons à des compar-

timents dans le contexte thermodynamique.

Ceci fait, nous allons voir dans la suite comment le concept de la température en ther-

modynamiques peut être introduit dans le contexte de transport. Pour ce faire, remarquons

d’abord que chaque tronçon a une longueur fixe. Il s’ensuit que chaque tronçon i admet

une certaine capacité x∗i à contenir les véhicules. Par conséquent, la capacité x∗i s’appa-

rente à la capacité thermique E∗i . Ainsi, si nous définissons le taux d’occupation d’une

voie comme la proportion entre le nombre des véhicules sur le tronçon et sa capacité,

c’est à dire :

fi =xix∗i, i ∈ 1, · · · , n (2.17)

nous pouvons considérer le taux d’occupation de la voie comme étant la température

Ti = Ei/E∗i dans le contexte thermodynamique. En résumé, le tableau 2.1 montre les

correspondances des concepts de base entre les systèmes de transport et les systèmes

thermodynamiques.

Ainsi, la prise en compte de l’ensemble des ces caractéristiques thermodynamiques

du réseau de carrefours justifie le modèle mathématique suivant du i-ième tronçon entre

l’instant k et k + 1 :

xi(k + 1) = xi(k) + li(k) + ri(k)− di(k) (2.18)

Page 54: Concepts thermodynamiques et d'entropie pour la

36 Chap 2. Modélisation thermodynamique des réseaux de transport

TABLE 2.1 – Correspondances des concepts de baseThermodynamique Transport

Energie Véhicules

Sous-système Voie de circulation

Energie stockée dans les sous-systèmes Nombre de véhicules sur le tronçon

Capacité thermique Capacité de la voie

Température Taux d’occupation

– xi le nombre de véhicules dans chaque tronçon i.

– ri le nombre d’entrée de véhicules de l’extérieur dans le tronçon i.

– di le nombre de sortie de véhicules du tronçon i vers l’extérieur.

– li(k)=n∑

j=1,j 6=i

(σi,j(k)− σj,i(k)) les échanges de véhicules entre la voie i et les voies

j.

–n∑

j=1,j 6=i

σi,j , le flux de véhicules entrants dans la voie i depuis les voies j.

–n∑

j=1,j 6=i

σj,i, le flux de véhicules sortants de la voie i vers les voies j.

Il est important de noter que, seuls sont explicités les termes correspondant à des liens

effectifs du système. En d’autres termes, les σi,j correspondant à des liens inexistants

n’apparaissent pas dans les équations. En outre, il est clair que σi,j = 0, dj = 0 si et

seulement si xj = 0. Cette contrainte implique que si le nombre de véhicules du sous-

système j est égale à zéro, alors ce sous-système ne peut pas fournir des véhicules à son

environnement.

Pour un réseau à plusieurs intersections et n tronçons nous avons alors l’équation

d’état du système global :

x(k + 1) = x(k) + l(k) + r(k)− d(k), ∀k ∈ N (2.19)

où x = [x1, · · · , xn]T , l = [l1, · · · , ln]T , r = [r1, · · · , rn]T , d = [d1, · · · , dn]T ,

Dans la suite du chapitre, nous allons voir que les réseaux de carrefours ainsi définis

respectent certains principes thermodynamiques.

Page 55: Concepts thermodynamiques et d'entropie pour la

2.4 Modélisation thermodynamique d’un réseau de carrefours 37

2.4.1 Conservation des véhicules (premier principe)

Une propriété fondamentale de l’énergie est qu’elle se conserve. En effet, la première

loi de la thermodynamique indique que l’énergie ne peut être ni créée ni détruite, elle

peut juste changer de forme ou être transférée [55]. Plus particulièrement, la variation de

l’énergie stockée dans un système thermodynamique est exactement égale à la quantité

d’énergie échangée avec son environnement.

Ce principe est également valable pour le système de transport. En effet, il est clair

que la variation de la quantité de véhicules au sein d’un réseau de transport est exactement

égale aux échanges de trafic avec le milieu extérieur. Ce principe est résumé dans le

théorème suivant.

Théorème 2.1 Soit ε , [1, · · · , 1]T le vecteur dont toutes les composantes sont égales à

1. Définissons :

U , εTx (2.20)

comme le nombre total des véhicules à l’intérieur du réseau de transport à l’instant k.

Soit :

Q , εT (r − d) (2.21)

la quantité de véhicules échangés entre le réseau de transport et le milieu extérieur à

l’instant k. Nous avons alors : ∀k ∈ N

∆U(k) = U(k + 1)− U(k) = Q(k) (2.22)

Preuve: A partir du modèle (2.19), nous avons :

U(k + 1) = εTx(k + 1) = εTx(k) + εT l(k) + εT (r(k)− d(k))

= U(k) + εT l(k) +Q(k)

Il vient alors :

∆U(k)−Q(k) = εT l

Page 56: Concepts thermodynamiques et d'entropie pour la

38 Chap 2. Modélisation thermodynamique des réseaux de transport

D’autre part, remarquons que :

εT l(k) =n∑i=1

li(k) =n∑i=1

( n∑j=1,j 6=i

σi,j(k)−n∑

j=1,j 6=i

σj,i(k))

=n∑i=1

n∑j=1,j 6=i

σi,j(k)−n∑i=1

n∑j=1,j 6=i

σj,i(k)

=n∑i=1

n∑j=1,j 6=i

σi,j(k)−n∑j=1

n∑i=1,i6=j

σj,i(k)

= 0

si bien que ∆U(k) = Q(k), ce qui achève la preuve.

Remarquons que si on définit l’entrée du système comme u(k) = r(k) et la sortie par

y(k) = d(k), il vient à partir de l’équation (2.22) que :

U(k1) = U(k0) +

k1−1∑k=k0

(εTu(k)− εTy(k)

), ∀k1 ∈ N, k1 > k0

ce qui montre que le réseau de transport est conservatif par rapport à la fonction de sto-

ckage U , εTx et la fonction d’approvisionnement Γ(u, y) = εTu(k) − εTy(k). Ceci

implique (voir [56]) que :

0 ≤ Ua(x0) = U(x0) = Ur(x0) <∞ (2.23)

Ua(x0) = supu

k−1∑j=k0

(εTu(j)− εTy(j)

)(2.24)

Ur(x0) = infu

k0−1∑−k

(εTu(k)− εTy(k)

); k ≥ 1− k0 (2.25)

Ua(x0) est la quantité maximale de véhicules stockées qui peut être extraite du réseau de

transport à chaque instant k. Ur(x0) est la quantité minimale de véhicule qui peut être

délivrée au réseau pour le transférer à partir de l’état x(−k) = 0 à l’état x(k0) = x0. Il

en résulte à partir de (2.23) que le réseau de transport est capable de délivrer à l’extérieur

tous les véhicules stockés en son sein et peut stocker tous les véhicules échangés entre ses

sous-systèmes.

Page 57: Concepts thermodynamiques et d'entropie pour la

2.5 Entropie du transport 39

Par ailleurs, si r(k) = 0 il vient à partir de l’équation (2.22) et (2.21) que :

∆U(k) = −εTd ≤ 0

Ceci montre que l’état d’équilibre x = 0 est stable au sens de Lyapunov et U(k) (le

nombre total des véhicules à l’intérieur du réseau de transport) est une fonction de Lya-

punov pour le système.

2.5 Entropie du transport

Si le premier principe est un principe de conservation de l’énergie, le second principe

de la thermodynamique est un principe d’évolution qui introduit la notion d’irréversibilité

des phénomènes physiques et la notion d’entropie. Il dit que l’entropie d’un système isolé

augmente, ou reste constante. Il est associé à l’impossibilité du passage du désordre à

l’ordre sans intervention extérieure.

Le second principe a une origine statistique : à la différence du premier principe, les

lois microscopiques qui gouvernent la matière ne le contiennent qu’implicitement et de

manière statistique. En revanche, il est assez indépendant des caractéristiques mêmes de

ces lois, car il apparaît également si l’on suppose des lois simplistes à petite échelle.

Bien que les systèmes thermodynamiques et les réseaux de transport peuvent être si-

milaires comme nous venons de le voir, le second principe de la thermodynamique n’est

pas applicable dans le contexte du transport. En effet, une des conséquences directe du

deuxième principe de la thermodynamique est que lorsque deux corps dans l’espace mis

en contact sont à des températures différentes, il y a systématiquement transfert de cha-

leur toujours vers le corps froid. Dans le contexte du transport, ce phénomène n’est pas

observable car la propagation des véhicules dans un réseau est déterminée par la volonté

des conducteurs et aucune règle n’existe pour obliger les véhicules de se déplacer seule-

ment des voies les plus chargées vers celles les moins chargées. Par conséquent, nous ne

pouvons pas introduire le concept d’entropie dans le cadre du transport en fonction de

certains principes tel qu’il est défini dans le cadre de la thermodynamique. Néanmoins,

sur la base des similarités des concepts de base, tels que l’énergie et la température, nous

pouvons présenter l’entropie de transport comme une mesure du désordre du système.

Pour ce faire, comparons tout d’abord les notions de l’ordre et du désordre entre les

systèmes thermodynamiques et les réseaux de transport. En effet, dans le contexte ther-

Page 58: Concepts thermodynamiques et d'entropie pour la

40 Chap 2. Modélisation thermodynamique des réseaux de transport

modynamique, un ordre élevé signifie une plus grande capacité de réaliser un travail,

ce qui se traduit par une grande différence de températures entre les sous-systèmes. Par

exemple, dans un système thermodynamique composé de deux sous-systèmes comme le

montre la figure 2.3, si la plupart de l’énergie se concentre sur un seul sous-système pour

générer un gradient de température, l’énergie du sous-système le plus chaud aura le po-

tentiel de se déplacer vers celui le plus froid. Ainsi, la quantité d’énergie potentielle de

la transmission est également déterminée par la différence de température. Ce potentiel

correspond à la capacité du système d’effectuer un travail. Dans ce cas, le système est

dans une organisation élevé. D’autre part, si l’énergie est répartie uniformément dans ces

deux sous-systèmes de sorte qu’ils partagent la même température, il n’y aura pas de

mouvements d’énergie potentielle. Dans ce cas, le système est considéré comme étant

mal organisé.

Ainsi, l’entropie d’un système thermodynamique est maximale quand la température

est identique en tout point. De même, si on verse un liquide colorant dans un verre

d’eau, l’entropie du système coloré sera maximale quand, suite au mélange, la couleur

du contenu sera devenue uniforme.

Gradient de température Équilibre de température

FIGURE 2.3 – L’ordre thermodynamique

Pour les systèmes de transport il en va autrement. En effet, une grande différence

entre les taux d’occupation de deux voies de circulation correspond à un désordre élevé.

Par exemple, pour l’intersection de la figure 2.4, si la plupart des véhicules se concentrent

sur une seule voie, celle-ci sera encombrée et par conséquent susceptible de provoquer

une congestion. Dans ce cas, le système de transport est considéré mal organisé. D’autre

part, si les véhicules sont dispersés d’une manière uniforme, le problème de congestion

disparaît et le système sera mieux organisé. En outre, l’apport d’énergie au système ther-

modynamique apporte plus de capacité à faire un travail, ce qui augmente l’ordre du

système. Cependant, dans le contexte du transport, l’entrée des véhicules par le milieu

extérieur apporte plus de chances de générer des congestions, ce qui diminue l’ordre du

Page 59: Concepts thermodynamiques et d'entropie pour la

2.5 Entropie du transport 41

système. Pour un système thermodynamique isolé sans apport d’énergie, le désordre (en-

tropie) augmente jusqu’à ce que le système atteigne l’équilibre. Au contraire, si, à un

moment donné, le système de transport ne possède pas d’entrée de véhicules, le système

dissipe les véhicules existants, et par conséquent devient mieux organisé.

Congestionné Distribution uniforme

FIGURE 2.4 – L’ordre du transport

En résumé, les notions de l’ordre et du désordre dans les deux systèmes sont oppo-

sées. Ceci signifie que l’ordre thermodynamique (mesuré par la disentropie) correspond

au désordre dans le contexte du transport. En d’autres termes, l’entropie du transportcorrespond à la disentropie thermodynamique. Ce qui nous permet d’écrire :

ψ(x) ,1

2xTPx, Entropie du transport (2.26)

φ(x) , x∗T ln(τε+ Px)− εTx∗ ln τ, Disentropie du transport (2.27)

2.5.1 Justification de l’entropie du transport

La formule de l’entropie du transport a été introduite principalement à partir des

considérations thermodynamiques, mais nous n’avons pas montré sa signification dans

le contexte du transport. Pour ce faire, la figure 2.5 montre le diagramme fondamental

liant le débit à la concentration. Ce diagramme est le plus couramment utilisé dans l’ana-

lyse du transport. Il est déduit à partir d’un modèle pionnier en modélisation du trafic

routier. Il s’agit du modèle développé simultanément par [Lighthill et Whitham, 1955]

ainsi que [Richards, 1956], s’appuyant sur une analogie avec la dynamique des fluides.

Plus communément appelé le modèle LWR.

On constate qu’il existe deux régimes différents :

Page 60: Concepts thermodynamiques et d'entropie pour la

42 Chap 2. Modélisation thermodynamique des réseaux de transport

Traffic DensityTrafficFlow

FIGURE 2.5 – Le diagramme fondamental

– Lorsque le nombre de véhicules (concentration) est suffisamment faible sur la sec-

tion considérée, ces véhicules n’interagissent pas et chacun peut circuler à la vi-

tesse désirée, appelée vitesse libre (prise généralement égale à la vitesse maximale

moyenne νm) ;

– En augmentant le nombre de véhicules dans la voie, les interactions deviennent

plus importantes et se reflètent par une limitation du débit. Dans ce cas, les vitesses

pratiquées diminuent. La vitesse de flot est donc une fonction décroissante de la

concentration ;

– Dans le cas extrême où la voie est saturée et donc la concentration est maximale

ρm, la vitesse et le débit sont nuls ;

A noter que ces observations conduisent la plupart du temps à considérer un diagramme

fondamental décomposé en deux parties distinctes, à savoir le régime fluide et le régime

congestionné. En outre, nous pouvons remarquer que le désordre du réseau est intime-

ment relié au nombre de véhicules sur les voies (plus le nombre de véhicules sur les

voies est grand plus le système est désordonné) puisque la vitesse du flot est une fonction

décroissante de la concentration.

Ceci fait, nous allons voir à présent comment l’entropie (2.26) prend toute sa signifi-

cation dans le domaine du transport en la rattachant au nombre de véhicules sur les voies.

En effet, étant donnés deux états x(k1) et x(k2) du réseau avec k1 < k2, la question fonda-

mentale est : que signifie mathématiquement qu’un état est plus désordonné que l’autre ?

Commençons par un cas intuitif, à savoir x(k2) ≤ x(k1) (c’est-à-dire, xi(k2) ≤xi(k1), i = 1, · · · , n). Alors le nombre de véhicules de chaque voie diminu entre les

instants k1 et k2. Ceci implique une diminution de la densité dans chaque voie et donc

une augmentation de la vitesse des véhicules, ce qui conduit à un ordre élevé du système.

Page 61: Concepts thermodynamiques et d'entropie pour la

2.5 Entropie du transport 43

Ainsi, dans ce cas nous avons ψ(x(k2)) = xT (k2)Px(k2) ≤ ψ(x(k1)) = xT (k1)Px(k1)

car 0 ≤ x(k2) ≤ x(k1). Par conséquent, l’entropie peut être considérée comme une me-

sure de la tendance du système à perdre son désordre.

Dans le cas général, la réponse à la question peut être donnée par la théorie de la ma-

jorisation qui a été introduite par Hardy, Littlewood et Polya [57]. C’est une formalisation

de la notion de la diversité dans les composantes des vecteurs. Au cours des dernières

décennies, cette théorie a trouvé des applications dans plusieurs disciplines comme les

statistiques, la théorie des probabilités, l’économie, la génétique mathématiques, la mé-

canique quantique, l’algèbre linéaire et la géométrie. Pour plus de détails, les lecteurs

peuvent se référer à l’excellent livre sur le sujet de Marshall [58] .

En mathématiques, on désigne par majorisation un certain préordre sur les éléments

de l’espace vectoriel Rn. Pour un vecteur x = (x1, · · · , xn)T ∈ Rn, on note x↓ =

(x[1], · · · , x[n])T le vecteur de Rn qui a les mêmes composantes, mais ordonnées en ordre

décroissant, c’est-à-dire,

x[1] ≥ x[2] ≥ · · · ≥ x[n]

Par exemple, pour x = (2, 5, 1, 9), on a x↓ = (9, 5, 2, 1).

Définition 2.1 Soient x et y deux vecteurs de Rn. On dit que x est faiblement majoré par

y et on note x ≺fm y si :r∑1

x↓[i] ≤r∑1

y↓[i], ∀r = 1, · · · , n (2.28)

c’est-à-dire,

x[1] ≤ y[1]

x[1] + x[2] ≤ y[1] + y[2]

...n∑1

x[i] ≤n∑1

y[i]

Si de plus∑n

1 x[i] =∑n

1 y[i], alors on dit que x est majoré par y et on note x ≺m y. I

Par exemple, nous avons la majorisation de la séquence suivante de vecteurs à n compo-

santes :(1

n, . . . ,

1

n

)≺m

(1

n− 1, . . . ,

1

n− 1, 0

)≺m · · · ≺m

(1

2,1

2, 0, . . . , 0

)≺m (1, 0, . . . , 0)

Page 62: Concepts thermodynamiques et d'entropie pour la

44 Chap 2. Modélisation thermodynamique des réseaux de transport

Il est clair que si x ≤ y, alors x est faiblement majoré par y. Ainsi, la définition 2.1

inclut le cas mentionné plus haut. En plus, la majorisation ne dépend pas de l’ordre des

composantes des deux vecteurs, et ce n’est donc pas une relation d’ordre, malgré son nom

puisque x fm y et y fm x n’implique pas que x = y, mais seulement que x↓ = y↓.

Le concept de la majorisation fournit une procédure de calcul simple et évidente pour

la comparaison de deux vecteurs, mais il offre peu de lumière sur le sens de l’ordre. Une

approche plus pratique est donnée par les matrices dites doublement sous-stochastique et

les fonctions convexes.

Définition 2.2 Une matrice Λ ∈ Rn×n est dite doublement sous-stochastique si :

Λij ≥ 0,n∑j=1

Λij ≤ 1,n∑i=1

Λij ≤ 1

Si de plus∑n

j=1 Λij =∑n

i=1 Λij = 1, Λ est dite doublement stochastique. I

Par exemple, la matrice suivante est doublement sous-stochastique :0 1

214

34

14

015

15

15

tandis que la matrice suivante est doublement stochastique :

0 15

45

25

35

035

15

15

Pour introduire ce que nous allons faire, rappelons tout d’abord la définition des fonc-

tions convexes.

Définition 2.3 Soit C ⊂ Rn un convexe et f : C → R une fonction. On dit que f est

convexe lorsque pour tous x et y ∈ C et tout t ∈ [0, 1], on a

f((1− t)x+ ty

)6 (1− t)f(x) + tf(y)

Dans le travail déjà cité [57], Hardy, Littlewood et Polya ont démontré le résultat

suivant qui donne une caractérisation de la notion de majorisation.

Page 63: Concepts thermodynamiques et d'entropie pour la

2.5 Entropie du transport 45

Lemme 2.1 Soient x ∈ Rn+ et y ∈ Rn

+ deux vecteurs positifs. Alors les trois conditions

suivantes sont équivalentes :

1. x ≺fm y, (x est faiblement majoré par y)

2. il existe une matrice doublement sous-stochastique Λ telle que x = Λy

3. quelle que soit la fonction convexe croissante Θ définie dans R, on a

n∑i=1

Θ(xi) ≤n∑i=1

Θ(yi)

Si de plus x ≺m y (x est majoré par y), alors Λ est une matrice doublement stochastique

et Θ une fonction convexe.

Il vient immédiatement à partir de ce lemme que l’ordre au sens de la majorisation est

maintenant clair. En effet, à partir du point 2 nous pouvons remarquer que chaque compo-

sant xi est une combinaison linéaire de y1, · · · , yn. Ceci implique que le vecteur x est le

résultat d’une moyennisation du vecteur y à l’aide de poids dont la somme est inférieure

à l’unité. En d’autres termes, x est le résultat de la diminution des écarts entre les com-

posantes de y. Cela signifie que toutes les composantes xi sont beaucoup plus proches

que les yi. Par conséquent, les composantes de x sont plus uniformément distribuées que

celles de y.

Le point 3 identifie la classe des fonctions compatibles avec l’ordre au sens de la

majorisation. Cela signifie que si x est faiblement majoré par y, alors l’inégalité associée

à y sera plus grande que l’inégalité associée à x par une classe de fonctions d’évaluation

Θ. Il s’agit de la mesure du degré d’inégalité d’une distribution.

Ceci fait, nous allons montrer maintenant que le concept de la majorisation et l’entro-

pie ψ(x) sont intimement liés, en ce sens que les deux offrent des approches au problème

de la quantification de ce qu’un état du réseau est plus désordonné qu’un autre. En effet,

si nous supposons que pour k2 ≥ k1 l’état du réseau x(k2) est faiblement majoré par l’état

x(k1), l’inégalité (2.28) implique que l’état x(k2) représente un degré de concentration

de véhicules plus faible que celui de l’état x(k1) (moyennisation). En d’autres termes, la

distribution des véhicules de l’état x(k2) est plus uniforme dans le réseau que celle de

x(k1). Par conséquent, le système est plus organisé lorsque l’état x(k2) est atteint, ce qui

conduit à une faible possibilité d’apparition des congestions à l’instant k2. Cela dit, soit

ψi(xi) =x2i

x∗i. Alors ψi(xi) est une fonction convexe et croissante dans l’orthant positif. Il

Page 64: Concepts thermodynamiques et d'entropie pour la

46 Chap 2. Modélisation thermodynamique des réseaux de transport

vient à partir du point 3 du lemme que :

n∑i=1

ψi(xi(k2)) ≤n∑i=1

ψi(xi(k1))

Or,

ψ(x) = xTPx =n∑i=1

x2i

x∗i=

n∑i=1

ψi(xi)

ce qui implique que ψ(x(k2)) ≤ ψ(x(k1)). Nous en déduisons qu’une faible entropie

correspondant à la distribution la plus uniforme des véhicules dans le réseau.

Inversement, si pour k2 ≥ k1 nous avonsψ(x(k2)) ≤ ψ(x(k1)), alors d’après le lemme

x(k2) est faiblement majoré par x(k1). Par conséquent, x(k2) représente une distribution

plus uniforme des véhicules dans le réseau que x(k1). Ainsi, aucune concentration parti-

culière de véhicules n’existe dans un tronçon du réseau à l’instant k2 et par suite, l’ordre

émanant de la distribution x(k2) est plus grand que celui de x(k1).

En conclusion, il devient maintenant clair que l’entropie de transport ψ(x) est une me-

sure appropriée du désordre du système. En effet, une faible entropie de transport (faible

désordre) correspond à une distribution plus uniforme des véhicules dans le réseau. Il

s’ensuit alors une faible concentration de la circulation, et par conséquent (diagramme

fondamental) une augmentation de la vitesse de circulation des véhicules puisque la vi-

tesse est inversement reliée à la concentration et donc une meilleure organisation du réseau

de transport. Ainsi, l’entropie ψ(x) peut donc être considérée non seulement comme un

très bon moyen d’évaluer les performances du réseau de transport mais aussi, une source

d’information pour remettre de l’ordre dans le système.

2.5.2 Equilibre thermique = Equilibre du taux d’occupation

Dans un système thermodynamique isolé, au début de l’expérience l’agitation des

molécules peut-être élevée, l’énergie est intense, mais sans apport extérieur, au bout d’un

certain temps tout finit par se calmer, il n’y a plus d’échanges d’énergie ou de chaleur

et les molécules reviennent au repos. Le système qui tout d’abord était en déséquilibre

finit par s’équilibrer ; la chaleur s’est dissipée, le désordre est total. Le système ne peut

plus entraîner aucun échange d’énergie et ne peut plus engendrer le moindre ordre. Ainsi,

l’entropie (réps, disentropie) d’un système thermodynamique isolé est maximale (réps,

minimale) quand le système est en équilibre thermique.

Page 65: Concepts thermodynamiques et d'entropie pour la

2.5 Entropie du transport 47

Puisque la température s’apparente au taux d’occupation des voies d’un réseau de car-

refours, ce concept d’équilibre thermique peut être facilement introduit dans le contexte

du transport pour désigner l’état lorsque les taux d’occupation de toutes les voies de cir-

culation sont les mêmes. Cet état est appelé l’équilibre du taux d’occupation dans ce

chapitre. Il est désigné par l’expression suivante :

x1

x∗1= · · · = xn

x∗n= fi = constante (2.29)

L’équilibre du taux d’occupation implique qu’aucune concentration particulière de vé-

hicules existe dans un tronçon du réseau, et par conséquent la possibilité d’apparition

d’une congestion est extrêmement faible. En d’autres termes, pour un certain vecteur x,

l’équilibre du taux d’occupation correspond à la meilleure organisation du système. Ainsi,

contrairement aux systèmes thermodynamiques (comme nous l’avons vu precédemment),

pour un réseau de transport isolé, l’entropie ψ qui exprime le désordre (résp, disentropie

φ qui exprime l’ordre) est minimale (réps, maximale) quand le système est en équilibre

du taux d’occupation. Cette observation est démontrée dans le théorème suivant.

Théorème 2.2 Supposons que le réseau de transport soit isolé. Soit alors N le nombre

total des véhicules dans le réseau. Soient ψ et φ l’entropie et la disentropie du système

réspectivement. Définissons l’ensemble D par D = x ∈ R+/εTx = N. Alors :

arg minx∈D

ψ(x) = arg maxx∈D

φ(x) = x =N

εTx∗x∗

et

minx∈D

ψ(x) = ψ(x) =N2

2εTx∗

maxx∈D

φ(x) = φ(x) = εTx∗ ln(τ +

N

εTx∗

)− εTx∗ ln τ

Preuve: L’existence et l’unicité de la solution x vient du fait que ψ(x) ainsi que −φ(x)

sont des fonctions convexes etD est un ensemble compact. Il s’agit maintenant de connaître

la valeur minimale de la fonction ψ(x) sur l’ensemble D, c’est-à-dire :

minψ(x) =1

2xTPx

sous la contrainte εTx = N

Page 66: Concepts thermodynamiques et d'entropie pour la

48 Chap 2. Modélisation thermodynamique des réseaux de transport

Pour résoudre ce problème, nous allons appliquer les conditions de Kuhn et Tucker

(voir chapitre 4). En effet, soit le Lagrangien J :

J(x, λ) =1

2xTPx− λ(εTx−N)

Alors, si x est la solution recherchée, il existe un scalaire λ ∈ R tel que :

∂J

∂x= xTP + λεT = 0, (2.30)

∂J

∂λ= εT x−N = 0 (2.31)

Ainsi, à partire de (2.30) on a x = −λP−1ε. On en déduit à partir de (2.31) λ = NεTP−1ε

,

ce qui implique x = NεT x∗

x∗. Or, la matrice Hessienne de J est ∂2J∂x2 = P qui est définie

positive. Donc le point x est un minimum de ψ(x).

De la même manière, pour connaître la valeur maximale de la fonction disentropie

φ(E) =∑n

i=1 x∗i ln(τ + xi

x∗i)− x∗i ln τ sur l’ensemble D, on définit le Lagrangien J :

J(x, λ) =n∑i=1

x∗i ln(τ +xix∗i

)− x∗i ln τ − λ(εTx−N)

Alors, si x est la solution recherchée, il existe un scalaire λ ∈ R tel que :

∂J

∂x=[ 1

τ + x1

x∗1

+ λ, · · · , 1

τ + xnx∗n

+ λ]

= 0, (2.32)

∂J

∂λ= εT x−N = 0 (2.33)

Il vient à partir de (2.32) que :

λ = − 1

τ + xix∗i

, ∀i = 1, · · · , n

Si λ = 0, alors la seule valeur possible de x = +∞, ce qui viole le fait que εTx = N pour

une valeur finie de N . Ainsi, λ 6= 0 si bien que : xi = −(λ+ τ)x∗i ,∀i = 1, · · · , n, ce qui

implique x = −(λ+ τ)x∗. Ainsi, l’équation (2.33) donne :

λ = − N

εTx∗− τ

Page 67: Concepts thermodynamiques et d'entropie pour la

2.5 Entropie du transport 49

d’où x = NεT x∗

x∗. Or, la matrice Hessienne de J est :

∂2J

∂x2=

− 1

x∗1

((τ+

x1x∗1

)2 0... 0

0 − 1

x∗2

((τ+

x2x∗2

)2 0 · · ·

... · · · . . . 0

0 · · · 0 − 1

x∗1

((τ+ xn

x∗n

)2

qui est définie négative. Donc le point x est un maximum de φ(x). Finalement, on en

déduit que

arg minx∈D

ψ(x) = arg maxx∈D

φ(x) = x =N

εTx∗x∗

et

minx∈D

ψ(x) = ψ(x) =N2

2εTx∗(2.34)

maxx∈D

φ(x) = φ(x) = εTx∗ ln(τ +

N

εTx∗

)− εTx∗ ln τ (2.35)

Il vient immédiatement à partir du théorème (2.2) que l’équilibre pour lequel le désordre

(résp, l’ordre) est minimal (réps, maximal) quand le système est en équilibre du taux d’oc-

cupation. En effet, il est clair que x = NεT x∗

x∗ implique xix∗i

= NεT x∗

= fi = constante, ∀i =

1, · · · , n. Ainsi, pour que le réseau du transport soit bien organisé, toute stratégie de

contrôle de signalisation doit avoir comme objectif essentiel la réalisation de l’équilibre

du taux d’occupation.

Par ailleurs, puisque εTx = N , il vient à partir de (2.34)

ψ(x) =N2

2εTx∗=

1

2

n∑i=1

x2i

x∗i− 1

2εTx∗

n−1∑i=1

n∑j=i+1

(x∗jxi − x∗ixj)2

x∗ix∗j

=1

2xTPx− 1

2εTx∗

n−1∑i=1

n∑j=i+1

(x∗jxi − x∗ixj)2

x∗ix∗j

= ψ(x)− 1

2εTx∗

n−1∑i=1

n∑j=i+1

(x∗jxi − x∗ixj)2

x∗ix∗j

(2.36)

Page 68: Concepts thermodynamiques et d'entropie pour la

50 Chap 2. Modélisation thermodynamique des réseaux de transport

Ainsi, si x = x alors x∗j xi−x∗i xj = 0. Nous en déduisons que l’entropie (le désordre) pour

un système isolé diminue jusqu’à ce que l’équilibre du taux d’occupation soit atteint. De

la même manière on montre que la disentropie (l’ordre) pour un système isolé augmente

jusqu’à ce que l’équilibre du taux d’occupation soit atteint.

2.6 Conclusion

La thermodynamique est une branche de la physique et de la chimie liée à l’étude du

comportement thermique des corps, à l’étude de l’énergie et de ses transformations (en

particulier de l’énergie interne). Bien que sa puissance dans différents domaines indus-

triels n’est plus à démontrer, aucun travail, à notre connaissance, n’a été élaboré pour son

utilisation dans la régulation du trafic.

Le but de ce chapitre était donc de proposer un premier travail sur la manière dont les

liens se tissent entre les systèmes de transport et la thermodynamique. Pour cela, plusieurs

paramètres et principes thermodynamiques ont trouvé leurs parallèles dans le cadre des

systèmes de transport tels que la température (taux d’occupation de la voie), la capacité

thermique (capacité de la voie), l’équilibre thermique (l’équilibre du taux d’occupation),

le premier principe de la thermodynamique (loi de conservation des véhicules) et les no-

tions d’entropie et disentropie. Le point de vue dominant est l’assimilation des véhicules

à l’énergie fournie ou/et échangée entre les intersections signalisées. Contrairement aux

approches existantes, le modèle développé se base sur la notion d’énergie au lieu du débit.

L’avantages majeur du choix énergétique est qu’il fait apparaître sur le modèle le

nombre de véhicules présents sur les segments de route comme variable d’état, ce qui per-

met de suivre les modifications de l’infrastructure routière dues à des situations nouvelles

sans avoir à reprendre les démarches de modélisation depuis le début. En outre, il permet

de décrire explicitement les phénomènes qui gouvernent le trafic tel que le phénomène de

congestion qui est facilement représenté par l’augmentation de l’entropie (désordre).

Cependant, bien que les systèmes thermodynamiques et les réseaux de transport puissent

être similaires, le second principe de la thermodynamique n’est pas applicable dans le

contexte du transport. La raison en est que la propagation des véhicules est déterminée

par la volonté des conducteurs et aucune règle n’existe pour obliger les véhicules de se

déplacer seulement des voies les plus chargées vers celles les moins chargées (comme le

principe de la propagation de la température). En outre, les notions de l’ordre et désordre

Page 69: Concepts thermodynamiques et d'entropie pour la

2.6 Conclusion 51

dans les deux systèmes sont opposées. Ceci signifie que l’ordre thermodynamique (me-

suré par la disentropie) correspond au désordre (mesuré par l’entropie) dans le contexte

du transport. Cette entropie du transport est liée à la densité de la circulation ce qui lui

confère une légitimité de son utilisation. En effet, non seulement elle peut être considérée

comme un moyen pour la compréhension des phénomènes du trafic, mais aussi comme

un outil d’évaluation pour avoir une idée rapide sur l’évolution du trafic surtout lorsqu’il

s’agit de traiter des réseaux de grande taille. Un autre avantage à souligner de l’utilisation

de l’entropie se situe au niveau de la commande du trafic. En effet, puisque l’entropie me-

sure le désordre dans le système, elle peut être considérée comme un outil de régulation

car sa diminution fournit un moyen de réduire le désordre et donc de rendre le système

mieux organisé. Ceci est l’un des objectifs du chapitre suivant.

Page 70: Concepts thermodynamiques et d'entropie pour la

52 Chap 2. Modélisation thermodynamique des réseaux de transport

Page 71: Concepts thermodynamiques et d'entropie pour la

CHAPITRE 3

COMMANDE DISSIPATIVE DES

RÉSEAUX DE TRANSPORT

3.1 Introduction

L’objectif principal de contrôle et de régulation des systèmes de transport est de main-

tenir un trafic plus fluide afin d’assurer une meilleure qualité de service. Les feux de

signalisation représentent dans cette optique, le moyen le plus important pour réguler les

réseaux de carrefours. Néanmoins, la conception d’une commande nécessite de dispo-

ser d’un modèle et d’un représentant (critère) afin de préciser les objectifs par rapport

auxquels la commande est définie.

Dans le chapitre précédent, nous avons vu que l’entropie du transport représente le

visage thermodynamique du système et prend source et forme à partir de l’énergie (véhi-

cules) échangée ou transférée entre les sous-systèmes. Avec cette fonction, nous pouvons

définir le sens de l’évolution du trafic. En effet, plus l’entropie est grande plus le sys-

tème est désordonné. Elle peut donc être considérée non seulement comme un très bon

représentant pour évaluer les performances du réseau de transport mais aussi, comme une

source d’information pour remettre de l’ordre dans le système.

Dans ce chapitre, nous nous intéressons essentiellement à l’apport que pourrait avoir

l’implication de la théorie des systèmes dissipatifs dans le cadre des systèmes de transport.

Page 72: Concepts thermodynamiques et d'entropie pour la

54 Chap 3. Commande dissipative des réseaux de transport

Les systèmes dissipatifs sont des systèmes qui ne peuvent pas stocker toute l’énergie

échangée avec l’environnement extérieur. Autrement dit, ils dissipent partiellement ou

totalement l’énergie absorbée. Cette théorie joue un rôle très important dans l’analyse des

propriétés et la commande des systèmes physiques et a donné lieu à plusieurs résultats

importants dans les domaines de la thermodynamique, de l’électronique, de la mécanique,

etc.

L’idée fondamentale de notre approche est de faire le lien entre la théorie des systèmes

dissipatifs et les systèmes des carrefours signalisés. En effet, comme nous l’avons vu au

chapitre 2, l’entropie peut être vue comme étant le désordre stocké dans le réseau. Les feux

de signalisation peuvent alors être considérés comme des vannes dissipant ce désordre.

Dans le cas des carrefours congestionnés par exemple, ce concept se traduit par le

fait que l’énergie stockée (véhicules en files d’attente) est beaucoup plus importante que

l’énergie dissipée (véhicules sortants). Ce constat nous amène donc à réfléchir sur des

commandes permettant de dissiper cette énergie (désordre) stockée. C’est précisément

là où se situe l’intérêt d’utiliser la théorie des systèmes dissipatifs. En effet, cette théorie

offre des outils qui permettent de moduler par rétroaction l’énergie physique de façon à ce

que cette énergie soit utilisable comme fonction de Lyapunov à des fins de commande et

de stabilisation. Ces développements ont conduit à ce qu’on appelle parfois dissipativity-based control, ou commande dissipative. C’est une stratégie qui consiste à trouver un

contrôleur qui transforme un système non-dissipatif, comme dans le cas des carrefours

congestionnés, en un système dissipatif. De cette manière, le système sera mieux organisé.

Cependant, le fonctionnement des systèmes de transport imposent souvent des incer-

titudes et des contraintes de type inégalité sur les variables de commande et de l’état du

modèle considéré. De ce fait, synthétiser une loi de commande dissipative pour les sys-

tèmes de transport nécessite la prise en compte de ces contraintes.

Notre contribution dans ce chapitre consiste à fournir des solutions au problème de la

dissipativité avec contraintes sur l’état et la commande pour les systèmes de transport, qui

soient aussi simples que possible à mettre en œuvre en temps réel. L’approche utilisée vise

à appliquer les techniques des Inégalités Matricielles Linéaires (LMI). Leur succès vient

du développement des méthodes dites du point intérieur (interior point methods) qui per-

mettent d’apporter des solutions intéressantes par la manipulation des contraintes de fa-

çon systématique. La mise en évidence de l’approche LMI a ouvert des possibilités telles

qu’il est devenu possible d’aborder des problèmes d’analyse et/ou de commande jusque

Page 73: Concepts thermodynamiques et d'entropie pour la

3.2 Rappels mathématiques et résultats préliminaires 55

là non envisageables. En outre, de nombreux logiciels (solveurs) conviviaux existent dont

certains offrent une interface avec MATLAB.

Dans un premier temps, nous rappelons quelques définitions et résultats utiles don-

nés dans la littérature et nous donnons certains résultats préliminaires relatifs au concept

d’inclusion des polyèdres. Ensuite, nous présentons la théorie des systèmes dissipatifs

à travers une formulation très générale. Cette formulation permet néanmoins de présen-

ter les avantages et les inconvénients de la commande dissipative. Une fois l’intérêt de

cette commande justifié, nous précisons la définition du problème de commande qui nous

concerne. Cette définition est faite par spécialisation du problème de la commande dis-

sipative aux systèmes de transport. Une fois le problème bien défini, nous proposons

d’appliquer cette commande en vue d’une régulation des intersections du réseau tout en

prenant en compte les incertitudes du modèle et en respectant les contraintes sur les va-

riables de commande et de l’état. Deux cas sont étudiés : celui où le modèle du système

est non-linéaire est d’abord analysé. Ensuite, nous nous intéressons au cas où le modèle

de transport est linéaire.

3.2 Rappels mathématiques et résultats préliminaires

Nous définissons ici différentes notations concernant les vecteurs et les opérateurs po-

sitifs. Ces notations sont conformes à celles classiquement introduites dans la littérature.

Nous introduisons tout d’abord deux relations d’ordre partiel dans Rn : > et ≥. Considé-

rons deux vecteurs x et y de Rn ; alors :

– x > y ⇔ ∀i ∈ 1, · · · , n, xi > yi

– x ≥ y ⇔ ∀i ∈ 1, · · · , n, xi ≥ yi

Il est clair que : x > y ⇒ x ≥ y. Ces relations d’ordre partiel nous permettent de

définir les vecteurs positifs de Rn :

– x est non-négatif, i.e., x ≥ 0

– x est positif, i.e., x > 0

Définissons les orthants non-négatifs et positifs, que nous noterons respectivement Rn+ et

Rn+∗ :

Rn+ = x ∈ Rn, x ≥ 0

Rn+∗ = x ∈ Rn, x > 0

Page 74: Concepts thermodynamiques et d'entropie pour la

56 Chap 3. Commande dissipative des réseaux de transport

De la même façon, nous définissons les relations > et ≥ pour les matrices (m× n) :

– A > B ⇔ ∀(i, j), aij > bij

– A ≥ B ⇔ ∀(i, j), aij ≥ bij

Nous définissons donc les matrices :

– A est non-négative, i.e., A ≥ 0

– A est positif, i.e., A > 0

Clairement : A > 0⇒ A ≥ 0.

L’espace vectoriel Rn muni de la relation d’ordre partiel ≥ est un espace de Riesz

[59], c’est-à-dire pour tout couple (x, y) d’éléments de Rn,

– sup(x, y) existe (le plus petit des majorants de x, y– inf(x, y) existe (le plus grand des minorants de x, yDéfinissons maintenant pour tout x ∈ Rn :

x+ = sup(x, 0); x− = sup(−x, 0) = (−x)+ = − inf(x, 0)

Il est clair que pour tout x ∈ Rn, x+ > 0 et x− > 0 et :

x = x+ − x−; |x| = x+ + x− (3.1)

D’autre part, on a pour tout x, y ∈ Rn :

sup(x, y) = x+ sup(y − x, 0) = x+ (y − x)+ =1

2

[x+ y + |x− y|

]x+ y = sup(x, y) + inf(x, y) (relation de Dedekind)

Lemme 3.1 Soit x ∈ Rn et soient u, v ∈ Rn+ tels que :

x = u− v

Alors nous avons :

x+ ≤ u, x− ≤ v

Autrement dit, la décomposition de x en x+ − x− est minimale.

Preuve: Nous avons :

x+ = (u− v)+ = sup(u− v, 0) = sup(u, v)− v

Donc, si u > v alors il vient :

x+ = u− v ≤ u, car u, v ≥ 0

Page 75: Concepts thermodynamiques et d'entropie pour la

3.2 Rappels mathématiques et résultats préliminaires 57

et si u ≤ v, alors :

x+ = v − v = 0 ≤ u

Pour montrer x− ≤ v, il suffit de remarquer que :

x− = (u− v)− = − inf(u− v, 0) = sup(v − u, 0) = sup(u, v)− u

et d’appliquer le raisonnement précédent.

De la même manière, pour toute matrice A ∈ Rm×n on définit :

A+ = (A+ij); où A+

ij = sup(Aij, 0)

A− = (A−ij); où A−ij = − inf(Aij, 0)

Il est clair que :

A+ ≥ 0; A− ≥ 0; A = A+ − A−; |A| = A+ + A− (3.2)

En nous servant du lemme 3.1, nous pouvons aisément établir le lemme suivant :

Lemme 3.2 Soit x ∈ Rn et soit A ∈ Rm×n, alors :

(Ax)+ ≤ A+x+ + A−x−; (Ax)− ≤ A+x− + A−x+ (3.3)

Preuve: Remarquons que :

Ax = (A+ − A−)(x+ − x−) = (A+x+ + A−x−)− (A+x− + A−x+)

Posons :

u = A+x+ + A−x−, v = A+x− + A−x+

Ainsi, l’application du Lemme 3.1 donne immédiatement le résultat.

Sur l’inclusion des polyèdres

Soient Q ∈ Rq×n et P ∈ Rp×n deux matrices. Définissons les ensembles suivants :

Q =x ∈ Rn \ Qx ≤ λ

P =

x ∈ Rn \ Px ≤ β

Page 76: Concepts thermodynamiques et d'entropie pour la

58 Chap 3. Commande dissipative des réseaux de transport

Théorème 3.1 (Hennet [60]) Une condition nécessaire et suffisante pour que Q ⊆ P est

qu’il existe une matrice K ∈ Rp×q telle que :

Kij ≥ 0; ∀i = 1 · · · p, j = 1 · · · q

KQ = P

Kλ ≤ β

Le théorème 3.1 donne une condition nécessaire et suffisante du problème suivant : si x

est solution du système d’inégalités Qx ≤ λ alors x est aussi une solution du système

d’inégalités Px ≤ β

Sur les Inégalités Matricielles Linéaires (LMI)

Une inégalité matricielle linéaire (LMI) est une relation de type :

F (x) = F0 + x1F1 + ...+ xnFn = F0 +n∑i=1

xiFi 0 (3.4)

où x = (x1, · · · , xn)T est un vecteur réel à n composantes et les matrices Fi ∈ Rn×n

sont symétriques. Fi sont des données, x est l’inconnue. Le signe d’inégalité signifie

que la matrice symétrique F (x) doit être semi-définie positive. Il est possible de traiter

des inégalités strictes du type F (x) 0 qui signifie que la matrice F (x) est définie

positive. On consultera avec profit l’ouvrage de [61] qui constitue un très bon répertoire

de nombreux problèmes faisant appel aux LMIs.

Considérons à titre d’exemple le problème de la recherche d’une matrice réelle P =

P T d’ordre 2 définie positive. La matrice P dépend alors de trois paramètres xi, i = 1, 2, 3

et peut s’écrire :

P = P T =

(x1 x2

x2 x3

)= x1

(1 0

0 0

)︸ ︷︷ ︸

F1

+x2

(0 1

1 0

)︸ ︷︷ ︸

F2

+x3

(0 0

0 1

)︸ ︷︷ ︸

F3

0

Une propriété remarquable des LMIs est la possibilité de regrouper plusieurs LMIs

F 1(x) 0, · · · , F q(x) 0 en une seule LMI bloc-diagonale :

F (x) =

F 1(x)

. . .

F q(x)

0

Page 77: Concepts thermodynamiques et d'entropie pour la

3.3 Définition des systèmes discrets dissipatifs 59

Cette propriété découle du fait que les valeurs propres d’une matrice diagonale par blocs

sont constituées par les valeurs propres des matrices de la diagonale.

Quelques outils pour les LMIs

Certaines inégalités non-linéaires peuvent être également transformées en LMIs à

l’aide du complément de Schur. En effet, soit

F (x) =

[R(x) S(x)

ST (x) Q(x)

]

où R(x) = RT (x), Q(x) = QT (x) inversible, et S(x) dépendent linéairement de x.

Définition 3.1 Le complément de Schur du bloc Q(x) de la matrice F (x) est la matrice :

R(x)− S(x)Q−1(x)ST (x)

Le complément de Schur apparaît naturellement comme le résultat d’un échantillonnage

partiel de F (x) à l’aide du pivot de Gauss. Nous avons alors le résultat suivant :

Lemme 3.3 ([61]) On suppose que Q(x) est définie positive (respectivement semi-définie

positive).

– F (x) 0 si et seulement si R(x)− S(x)Q−1(x)ST (x) 0.

– F (x) 0 si et seulement si R(x)− S(x)Q−1(x)ST (x) 0.

Remarquons à partir de ce lemme que R(x) 0 est une condition nécessaire pour que

F (x) 0. Pour le montrer, il suffit de remarquer que :

(yT , zT )

[R S

ST Q

](y

z

)= yTRy + 2yTSz + zTQz 0

implique, en posant z = 0 , yTRy 0.

3.3 Définition des systèmes discrets dissipatifs

Le concept d’énergie est d’une grande utilité dans l’analyse des systèmes physiques.

La plupart des systèmes physiques peuvent être étudiés à partir du gain et de la perte

d’énergie. Intuitivement, un système dissipatif dissipe de l’énergie et ne peut la produire.

Page 78: Concepts thermodynamiques et d'entropie pour la

60 Chap 3. Commande dissipative des réseaux de transport

Autrement dit, toute augmentation de l’énergie stockée est seulement due à l’environne-

ment extérieur. Cette remarque implique l’existence de deux types de fonctions d’éner-

gies : la fonction d’approvisionnement représentant l’énergie injectée au système et la

fonction de stockage représentant l’énergie stockée dans le système.

L’interaction entre la théorie des systèmes dissipatifs et les systèmes dynamiques ne

remonte pas assez loin dans le passé. La présentation de la chronologie des résultats per-

met de réaliser à quel point cette théorie est récente. En effet, dans [62], en étudiant les

phénomènes de dissipation dans les circuits électriques, Zames semble être le premier à

étudier les systèmes dissipatifs sans qu’ils aient été encore nommés. Plus tard, dans [63],

Willems, sous une écriture condensée, a repris ce travail en introduisant pour la première

fois les notions d’énergies d’approvisionnement et de stockage. L’objectif de l’étude était

de faire l’interconnexion entre les systèmes dissipatifs et la théorie de la commande. Une

première application de cette théorie a été mise en évidence par Popov [64] pour la syn-

thèse d’une loi de commande pour les systèmes Lury Postnikov. L’objectif de la com-

mande était la stabilisation absolue de ce type de système. Plus récemment, ce principe

a été largement exploité d’une manière implicite ou explicite pour de nouveaux dévelop-

pements en matière de stabilité et de stabilisation. On consultera avec profit l’ouvrage de

Brogliato [65] qui présente une excellente introduction sur ce sujet.

Dans la suite, les définitions et les notations utilisées sont présentées de la façon la

plus générale, dans le but de montrer le principe de la dissipation. Des spécialisations

sont apportées chaque fois que cela est opportun.

On s’intéresse aux systèmes discrets non linéaires affines par rapport à la commande

définis par l’équation suivante :

x(k + 1) = f(x(k)) + g(x(k))u(k),

y(k) = h(x(k), u(k)),(3.5)

où x ∈ Rn et u, y ∈ Rm sont l’état, l’entrée et la sortie du système respectivement.

f : Rn → Rn, h : Rn → Rm et g : Rn → Rn×m sont supposées continues avec f(0) = 0.

Supposons donnée une fonction S(·) définie sur Rm ×Rm, S est une fonction de u et

de y et S(0, 0) = 0. Cette fonction est appelée taux d’approvisionnement. Notons que

seules l’entrée et la sortie sont utilisées pour formuler la fonction d’approvisionnement.

Ceci est cohérent avec la logique physique de cette formulation. En effet, pour la plupart

des systèmes physiques, la fonction S(·) représente la quantité d’énergie fournie au sys-

tème. Par exemple, dans le cas des réseaux électriques, en appliquant un potentiel v aux

Page 79: Concepts thermodynamiques et d'entropie pour la

3.3 Définition des systèmes discrets dissipatifs 61

bornes on obtient un courant i. La quantité d’énergie fournie se traduit alors dans ce cas

par la puissance électrique donnée par P = vi.

Il va sans dire que cette énergie doit être définie par une limitation pratique, à savoir,

elle doit être finie. C’est pourquoi, dans la suite, nous supposons que pour tout u ∈ Rm

et pout tout x(0) ∈ Rn, la sortie y(k) du système (3.5) doit être telle que S(y(k), u(k))

vérifie :k∑i=0

S(y(i), u(i)) <∞, ∀k ≥ 0.

En termes plus précis, la somme de la fonction S(y(k), u(k)) sur un intervalle de temps

borné doit être finie.

Définition 3.2 Le système (3.5) est dit dissipatif par rapport au taux d’approvisionne-

ment S(y, u), s’il existe une fonction non-négative V : Rn −→ R, avec V (0) = 0,

appelée fonction de stockage, telle que pour tout u ∈ Rm et pour tout k ∈ N :

V (x(k + 1))− V (x(k)) ≤ S(y(k), u(k)). (3.6)

Si l’inégalité (3.6) est stricte, le système est dit strictement dissipatif. I

Notons tout de suite que l’inégalité (3.6) est satisfaite si et seulement si l’inégalité suivante

est satisfaite :

V (x(k + 1))− V (x(0)) ≤k∑i=0

S(y(i), u(i)); ∀k, u, x(0). (3.7)

Cette équivalence peut être démontrée comme suit : (3.6)⇒ (3.7) est triviale. Inversement,

puisque (3.7) est satisfaite pout tout k, pour tout u ∈ Rm et pout tout état initial x(0) =

x ∈ Rn, posons x(0) = x = x(j), y(0) = y(j), u(0) = u(j) et k = j, on déduit à partir

de (3.7)

V (x(j + 1))− V (x(j)) ≤ S(y(j), u(j)); ∀j, u(j).

ce qui est exactement (3.6).

L’inégalité (3.7) est appelée inégalité de dissipation. Elle signifie que la quantité

d’énergie stockée dans un intervalle de temps n’est jamais supérieure à l’énergie totale

fournie durant cette période. Autrement dit, un système dissipatif ne peut stocker plus

d’énergie que l’environnement extérieur lui fournit.

Remarque 3.1 Il est important de noter que, malgré qu’initialement, le concept de la

dissipation a été motivé par l’étude de l’énergie, les définitions et les résultats qui en

découlent restent valables même si aucune interprétation de l’énergie n’est donnée. I

Page 80: Concepts thermodynamiques et d'entropie pour la

62 Chap 3. Commande dissipative des réseaux de transport

3.3.1 Commande dissipative des systèmes discrets

La théorie des systèmes dissipatifs a connu un regain d’intérêt très important ces dix

dernières années. Cet aspect de la théorie des systèmes a été motivé essentiellement par

les applications dans le domaine de la commande des systèmes physiques, car ces outils

permettent de moduler par bouclage l’énergie physique de façon à ce que cette énergie

soit utilisable comme fonction de Lyapunov à des fins de commande et de stabilisation.

Ces développements ont conduit à ce qu’on appelle parfois dissipativity-based control,ou commandes dissipatives.

Principe de la commande dissipative : La stratégie de la commande dissipative consiste

à trouver un contrôleur qui transforme un système non-dissipatif en un système dissipatif.

Ceci passe, tout d’abord, par le choix d’une fonction de stockage d’énergie désirée ayant

un minimum à l’équilibre souhaité et par l’injection de l’amortissement (commande) dans

le système. Dans ce cadre, la classe de systèmes qui peuvent être rendus dissipatifs est dite

feedback dissipative. Ainsi, le problème de la commande dissipative peut être formulé

comme suit :

Problème de la commande dissipative : Soient S(y, u) le taux d’approvisionnement et

V (x) une fonction de stockage. Alors, pour le système x(k+1) = f(x(k)+g(x(k))u(k),

trouver, si c’est possible, un retour d’état u = α(x), tel que le système en boucle fermée :

x(k + 1) = f(x(k)) + g(x(k))α(x(k)), (3.8)

soit dissipatif. Autrement dit, le système transformé (3.8) vérifie l’inégalité de dissipation

suivante :

V(f(x) + g(x)α(x, v)

)− V (x) ≤ S(α(x), y). (3.9)

3.3.2 Avantages et inconvénients

Plusieurs atouts majeurs de cette stratégie peuvent être soulignés. En effet :

1. Il est possible, comme nous allons le voir avec les systèmes de transport, de donner

aux énergies une interprétation cohérente avec la réalité physique du système. Cette

propriété peut être d’une grande importance dans des applications industrielles.

Page 81: Concepts thermodynamiques et d'entropie pour la

3.4 Spécialisation aux systèmes de transport 63

2. la stratégie de commande présente une faible sensibilité vis-à-vis de la structure du

modèle. En effet, les systèmes dissipatifs sont robustes vis-à-vis des incertitudes

paramétriques et des dynamiques non modélisées.

3. la stratégie de commande est une approche systématique pouvant fonctionner sans

connaissance préalable de la solution du système.

Cependant, si la commande dissipative est calculée à partir d’une information très

riche, à savoir la connaissance du modèle du système, la qualité de ce dernier dépend de

la connaissance parfaite des paramètres définissant la dynamique du système. Dans toute

application pratique, ces quantités ne sont connues qu’avec une part d’incertitude, et la

dégradation de performance découlant d’un choix impropre des valeurs des paramètres

peut être selon les cas très importante. Le développement de stratégies de contrôle ef-

ficaces nécessite alors la prise en compte de ces incertitudes inhérentes à tout système

physique, car celles-ci conduisent souvent à une grande instabilité.

En dépit de ce handicap sérieux, les avantages de cette approche, le succès industriel

qu’elle a rencontré ainsi que l’efficacité que peuvent apporter les techniques du calcul

numérique, sont des arguments suffisants pour justifier l’intérêt porté à cette approche.

Dans la suite, nous montrerons comment la commande dissipative est également im-

portante dans une optique de régulation d’un réseau de carrefours à feux.

3.4 Spécialisation aux systèmes de transport

La présentation de la formulation générale de la commande dissipative est donnée

dans la section précédente. Dans cette partie, nous précisons la définition du problème

qui nous concerne. Cette définition est faite par spécialisation de la commande dissipative

au problème de la régulation d’un réseau de carrefours à feux.

Pour introduire ce que nous allons faire dans la suite, rappelons d’abord le modèle de

transport établi dans le chapitre 2.

x(k + 1) = x(k) + l(k) + r(k)− d(k), ∀k ∈ N (3.10)

où x = [x1, · · · , xn]T , l = [l1, · · · , ln]T , r = [r1, · · · , rn]T , d = [d1, · · · , dn]T avec :

– xi le nombre de véhicules dans chaque tronçon i.

– ri le nombre d’entrées de véhicules de l’extérieur dans le tronçon i.

– di le nombre de sorties de véhicules du tronçon i vers l’extérieur.

Page 82: Concepts thermodynamiques et d'entropie pour la

64 Chap 3. Commande dissipative des réseaux de transport

– li(k)=n∑

j=1,j 6=i

(σi,j(k) − σj,i(k)) les échanges de véhicules entre le tronçon i et les

tronçons j.

–n∑

j=1,j 6=i

σi,j , le flux de véhicules entrants dans le tronçon i depuis les tronçons j.

–n∑

j=1,j 6=i

σj,i, le flux de véhicules sortants du tronçon i vers les tronçons j.

Rappelons que σi,j = 0, dj = 0 si et seulement si xj = 0. Cette contrainte implique que si

le nombre de véhicules du sous-système j est égal à zéro, alors ce sous-système ne peut

pas fournir des véhicules à son environnement.

L’utilisation de la commande dissipative pour les systèmes de transport n’est pas sys-

tématique. Elle nécessite donc un travail d’adaptation afin de pouvoir l’appliquer à notre

système. En effet, la théorie des systèmes dissipatifs nécessite de définir clairement les

deux points suivants :

– Les énergies d’approvisionnement et de stockage.

– Le domaine de commande admissible.

Les énergies d’approvisionnement et de stockage précisent les objectifs par rapport aux-

quels la commande est définie. Le domaine de commande admissible est le sous-ensemble

de l’espace de commande dans lequel une commande est à rechercher.

Energie de stockage : Dans le chapitre précédent, nous avons vu que l’entropie ψ(x) =

xTPx est une mesure du désordre dans le réseau de transport. Ce désordre est provoqué

par l’accumulation des véhicules dans les voies. Ces dernières stockent une partie des

véhicules en files d’attente et en dissipent d’autres par les feux de signalisation. Ainsi,

l’entropie est un représentant idéal pour la fonction de stockage.

Energie d’approvisionnement : Le taux d’approvisionnement S reflète des facteurs

extérieurs au système. Dans le contexte du transport, toute augmentation du nombre de

véhicules dans le réseau provoque un désordre dans le système. Ce désordre dépend non

seulement des véhicules fournis par le milieu extérieur r(k), mais aussi de la répartition

des véhicules entre les sous-systèmes. En effet, une même quantité de véhicules apporte

plus de désordre aux voies les plus occupées qu’aux voies les moins fréquentées. Ainsi,

puisque les taux d’occupation représentent la manière dont les voies sont occupées, il est

naturel de considérer la fonction d’approvisionnement S en fonction de la quantité r(k) et

Page 83: Concepts thermodynamiques et d'entropie pour la

3.4 Spécialisation aux systèmes de transport 65

du vecteur d’occupation f(k). Cependant, puisque f(k + 1) correspond à la fin du cycle

k, il est clair que la quantité de désordre fournie par le milieu extérieur pendant le cycle k

est donnée par :

S(k) = fT (k + 1)r(k)

Puisque f = Px (voir équation (2.17)), nous avons alors :

S(k) = xT (k + 1)Pr(k) (3.11)

D’où la définition suivante.

Définition 3.3 Le système de transport (3.10) est dissipatif par rapport au taux d’appro-

visionnement S(k) et la fonction de stockage ψ(x) si et seulement si :

ψ(x(k + 1))− ψ(x(k)) ≤ S(k), ∀k ∈ N (3.12)

Ainsi, la dissipativité par rapport au taux d’approvisionnement S(k) implique que la quan-

tité du désordre stockée pendant un cycle n’est jamais supérieure au désordre fourni par

le milieu extérieur durant ce cycle. Autrement dit, un système de transport dissipatif a une

tendance à diminuer son désordre et par conséquent, devient mieux organisé.

Soulignons tout de suite que le système de transport (3.10) n’est pas dissipatif par

rapport au taux d’approvisionnement S(k). En effet, observons d’abord que la différence

totale de l’entropie ψ(x) le long de la trajectoire du système est donnée par :

∆ψ(x(k)) =1

2xT (k + 1)Px(k + 1)− 1

2xT (k)Px(k)

= xT (k + 1)P(x(k + 1)− x(k)− l(k)

)− 1

2

(x(k + 1)− x(k)

)TP(x(k + 1)− x(k)

)+ xT (k + 1)Pl(k)

Or, x(k + 1)− x(k)− l(k) = r(k)− d(k) et S(k) = xT (k + 1)Pr(k), il vient :

∆ψ(x(k)) = S(k)− xT (k + 1)Pd(k)− 1

2

(x(k + 1)− x(k)

)TP(x(k + 1)− x(k)

)+ xT (k + 1)Pl(k)

Page 84: Concepts thermodynamiques et d'entropie pour la

66 Chap 3. Commande dissipative des réseaux de transport

Comme la matrice P est définie positive et l’état x(k) ainsi que d(k) sont positifs, il

s’ensuit :

−1

2

(x(k + 1)− x(k)

)TP(x(k + 1)− x(k)

)≤ 0; −xT (k + 1)Pd(k) ≤ 0

On en déduit alors :

∆ψ(x(k)) ≤ S(k) + xT (k + 1)Pl(k) (3.13)

Pour simplifier les équations, posons g(x(k)) = xT (k + 1)Pl(k). Puisque :

li(k) =n∑

j=1,j 6=i

(σi,j(k)− σj,i(k))

il vient :

g(x(k)) =n∑i=1

xi(k + 1)li(k)

x∗i=

n∑i=1

n∑j=1,j 6=i

xi(k + 1)(σi,j(k)− σj,i(k))

x∗i

=n−1∑i=1

n∑j=i+1

(xi(k + 1)

x∗i− xj(k + 1)

x∗j

)(σi,j(k)− σj,i(k)

)Si nous supposons que

(xi(k+1)x∗i

− xj(k+1)

x∗j

)(σi,j(k) − σj,i(k)

)≤ 0 pour tout i 6= j et

pour tout k ∈ N, alors ∆ψ(x(k)) ≤ S(k), ∀k ∈ N. Par conséquent, le système de

transport serait dissipatif. Malheureusement, cette hypothèse n’existe pas dans la réalité,

car elle implique que les voies les plus chargées fournissent plus de véhicules aux voies

les moins chargées ; ce qui n’est pas réaliste dans les systèmes de transport. Même la

situation où σi,j(k) = σj,i(k) pour tout k ∈ N (les voies i et j échangent la même quantité

de véhicules) n’est pas réaliste car les directions des véhicules sont déterminées par les

conducteurs. Ainsi, contrairement aux systèmes thermodynamiques, la dissipativité des

systèmes de transport n’est pas naturelle, d’où la nécessité de faire appel à la notion de

commande dissipative.

3.4.1 Commande dissipative des réseaux de transport

Dans cette partie, nous adoptons une démarche qui consiste à séparer l’étude de la

dissipativité des réseaux de transport dans le cas ou le modèle d’état est non-linéaire

et l’étude de la dissipativité dans le cas linéaire. Il s’agit de simplifier la présentation

tout en traitant l’ensemble des aspects du problème. Une fois que ces deux études sont

présentées séparément, le principe de la commande dissipative des réseaux de transport

devient évident.

Page 85: Concepts thermodynamiques et d'entropie pour la

3.4 Spécialisation aux systèmes de transport 67

3.4.2 Cas d’un modèle non-linéaire

Afin de pouvoir présenter le modèle d’état non-linéaire du système, un certain nombre

de remarques est nécessaire. En effet, considérons à titre d’exemple l’intersection à deux

phases de la figure 3.1. Soit gj, j = 1, · · · , 4, les temps des feux verts de chaque mouve-

FIGURE 3.1 – Intersection à deux phases

ment. Il est clair que :

g1 = g2 = ge1

g3 = g4 = ge2

où ge1 et ge2 sont les temps des feux verts effectifs de la phase 1 et la phase 2 respecti-

vement (voir chapitre 1). Or, on sait que les feux verts effectifs sont liés par l’équation

suivante :

ge1 + ge2 = c− lo

où lo est le rouge intégral pendant un cycle. Il s’ensuit que ge1 et ge2 ne sont pas indépen-

dants. Ainsi, si ge1 est choisi comme la variable de commande, les temps des feux verts

des quatre mouvements peuvent être représentés par la relation linéaire suivante :g1

g2

g3

g4

=

ge1

ge1

ge2

ge2

=

1

1

−1

−1

ge1 +

0

0

c− loc− lo

(3.14)

Ainsi, pour un carrefour à deux phases, il existe une seule variable de commande indé-

pendante.

Page 86: Concepts thermodynamiques et d'entropie pour la

68 Chap 3. Commande dissipative des réseaux de transport

FIGURE 3.2 – Intersection à trois phases

Considérons maintenant l’intersection à trois phases de la figure 3.2. Ce carrefour est

composé de six mouvements. Chaque mouvement est associé à un feux vert gj . Dans ce

cas, les feux verts effectifs correspondants aux trois phases ge1 , ge2 et ge3 sont liés aux

feux verts gj par la relation suivante :

g1

g2

g3

g4

g5

g6

=

ge1

ge1 + ge3

ge3

ge2 + ge3

ge2

ge1 + ge2

(3.15)

Comme :

ge1 + ge2 + ge3 = c− lo

Page 87: Concepts thermodynamiques et d'entropie pour la

3.4 Spécialisation aux systèmes de transport 69

il existe alors deux variables indépendantes. Si nous choisissons ge1 et ge2 comme les

variables de commande, alors l’équation (3.15) devient :

g1

g2

g3

g4

g5

g6

=

1 0

0 −1

−1 −1

−1 0

0 1

1 1

(ge1

ge2

)+

0

c− loc− loc− lo

0

0

(3.16)

En résumé, notons g ∈ Rn le vecteur des feux verts du réseau de carrefours et soit u ∈Rm le vecteur des feux verts effectifs du réseau dont les composantes sont indépendantes.

Alors g et u sont liés par la relation suivante :

g = Gu+ ξ (3.17)

où G ∈ Rn×m et ξ ∈ Rn.

Regardons maintenant comment les échanges de flux σi,j entre les tronçons peuvent

être exprimés par la commande. En effet, comme les échanges des flux de trafic entre les

tronçons sont déterminés par les feux de signalisation, ils peuvent s’écrire sous la forme

(voir [44])

σi,j(k) = sjλi,jgj(k) (3.18)

où λi,j est la proportion du flux de sortie de la voie j vers la voie i, c’est-à-dire le pourcen-

tage des véhicules allant de la voie j vers la voie i par rapport au nombre total de véhicules

présents sur la voie j. gj(k) est le feu vert de la voie j et sj son débit de saturation. Ainsi,

à partir de l’équation (3.18) nous avons :

li(k) =n∑

j=1,j 6=i

σi,j(k)−n∑

j=1,j 6=i

σj,i(k)

=n∑

j=1,j 6=i

sj(x)gj(k)λi,j(x)−n∑

j=1,j 6=i

si(x)gi(k)λj,i(x)

=n∑

j=1,j 6=i

sj(x)gj(k)λi,j(x)− si(x)gi(k)n∑

j=1,j 6=i

λj,i(x) (3.19)

Définissons le vecteur Li par : Li = [Li,1, · · · , Li,n]T ∈ Rn où

Li,j =

−si

∑nj=1,j 6=i λj,i : pour i = j

sjλi,j : pour i 6= j

Page 88: Concepts thermodynamiques et d'entropie pour la

70 Chap 3. Commande dissipative des réseaux de transport

Alors, les équations (3.19) et (3.17) donnent :

li(k) =n∑

j=1,j 6=i

Li,jgj(k) + Li,igi(k) =n∑j=1

Li,jgj(k) = LTi g(k)

= LiGu(k) + Liξ (3.20)

Par ailleurs, si di(x) est différentiable et puisque di(x) = 0 si et seulement si xi =

0, i = 1, · · · , n, alors di(x) peut s’écrire sous la forme di(x) = di(x)xi avec 0 ≤ di(x) ≤1, car di(x) ≤ xi.

Cela fait, posons maintenant D(x) = diag(d1(x), · · · , dn(x)

), A(x) = I − D(x) et

L = [L1, · · · , Ln]T . Dans ce cas, l’équation (3.10) peut s’écrire sous la forme :

x(k + 1) = A(x)x(k) +Bu(k) + h(k) (3.21)

où B = LG ∈ Rn×m et h(k) = r(k) +GLξ ∈ Rn. Notons tout de suite que la matrice A

est non-négative car di(x) ≤ 1 et 0 ≤ A(x) ≤ I .

Il va sans dire que le flux d’entrée représenté par le vecteur r(k) n’est pas connu en

général. Dans la pratique, la seule information disponible sur ce vecteur incertain réside

dans la connaissance des bornes des intervalles auxquels appartiennent ces composantes.

C’est pourquoi, dans la suite, nous supposons que l’incertitude h(k) est de type borné en

norme, c’est-à-dire les contraintes sur h(k) sont définies par :

R = h ∈ Rn/ ‖h‖2 ≤ hm, hm > 0 (3.22)

où, ‖ ‖2 est la norme euclidienne.

Domaine de commande admissible : Comme pour toute stratégie de synthèse, il est

nécessaire de définir clairement le domaine de commande admissible. En effet, la com-

mande du système est à rechercher dans un ensemble défini par deux limitations pra-

tiques :

– La première est la nécessité de prendre en compte des contraintes sur l’état. En effet,

pour que le modèle de transport ait un sens physique, il faut que l’état appartienne

au domaine E = x ∈ Rn/x ≥ 0. Ainsi la commande est à rechercher parmi les

suites de commandes telles que x ∈ E pour tout k ∈ N. Soit x∗ = [x∗1, · · · , x∗n]T le

vecteur des capacités maximales de chaque tronçon. Puisque le nombre de véhicules

Page 89: Concepts thermodynamiques et d'entropie pour la

3.4 Spécialisation aux systèmes de transport 71

ne peut pas dépasser la capacité de chaque tronçon, les contraintes sur l’état sont

alors définies par :

X = x ∈ Rn/ 0 ≤ x ≤ x∗ (3.23)

– La deuxième limitation est la nécessité de prendre en compte des contraintes sur la

commande. En effet, les feux verts effectifs doivent respecter les conditions aux li-

mites suivantes 0 ≤ gej ≤ c. Cependant, certaines conditions aux limites ne corres-

pondent pas à la réalité physique du système. En particulier, gej = 0 (resp, gej = c)

se traduit par l’absence du feu vert effectif pour le tronçon j (resp, l’absence des

feux verts effectifs pour les tronçons antagonistes). Par conséquent, il est important

de sélectionner deux bornes gmin et gmax sur la valeur de la commande telles que

gmin ≤ gej ≤ gmax. Ces bornes peuvent être fournies par les actionneurs et doivent

être convenablement choisies. En effet, une durée courte ou longue du feu vert ef-

fectif n’est pas acceptable sur le plan pratique. De ce fait, les feux verts effectifs

doivent respecter les conditions aux limites suivantes :

umin = gmin ≤ uj ≤ gmax = umax (3.24)

Les contraintes sur u(k) sont alors définies par :

U = u ∈ Rm/ umin ≤ u ≤ umax (3.25)

Notons que ces deux contraintes traduisent une cohérence avec le fonctionnement réel

d’un carrefour. En effet, puisque le cycle de signalisation est borné, le temps du feu vert

effectif doit être borné. En outre, puisque l’état traduit dans notre cas le nombre de véhi-

cules présents dans un tronçon, nous comprenons aisément qu’il soit positif.

Sur ce, nous terminons notre aperçu général de la formulation du modèle non-linéaire

pour passer à la définition du problème de la commande et sa solution en terme de LMI.

Problème de la commande dissipative des systèmes de transport

le problème de la commande dissipative pour notre système peut être formulé comme

suit : trouver, si c’est possible, un retour d’état u = α(x), tel que le système (3.21)

transformé :

x(k + 1) = A(x)x(k) +Bα(x(k)) + h(k) (3.26)

Page 90: Concepts thermodynamiques et d'entropie pour la

72 Chap 3. Commande dissipative des réseaux de transport

soit dissipatif pour tout h ∈ R. En d’autres termes, d’après l’inégalité (3.13), trouver un

retour d’état u = α(x) tel que pour tout h ∈ R, l’inégalité suivante est satisfaite :

g(α(x)) = αT (x)BTPBα(x) + αT (x)BTP (Ax+ h) ≤ 0 (3.27)

Il est important de noter que l’existence des contraintes (3.25) implique que le retour

d’état u = α(x) n’est admissible que dans une région déterminée de l’espace d’état,

c’est-à-dire :

Ux = x ∈ Rn/ umin ≤ α(x) ≤ umax (3.28)

Toutefois, tout état émanant de X peut parfaitement donner une trajectoire sortant

de l’ensemble Ux. De ce fait, il est nécessaire d’assurer l’inclusion X ⊆ Ux. De cette

manière, si x(k) ∈ X alors on est sûr que x(k) ∈ Ux. L’objectif de la commande est donc

le suivant :

Objectif :

1. trouver un retour d’état u = α(x) tel que pour tout h ∈ R, l’inégalité suivante est

satisfaite :

g(α(x)) = αT (x)BTPBα(x) + αT (x)BTP (Ax+ h) ≤ 0 (3.29)

2.

X ⊆ Ux (3.30)

Dans la suite, nous adoptons une démarche qui consiste à séparer l’étude de la dissi-

pativité du système et l’étude de l’inclusion X ⊆ Ux. Il s’agit de simplifier la présentation

tout en traitant l’ensemble des aspects du problème. Une fois que ces deux études sont

présentées séparément, leur intégration dans une formulation complète devient évidente.

Solution du problème :

Sur la dissipativité du système :

Pour simplifier les notation, posons M = BTPB, y = 12BTPAx et w = 1

2BTPh. Il

vient à partir de (3.29) que :

g(u) = uTMu+ 2uTy + 2uTw (3.31)

Page 91: Concepts thermodynamiques et d'entropie pour la

3.4 Spécialisation aux systèmes de transport 73

Or, on sait que uTw ≤ |uTw| ≤ ‖u‖2 ‖w‖2. De plus, pour tout h ∈ R nous avons :

‖w‖2 = ‖1

2BTPh‖2 ≤

1

2‖BTP‖2‖h‖2 ≤

1

2‖BTP‖2hm , wm

On en déduit que :

g(u) ≤ uTMu+ 2uTy + 2‖u‖2wm (3.32)

Or, on sait que ‖u‖2 ≤ ‖u‖1, où ‖u‖1 est la norme 1. Il vient ‖u‖1 = εTu, car u > 0.

Rappelons que ε = (1, · · · , 1)T . Ainsi, l’inégalité (3.32) implique :

g(u) ≤ uTMu+ 2uT (y + εwm) , gm(u) (3.33)

Donc, si gm(u) ≤ 0, alors g(u) ≤ 0 et le système serait dissipatif. Le problème main-

tenant est de trouver u telle que gm(u) ≤ 0. En effet, observons d’abord que, puisque

εT l = εTBu = 0 pour tout u (voir chapitre 2), alors εTB = 0. Ceci implique que les

lignes de B sont linéairement dépendantes si bien que M est singulière. Par conséquent,

la matrice M est symétrique semi-définie positive, et donc toutes ses valeurs propres

sont non-négatives. Ainsi, il existe une matrice orthogonale K (KT = K−1) telle que

M = KCKT , où C est une matrice diagonale sous la forme :

C = diag(ν1; · · · , νp, 0, · · · , 0)

avec νi > 0 sont les valeurs propres de M et p = rang(M). Les colonnes de K sont les

vecteurs propres de M . Posons D = diag(ν1; · · · , νr), D est donc inversible et M peut

s’écrire comme :

M = K

(D

12 0

0 Im−p

)(Ip 0

0 0

)(D

12 0

0 Im−p

)KT

Définissons la matrice J par :

J = K

(D

12 0

0 Im−p

)

Alors J−1 est bien définie car la matrice K est orthogonale. Il vient alors :

M = J

(Ip 0

0 0

)JT

Page 92: Concepts thermodynamiques et d'entropie pour la

74 Chap 3. Commande dissipative des réseaux de transport

Dans ce cas, la fonction gm(u) se transforme naturellement en :

gm(u) = uTJ

(Ip 0

0 0

)JTu+ 2uT (y + εwm)

Soient z = JTu et θ = J−1(y + εwm), alors gm peut s’écrire sous la forme :

gm(z) = zT

(Ip 0

0 0

)z + 2zT θ = zT z + 2zT θ − zT

(0 0

0 Im−p

)z

Or, −zT(

0 0

0 Im−p

)z ≤ 0, il vient :

gm(z) ≤ zT z + 2zT θ = (z + θ)T (z + θ)− θT θ , f(θ)

Soit maintenant R une matrice telle que z = Rθ. Il s’ensuit que :

f(θ) = (z + θ)T (z + θ)− θT θ = θT[(R + I)T (R + I)− I

]θ (3.34)

Ainsi, f(θ) ≤ 0 pour tout θ si et seulement si (R + I)T (R + I) − I est semi-définie

négative, c’est-à-dire :

(R + I)T (R + I)− I 0

ou d’une manière équivalente :

I − (R + I)T (R + I) 0 (3.35)

L’application du lemme 3.3 de Schur avec R = Q = I , S = (R+I)T donne (voir rappels

mathématiques) : (I (R + I)T

(R + I) I

) 0 (3.36)

Ainsi, le système (3.26) est dissipatif si la LMI (3.36) est faisable. D’où le théorème

suivant.

Théorème 3.2 Soit la matrice R solution de la LMI suivante :(I (R + I)T

(R + I) I

) 0

Alors, pour tout h ∈ R, le retour d’état :

u(x) = (JT )−1RJ−1(1

2BTPAx+ εwm) (3.37)

rend le système (3.26) dissipatif par rapport au taux d’approvisionnement S(k) = xT (k+

1)Pr(k) et la fonction de stockage ψ(x) = 12xTPx.

Page 93: Concepts thermodynamiques et d'entropie pour la

3.4 Spécialisation aux systèmes de transport 75

Remarquons que si la matrice R est symétrique (i.e., RT = R), alors d’après (3.34),

f(θ) ≤ 0 si et seulement si −2 ≤ λi ≤ 0, pour toute valeur propre λi de R. En effet,

puisque R est symétrique, elle est toujours diagonalisable. Ainsi, il existe une matrice

orthogonale F telle que R = FLF T , où L est une matrice diagonale dont les éléments

diagonaux sont les valeurs propres de R. Il vient alors :

(R + I)T (R + I)− I = R2 + 2R = F (L2 + 2L)F T

d’où f(θ) ≤ 0 si et seulement si (L2 + 2L) est semi-définie négative. Or L2 + 2L =

diag(λ21 + 2λ1, · · · , λ2

n + 2λm), on en déduit que (L2 + 2L) est semi-définie négative si

et seulement si λ2i + 2λi ≤ 0, ∀i = 1, · · · ,m. D’où l’on peut inférer −2 ≤ λi ≤ 0. Nous

avons alors le corollaire suivant.

Corollaire 3.1 Soit R une matrice symétrique telle que −2 ≤ λi ≤ 0,∀i = 1, · · · ,m, où

λi sont les valeurs propres de R. Alors, pour tout h ∈ R, le retour d’état :

u(x) = (JT )−1RJ−1(1

2BTPAx+ εwm) (3.38)

rend le système (3.26) dissipatif par rapport au taux d’approvisionnement S(k) = xT (k+

1)Pr(k) et la fonction de stockage ψ(x) = 12xTPx.

Remarque 3.2 Il vient immédiatement à partir de ce corollaire que pour un choix arbi-

traire de la matrice R telle que −2 ≤ λi ≤ 0,∀i = 1, · · · ,m, le retour d’état (3.38)

fournit la classe des commandes rendant le système dissipatif. Ainsi, le corollaire 3.1

donne une solution explicite mais pas unique au problème de la commande dissipative.

Cette liberté de choix de la matrice R confère à la commande dissipative dans le cadre

de la régulation des carrefours à feux une flexibilité permettant de l’adapter à plusieurs

situations possibles. Ceci est, à notre sens, un avantage certain, car elle nous offre un

ensemble de choix possibles pour améliorer les performances de la commande de notre

système. En outre, dans le cas particulier d’un système de transport sans flux d’entrée,

i.e., r ≡ 0, le taux d’approvisionnement devient S(k) = 0. Dans ce cas, si R est choisie

telle que −2 < λi < 0, ∀i = 1, · · · ,m, alors (R + I)T (R + I) − I est définie négative.

Il vient ∆ψ(x(k)) < 0, x 6= 0, ∀k ∈ N, ce qui montre que l’état d’équilibre x = 0 est

asymptotiquement stable au sens de Lyapunov. I

Page 94: Concepts thermodynamiques et d'entropie pour la

76 Chap 3. Commande dissipative des réseaux de transport

Sur l’inclusion X ⊆ Ux

Pour introduire ce que nous allons faire, commençons par préciser un peu le cadre.

Soit XA l’ensemble défini par :

XA = x ∈ Rn/ 0 ≤ Ax ≤ x∗ (3.39)

Proposition 3.1 Nous avons X ⊆ XA

Preuve: La preuve est immédiate si on remarque que 0 ≤ A ≤ I,∀x ∈ X

Il vient immédiatement à partir de cette proposition que si XA ⊆ Ux alors X ⊆ Ux. Cela

dit, observons d’abord que le retour d’état (3.38) peut s’écrire sous la forme :

u(x) = HA(x)x+ π (3.40)

avecH = 12(JT )−1RJ−1BTP et π = (JT )−1RJ−1εwm. Ainsi, l’ensemble des contraintes

Ux peut s’écrire sous la forme :

Uπ = x ∈ Rn/ − π2 ≤ HA(x)x ≤ π1 (3.41)

Avec, π2 = π − umin et π1 = umax − π. Donc, l’inclusion (3.30) peut alors se formuler

ainsi :

XA ⊆ Ux ⇐⇒ XA ⊆ Uπ

Posons maintenant Ax = y. Les ensembles XA et Uπ se transforment en :

Uy = y ∈ Rn/ − π2 ≤ Hy ≤ π1

Xy = y ∈ Rn/ 0 ≤ y ≤ x∗

Remarquons que puisque 0 ∈ Uy alors nécessairement nous avons π1 ≥ 0 et π2 ≥ 0. Cela

dit, la condition d’inclusion XA ⊆ Uπ peut alors se formuler ainsi :

y ∈ Xy ⇒ y ∈ Uy (3.42)

En d’autres termes, si y est solution du système d’inégalités(I−I

)y ≤

(x∗

0

)alors y est

aussi une solution du système d’inégalités(H−H

)y ≤

(π1

π2

). Ainsi, en vertu du théorème

Page 95: Concepts thermodynamiques et d'entropie pour la

3.4 Spécialisation aux systèmes de transport 77

3.1 (voir rappels mathématiques), la condition (3.42) équivaut à l’existence d’une matrice

non-négative K ∈ R2m×2n+ telle que :

K(I

−I

)=

(H

−H

)(3.43)

K(x∗

0

)≤(π1

π2

)(3.44)

Posons :

K =

(K11 K12

K21 K22

)Il s’ensuit à partir de (3.43) et (3.44) que :

K11 −K12 = H (3.45)

K22 −K21 = H (3.46)

K11x∗ ≤ π1 (3.47)

K21x∗ ≤ π2 (3.48)

d’où l’on peut inférer :

H = K11 −K12 = K22 −K21 (3.49)

Les relations (3.47) et (3.48) peuvent se formuler ainsi :(K11 O

O K21

)(x∗

x∗

)≤(π1

π2

)(3.50)

Définissons les matrices H+ et H− par :

H+ = (H+ij ); où H+

ij = sup(Dij, 0)

H− = (H−ij ); où H−ij = − inf(Dij, 0)

Il est clair que :

H+ ≥ 0; H− ≥ 0; H = H+ −H− (3.51)

Nous avons alors le proposition suivante :

Proposition 3.2 Les inégalités suivantes sont satisfaites :

H+ij ≤ min(K11)ij; (K22)ij

H−ij ≤ min(K12)ij; (K21)ij

Page 96: Concepts thermodynamiques et d'entropie pour la

78 Chap 3. Commande dissipative des réseaux de transport

Preuve: Puisque la décomposition de H en H+ et H− est minimale (voir lemme 3.1)

alors l’équation (3.49) donne :

H+ij ≤ (K11)ij et H+

ij ≤ (K22)ij

H−ij ≤ (K12)ij et H−ij ≤ (K21)ij

si bien que :

H+ij ≤ min(K11)ij; (K22)ij

H−ij ≤ min(K12)ij; (K21)ij

Il résulte de cette proposition et l’inégalité (3.50) que :(H+ O

O H−

)(x∗

x∗

)≤

(K11 O

O K21

)(x∗

x∗

)≤(π1

π2

)(3.52)

Par conséquent, les conditions (3.43) et (3.44) et l’équation (3.49) sont équivalentes à

l’existence de deux matrices non-négatives H1 ∈ Rm×n+ et H2 ∈ Rm×n

+ :

H1 −H2 = H (3.53)

H1x∗ ≤ π1 (3.54)

H2x∗ ≤ π2 (3.55)

Finalement, en réunissant les conditions citées plus haut, nous avons la proposition

suivante.

Proposition 3.3 Supposons que π1 > 0 et π2 > 0. Alors Xy ⊆ Uy si et seulement s’il

existe deux matrices non-négatives H1 et H2 telles que :

H1 −H2 = H (3.56)

H1x∗ ≤ π1 (3.57)

H2x∗ ≤ π2 (3.58)

Preuve: Suffisance : Multiplions l’inégalité 0 ≤ y ≤ x∗ par H1, il vient :

0 ≤ H1y ≤ H1x∗ (3.59)

Page 97: Concepts thermodynamiques et d'entropie pour la

3.4 Spécialisation aux systèmes de transport 79

De même, la multiplication de l’inégalité par −H2 donne :

−H2x∗ ≤ −H2y ≤ 0 (3.60)

L’addition maintenant de (3.59) et (3.60) implique :

−H2x∗ ≤ (H1 −H2)y ≤ H1x

∗ (3.61)

il vient à partir de (3.56), (3.57) et (3.58) :

−π2 ≤ Hy ≤ π1

d’où y ∈ Uy.

Nécessité : il suffit de prendre H1 = H+ et H2 = H− et d’appliquer le raisonnement

plus haut.

Finalement la solution de notre problème de commande est résumée dans le théorème

suivant :

Théorème 3.3 Supposons que π1 > 0 et π2 > 0. Alors, s’il existe une matrice R et deux

matrices non-négatives H1 et H2 telles que :(I (R + I)T

(R + I) I

) 0

H1 −H2 = H (3.62)

H1x∗ ≤ π1 (3.63)

H2x∗ ≤ π2 (3.64)

Alors, pour tout h ∈ R, le retour d’état :

u(x) = (JT )−1RJ−1(1

2BTPAx+ εwm) (3.65)

1. rend le système (3.26) dissipatif par rapport au taux d’approvisionnement S(k) =

xT (k + 1)Pr(k) et la fonction de stockage ψ(x) = 12xTPx.

2. respecte la contrainte X ⊆ Ux

Page 98: Concepts thermodynamiques et d'entropie pour la

80 Chap 3. Commande dissipative des réseaux de transport

Il va sans dire que la condition X ⊆ Ux nécessite l’hypothèse π1 > 0 et π2 > 0.

Si cette condition n’est pas vérifiée, nous pouvons envisager pour éviter la violation des

contraintes sur la commande u(x) ∈ U de prendre la fonction sat(x) suivante :

sat(ui) =

ui,min : ui ≤ ui,min

ui : ui,min ≤ ui ≤ ui,max

ui,max : ui ≥ ui,max

(3.66)

Sur ce, nous terminons notre solution du problème de la dissipativité du modèle non-

linéaire pour passer au cas linéaire.

3.4.3 Cas d’un modèle linéaire

Pour modéliser un réseau de transport par une équation d’état linéaire, le flux de sor-

tie di ainsi que le flux d’entrée ri de chaque tronçon i peuvent s’écrire sous la forme

(voir[44]) :

di(k) = sigi(k)λi,i (3.67)

ri(k) = qi(k)c (3.68)

où c est le temps du cycle des feux et q(k) est le débit d’entrée du i-ième tronçon. C’est

le nombre de véhicules par unité de temps franchissant une ligne d’entrée d’un tronçon.

D’après l’équation (3.18) nous avons :

li(k) =n∑

j=1,j 6=i

sj(x)gj(k)λi,j − si(x)gi(k)n∑

j=1,j 6=i

λj,i (3.69)

Puisque∑n

j=1 λj,i = 1, il vient :

li(k) =n∑

j=1,j 6=i

sj(x)gj(k)λi,j − si(x)gi(k)(1− λi,i) (3.70)

Définissons le vecteur Li par : Li = [Li,1, · · · , Li,n]T ∈ Rn où :

Li,j =

−si(1− λi,i) : pour i = j

sjλi,j : pour i 6= j

Page 99: Concepts thermodynamiques et d'entropie pour la

3.4 Spécialisation aux systèmes de transport 81

Alors, les équations (3.70) et (3.17) donnent :

li(k) =n∑

j=1,j 6=i

Li,jgj(k) + Li,igi(k) =n∑j=1

Li,jgj(k) = LTi g(k)

= LiGu(k) + Liξ (3.71)

Dans ces conditions, l’équation d’état du réseau de transport (3.21) prend la forme linéaire

suivante :

x(k + 1) = x(k) + q(k)c+Bu(k) + h (3.72)

où q = [q1, · · · , qn]T est le vecteur de débits d’entrée, B = (L−D)G, h = (L−D)ξ et

D ∈ Rn×n est une matrice diagonale dont les éléments diagonaux sont siλi,i.

Comme il a été étudié par Diakaki [51], dans les carrefours à feux, il existe une situa-

tion où le nombre d’entrées est égal au nombre de sorties. Cette situation est appelée étatnominal ou état d’équilibre et est notée xN . La commande et le débit d’entrée corres-

pondants quant à eux sont notés uN et qN . Dans cette situation, nous avons :

qNc+BuN + h = 0. (3.73)

Généralement, un minimum de connaissances sur le processus à commander permet de

dire quels sont les états d’équilibre intéressants. Nous supposons donc que l’ensemble de

ces états d’équilibre est connu. Dans ces conditions, posons comme nouveau vecteur de

commande :

v(k) = u(k)− uN (3.74)

et comme nouveau vecteur de débit :

w(k) = (q(k)− qN)c (3.75)

L’équation d’état (3.72) se transforme naturellement en :

x(k + 1) = x(k) +Bv(k) + ω(k) (3.76)

Les contraintes sur l’état sont définies par :

X = x ∈ Rn/ 0 ≤ x ≤ x∗ (3.77)

D’après (3.25), les contraintes sur u(k) se transportent sur v(k) en :

U = v ∈ Rm/ − v2 ≤ v ≤ v1, v1, v2 > 0 (3.78)

où v1 = umax − uN , and v2 = uN − umin.

Page 100: Concepts thermodynamiques et d'entropie pour la

82 Chap 3. Commande dissipative des réseaux de transport

Remarque 3.3 Soulignons que, comme dans le cas non-linéaire, le débit d’entrée q(k)

n’est pas connu en général. Ainsi, w(k) représente les incertitudes du modèle. Cependant,

contrairement au cas non-linéaire, nous supposons qu’aucune information sur ce vecteur

incertain n’est disponible. I

La commande du système dynamique (3.76) aura pour expression :

v(k) = Kx(k) (3.79)

où K ∈ Rm×n. Dans ce cas, le système(3.76) en boucle fermée est donné par :

x(k + 1) = x(k) +BKx(k) + ω(k) = Ax(k) + ω(k) (3.80)

où A = I +BK.

Soulignons que, comme dans le cas non-linéaire, l’existence des contraintes (3.78)

implique que le retour d’état u = Kx n’est admissible que dans une région déterminée de

l’espace d’état, c’est-à-dire :

Ux = x ∈ Rn/ − v2 ≤ Kx ≤ v1; v1 > 0; v2 > 0 (3.81)

Ce domaine représente l’ensemble des états admissibles pour la commande pour K choi-

sie telle que rang(K) = m. Il est polyédral dissymétrique contenant l’origine. De ce fait,

il est nécessaire d’assurer l’inclusion X ⊆ Ux. De cette manière, si x(k) ∈ X alors on est

sûr que x(k) ∈ Ux. l’objectif de la commande est donc le suivant :

Objectif : Trouver un contrôleur par retour d’état v = Kx tel que :

1. le système (3.76) soit dissipatif par rapport au taux d’approvisionnement S(k) =

xT (k + 1)Pr(k) et la fonction de stockage ψ(x) = 12xTPx,

2. X ⊆ Ux

Comme dans le cas non-linéaire, nous allons séparer l’étude de la dissipativité du

système et l’étude de l’inclusion X ⊆ Ux.

Sur la dissipativité du système

Pour expliquer comment on peut trouver un retour d’état rendant le système (3.76)

dissipatif sans connaissance préalable sur les bornes des incertitudes w, il nous faut com-

mencer à préciser le cadre. Commençons donc par donner le lemme suivant.

Page 101: Concepts thermodynamiques et d'entropie pour la

3.4 Spécialisation aux systèmes de transport 83

Lemme 3.4 Soit :

Sω(k) = x(k + 1)TPω(k) (3.82)

Si le système (3.76) est dissipatif par rapport au taux d’approvisionnement Sω(k), alors

il est aussi dissipatif par rapport au taux d’approvisionnement S(k).

Preuve: Puisque le système (3.76) est dissipatif par rapport au taux d’approvisionnement

Sω(k), alors d’après la définition 3.3 :

ψ(x(k + 1))− ψ(x(k)) ≤ Sω(k) (3.83)

Or, r(k) = q(k)c et ω(k) = (q(k)− qN)c, il vient alors ω(k) = r(k)− rN . Ainsi :

Sω(k) = x(k + 1)TP (r(k)− rN(k))

= x(k + 1)TPr(k)− x(k + 1)TPrN(k)

Puisque −x(k + 1)TPrN(k) < 0 car x(k + 1) ≥ 0 et rN(k) ≥ 0, il s’ensuit que :

Sω(k) ≤ x(k + 1)TPr(k) = S(k)

ce qui prouve le lemme.

A partir de ce lemme, il devient maintenant clair que toute recherche d’un retour d’état

rendant le système (3.76) dissipatif va se baser sur le taux d’approvisionnement Sω(k) au

lieu de S(k).

Regardons à présent les conditions sur le gain K pour que le système bouclé (3.80)

soit dissipatif. En effet, observons d’abord que :

4ψ(x)− Sω(k) =1

2

[x(k + 1)TPx(k + 1)− x(k)TPx(k)

]−x(k + 1)TPω(k)

=1

2

[(Ax+ ω

)TP(Ax+ ω

)−xTPx

]−(Ax+ ω

)TPω

= −1

2

[xT (P − ATPA)x+ ωTPω

]Ainsi, puisque ωTPω ≥ 0 car P est définie positive, alors l’inégalité :

ψ(x(k + 1))− ψ(x(k)) ≤ Sω(k)

est satisfaite si la matrice P − ATPA est semi-définie positive, c’est-à-dire,

P − ATPA 0

Page 102: Concepts thermodynamiques et d'entropie pour la

84 Chap 3. Commande dissipative des réseaux de transport

Or,

P − ATPA = P − (I +BK)TP (I +BK) = −KTBTP − PBK −KTBTPBK

= −KTBTP − PBK −KTBTPP−1PBK

L’application du lemme 3.3 de Schur avec R = −KTBTP − PBK, Q = P , S =

(PBK)T donne la LMI suivante :(−KTBTP − PBK KTBTP

PBK P

) 0 (3.84)

D’où le théorème.

Théorème 3.4 Si le gain K est solution de la LMI suivante :(−KTBTP − PBK KTBTP

PBK P

) 0 (3.85)

alors, le retour d’état v = Kx rend le système (3.76) dissipatif par rapport au taux

d’approvisionnement S(k) = xT (k+ 1)Pr(k) et la fonction de stockage ψ(x) = 12xTPx.

Notons tout de suite que la condition P − ATPA 0 peut aussi être déterminée par

une autre procédure. En effet, puisque A = I +BK, alors

P − (I +BK)TP (I +BK) 0 (3.86)

Or, on sait que la condition T 0 est équivalente à P−1TP−1 0, car xTTx =

yTP−1TP−1y ≥ 0, où y = Px. Ainsi, (3.86) est équivalente à :

P−1 − P−1(I +BK)TP (I +BK)P−1 0

Il s’ensuit que :

P−1 − (P−1 +BKP−1)TP (P−1 +BKP−1) 0

Posons Q = P−1. Il vient alors :

Q− (Q+BKQ)TQ−1(Q+BKQ) 0

Si nous appliquons maintenant le changement de variable Y = KQ, la dernière inégalité

devient :

Q− (Q+BY )TQ−1(Q+BY ) 0

Page 103: Concepts thermodynamiques et d'entropie pour la

3.4 Spécialisation aux systèmes de transport 85

L’application du lemme 3.3 de Schur avec R = Q, S = (Q+BY )T donne :(Q Q+ Y TBT

Q+BY Q

) 0, Q = P−1, Y = KQ (3.87)

D’où le corollaire suivant.

Corollaire 3.2 Si la LMI suivante est faisable :(Q Q+ Y TBT

Q+BY Q

) 0, Q = P−1, Y = KQ (3.88)

alors, le retour d’état v = Kx rend le système (3.76) dissipatif par rapport au taux

d’approvisionnement S(k) = xT (k+ 1)Pr(k) et la fonction de stockage ψ(x) = 12xTPx.

Remarquons à partir de ce lemme que pour calculer le gain K, Il suffit donc de ré-

soudre la LMI ci-dessus en Y = KQ puis de calculer K = Y Q−1.

Sur l’inclusion X ⊆ Ux

Regardons à présent les nouvelles conditions sur K pour que X ⊆ Ux. En effet, défi-

nissons le vecteur v∗ = [v∗1, · · · , v∗m]T par :

v∗i = min(v1,i, v2,i), i ∈ 1, · · · ,m

Soit Ki la i-ème ligne de la matrice K. Nous avons alors pour tout i ∈ 1, · · · ,m :

|vi|2 = |Kix|2 ≤ ‖Ki‖22 ‖x‖2

2 ≤ ‖Ki‖22 max

x∈X‖x‖2

2 = ‖Ki‖22 ‖x∗‖2

2 (3.89)

Nous sommes maintenant prêts à énoncer le lemme suivant.

Lemme 3.5 Si la matrice K est choisie telle que :

‖Ki‖22 ‖x∗‖2

2 ≤ v∗2

i , ∀i ∈ 1, · · · ,m (3.90)

alors X ⊆ Ux.

Preuve: Soit x ∈ X et soit v = Kx. En vertu de (3.89), l’inégalité (3.90) implique pour

tout i ∈ 1, · · · ,m :

|vi|2 ≤ v∗2

i

Page 104: Concepts thermodynamiques et d'entropie pour la

86 Chap 3. Commande dissipative des réseaux de transport

ce qui donne −v∗i ≤ vi ≤ v∗i . Puisque v∗i = min(v1,i, v2,i), il vient aussitôt que :

vi ≤ v1,i

De plus, −v∗i ≤ vi implique :

vi ≥ −min(v1,i, v2,i) ≥ −v2,i

Ainsi, −v2,i ≤ vi ≤ v1,i, ou d’une manière équivalente −v2,i ≤ Kix ≤ v1,i pour tout

i ∈ 1, · · · ,m, ce qui prouve que x ∈ Ux .

Pour transformer la contrainte (3.90) en LMIs, observons qu’elle est équivalente à

v∗2

i

‖x∗‖22

−KiKTi ≥ 0, ∀i ∈ 1, · · · ,m (3.91)

Soit N ∈ Rm×m une matrice symétrique dont les éléments diagonaux vérifient Nii ≤v∗

2

i

‖x∗‖22. Il est clair que si l’inégalité suivante est satisfaite :

Nii −KiKTi ≥ 0, ∀i ∈ 1, · · · ,m (3.92)

alors l’inégalité (3.91) est satisfaite. Ceci dit, remarquons que l’inégalité (3.92) est équi-

valente à :

diag[N −KKT ] ≥ 0 (3.93)

Or, il est bien connu que si une matrice est semi-définie positive, alors nécessairement

ses éléments diagonaux sont non-négatifs. Ainsi, si la matrice K est choisie telle que la

matrice N − KKT est semi-définie positive, alors l’inégalité (3.93) est satisfaite. L’ap-

plication maintenant du lemme 3.3 de Schur sur N −KKT 0 avec R = N , Q = I et

S = KT donne la LMI suivante : (N K

KT I

) 0 (3.94)

Pour résumer les résultats précédents, notons qu’une propriété remarquable des LMIs

est la possibilité de regrouper plusieurs LMIs en une seule LMI bloc-diagonale. Cette

propriété nous permet finalement d’énoncer la solution de notre problème de commande

en termes d’une seule LMI.

Page 105: Concepts thermodynamiques et d'entropie pour la

3.4 Spécialisation aux systèmes de transport 87

Théorème 3.5 Soit la matrice K solution de la LMI suivante :(−KTBTP − PBK KTBTP

PBK P

)O

O

(N K

KT I

) 0, avec Nii ≤

v∗2

i

‖x∗‖22

(3.95)

Alors, le retour d’état v = Kx :

1. rend le système (3.76) dissipatif par rapport au taux d’approvisionnement S(k) =

xT (k + 1)Pr(k) et la fonction de stockage ψ(x) = 12xTPx

2. vérifie la contrainte X ⊆ Ux.

Soulignons un fait majeur qui résulte aussitôt de ce Lemme. En effet, pour un choix

arbitraire de la matrice N telle que Nii ≤ v∗2

i

‖x∗‖22, le retour d’état v = Kx fournit la

classe des commandes rendant le système dissipatif. Cette liberté de choix de la matriceN

confère à la commande dissipative dans le cadre de la régulation des carrefours à feux une

flexibilité permettant de l’adapter à plusieurs situations possibles. Ceci est, à notre sens,

un avantage certain, car elle nous offre une multitude de choix possibles pour améliorer

les performances de la commande de notre système.

Par ailleurs, remarquons que l’inclusion X ⊆ Ux peut aussi être déterminée par l’ap-

plication du théorème 3.1. En effet, cette inclusion implique que si x est solution du

système d’inégalités(I−I

)y ≤

(x∗

0

)alors x est aussi une solution du système d’inégalités(

K−K

)x ≤

(v1

v2

). Ainsi, en vertu de la proposition 3.3 la condition X ⊆ Ux est équivalente

à l’existence de deux matrices non-négatives K1 ∈ Rm×n+ et K2 ∈ Rm×n

+ :

K1 −K2 = K (3.96)

K1x∗ ≤ v1 (3.97)

K2x∗ ≤ v2 (3.98)

Pour transformer les inégalités (3.97) et (3.97) en LMI, il suffit de remarquer que ces

inégalités peuvent s’écrire sous la forme :

v1 −K1x∗ ≥ 0

v2 −K2x∗ ≥ 0

Page 106: Concepts thermodynamiques et d'entropie pour la

88 Chap 3. Commande dissipative des réseaux de transport

ce qui est équivalent à :(diag(vi1 −Ki

1x∗i ) 0

0 diag(vi2 −Ki2x∗i )

) 0 (3.99)

D’où le théorème

Théorème 3.6 Soient les matrices K, K1 et K2 sont solutions de la LMI suivante :(−KTBTP − PBK KTBTP

PBK P

)O

O

(diag(vi1 −Ki

1x∗i ) 0

0 diag(vi2 −Ki2x∗i )

) 0,

avec K = K1 −K2

Alors, le retour d’état v = Kx :

1. rend le système (3.76) dissipatif par rapport au taux d’approvisionnement S(k) =

xT (k + 1)Pr(k) et la fonction de stockage ψ(x) = 12xTPx

2. vérifie la contrainte X ⊆ Ux.

Remarque 3.4 Contrairement au cas non-linéaire, les conditions de la dissipativité du

système de transport dans le cas linéaire sont données sans qu’on dispose d’information

spécifique sur les incertitudes w. Ceci peut paraître surprenant, cependant il n’en est rien.

En effet, les conditions du théorème sont formulées pour exiger la dissipativité par rap-

port au taux d’approvisionnement Sw(k) au lieu de S(k). Dans ce cas, la quantité du

désordre stockée pendant un cycle n’est jamais supérieure au désordre fourni par les per-

turbations w(k) durant ce cycle. Autrement dit, si la condition (3.85) est satisfaite, alors

la commande fait que, toutes les trajectoires du système sont incluses dans l’ensemble des

contraintes X. La stabilité du système peut seulement être garantie si r(k) ≤ rN ∀k, car

dans ce cas Sw(k) ≤ 0 et l’entropie est une fonction de Lyapunov définie positive. Ce-

pendant, dans la réalité, cette hypothèse ne peut pas toujours être suivie et par conséquent

la stabilité peut être menacée.

3.5 Conclusion

Dans ce chapitre, une approche basée sur la commande dissipative a été adaptée avec

succès et appliquée aux réseaux de carrefours à feux. Dans un premier temps, le principe

Page 107: Concepts thermodynamiques et d'entropie pour la

3.5 Conclusion 89

de cette approche a été donné dans sa formulation la plus générale, puis un examen a été

fait afin de mettre en évidence ses avantages. Dans un deuxième temps, une spécialisation

du problème de la commande dissipative aux systèmes des carrefours à feux a été réalisée.

En considérant l’entropie comme étant le désordre stocké dans le système, nous avons

élaboré une loi de commande rendant le système dissipatif, c’est à dire permettant de

rendre le système mieux organisé. Cette étude est faite dans une formulation qui prend

en compte explicitement les contraintes aussi bien sur la commande que sur l’état. Deux

cas ont été étudiés : celui où le modèle du système est non-linéaire est d’abord analysé.

Ensuite, nous nous sommes intéressés au cas où le système peut être représenté par un

modèle linéaire. Dans les deux cas, la mise en évidence de l’outil LMI nous a permis

d’énoncer des conditions suffisantes pour la résolution de notre problème de commande

dissipative.

Dans le cas non-linéaire, nous avons trouvé une borne supérieure sur la norme des

incertitudes wm en deçà de laquelle la propriété de la dissipativité du système incertain

est conservée. Cependant, dans le cas linéaire, la commande n’impose aucune pénalité sur

les incertitudes. Par conséquent, l’effet des perturbations sur le comportement du système

bouclé est difficile à maitriser, et en particulier la stabilité n’est plus garantie.

Ce dernier point est un handicap qui est, à notre sens, sérieux. En effet, il enlève à

l’approche des systèmes dissipatifs l’un de ces principaux avantages, à savoir la possibilité

de réaliser un compromis entre un comportement souhaité et le coût de la commande

nécessaire pour l’obtenir. Il faut donc se tourner vers d’autres méthodes de synthèse pour

un traitement quantitatif plus rigoureux garantissant une loi de contrôle qui amortisse

le plus rapidement possible les perturbations susceptibles de déstabiliser les systèmes.

La commande H∞ se positionne parmi les approches permettant d’atteindre cet objectif.

C’est le sujet du chapitre suivant.

Page 108: Concepts thermodynamiques et d'entropie pour la

90 Chap 3. Commande dissipative des réseaux de transport

Page 109: Concepts thermodynamiques et d'entropie pour la

CHAPITRE 4

COMMANDE H∞ DES RÉSEAUX DE

TRANSPORT

4.1 Introduction

Ce chapitre utilise le concept d’invariance positive des ensembles pour la régulation a

priori des carrefours signalisés. La vérification de cette propriété permet de conclure sur la

possibilité de restreindre l’état d’un système à l’intérieur d’un ensemble donné, au moyen

d’une commande appropriée sans supposer aucune structure particulière des contraintes.

Comme il est souligné dans la conclusion du chapitre précédent sur l’inconvénient

de l’approche de la commande dissipative dans le cas linéaire, notre souci premier est

de déterminer une loi de commande permettant de maintenir un comportement désiré

face aux incertitudes et fluctuations qui affectent le système pendant son fonctionnement.

L’avantage de cette approche serait de donner aux systèmes de transport modélisés par

une équation d’état linéaire, une certaine capacité à résister ou s’adapter aux perturba-

tions extérieures. Pour ce faire, la commande H∞ est une bonne candidate pour réaliser

nos objectifs. En effet, il est bien connu que l’un des principaux avantages de la com-

mande H∞ est l’atténuation des effets des perturbations susceptibles de déstabiliser un

système. En outre, contrairement à l’approche de la commande dissipative, la commande

H∞ permet d’intégrer directement les contraintes sur l’état dans la synthèse du régulateur.

Page 110: Concepts thermodynamiques et d'entropie pour la

92 Chap 4. Commande H∞ des réseaux de transport

En effet, il suffit d’imposer à la fois en boucle fermée l’invariance du domaine X et son

inclusion dans le domaine des contraintes sur la commande Ux pour assurer le respect des

contraintes par les trajectoires du système.

Dans un premier temps, nous rappelons quelques définitions et résultats utiles dont

nous aurons besoin dans la suite de l’exposé. Ceci passe par la définition du problèmeH∞et les conditions d’optimisation de Kuhn et Tucker. Ensuite, nous précisons la définition

du problème de commande qui nous concerne. Une fois que le problème est bien défini,

nous donnons sous forme de relations matricielles linéaires des conditions nécessaires et

suffisantes sur l’existence d’une commande robuste permettant à un domaine ellipsoïdal

d’être à la fois positivement invariant et inclus dans l’ensemble des contraintes sur l’état

et la commande.

4.2 Rappels mathématiques et résultats préliminaires

4.2.1 Sur l’optimisation sous contraintes inégalités

considérons le problème de maximisation suivant :

max f(x)

sous les contraintes hj(x) ≤ cj, j = 1, · · · ,m

On définit le Lagrangien L par la fonction suivante :

L(x, λ) = f(x)−m∑j=1

λj(hj(x)− cj)

où les variables λj sont les multiplicateurs de Lagrange associés a chaque contrainte j.

Notons qu’il est très facile de passer d’un problème de minimisation sous contraintes pre-

nant la forme d’inégalité à un problème de maximisation. En effet, il suffit de remarquer

que le problème de minimisation min f(x) : est équivalent au problème de maximisation

max−f(x).

Soit x la solution du problème de maximisation de la fonction f(x). Deux situations

sont envisageables pour chaque contrainte j.

1. soit hj(x) = cj : dans ce cas, on dit que la contrainte j est saturée à l’optimum ;

2. soit hj(x) < cj : dans ce cas, on dit que la contrainte j est non saturée à l’optimum.

Page 111: Concepts thermodynamiques et d'entropie pour la

4.2 Rappels mathématiques et résultats préliminaires 93

Conditions de qualification des contraintes : Pour pouvoir utiliser le Lagrangien dans

la résolution d’un programme d’optimisation sous contraintes prenant la forme d’inéga-

lité, il suffit que l’une des conditions suivantes soit vérifiée :

a) Soit s ≤ m le nombre de contraintes saturées a l’optimum x. Si la matrice ja-

cobienne de ces s fonctions contraintes, de taille (s, n), est de rang s lorsqu’elle

est évaluée a l’optimum x, alors la condition de qualification des contraintes est

vérifiée.

b) Les fonctions contraintes hj, j = 1, · · · , s sont toutes linéaires.

Conditions du premier ordre (Kuhn et Tucker) : On suppose que les contraintes

de qualification sont vérifiées. Si le vecteur x ∈ Rn est une solution du problème de

maximisation de la fonction f , alors il existe un unique vecteur λ ≥ 0 tel que x vérifie les

conditions suivantes :

∂L(x, λ)

∂x= 0

λj(hj(x)− cj) = 0 ⇔ λj = 0, ou hj(x)− cj = 0, j = 1, · · · ,m∂L(x, λ)

∂λ≥ 0 ⇔ hj(x) ≤ cj, j = 1, · · · ,m

Notons que ces conditions n’excluent pas la possibilité que λj = 0 et hj(x) − cj = 0

simultanément.

Conditions suffisantes du second ordre pour un optimum global : Supposons qu’il

existe un x ∈ Rn qui vérifie les conditions du premier ordre.

1. Si f est concave et les hj sont convexes, x est un maximum global.

2. Si f est convexe et les hj sont concaves, x est un minimum global

En pratique, la résolution des conditions de Kuhn et Tucker est compliquée par le

fait qu’il faut envisager successivement toutes les configurations possibles : toutes les

contraintes sont saturées à l’équilibre, toutes sauf une, deux,..., aucune (tous les λj sont

nuls à l’équilibre). Pour trouver la bonne solution, il faut procéder par élimination en mon-

trant que parmi l’ensemble de ces possibilités, certaines aboutissent à des contradictions.

Page 112: Concepts thermodynamiques et d'entropie pour la

94 Chap 4. Commande H∞ des réseaux de transport

4.2.2 Sur le problème H∞

L’avantage essentiel des techniques de commande robuste est de générer des lois de

commande qui satisfont à l’exigence de maintenir un comportement désiré du système

face aux aléas et fluctuations qui l’affectent pendant son fonctionnement. Cette exigence

est qualifiée de robustesse à l’incertitude. Plus précisément, étant donné une spécifica-

tion temporelle ou fréquentielle du comportement désiré et une estimation de l’ordre de

grandeur de l’incertitude, la théorie évalue la faisabilité, produit une loi de commande

adaptée et fournit une garantie sur le domaine de validité de cette loi de commande (ro-

bustesse). Cette démarche de synthèse est systématique et très générale. En particulier,

elle est directement applicable aux systèmes à plusieurs entrées/sorties comme dans le

cas des systèmes de transport.

Sous sa forme la plus simple, le problème H∞ est un problème de réjection de per-

turbation. Il consiste à minimiser l’effet d’une perturbation w sur le comportement du

système. Le signal w est supposé d’énergie finie et sa taille est mesurée en norme `2

(norme Euclidienne). Son effet sur le système est mesuré par la norme `2 d’un vecteur

du coût z (la sortie). Enfin, on peut agir sur le système par une commande u et on dis-

pose d’une observation y. Il s’agit donc de synthétiser une loi de commande u = Ky qui

minimise l’impact de w sur z. On mesurera cet impact par le rapport :

‖z‖2

‖w‖2

Ce problème standard est représenté schématiquement par la figure 4.1.

FIGURE 4.1 – Problème H∞ standard

La matrice de transfert G(η) décrit les interconnections entre w, u, z, y est donnée

par : (z

y

)= G

(w

u

)=

(G11 G12

G21 G22

)(w

u

)

Page 113: Concepts thermodynamiques et d'entropie pour la

4.2 Rappels mathématiques et résultats préliminaires 95

Lorsque ce système est rebouclé sur la commande u = K(z)y, le transfert boucle fermée

de w à z est donné par :

M = G11 +G12K(I −G22K)−1G21

Ainsi, le ratio ‖z‖2‖w‖2 dans le pire des cas est donné par :

supw 6=0

‖z‖2

‖w‖2

= ‖M(η)‖∞

La fonction sup(x) signifie qu’on s’intéresse à la plus importante perturbation parmi

toutes les perturbations envisageables. Dans le cas des systèmes discrets sans pôle sur

le cercle unité, on définit la norme H∞ de M(η) par la quantité :

‖M(η)‖∞ = sup0≤θ≤π

σ(M(exp(jθ))

)où σ(M) est la plus grande valeur singulière de la matrice M .

le problème décrit ci-dessus peut se reformuler mathématiquement comme suit : étant

donné une tolérance γ > 0, trouver un compensateur K qui assure ‖M(η)‖∞ ≤ γ. De

cette manière nous assurerons pour toute perturbation w la relation suivante :

‖z‖2

‖w‖2

≤ γ,

La philosophie de cette commande est intuitive. En effet, ‖M(z)‖∞ serait la perte

maximale possible que le système peut subir à cause des perturbations. Le fait d’intro-

duire la tolérance γ > 0, signifie que ce type de commande est conçu pour imposer des

restrictions de type mini-max au sens de la théorie de la décision (minimiser γ revient à

minimiser la perte maximale possible).

Considérons maintenant un système discret linéaire bouclé par u = Kx :

x(k + 1) = Ax(k) +D1w(k) (4.1)

z(k) = Cx(k) +D2w(k) (4.2)

Le calcul de ‖M(z)‖∞ n’est pas toujours aisé. En effet, si on se restreint à un nombre

fini de pulsations, on n’obtient qu’une borne inférieure. Le lemme suivant donne une

caractérisation du problème H∞ en termes d’inégalité matricielle linéaire (LMI).

Lemme 4.1 [66] SoitM(η) = C(ηI−A)−1B+D, la fonction de transfert entre la sortie

z et la perturbation w. Donnons nous une tolérance γ > 0. Alors, les deux propositions

suivantes sont équivalentes :

Page 114: Concepts thermodynamiques et d'entropie pour la

96 Chap 4. Commande H∞ des réseaux de transport

1. A est stable et ‖M(η)‖∞ ≤ γ.

2. Il existe une matrice X = XT 0 telle que :(A B

C D

)T (X 0

0 γ−2I

)(A B

C D

)−

(X 0

0 I

) 0

Sur ce, nous terminons notre aperçu général des rappels mathématiques pour passer

aux sections suivantes à la définition du problème de la commande de notre système et sa

solution.

4.3 Commande H∞ des réseaux de transport

Considérons maintenant le système de transport linéaire (3.76) établi dans le chapitre

3 :

x(k + 1) = x(k) +Bv(k) + ω(k)

où x(k) est l’état du système à l’instant k, v(k) est la commande et ω(k) est le vecteur

des incertitudes (perturbations) affectant le système.

Pour pouvoir appliquer la commande H∞ comme cela est montré dans la figure 4.1, il

est nécessaire de définir la sortie du modèle. Cette dernière peut représenter toute grandeur

mesurable du système. Cependant, la synthèse H∞ exige que la sortie soit en fonction de

la commande v et les perturbationsw. Dans notre cas, le taux d’occupation f(k) = Px(k)

est un bon candidat qui se prête à cette exigence. En effet, le système de contrôle dyna-

mique du trafic est un système qui dispose de capteurs lui donnant des informations sur

l’état du trafic, et notamment, le nombre de véhicules x(k) sur certaines rues ou inter-

sections du réseau routier. En outre, à la fin du cycle k, le taux d’occupation est donné

par :

z(k) = f(k + 1) = Px(k + 1) = Px(k) + PBv(k) + Pω(k) (4.3)

Ainsi, le système de transport considéré est le suivant :

x(k + 1) = x(k) +Bv(k) + ω(k)

z(k) = Px(k) + PBv(k) + Pω(k)(4.4)

Les contraintes sur l’état et la commande sont définies par :

X = x ∈ Rn/ 0 ≤ x ≤ x∗ (4.5)

Page 115: Concepts thermodynamiques et d'entropie pour la

4.3 Commande H∞ des réseaux de transport 97

U = v ∈ Rm/ − v2 ≤ v ≤ v1, v1, v2 > 0 (4.6)

Effectuons maintenant le changement de variable :

xc(k) , x(k)− xN

où xN est l’état nominal (voir chapitre 3). Dans ce cas, la sortie z se transforme en :

zc(k) , Pxc(k + 1) = Px(k + 1)− PxN = z − zN

où zN = PxN . Ainsi, le système devient :xc(k + 1) = xc(k) +Bv(k) + ω(k)

zc(k) = Pxc(k) + PBv(k) + Pω(k)(4.7)

La commande du système dynamique (4.7) aura pour expression :

v(k) = Kxc(k) (4.8)

où K ∈ Rm×n. Dans ce cas, le système (4.7) en boucle fermée est donné par :

xc(k + 1) = Axc(k) + ω(k)

zc(k) = Cxc(k) +Dω(k)(4.9)

avec A = I + BK, C = P + PBK et D = P . Ainsi, les contraintes sur x(k) se

transportent sur xc(k) en :

Xc = xc ∈ Rn/− x2 ≤ xc ≤ x1, x1, x2 ≥ 0 (4.10)

avec x1 = x∗ − xN et x2 = xN .

Par ailleurs, observons que l’inégalité 0 ≤ x ≤ x∗ implique 0 ≤ Px ≤ Px∗. Il

s’ensuit que 0 ≤ Px ≤ ε, où ε = (1, · · · , 1)T , car P est diagonal dont les éléments

diagonaux sont 1x∗j

. Dans ce cas, les contraintes sur xc(k) se transportent sur zc(k) en :

Zc = zc ∈ Rn/− z2 ≤ zc ≤ z1, z1, z2 ≥ 0 (4.11)

avec z1 = ε− zN et z2 = zN . Il est clair que :

x(k) ∈ X⇐⇒ xc(k) ∈ Xc ⇐⇒ zc(k) ∈ Zc (4.12)

Page 116: Concepts thermodynamiques et d'entropie pour la

98 Chap 4. Commande H∞ des réseaux de transport

Remarquons aussi que, comme dans le chapitre précédent, l’existence des contraintes

(4.6) implique que le retour d’état u = Kxc n’est admissible que dans une région déter-

minée de l’espace d’état, c’est-à-dire :

Ux = x ∈ Rn/ − v2 ≤ Kxc ≤ v1; v1 > 0; v2 > 0 (4.13)

Ce domaine représente l’ensemble des états admissibles pour la commande pour K choi-

sie telle que rang(K) = m. Il est polyédral dissymétrique contenant l’origine.

Soulignons tout de suite que les contraintes (4.11) et (4.13) sont de nature fonda-

mentalement différente. En effet, la contrainte (4.11) exprime une exigence du cahier des

charges du contrôleur, alors que la contrainte (4.13) est une contrainte technique imposée

par l’ingénieur pour garantir la faisabilité de son contrôleur. Ainsi, violer les contraintes

(4.11), c’est ne pas respecter l’objectif de la commande, alors que trouver un autre schéma

de commande dans lequel (4.11) n’est pas nécessaire, c’est réaliser les objectifs autre-

ment.

4.3.1 Position du problème de la commande

Problème 1 : Conformément à ce qui a été annoncé dans l’introduction, notre souci

premier est d’élaborer une loi de commande v = Kxc permettant d’éviter les congestions

au sein du réseau de transport. Ceci est possible si la loi de commande force le nombre de

véhicules à ne pas dépasser le niveau du trafic correspondant à l’optimum opérationnel des

lignes. Plus formellement, si x∗ est le vecteur des capacités des lignes du réseau, alors la

congestion peut se produire dans le système si le nombre de véhicules stockés dans chaque

ligne dépasse sa capacité. Une conséquence de ce type d’instabilité est l’accumulation

illimitée de véhicules dans le système. L’objectif de la commande est alors de trouver un

contrôleur par retour d’état vérifiant x(k) ≤ x∗ pour chaque cycle k, ce qui est équivalent

à zc(k) ∈ Zc, ∀k en vertu de (4.12). Ceci se traduit par l’invariance positive de l’ensemble

Zc. Rappelons que Zc est positivement invariant si et seulement si :

zc(0) ∈ Zc =⇒ zc(k) ∈ Zc, ∀k

Toutefois, la commande H∞ nécessite l’utilisation des normes euclidiennes. Ainsi,

toute tentative d’application de l’approche H∞ doit utiliser ces normes. Or, l’ensemble

Zc est un polyèdre dissymétrique contenant l’origine et donc l’étude de son invariance

Page 117: Concepts thermodynamiques et d'entropie pour la

4.3 Commande H∞ des réseaux de transport 99

positive par les normes euclidiennes n’est pas chose évidente. L’idée alors est de chercher

à garantir le respect des contraintes sur l’état et la commande par la restriction de l’état

en boucle fermée à un ensemble Z∗c positivement invariant ellipsoïdal centré à l’origine et

tel que Z∗c ⊆ Zc. De cette manière, si zc(0) ∈ Z∗c alors on est sûr que zc(k) ∈ Zc pour tout

k. C’est la raison pour laquelle nous montrons le lemme suivant qui représente un résultat

utile pour la suite (voir Remarque 4.2).

Proposition 4.1 Soit α un scalaire positif défini par :

α = min(

mini

(z1,i),mini

(z2,i))

Définissons l’ensemble Z∗c par :

Z∗c = zc ∈ Rn/‖zc‖2 ≤ α (4.14)

Alors nous avons :

Z∗c ⊆ Zc

Preuve: Si ‖zc‖2 ≤ α, alors −α ≤ zc,i ≤ α, ∀i ∈ 1, · · · , n, ce qui implique :

−[α, · · · , α]T ≤ zc(k) ≤ [α, · · · , α]T (4.15)

Puisque α = min(

mini

(z1,i),mini

(z2,i)), il vient aussitôt que :

[α, · · · , α]T ≤ z1 et [α, · · · , α]T ≤ z2

Ainsi, (4.15) implique :

−z2 ≤ zc ≤ z1

Ce qui montre que zc ∈ Zc et complète la preuve.

Problème 2 : Pour maintenir le comportement désiré du problème 1 face aux incerti-

tudes w(k) pendant son fonctionnement, la loi de commande doit être robuste dans le

sens où, elle doit permettre d’amortir le plus rapidement possible ces perturbations. Pour

ce faire, observons d’abord qu’à partir de (4.9), la fonction de transfert entre la sortie zcet la perturbation w est donnée par :

G(η) = C(ηI − A)−1 +D (4.16)

Page 118: Concepts thermodynamiques et d'entropie pour la

100 Chap 4. Commande H∞ des réseaux de transport

Donnons nous une tolérance γ > 0. On sait maintenant que l’objectif de la commande

H∞ est de trouver un gain K tel que ‖G(η)‖∞ ≤ γ. Ceci est équivalent à :

‖zc(k)‖2 ≤ γ‖ω(k)‖2, ∀k ∈ N

Ainsi, si nous imposons aux incertitudes w(k) d’appartenir au domaine suivant :

Ω = ω ∈ Rn/‖ω(k)‖2 ≤α

γ, ∀k ∈ N (4.17)

alors on est sûr que pour tout k, zc(k) ∈ Z∗c et par conséquent la commande H∞ permet

l’invariance positive de Z∗c . Ce problème est représenté schématiquement par la figure

4.2 :

FIGURE 4.2 – Problème H∞ du système de transport

Il est clair que pour atténuer l’effet des perturbations, il faut maximiser αγ

car la valeur

max(α

γ), fournit le plus grand domaine des incertitudes Ωopt garantissant l’invariance po-

sitive de Z∗c . Ainsi, pour maximiser αγ

, il suffit de minimiser γ car la valeur α est calculée

à partir des bornes de Zc et donc imposée par le système. L’objectif de la commande H∞pour l’invariance positive de Z∗c est donc :

min γ

sous la contrainte ‖G(η)‖∞ ≤ γ

Problème 3 : Comme dans le chapitre précédent, rappelons que tout état émanant de

Zc peut parfaitement donner une trajectoire sortant de l’ensemble Ux. De ce fait, il est

nécessaire d’assurer l’inclusion Zc ⊆ Ux ou d’une manière suffisante Z∗c ⊆ Ux. De cette

manière, si xc(k) ∈ Zc (xc(k) ∈ Z∗c) alors on est sûr que xc(k) ∈ Ux.

En résumé, l’objectif final de la commande est donc le suivant :

Page 119: Concepts thermodynamiques et d'entropie pour la

4.3 Commande H∞ des réseaux de transport 101

Objectifs : Trouver un retour d’état u = Kx minimisant l’effet des perturbations w(k)

et permettant que :

1. ‖G(η)‖∞ ≤ γ ou d’une manière équivalente Z∗c soit positivement invariant par

rapport à la solution du système,

2. Zc ⊆ Ux ou Z∗c ⊆ Ux .

Soulignons qu’une méthode simple de résolution de ce problème de régulation sous

contraintes consiste donc, par exemple à déterminer la matrice K en résolvant le pro-

gramme d’optimisation sous contraintes suivant :

Minimiser γ

sous les contraintes ‖G(η)‖∞ ≤ γ

Zc ⊆ Ux ouZ∗c ⊆ Ux

Nous pouvons à présent en venir à l’examen de ces conditions.

4.3.2 Solution du problème de la commande

Afin de présenter rigoureusement l’ensemble des résultats, nous allons répartir les

objectifs sur deux présentations. La première est consacrée à l’étude de l’invariance po-

sitive de Z∗c par la commande H∞. La deuxième traite l’étude des inclusions Zc ⊆ Ux et

Z∗c ⊆ Ux. Une fois ces deux présentations faites, leur intégration dans une formulation

globale devient parfaitement claire.

Sur l’invariance positive de Z∗cNous allons voir à présent comment trouver le gain K tel que ‖G(η)‖∞ ≤ γ. En effet,

observons d’abord que ‖G(η)‖∞ ≤ γ est équivalente à :

‖1

γC(ηI − A)−1 +

1

γD‖∞ ≤ 1

Ainsi, en vertu du lemme 4.1, une condition nécessaire et suffisante pour la solution du

problème H∞ pour notre système est l’existence d’une matrice X = XT 0 telle que :(A I

C D

)T (X 0

0 γ−2I

)(A I

C D

)−

(X 0

0 I

) 0

Page 120: Concepts thermodynamiques et d'entropie pour la

102 Chap 4. Commande H∞ des réseaux de transport

Par application du lemme Schur (voir chapitre 3), cette relation est équivalente à :X ∗ ∗ ∗0 I ∗ ∗A I X−1 ∗C D 0 γ2I

0 (4.18)

où ∗ représente le transposé des éléments sous la diagonale. Définissons maintenant la

matrice suivante :

M =

√γI 0 0 0

0√γI 0 0

0 0 1√γI 0

0 0 0 1√γI

Il est clair que M est inversible. Ainsi, (4.18) est équivalente à :

MT

X ∗ ∗ ∗0 I ∗ ∗A I X−1 ∗C D 0 γ2I

M 0

Il s’ensuit que : Q ∗ ∗ ∗0 γI ∗ ∗A I Q−1 ∗C D 0 γI

0 (4.19)

où Q = γX . D’où le théorème suivant.

Théorème 4.1 Pour le système de transport (4.9), une condition nécessaire et suffisante

pour l’invariance positive de Z∗c est l’existence d’une matriceK et une matrice symétrique

Q = QT solution de la LMI suivante :Q ∗ ∗ ∗0 γI ∗ ∗

I +BK I Q−1 ∗P + PBK P 0 γI

0 (4.20)

Page 121: Concepts thermodynamiques et d'entropie pour la

4.3 Commande H∞ des réseaux de transport 103

Soulignons tout de suite un point important qui va nous servir pour la suite. En ef-

fet, l’invariance positive de Z∗c peut aussi être établie par la dissipativité du système par

rapport au taux d’approvisionnement :

W (zc(k), ω(k)) =1

2(γ2‖ω(k)‖2

2 − ‖zc(k)‖22) (4.21)

et la fonction de stockage :

V (xc(k)) =1

2γxc(k)TQxc(k), ∀k ∈ N (4.22)

En effet, par application du lemme de Shur, la relation (4.20) est équivalente à :(Q 0

0 γI

)−

(A I

C D

)T (Q 0

0 γ−1I

)(A I

C D

) 0

ou d’une manière équivalente ∀xc(k), ω(k) ∈ Rn :(xc(k)

ω(k)

)T [(Q 0

0 γI

)−

(A I

C D

)T (Q 0

0 γ−1I

)(A I

C D

)](xc(k)

ω(k)

)≥ 0

Puisque : (A I

C D

)(xc(k)

ω(k)

)=

(xc(k + 1)

zc(k)

)il vient :

xc(k)TQxc(k) + γω(k)Tω(k)− xc(k + 1)TQxc(k + 1) + γ−1zc(k)T zc(k) ≥ 0

Il s’ensuit :

4V (xc) =1

2γxc(k + 1)TQxc(k + 1)− 1

2γxc(k)TQxc(k) ≤ 1

2(γ2‖ω(k)‖2

2 − ‖zc(k)‖22)

(4.23)

ce qui montre que le système de transport est dissipatif par rapport au taux d’approvision-

nement (4.21) et la fonction de stockage (4.22). D’où le corollaire suivant.

Corollaire 4.1 Pour le système de transport (4.9), une condition nécessaire et suffisante

pour l’invariance positive de Z∗c est que le système soit dissipatif par rapport au taux

d’approvisionnement :

W (zc(k), ω(k)) =1

2(γ2‖ω(k)‖2

2 − ‖zc(k)‖22) (4.24)

et la fonction de stockage :

V (xc(k)) =1

2γxc(k)TQxc(k), ∀k ∈ N (4.25)

Page 122: Concepts thermodynamiques et d'entropie pour la

104 Chap 4. Commande H∞ des réseaux de transport

Sur ce, nous terminons notre aperçu général du sujet pour passer à l’examen des condi-

tions supplémentaires que doit vérifier la matrice de gain K pour la condition d’inclusion

Zc ⊆ Ux ou Z∗c ⊆ Ux.

Sur l’inclusion Zc ⊆ Ux

Voyons à présent les nouvelles condition sur le gain K pour que Zc ⊆ Ux. L’inclusion

Z∗c ⊆ Ux sera étudiée à la fin de cette partie. En effet, remarquons d’abord que :

x(k) ∈ X⇐⇒ xc(k) ∈ Xc ⇐⇒ z(k) ∈ Zc

Il s’ensuit que :

Zc ⊆ Ux ⇐⇒ Xc ⊆ Ux

Ainsi, pour des raisons de simplicité, nous allons travailler avec l’inclusion Xc ⊆ Ux. En

effet, observons que les ensembles Xc et Ux peuvent s’écrire sous la forme :

Xc =

xc ∈ Rn/

[I

−I

]xc ≤

[x1

x2

](4.26)

Ux =

xc ∈ Rn/

[K

−K

]xc ≤

[v1

v2

](4.27)

En vertu du théorème 3.1 (voir chapitre 3), l’inclusion Xc ⊆ Ux équivaut à l’existence

d’une matrice non-négative T ∈ R2m×2n+ telle que :

T

[I

−I

]=

[K

−K

](4.28)

T

[x1

x2

]≤

[v1

v2

](4.29)

Posons :

T =

[T11 T12

T21 T22

]Il vient à partir de (4.28) et(4.29) que :

T11 − T12 = T22 − T21 = K (4.30)

T11x1 + T12x2 ≤ v1 (4.31)

T21x1 + T22x2 ≤ v2 (4.32)

Page 123: Concepts thermodynamiques et d'entropie pour la

4.3 Commande H∞ des réseaux de transport 105

Nous avons alors le théorème suivant :

Théorème 4.2 L’inclusion Xc ⊆ Ux (et par conséquent Zc ⊆ Ux) est équivalente à

l’existence de deux matrices non-négatives K1 et K2 telles que :

K1 −K2 = K (4.33)

K1x1 +K2x2 ≤ v1 (4.34)

K2x1 +K1x2 ≤ v2 (4.35)

Preuve: Suffisance : Multiplions l’inégalité −x2 ≤ xc ≤ x1 par K1, il vient :

−K1x2 ≤ K1xc ≤ K1x1 (4.36)

De même, la multiplication de l’inégalité par −K2 donne :

−K2x1 ≤ K2xc ≤ K2x2 (4.37)

L’addition maintenant de (4.36) et (4.37) implique :

−K2x1 −K1x2 ≤ (K1 −K2)xc ≤ K1x1 +K2x2 (4.38)

il vient à partir de (4.33), (4.34) et (4.35) :

−v2 ≤ Kx ≤ v1

d’où xc ∈ Ux.

Nécessité : Supposons que Xc ⊆ Ux. Soit :

K+ = (K+ij ); où K+

ij = sup(Kij, 0)

K− = (K−ij ); où K−ij = − inf(Kij, 0)

Il est clair que :

K+ ≥ 0; K− ≥ 0; K = K+ −K− (4.39)

Or puisque la décomposition K = K+ −K− est minimale (voir lemme 3.2 du chapitre

3), il vient :

K+ ≤ T11 et K+ ≤ T22

K− ≤ T12 et K+ ≤ T21

Page 124: Concepts thermodynamiques et d'entropie pour la

106 Chap 4. Commande H∞ des réseaux de transport

On en déduit à partir de (4.31), (4.32) :

K+x1 +K−x2 ≤ T11x1 + T12x2 ≤ v1

K−x1 +K+x2 ≤ T21x1 + T22x2 ≤ v2

Ainsi, la nécessité est prouvée si on pose :

K1 = K+

K2 = K−

Sur l’inclusion Z∗c ⊆ Ux

Pour simplifier les notation, posons M = 1α2P

2. Ainsi, le domaine Z∗c peut s’écrire

comme :

Z∗c = xc ∈ Rn/xTcMxc ≤ 1 (4.40)

C’est un ellipsoïde centré à l’origine.

Regardons à présent les nouvelles conditions sur le gain K pour que Z∗c ⊆ Ux. En

effet, rappelons d’abord qu’avec le retour d’état v = Kxc, l’ensemble Ux s’écrit :

Ux = xc ∈ Rn/ Kxc ≤ v1 et −Kxc ≤ v2; v1 > 0, v2 > 0 (4.41)

Soient V1,V2 des matrices diagonales de termes diagonaux vi1 et vi2 respectivement. Nous

avons alors :

V−11 =

1v11

0 · · · 0

0 1v21

0...

... . . . . . . 0

0 · · · 0 1vm1

, V−12 =

1v12

0 · · · 0

0 1v22

0...

... . . . . . . 0

0 · · · 0 1vm2

Il s’ensuit que l’ensemble Ux peut s’écrire sous la forme suivante :

Ux =xc ∈ Rn/

(V−1

1 K

−V−12 K

)xc ≤ ε

=xc ∈ Rn/ Hxc ≤ ε

avec

H =

(H1 = V−1

1 K

H2 = −V−12 K

), ε = (1, 1, · · · , 1)T

Page 125: Concepts thermodynamiques et d'entropie pour la

4.3 Commande H∞ des réseaux de transport 107

ou d’une manière équivalente :

Ux = xc ∈ Rn/ Hixc ≤ 1, i = 1, · · · , 2m

où Hi est la iième ligne de la matrice H . Ceci fait, il est clair que la condition Z∗c ⊆ Ux est

équivalente à :

maxxc∈Z∗

c

Hixc

≤ 1 (4.42)

Il s’agit maintenant de connaître la valeur maximale de la fonction linéaire Hixc sur l’en-

semble Z∗c , c’est-à-dire :

maxHixc

sous la contrainte xTcMxc ≤ 1

Pour résoudre ce problème, nous allons appliquer les conditions de Kuhn et Tucker

(voir section 4.2.1). En effet, soit le Lagrangien L :

L(xc, λ) = Hixc − λ(xTcMxc − 1)

Alors, si xc est la solution recherchée, il existe un scalaire λ ≥ 0 tel que :

∂L

∂xc= HT

i − 2λMxc = 0 (4.43)

λ(xTcMxc − 1) = 0 ⇔ λ = 0, ou xTcMxc − 1 = 0 (4.44)∂L

∂λ≥ 0 ⇔ xTcMxc ≤ 1 (4.45)

Pour déterminer les solutions de ce système, il faut envisager successivement tous les cas

de figure possibles portant sur la saturation des contraintes et procéder par élimination.

Cas 1 : xTcMxc = 1 (la contrainte est saturée à l’optimum). Dans ce cas, on a :

rang(∂xTcMxc

∂xc

)= rang

(2Mxc

)= 1, ∀xc ∈ Rn

Ainsi, la contrainte de qualification est vérifiée. Il s’ensuit alors que dans ce cas nous

avons λ > 0 car sinon on aurait Hi = 0 en vertu de (4.43), ce qui absurde car Hi 6= 0. Il

vient alors à partir de (4.43) :

xc =1

2λM−1HT

i

Page 126: Concepts thermodynamiques et d'entropie pour la

108 Chap 4. Commande H∞ des réseaux de transport

En multipliant (4.43) par xTc il vient :

λ =1

2(HiM

−1HTi )

12

En remplaçant λ dans xc on obtient :

xc = (HiM−1HT

i )−12M−1HT

i

qui est une solution possible du problème de maximisation de la fonction Hix sur l’en-

semble Z∗c .

Cas 2 : xTcMxc < 1 (la contrainte n’est pas saturée à l’optimum). Dans ce cas, on a

λ = 0. Or, l’équation (4.43) donne HTi = 0, ce qui viole le fait que Hi 6= 0.

Finalement, on en déduit que les conditions de Kuhn et Tucker admettent une seule

solution :

xc = (HiM−1HT

i )−12M−1HT

i

Or, Hixc est concave et les contraintes sont convexes, donc xc est un maximum global.

Par conséquent, la valeur maximale de Hixc sur l’ensemble Z∗c est donnée par :

maxxc∈Z∗

c

Hixc

= (HiM

−1HTi )

12

Ainsi, d’après (4.42), la condition Z∗c ⊆ Ux est équivalente à :

(HiM−1HT

i )12 ≤ 1

qui est à son tour équivalente à :

HiM−1HT

i ≤ 1

d’où :

1−HiM−1HT

i ≥ 0, i = 1, · · · , 2m

Puisque 1−HiM−1HT

i ∈ R, l’application du lemme 3.3 de Schur avec R = 1 et S = Hi

donne la LMI suivante : (1 Hi

HTi M

) 0, i = 1, · · · , 2m

Page 127: Concepts thermodynamiques et d'entropie pour la

4.3 Commande H∞ des réseaux de transport 109

D’autre part, puisque H1i = 1

vi1Ki et H2

i = − 1vi2Ki, avec Ki est la iième ligne de la matrice

K, la dernière LMI devient : 1 1vi1Ki

1vi1KTi M

0,

1 − 1vi2Ki

− 1vi2KTi M

0, i = 1, · · · ,m

En outre, puisque plusieurs LMI peuvent s’exprimer sous la forme d’une seule LMI

simple diag(LMIj) 0, nous avons alors le résultat suivant.

Théorème 4.3 Pour que Z∗c ⊆ Ux, il est nécessaire et suffisant que la LMI suivante soit

faisable :

1 1vi1Ki

1vi1KTi

1α2P

2

O

O

1 − 1vi2Ki

− 1vi2KTi

1α2P

2

0, i = 1, · · · ,m (4.46)

Formulation globale de la solution

Avec les théorèmes 4.1, 4.2 et 4.3, nous avons maintenant tous les éléments néces-

saires pour formuler la solution de notre problème de commande.

Théorème 4.4 Pour le système de transport (4.9), s’il existe un grain K, une matrice

définie positive Q et deux matrices non-négatives K1, K2 solutions du problème d’opti-

misation suivant :

min γ (4.47)

sous les contraintes (4.20) et (4.33)-(4.35).

alors le retour d’état v = Kxc garantit les conditions suivantes :

1. Z∗c est positivement invariant où d’une manière équivalente ‖zc‖2/‖ω‖2 ≤ γ ; pour

tout k ∈ N

2. v(k) ∈ Ux, pour tout k ∈ N.

Remarque 4.1 Anticipons sur ce qui va suivre pour noter que la solvabilité du problème

d’optimisation (4.47) est difficile car, la recherche à la fois de la matrice inconnue Q et

Page 128: Concepts thermodynamiques et d'entropie pour la

110 Chap 4. Commande H∞ des réseaux de transport

son inverse Q−1 introduit une non-linéarité dans la contrainte LMI (4.20). Cette condition

nécessite une recherche qui est à la fois difficile à accomplir et très coûteuse en temps de

calcul. C’est le problème de l’optimisation non-linéaire non-convexe. I

Pour contourner le problème posé par le théorème 4.4, remarquons que d’après le

corollaire 1, la matrice Q définit la fonction de stockage et par conséquent, nous pouvons

la remplacer par l’entropie du système, c’est-à-dire :

V (xc(k)) = ψ(xc(k)) =1

2xc(k)TPxc(k)

ce qui donne Q = γ−1P . Ainsi la LMI (4.20) devient :γ−1P ∗ ∗ ∗

0 γI ∗ ∗I +BK I γP−1 ∗P + PBK P 0 γI

0 (4.48)

ce qui équivaut à : P ∗ ∗ ∗0 γ2I ∗ ∗

I +BK I P−1 ∗P + PBK P 0 I

0 (4.49)

Si on pose β = γ2, (4.49) devient une LMI affine par rapport aux variables de décision.

Ce qui donne le corollaire suivant.

Corollaire 4.2 Pour le système de transport (4.9), s’il existe un grain K et deux matrices

non-négatives K1, K2 solutions du problème d’optimisation suivant :

min β (4.50)

sous les contraintes

LMI :

P ∗ ∗ ∗0 βI ∗ ∗

I +BK I P−1 ∗P + PBK P 0 I

0 (4.51)

K1 −K2 = K (4.52)

K1x1 +K2x2 ≤ v1 (4.53)

K2x1 +K1x2 ≤ v2 (4.54)

Page 129: Concepts thermodynamiques et d'entropie pour la

4.3 Commande H∞ des réseaux de transport 111

alors le retour d’état v = Kxc garantit les conditions suivantes :

1. Z∗c est positivement invariant où d’une manière équivalente ‖zc‖2/‖ω‖2 ≤√β ;

pour tout k ∈ N

2. v(k) ∈ Ux, pour tout k ∈ N.

Remarque 4.2 Dans ce corollaire, l’existence de la LMI (4.51) affine par rapport aux

variables de décision pourrait être trompeuse. En effet, ceci suggérerait que le problème

lié au temps de calcul de la commande posé par le théorème 4.4 est résolu. Or, il n’en est

rien, car la complexité est simplement déplacée vers la recherche des matrices K1, K2, et

le temps de calcul est consommé dans la vérification des conditions (4.52), (4.53), (4.54).

Si nous voulons éviter la recherche des matrices K1, K2, nous pouvons utiliser les ré-

sultats du théorème 4.3, ce qui fournit la solution finale de notre problème de commande.

Théorème 4.5 Pour le système de transport (4.9), s’il existe un grain K solution du pro-

blème d’optimisation suivant :

min β

sous la contrainte

P ∗ ∗ ∗0 βI ∗ ∗

I +BK I P−1 ∗P + PBK P 0 I

O O

O

1 1vi1Ki

1vi1KTi

1α2P

2

O

O O

1 − 1vi2Ki

− 1vi2KTi

1α2P

2

0,

i = 1, · · · ,m

alors le retour d’état v = Kxc garantit les conditions suivantes :

1. Z∗c est positivement invariant où d’une manière équivalente ‖zc‖2/‖ω‖2 ≤√β ;

pour tout k ∈ N

2. v(k) ∈ Ux, pour tout k ∈ N.

Page 130: Concepts thermodynamiques et d'entropie pour la

112 Chap 4. Commande H∞ des réseaux de transport

Ce théorème est très important dans le sens où il offre une condition pratique de mise

en oeuvre de la stratégie de commande. En effet, le problème d’optimisation LMI posé

dans ce théorème est convexe en K et par conséquent, il peut facilement être résolu avec

des outils sous Matlab [67, 68].

4.4 Conclusion

Dans ce chapitre, une approche basée sur la commandeH∞ a été appliquée pour éviter

les congestions du trafic urbain par les feux de signalisation en forçant les files d’attente

à ne pas dépasser le niveau de trafic correspondant à l’optimum opérationnel des lignes.

Cette étude à été faite grâce à la construction d’un domaine ellipsoïdal Z∗c positivement

invariant, contenu dans le domaine des contraintes sur l’état et la commande. La mise

en évidence des techniques LMIs nous a permis d’énoncer des conditions nécessaires et

suffisantes pour la résolution de notre problème de commande. Ces résultats s’avèrent plus

généraux que ceux de l’approche de la commande dissipative et permettent d’introduire

les incertitudes dans la conception de la commande.

Deux principaux objectifs ont été atteints avec la commande proposée : d’une part, la

commande est robuste vis-à-vis des incertitudes et peut être calculée par une procédure

numérique tirant largement partie des caractéristiques de convexité des LMIs (Théorème

4.5). Ceci lui confère une légitimité indépendante de son efficacité par rapport à l’objectif

fixé par notre investigation, à savoir le calcul de la commande en temps réel. D’autre part,

afin de respecter les contraintes physiques inhérentes à la signalisation des carrefours, la

commande proposée respecte les conditions aux limites.

Dans le chapitre suivant, nous présentons deux exemples de réseaux de carrefours

pour illustrer les contributions de notre travail ainsi que pour mettre en évidence les per-

formances de nos stratégies de commande.

Page 131: Concepts thermodynamiques et d'entropie pour la

CHAPITRE 5

APPLICATIONS

5.1 Introduction

Dans les chapitres précédents, nous avons présenté deux types de commandes permet-

tant d’améliorer la fluidité du trafic. Afin d’illustrer en pratique les stratégies de contrôle

proposées, nous exposons dans ce chapitre quelques simulations relatives aux réseaux de

transport urbains. En particulier, nous proposons d’évaluer les commandes proposées en

simulation pour deux types de réseaux :

1. les réseaux artériels, et

2. les réseaux en grille.

Dans un premier temps, nous présentons les réseaux sur lesquels les tests seront réalisés.

Ceci passe par la description de leurs caractéristiques géométriques. Ensuite, nous exami-

nons les objectifs des deux commandes pour chaque type de réseau tels que la dissipati-

vité de l’entropie de transport, la réjection des perturbations, le respect des contraintes

sur l’état et la commande. Dans un second temps, afin de montrer les avantages des

commandes proposées, une comparaison est effectuée avec la stratégie linéaire quadra-

tique (LQ). Plus précisément, trois grandeurs importantes sont considérées : l’entropie de

transport, le retard total des véhicules par cycle et le temps de calcul des paramètres de

signalisation dans chaque cycle.

Page 132: Concepts thermodynamiques et d'entropie pour la

114 Chap 5. Applications

Soulignons enfin que toutes les simulations sont réalisées sur un ordinateur avec un

CPU Core i5, 2.47 GHZ×4, une mémoire 4G, et le système opérationnel Windows 7

(64bit).

5.2 Application à un réseau artériel

Un réseau artériel en milieu urbain est constitué d’une route principale de grande

capacité (route artérielle) et plusieurs rues locales (voir Figure 5.1). La fonction principale

d’un réseau artériel est d’acheminer le trafic depuis des routes collectrices jusqu’à, par

exemple les autoroutes ou entre les centres urbains avec un plus haut niveau de qualité

de service [69]. Le réseau artériel représente de ce fait un élément très important pour la

régulation du trafic urbain.

5.2.1 Caractéristiques du réseau simulé

FIGURE 5.1 – Réseau artériel incluant quatre intersections

La Figure 5.1 schématise la structure géométrique de ce réseau sous la forme d’un

graphe direct. La route artérielle supporte la majorité du trafic du réseau, et elle est sub-

divisée en quatre carrefours numérotés 11, 12, 13 et 14. Ainsi, ce réseau comporte seize

voies numérotées de 1 jusqu’à 16. Le nombre de véhicules xi dans chaque voie représente

l’état du système. Les sorties du réseau sont ignorées étant donné que les arcs de sortie ne

sont pas pris en compte dans les stratégies. Pour chaque voie considérée, nous supposons

Page 133: Concepts thermodynamiques et d'entropie pour la

5.2 Application à un réseau artériel 115

que les véhicules tournant à gauche et à droite partagent la même ligne que les autres

véhicules. Pour chaque intersection, la durée d’un cycle est subdivisée en deux phases, et

les temps des feux verts correspondants à la direction horizontale sont considérés comme

les variables de commande, notés

u = [g11, g12, g13, g14]T

Durant les simulations, les paramètres de ce réseau (e.g., cycle, débits de saturation, λi,j ,

etc) sont supposés constants et connus. Ils sont donnés comme suit :

– tous les carrefours fonctionnent avec le même cycle de durée c = 100s ;

– le temps perdu est de 5s pour toutes les phases ;

– tous les temps des feux verts effectifs sont bornés entre 20s et 70s ;

– dans le cas d’une voie, le débit de saturation varie très légèrement autour de si =

0.5véh/s. Nous considérons donc cette valeur pour toutes les voies ;

– les proportions des flux des échanges λi,j entre voies sont données dans le Tableau

5.1. λi,j désigne le pourcentage des véhicules allant de la voie j vers la voie i par

rapport au nombre total de véhicules présents sur l’arc de la voie j.

– les capacités des voies sont données par x∗ = [80, 70, 50, 50, 70, 70, 50, 50, 70, 70,

50, 50, 70, 80, 50, 50]Tvéh.

TABLE 5.1 – Proportions des flux d’échange λi,jVoie i λi,j

2 λ2,6 =0.7 λ2,7 =0.27 λ2,8 =0.3

5 λ5,1 =0.72 λ5,3 =0.25 λ5,4 =0.28

6 λ6,10 =0.71 λ6,11 =0.29 λ6,12 =0.25

9 λ9,5 =0.75 λ9,7 =0.26 λ9,8 =0.25

10 λ10,14 =0.72 λ10,15 =0.27 λ10,16 =0.25

13 λ13,9 =0.75 λ13,11 =0.25 λ13,12 =0.29

Ainsi, le modèle linéaire de ce système est donné par :

x(k + 1) = x(k) +Bu(k) + q(k)c+ h

Page 134: Concepts thermodynamiques et d'entropie pour la

116 Chap 5. Applications

avec :

B =

−0.5 0 0 0

−0.5 0.065 0 0

0.5 0 0 0

0.5 0 0 0

0.095 −0.5 0 0

0 −0.5 0.085 0

0 0.5 0 0

0 0.5 0 0

0 0.12 −0.5 0

0 0 −0.5 0.1

0 0 0.5 0

0 0 0.5 0

0 0 0.105 −0.5

0 0 0 −0.5

0 0 0 0.5

0 0 0 0.5

h =

0

25.65

−45

−45

23.85

24.3

−45

−45

22.95

23.4

−45

−45

24.3

0

−45

−45

État nominal : Supposons que les débits d’entrée correspondants à l’état nominal soient

donnés par :

qN = [0.3, 0.0045, 0.15, 0.15, 0.0045, 0.006, 0.15, 0.15, 0,

0.006, 0.15, 0.15, 0, 0.3, 0.15, 0.15]Tvéh/s

Dans ce cas, la commande nominale est donnée par :

uN = [60, 60, 60, 60]T s

Par conséquent, le modèle devient :

x(k + 1) = x(k) +Bv(k) + ω(k) (5.1)

où v(k) = u(k)− uN et ω(k) = (q(k)− qN)c.

Perturbations : Afin de montrer l’atténuation des effets des perturbations, nous suppo-

sons que le vecteur ω est donné par une fonction sinusoïdale comme suit :

ω(k) = 10qN sin(2kπ

15)

Page 135: Concepts thermodynamiques et d'entropie pour la

5.2 Application à un réseau artériel 117

5.2.2 Solutions des commandes

Nous avons montré dans les chapitres précédents que l’existence de la commande

dissipative (résp, la commande H∞) est caractérisée par la faisabilité de certaines LMIs

(résp, le problème d’optimisation LMI). Ces problèmes peuvent être facilement résolus

en utilisant l’outil CVX [68] sous la plate forme de MATLAB.

Commande dissipative : Une solution au problème LMI du Théorème 3.6 est donnée

par :

K =(col 1-8)0.0081 0.0089 −0.013 −0.013 0.0004 0.0017 −0.0029 −0.0029

0.0013 −0.0004 −0.0021 −0.0021 0.01 0.0099 −0.0144 −0.0144

0.001 0.0008 −0.0017 −0.0017 0.002 0.0004 −0.0031 −0.0031

0.0009 0.0008 −0.0015 −0.0015 0.0016 0.0014 −0.0025 −0.0025

(col 9-16)

0.0014 0.0016 −0.0025 −0.0025 0.0008 0.0009 −0.0015 −0.0015

0.0004 0.002 −0.0031 −0.0031 0.0008 0.001 −0.0017 −0.0017

0.01 0.01 −0.0145 −0.0145 −0.0004 0.0013 −0.0021 −0.0021

0.0017 0.0004 −0.0029 −0.0029 0.0089 0.0081 −0.013 −0.013

CommandeH∞ : De même, en résolvant le problème d’optimisation du Théorème 4.5,

nous obtenons :

min γ = 0.2534

Page 136: Concepts thermodynamiques et d'entropie pour la

118 Chap 5. Applications

et le gain K comme :

K =(col 1-8)0.0604 0.068 −0.0966 −0.0966 −0.0071 0.0053 −0.0075 −0.0075

0.0044 −0.0071 −0.0071 −0.0071 0.0663 0.0663 −0.0941 −0.0941

0.0002 −0.0007 −0.0003 −0.0003 0.005 −0.007 −0.0071 −0.0071

0 −0.0001 −0 −0 0.0005 −0.0004 −0.0008 −0.0008

(col 9-16)−0.0004 0.0005 −0.0008 −0.0008 −0.0001 0 −0 −0

−0.007 0.005 −0.0071 −0.0071 −0.0007 0.0002 −0.0003 −0.0003

0.0663 0.0663 −0.0941 −0.0941 −0.0071 0.0044 −0.0071 −0.0071

0.0053 −0.0071 −0.0075 −0.0075 0.068 0.0604 −0.0966 −0.0966

5.2.3 Étude en simulation

L’objectif de cette section est la mise en œuvre des commandes proposées et l’analyse

de leurs comportements pour ce réseau artériel. Supposons que l’état initial soit donné

par : x(0) = [28, 35, 11, 12, 7, 7, 28, 30, 35, 16, 15, 14, 28, 34, 5, 6]Tvéh. Le système est

simulé pour 100 cycles dans la plate forme de MATLAB. Les résultats sont montrés dans

la suite.

5.2.3.1 Résultats de la commande dissipative

Pour illustrer les performances de la commande dissipative, la figure 5.2 montre les

variations des taux d’occupation fi des 16 voies pour 100 cycles. L’existence des per-

turbations sinusoïdales a pour cause les oscillations des fi, mais la tendance majeure est

la convergence vers un intervalle autour de 0.4 pour toutes les voies (notamment pour

les voies des carrefours 12 et 14). En d’autres termes, la commande dissipative rend la

distribution de véhicules plus uniforme. Cette observation est aussi liée à la dissipativité

illustrée par la figure 5.3 où l’on observe que la variation de l’entropie ∆ψ(x) est toujours

inférieure à la fonction d’approvisionnement Sω. Ainsi, la commande dissipative a pour

effet une meilleure organisation du système.

En outre, nous reportons également dans la Figure 5.4 l’évolution de la commande u

durant les 100 cycles. On peut observer que les temps verts effectifs oscillent aussi mais

Page 137: Concepts thermodynamiques et d'entropie pour la

5.2 Application à un réseau artériel 119

0 20 40 60 80 1000

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x1

x2

x3

x4

(a) Intersection 11

0 20 40 60 80 1000

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x

5

x6

x7

x8

(b) Intersection 12

0 20 40 60 80 1000

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x9

x10

x11

x12

(c) Intersection 13

0 20 40 60 80 1000

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x13

x14

x15

x16

(d) Intersection 14

FIGURE 5.2 – Évolution des taux d’occupation en utilisant la commande dissipative pour

le réseau artériel

convergent vers leurs valeurs nominales uiN = 60s. De plus, ils respectent les conditions

aux limites 20s ≤ gi ≤ 70s.

Page 138: Concepts thermodynamiques et d'entropie pour la

120 Chap 5. Applications

0 5 10 15 20 25 30 35 4010

8

6

4

2

0

2

4

6

8

10

Cycle

FIGURE 5.3 – Évolution de Sω et ∆ψ(x) en utilisant la commande dissipative pour le

réseau artériel

0 10 20 30 40 50 60 70 80 90 10059.2

59.4

59.6

59.8

60

60.2

60.4

60.6

Cycle

La

com

man

de u

FIGURE 5.4 – Évolution de la commande u en utilisant la commande dissipative pour le

réseau artériel

Page 139: Concepts thermodynamiques et d'entropie pour la

5.2 Application à un réseau artériel 121

5.2.3.2 Résultats de la commande H∞

De la même manière, les taux d’occupation sont illustrés dans la figure 5.5. On re-

marque que les oscillations sont similaires aux résultats de la figure 5.2 à cause de l’exis-

tence des perturbations sinusoïdales. Cependant, contrairement à la commande dissipa-

tive, les taux d’occupation convergent rapidement vers un petit intervalle autour de 0.4.

Ceci est notamment le cas pour les voies du carrefour 12 où on peut observer que la

convergence est atteinte avant le 20ième cycle tandis que la convergence dans le cas de la

commande dissipative demande presque 100 cycles (voir Figures 5.2(b) et 5.5(b)).

0 20 40 60 80 1000

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x1

x2

x3

x4

(a) Intersection 11

0 20 40 60 80 1000

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x5

x6

x7

x8

(b) Intersection 12

0 20 40 60 80 1000

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x9

x10

x11

x12

(c) Intersection 13

0 20 40 60 80 1000

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x13

x14

x15

x16

(d) Intersection 14

FIGURE 5.5 – Évolution des taux d’occupation en utilisant la commande H∞ pour le

réseau artériel

De plus, en comparant les figures 5.2 et 5.5, on constate que les amplitudes des os-

cillations des taux d’occupation sont plus petites en utilisant la commande H∞. Cette

observation confirme l’objectif de la commande H∞ à savoir, l’atténuation des pertur-

Page 140: Concepts thermodynamiques et d'entropie pour la

122 Chap 5. Applications

bations. Ce fait peut être aussi montré dans la figure 5.6 où la quantité ‖zc‖2‖ω‖2 est réduite

rapidement dans les premiers 20 cycles puis reste limité dans un petit intervalle. La valeur

maximale de ‖zc‖2‖ω‖2 durant la simulation est égale à 0.2156 ≤ min γ, ce qui en accord avec

l’objectif de la commande H∞.

0 10 20 30 40 50 60 70 80 90 1000

0.05

0.1

0.15

0.2

0.25

Cycle

FIGURE 5.6 – Évolution de ‖zc‖2‖ω‖2 en utilisant la commande H∞ pour le réseau artériel

Par ailleurs, la figure 5.7 montre l’évolution de la commande. On peut immédiatement

observer que la commande u évolue entre 54s et 63s puis converge vers un intervalle

autour de la valeur nominale viN = 60s lors des premiers 20 cycles. Ceci implique que les

temps des feux verts respectent aussi dans ce cas les conditions aux limites 20s ≤ gi ≤70s.

En résumé, on peut dire que la commande H∞ présente de bien meilleures perfor-

mances que la commande dissipative. Ceci se comprend assez facilement car la com-

mande H∞ limite les effets des perturbations en les intégrant dans la formulation de la

commande.

5.2.3.3 Comparaison avec la commande LQ

Les simulations précédentes montrent la portée des deux stratégies de la commande

pour la régulation du réseau de carrefours à feux. Il s’ensuit que toute discussion sur leurs

avantages ne peut se faire que par rapport aux autres méthodes de régulation des carrefours

à feux. Dans cette optique, nous avons choisi de comparer nos stratégies de commande

Page 141: Concepts thermodynamiques et d'entropie pour la

5.2 Application à un réseau artériel 123

0 10 20 30 40 50 60 70 80 90 10054

55

56

57

58

59

60

61

62

63

Cycle

La

com

man

de u

FIGURE 5.7 – Évolution de la commande u en utilisant la commande H∞ pour le réseau

artériel

avec la commande LQ (Linéaire Quadratique) proposée par [8]. Cette méthode joue un

rôle très important dans la stratégie TUC qui a été déployée dans quelques villes et a

présenté de bons résultats [53].

La commande LQ utilise un modèle similaire au modèle linéaire (5.1). La différence

principale est que cette stratégie ne prend pas en compte les contraintes sur l’état et la

commande. C’est la raison pour laquelle la commande LQ sera utilisée sous les mêmes

conditions de notre système. En effet, les figures 5.8 jusqu’à 5.10 comparent les perfor-

mances de la commande LQ et nos stratégies de commandes. Nous avons relevé les faits

suivants :

Comparaisons des entropies : A partir de la figure 5.8, nous pouvons remarquer que

la commande H∞ et la commande dissipative sont meilleurs par rapport à la commande

LQ dans le sens où elles fournissent des faibles entropies pour tous les cycles. Cependant,

l’entropie de la commandeH∞ reste un peu faible par rapport à celle de la commande dis-

sipative. En plus, on peut aussi observer que l’entropie de la commande LQ converge vers

un état correspondant à une grande entropie, ce qui se traduit par une faible performance.

Page 142: Concepts thermodynamiques et d'entropie pour la

124 Chap 5. Applications

0 10 20 30 40 50 60 70 80 90 10050

60

70

80

90

100

110

120

130

Cycle

Entr

opie

de

tran

sport

LQ

dissipative

H−infini

FIGURE 5.8 – Évolution de l’entropie de transport pour le réseau artériel

Comparaisons des retards des véhicules : Le retard des véhicules est un critère très

important pour mesurer la qualité de service d’un système de transport. La figure 5.9

illustre les courbes des retards des véhicules par cycle en utilisant ces trois commandes.

Là aussi, il est clair que la commande H∞ conduit au plus court retard pour tous les

cycles. Les performances de la commande dissipative sont un peu plus faibles lors des

premiers cycles, mais deviennent identiques avec celles de la commande H∞ dans la

seconde moitié de la simulation. Une fois encore, la commande LQ fait converger le

système vers un mauvais état.

Efficacité : Pour l’application en temps réel, l’efficacité des commandes doit être consi-

dérée. En effet, la figure 5.10 illustre les temps de calcul des commandes pour tous les

cycles. On constate que les commandes dissipative et H∞ ont un temps de calcul proche

de zéro pour tous les cycles. Celui de la commande LQ oscille entre 0, 008s et 0, 012s, ce

qui confère à nos stratégies de commande un avantage pour des applications temps réel.

Page 143: Concepts thermodynamiques et d'entropie pour la

5.2 Application à un réseau artériel 125

0 10 20 30 40 50 60 70 80 90 1001.8

2

2.2

2.4

2.6

2.8

3

3.2

3.4

3.6x 10

4

Cycle

Ret

ard t

ota

l de

veh

icule

par

cycl

e

LQ

dissipative

H−infini

FIGURE 5.9 – Évolution du retard total des véhicules par cycle pour le réseau artériel

0 10 20 30 40 50 60 70 80 90 100−5

0

5

10

15

20x 10

−3

Cycle

Tem

ps

de

calc

ul

par

cycl

e

LQ

dissipative

H−infini

FIGURE 5.10 – Évolution du temps de calcul pour le réseau artériel

Page 144: Concepts thermodynamiques et d'entropie pour la

126 Chap 5. Applications

Finalement, les résultats de cette comparaison sont résumés dans le tableau 5.2.

TABLE 5.2 – Performances pour le réseau artérielCommande Entropie de transport Retard de véhicules (véh*s)

Moyen Max Min Moyen Max Min

LQ 97 129 59 29614 35132 21638

Dissipative 71 93 55 24434 28621 20005

H∞ 69 86 54 24298 28378 19902

Ces résultats révèlent tout d’abord la puissance de la commande H∞ et indiquent que

les commandes proposées dans ce travail présentent de bien meilleures performances que

la commande LQ pour les réseaux artériels. Ceci est dû au fait que les gains des com-

mandes proposées sont calculés une fois pour tous les cycles tandis que la commande LQ

doit résoudre pour chaque cycle un problème d’optimisation quadratique. Ce dernier peut

s’avérer complexe, surtout quand il s’agit des systèmes de grandes dimensions comme

le cas des systèmes de transport. Une autre raison aussi est que la commande LQ n’est

pas appropriée pour ce type de réseaux. En effet, Kosmatopoulos dans [53] a montré que

la commande LQ conduit le plus souvent à des grands taux d’occupation pour le réseau

artériel de Munich.

5.3 Application à un réseau en grille

Bien que les réseaux artériels soient importants dans la régulation du trafic, la plupart

des réseaux de transport urbains se structurent sous la forme d’une grille. Afin d’analyser

plus en détail les commandes proposées, nous réalisons dans cette section des simulations

pour un réseau en grille (voir Figure 5.11). Ce système est bien plus complexe que le

réseau artériel et possède beaucoup de caractéristiques des réseaux réels. Sa nature est

utile pour mettre en lumière les performances des commandes proposées.

5.3.1 Caractéristiques du réseau simulé

La Figure 5.11 donne un aperçu du réseau sous la forme d’un graphe direct. Ce sys-

tème est composé de 12 intersections numérotées 12, 21, 22, 23, 24, 31, 32, 33, 34, 42,

43, et 54. Ainsi, il comporte 48 voies numérotées de 1 jusqu’à 48. Pour chaque voie, les

Page 145: Concepts thermodynamiques et d'entropie pour la

5.3 Application à un réseau en grille 127

FIGURE 5.11 – Réseau en grille incluant 12 intersections

véhicules tournant à gauche et à droite partagent la même ligne que les autres véhicules.

Les sorties du réseau sont ignorées étant donné que les arcs de sortie ne sont pas pris en

compte dans les stratégies.

Nous supposons que tous les carrefours sont à deux phases de même cycle de durée

c = 90s. Pour chaque phase, le temps perdu est égal à 5s, les temps des feux verts effectifs

sont bornés entre 30 et 60s. Comme dans le cas du réseau artériel, le débit de saturation

si = 0.5véh/s est considéré pour tous les arcs du réseau. Par contre, les flux des échanges

λi,j sont données par les pourcentages suivants direct= 0.6, tourne-à-gauche= 0.1 et

Page 146: Concepts thermodynamiques et d'entropie pour la

128 Chap 5. Applications

tourne-à-droite= 0.3. Pour des raisons de simplicité, nous supposons que toutes les voies

partagent la même capacité moyenne x∗i = 70véh.

État nominal : Pour les voies de connexion entre le réseau et l’extérieur, nous sup-

posons que leurs débits d’entrée nominaux sont tous égales à 0.22véh/s ; d’autre part,

les débits d’entrée nominaux des voies à l’intérieur du réseau sont donnés par 0.02véh/s.

Ainsi, toutes les phases de ces 12 carrefours partagent le même temps vert effectif nominal

uiN = 40s.

Perturbations : Pour mieux mettre en évidence les effets des commandes proposées

dans ce réseau, nous considérons deux scénarios. Le premier utilise des perturbations

sinusoïdales similaires au cas du réseau artériel. Dans le deuxième scénario, nous nous

intéressons aux performances des commandes dans la situation des heures de pointes en

utilisant les perturbations à distribution de Gauss.

5.3.2 Scénario 1 : Perturbations sinusoïdales

Comme dans le cas du réseau artériel, ce scénario suppose que les perturbations sont

données par :

ω(k) = 10qN sin(2kπ

15)

Commande dissipative : Pour illustrer les performances de la commande dissipative

dans ce cas, les figures 5.12 et 5.13 montrent les variations des taux d’occupation fi des 48

voies pour 120 cycles. Les remarques du cas d’un réseau artériel demeurent inchangées.

Néanmoins, les taux d’occupation ont tendance cette fois-ci à converger vers un intervalle

autour de 0.5. Par ailleurs, la figure 5.14 montre que la variation de l’entropie ∆ψ(x) est

toujours inférieure à la fonction d’approvisionnement Sω. Ce qui permet de dire que le

système a une tendance à perdre son désordre. Cette situation est montrée aussi par la

convergence de la commande vers les valeurs nominales uiN = 40s.

Page 147: Concepts thermodynamiques et d'entropie pour la

5.3 Application à un réseau en grille 129

0 20 40 60 80 100 1200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x1

x2

x3

x4

(a) Intersection 12

0 20 40 60 80 100 1200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x5

x6

x7

x8

(b) Intersection 21

0 20 40 60 80 100 1200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x9

x10

x11

x12

(c) Intersection 22

0 20 40 60 80 100 1200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x13

x14

x15

x16

(d) Intersection 23

0 20 40 60 80 100 1200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x17

x18

x19

x20

(e) Intersection 24

0 20 40 60 80 100 1200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x21

x22

x23

x24

(f) Intersection 31

FIGURE 5.12 – Évolution des taux d’occupation en utilisant la commande dissipative pour

le réseau en grille

Page 148: Concepts thermodynamiques et d'entropie pour la

130 Chap 5. Applications

0 20 40 60 80 100 1200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x25

x26

x27

x28

(a) Intersection 32

0 20 40 60 80 100 1200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x29

x30

x31

x32

(b) Intersection 33

0 20 40 60 80 100 1200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x33

x34

x35

x36

(c) Intersection 34

0 20 40 60 80 100 1200

0.2

0.4

0.6

0.8

1

Cycle

Occupations

x37

x38

x39

x40

(d) Intersection 42

0 20 40 60 80 100 1200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x41

x42

x43

x44

(e) Intersection 43

0 20 40 60 80 100 1200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x45

x46

x47

x48

(f) Intersection 53

FIGURE 5.13 – Évolution des taux d’occupation en utilisant la commande dissipative pour

le réseau en grille

Page 149: Concepts thermodynamiques et d'entropie pour la

5.3 Application à un réseau en grille 131

0 5 10 15 20 25 30 35 4015

10

5

0

5

10

15

Cycle

FIGURE 5.14 – Évolution de Sω et ∆ψ(x) en utilisant la commande dissipative pour le

réseau en grille

0 20 40 60 80 100 12039.7

39.8

39.9

40

40.1

40.2

40.3

40.4

Cycle

La

com

man

de u

FIGURE 5.15 – Évolution de la commande u en utilisant la commande dissipative pour le

réseau en grille

Commande H∞ : De la même manière, les figures 5.16, 5.17, 5.18 et 5.19 illustrent

respectivement les variations des taux occupations des voies, l’évolution du rapport ‖zc‖2‖ω‖2et la variation de la commande. Nous remarquons sans difficulté que toutes les observa-

Page 150: Concepts thermodynamiques et d'entropie pour la

132 Chap 5. Applications

tions concernant la commande H∞ du cas du réseau artériel sont toujours valables. En

plus, les meilleurs résultats sont obtenus quand la commande H∞ est appliquée.

0 20 40 60 80 100 1200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x1

x2

x3

x4

(a) Intersection 12

0 20 40 60 80 100 1200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x5

x6

x7

x8

(b) Intersection 21

0 20 40 60 80 100 1200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x9

x10

x11

x12

(c) Intersection 22

0 20 40 60 80 100 1200

0.2

0.4

0.6

0.8

1

Cycle

Occupations

x13

x14

x15

x16

(d) Intersection 23

0 20 40 60 80 100 1200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x17

x18

x19

x20

(e) Intersection 24

0 20 40 60 80 100 1200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x21

x22

x23

x24

(f) Intersection 31

FIGURE 5.16 – Évolution des occupations en utilisant la commande H∞ pour le réseau

en grille

Page 151: Concepts thermodynamiques et d'entropie pour la

5.3 Application à un réseau en grille 133

0 20 40 60 80 100 1200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x25

x26

x27

x28

(a) Intersection 32

0 20 40 60 80 100 1200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x29

x30

x31

x32

(b) Intersection 33

0 20 40 60 80 100 1200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x33

x34

x35

x36

(c) Intersection 34

0 20 40 60 80 100 1200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x37

x38

x39

x40

(d) Intersection 42

0 20 40 60 80 100 1200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x41

x42

x43

x44

(e) Intersection 43

0 20 40 60 80 100 1200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occ

upat

ions

x45

x46

x47

x48

(f) Intersection 53

FIGURE 5.17 – Évolution des taux d’occupation en utilisant la commande H∞ pour le

réseau en grille

Page 152: Concepts thermodynamiques et d'entropie pour la

134 Chap 5. Applications

0 20 40 60 80 100 1200

0.05

0.1

0.15

0.2

0.25

Cycle

FIGURE 5.18 – Évolution de ‖zc‖2‖ω‖2 en utilisant la commande H∞ pour le réseau en grille

0 20 40 60 80 100 12034

36

38

40

42

44

46

48

Cycle

La

com

man

de u

FIGURE 5.19 – Évolution de la commande u en utilisant la commande H∞ pour le réseau

en grille

Page 153: Concepts thermodynamiques et d'entropie pour la

5.3 Application à un réseau en grille 135

Comparaison avec la commande LQ : La figure 5.20 compare les entropies pour les

trois stratégies. On peut observer que la commande H∞ est toujours puissante par rapport

aux deux autres. Cependant, cette fois-ci, la commande LQ donne de meilleurs résultats

que la commande dissipative.

0 5 10 15 20 25 30 35 40280

300

320

340

360

380

400

420

440

460

480

Cycle

Entr

opie

de

tran

sport

LQ

dissipative

H−infini

FIGURE 5.20 – Évolution de l’entropie du transport pour le réseau en grille

La figure 5.21 compare le retard total des véhicules par cycle. Là aussi, on peut remar-

quer que la commande H∞ donne de bons résultats par rapport aux autres. Toutefois, la

différence entre la commande LQ et la commande dissipative est très peu illustrée. Cepen-

dant, le tableau 5.3 montre que la commande LQ est un peu meilleure que la commande

dissipative.

TABLE 5.3 – Performances pour le réseau en grille (scénario 1)Commande Entropie du transport Retard de véhicules (véh*s)

Moyen Max Min Moyen Max Min

LQ 382 474 305 91724 100835 82705

Dissipative 384 480 302 91881 100764 82638

H∞ 376 460 301 91635 100590 82866

Enfin, en ce qui concerne les temps de calcul des commandes par cycle, la figure 5.21

donne un avantage certain à nos stratégies de commandes par rapport à la commande LQ.

Page 154: Concepts thermodynamiques et d'entropie pour la

136 Chap 5. Applications

0 5 10 15 20 25 30 35 408.2

8.4

8.6

8.8

9

9.2

9.4

9.6

9.8

10

10.2x 10

4

Cycle

Ret

ard

to

tal

de

veh

icu

le p

ar c

ycl

e

LQ

dissipative

H−infini

FIGURE 5.21 – Évolution du retard total de véhicules par cycle pour le réseau en grille

0 20 40 60 80 100 120−5

0

5

10

15x 10

−3

Cycle

Tem

ps

de

calc

ul

par

cycl

e

LQ

dissipative

H−infini

FIGURE 5.22 – Évolution du temps de calcul pour le réseau en grille

En résumé, ces résultats révèlent toujours que la commande H∞ est bien puissante

et s’adapte aux deux types de réseaux. Par contre, la commande dissipative donne de

mauvais résultats par rapport à la commande LQ. Cependant, pour les applications temps

réel, nos deux stratégies de commande demeurent les meilleures.

Page 155: Concepts thermodynamiques et d'entropie pour la

5.3 Application à un réseau en grille 137

5.3.3 Scénario 2 : Perturbations à distribution de Gauss

L’heure de pointe est la période de la journée pendant laquelle le trafic est le plus im-

portant. Les problèmes de transport tels que la congestion, se concentrent lors de cette pé-

riode. Par conséquent, tester le comportement des commandes proposées face à l’heure de

pointe représente un grand intérêt. Pour ce scénario, nous introduisons des perturbations

qui correspondent à une période de pointe pour chaque entrée du réseau et examinons les

performances des commandes dans ce cas.

En effet, la distribution de Gauss est utilisée ici afin d’imiter la demande lors des

heures de pointe. Figure 5.23 montre les flux d’entrée à partir de l’extérieur du réseau.

Observons que le réseau rencontre de grands flux entre les cycles 20 et 60. Les ampli-

tudes et les durées de ces impulsions varient suivant 9 entrées y1, · · · , y9. Ces dernières

correspondent aux 5 directions horizontales et 4 verticales. Les autres flux d’entrée sont

donnés par leurs valeurs nominales.

0 10 20 30 40 50 60 70 800

2

4

6

8

10

12

14

16

18

20

Cycle

Per

turb

atio

ns

aux h

eure

s de

poin

te

y1

y2

y3

y4

y5

y6

y7

y8

y9

y1 pour les directions 11→ 12 et 13→ 12 y2 pour les directions 20→ 21 et 25→ 24

y3 pour les directions 30→ 31 et 35→ 34 y4 pour les directions 41→ 42 et 44→ 43

y5 pour les directions 52→ 53 et 54→ 53 y6 pour les directions 11→ 21 et 41→ 31

y7 pour les directions 02→ 12 et 52→ 42 y8 pour les directions 13→ 23 et 63→ 53

y9 pour les directions 14→ 24 et 44→ 34

FIGURE 5.23 – Perturbations aux heures de pointe

Page 156: Concepts thermodynamiques et d'entropie pour la

138 Chap 5. Applications

Afin d’examiner les capacités des commandes à gérer ces grandes demandes de trafic,

la simulation est effectuée pour 80 cycles (correspondant à deux heures). A partir des fi-

gures 5.24, 5.25 et 5.26, nous pouvons observer que ces grandes perturbations provoquent

de grandes augmentations des taux d’occupation pour les trois stratégies. Il y en a même

qui dépassent la capacité de la voie (état de congestion). Cependant, les amplitudes et

les durées de ces états sont différentes. En effet, le Tableau 5.4 nous donne, pour chaque

commande, l’amplitude de la première impulsion (réponse à la perturbation y1) et le cycle

de fin de l’évacuation (le cycle quand tous les taux d’occupation redeviennent inférieurs

à 0.3). Les résultats montrent que la commande H∞ dépasse largement les autres mé-

thodes avec la plus petite augmentation du taux d’occupation et la plus grande vitesse

d’évacuation.

Ce fait est aussi illustré par rapport aux entropies et le retard total des véhicules dans

les figures 5.27 et 5.28. Cependant, il faut souligner que la commande LQ présente de

meilleures performances par rapport à la commande dissipative.

10 20 30 40 50 60 700

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occupations

0.75

63

FIGURE 5.24 – Évolution des taux d’occupation en utilisant la commande dissipative avec

les perturbations aux heures de pointe

Page 157: Concepts thermodynamiques et d'entropie pour la

5.3 Application à un réseau en grille 139

10 20 30 40 50 60 700

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occupations

0.59

58

FIGURE 5.25 – Évolution des taux d’occupation en utilisant la commande H∞ avec les

perturbations aux heures de pointe

10 20 30 40 50 60 700

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Cycle

Occupations

0.7

60

FIGURE 5.26 – Évolution des taux d’occupation en utilisant la commande LQ avec les

perturbations aux heures de pointe

Page 158: Concepts thermodynamiques et d'entropie pour la

140 Chap 5. Applications

TABLE 5.4 – Performances face aux perturbations à distribution de GaussCommande Amplitude de la première impulsion Cycle de fin de l’évacuation

LQ 0.7 60

Dissipative 0.75 63

H∞ 0.59 58

10 20 30 40 50 60 7020

40

60

80

100

120

140

160

180

Cycle

Entr

opie

de

tran

sport

LQ

dissipative

H−infini

FIGURE 5.27 – Évolution de l’entropie du transport avec les perturbations aux heures de

pointe

10 20 30 40 50 60 701

1.5

2

2.5

3

3.5

4x 10

4

Cycle

Ret

ard t

ota

l de

veh

icule

par

cycl

e

LQ

dissipative

H−infini

FIGURE 5.28 – Évolution du retard total des véhicules par cycle avec les perturbations

aux heures de pointe

Page 159: Concepts thermodynamiques et d'entropie pour la

5.4 Conclusion 141

5.4 Conclusion

La difficulté de la mise en oeuvre d’une stratégie de régulation de trafic réside dans

le choix de la géométrie du réseau de test. Pour cela, nous avons choisi deux types de

réseaux à différentes échelles contenant 4 et 12 carrefours afin de tester nos commandes

sur différentes situations : artériel et en grille. Ces réseaux possèdent des caractéristiques

correspondantes aux flux et aux feux des réseaux réels, et donc peuvent servir comme des

systèmes de test.

Les résultats de simulation montrent que les commandes proposées réalisent leurs

objectifs pour chaque système et arrivent à bien réguler le trafic. De plus, confrontées à la

commande LQ, les stratégies proposées offrent de meilleures performances, notamment

la commande H∞ qui montre bien sa puissance dans la diminution de l’entropie et le

retard de véhicules pour les différents scénarii de test. Ces résultats nous encouragent à

privilégier à mettre en pratique la commande H∞ sur un réseau réel.

Enfin, nous terminons cette conclusion pour souligner une remarque importante concer-

nant l’entropie. En effet, lors des comparaisons de nos méthodes avec la command LQ,

les courbes des entropies et du retard des véhicules ont toujours les mêmes allures. Ceci

confirme la légitimité de l’entropie du transport que nous avons introduit dans ce travail

comme une mesure du désordre du système puisque le retard des véhicules est évidem-

ment relatif au niveau d’organisation du trafic.

Page 160: Concepts thermodynamiques et d'entropie pour la

142 Chap 5. Applications

Page 161: Concepts thermodynamiques et d'entropie pour la

CONCLUSION GÉNÉRALE

Dans ce travail, nous avons présenté notre contribution portant sur la modélisation

et le contrôle a priori de congestion des réseaux de carrefours signalisés. Ces systèmes

dynamiques sont sujets à des incertitudes et des contraintes d’ordre physique ou imposées

par des obligations de sécurité. Dans ce cadre, nous avons présenté deux contributions

permettant d’apporter des améliorations appréciables pour la fluidification du trafic dans

un réseau de transport tout en tenant compte à la fois des incertitudes et des contraintes

du système.

Du point de vue de la modélisation, nous avons introduit un nouveau regard sur les sys-

tèmes de transport en proposant un premier travail sur la manière dont les liens se tissent

entre ces systèmes et la thermodynamique. Pour cela, plusieurs paramètres et principes

thermodynamiques ont trouvé leurs parallèles dans le cadre des systèmes de transport

tels que la température (taux d’occupation de la voie), la capacité thermique (capacité de

la voie), l’équilibre thermique (l’équilibre du taux d’occupation), le premier principe de

la thermodynamique (loi de conservation des véhicules) et les notions d’entropie et di-

sentropie. Le point de vue prépondérant est la considération des véhicules comme étant

l’énergie fournie ou/et échangée entre les intersections signalisées. Contrairement aux ap-

proches existantes, le modèle développé se base sur la notion d’énergie au lieu du débit.

L’avantage majeur de la modélisation thermodynamique est l’introduction de la notion

d’entropie mesurant le désordre dans les réseaux du transport. Nous avons montré que

cette dernière est liée à la densité de la circulation, ce qui lui confère une légitimité de

son utilisation. En effet, non seulement elle peut être considérée comme un moyen pour

Page 162: Concepts thermodynamiques et d'entropie pour la

144 Conclusion générale

la compréhension des phénomènes du trafic, mais aussi comme un outil d’évaluation pour

avoir une idée rapide sur l’évolution du trafic surtout lorsqu’il s’agit de traiter des réseaux

de grande taille.

Un autre avantage de la modélisation est que le choix énergétique fait apparaître sur le

modèle le nombre de véhicules présents sur les segments de route comme variable d’état,

ce qui permet de suivre les modifications de l’infrastructure routière dues à des situations

nouvelles sans avoir à reprendre les démarches de modélisation depuis le début. En outre,

il permet de décrire explicitement les phénomènes qui gouvernent le trafic tels que le

phénomène de congestion qui est facilement représenté par l’augmentation de l’entropie

(désordre).

Du point de vue du contrôle, la contribution principale du travail est l’introduction

des concepts de la dissipativité et de la synthèse H∞ dans le domaine de la commande

du trafic. Ces approches nous ont permis de traiter le problème de la commande de deux

façons différentes.

La première fait appel à la commande dissipative. Nous avons exploité cet outil pour

arriver à des résultats théoriques dont la vérification permet de conclure sur la possibilité

de dissiper les véhicules au moyen d’une action de la commande adéquate. L’existence

d’une commande dissipative est caractérisée par la faisabilité de certaines inégalités ma-

tricielles linéaires dont les solutions s’avèrent relativement simples à mettre en œuvre

et non coûteuses du point de vue temps de calcul. Deux cas ont été étudiés : celui où

le modèle du système est non-linéaire est d’abord analysé. Ensuite, nous nous sommes

intéressés au cas où le système peut être représenté par un modèle linéaire.

Dans le cas non-linéaire, nous avons trouvé une borne supérieure sur la norme des

incertitudes en deçà de laquelle la propriété de la dissipativité du système incertain est

conservée. Par contre, le cas linéaire n’impose aucune pénalité sur les incertitudes. Par

conséquent, l’effet des perturbations sur le comportement du système bouclé est difficile

à maîtriser, et en particulier la stabilité n’est plus garantie.

Pour remédier aux inconvénients de l’approche de la commande dissipative dans le

cas linéaire, nous avons dû avoir recours à la commande H∞ pour la solution de notre

problème de commande. Nous avons tiré profit de cet outil pour développer des résultats

assurant l’invariance positive en boucle fermée d’un domaine ellipsoïdal contenu dans

l’ensemble des contraintes. Le test d’existence et le calcul d’une loi de commande par re-

tour d’état peut alors se faire de façon simple par la résolution d’un problème de program-

Page 163: Concepts thermodynamiques et d'entropie pour la

145

mation linéaire convexe. Cette méthode nous a permis en outre d’intégrer directement les

incertitudes sur la commande dans la synthèse du régulateur.

L’utilisateur dispose ainsi de deux approches à sa disposition selon ses besoins. Ce-

pendant, les résultats de simulation sur les deux types de réseaux du chapitre 5 ont permis

de mettre en lumière l’importance de la méthode H∞ puisqu’elle a réussi à satisfaire les

objectifs de départ à savoir :

– Eviter la congestion en forçant les files d’attente à ne pas dépasser le niveau du

trafic correspondant à l’optimum opérationnel des lignes.

– Le calcul de la commande en temps réel.

– La prise en compte des incertitudes dans la conception de la commande.

Finalement, l’ensemble de ces travaux contribue ainsi à préciser l’intérêt d’utiliser

les concepts de l’entropie et de l’invariance positive pour résoudre le problème de la

régulation du trafic au sein d’un réseau d’intersections signalisées.

Perspectives

Plusieurs perspectives et voies de recherche peuvent être discernées. En effet, il serait

intéressant de poursuivre ce travail sur les points suivants :

1. La perspective la plus directe consiste à valider nos stratégies de commande sur un

réseau de transport réel.

2. Le système de contrôle dynamique du trafic est un système qui dispose de cap-

teurs lui donnant des informations sur l’état du trafic, et notamment, le nombre de

véhicules sur certaines rues ou intersections du réseau routier. Ces capteurs sont

assujettis à leur tour à des perturbations diverses et par conséquent les informations

issues de ces outils de mesure sont souvent approximatives. Il est alors intéressant

de s’attaquer aux problèmes de la présence des incertitudes de structure qui peuvent

être confinées dans la matrice dynamique A ou la matrice de commande B.

3. Il est intéressant aussi de faire appel à l’outil d’optimisation avec contraintes afin

de prendre en compte les critères dédiés à la régulation du trafic comme le temps

de trajet, le temps d’attente des véhicules, etc.

Page 164: Concepts thermodynamiques et d'entropie pour la

146 Conclusion générale

Page 165: Concepts thermodynamiques et d'entropie pour la

BIBLIOGRAPHIE

[1] J. D. C. Little, M. D. Kelson, and N. H. Gartner, “MAXBAND : A Program for

Setting Signals on Arteries and Triangular Networks,” in Transportation Research

Record 795. Washington, DC : U.S. Dept. Transp., 1981.

[2] W. H. Kraft, W. S. HOMBURGER, and J. L. Pline, Traffic engineering handbook.

Institute of Transportation Engineers, 2009.

[3] F. V. Webster and B. M. Cobbe, Traffic signals, ser. Road research technical paper.

London : Great Britain Road Research Laboratory, 1966, no. 56.

[4] A. Benesch, “Regulating Street Traffic in Cleveland,” The American City, pp. 182–

184, 1915.

[5] B. Marsh, “Traffic control,” Annals of the American Academy of Political and Social

Science, vol. 133, pp. 90–113, 1927.

[6] M. Bell, “Future directions in traffic signal control,” Transportation Research Part

A : Policy and Practice, vol. 26A, pp. 303–313, 1992.

[7] R. Hall, Ed., Handbook of Transportation Science. Kluwer Academic Publishers,

1999.

[8] C. Diakaki, M. Papageorgiou, and K. Aboudolas, “A multivariable regulator ap-

proach to traffic-responsive network-wide signal control,” Control Engineering

Practice, vol. 10, no. 2, pp. 183–195, Feb. 2002.

[9] N. H. Gartner, C. J. Messer, and A. K. Rathi, Eds., Revised Monograph on Traffic

Flow Theory. Federal Highway Administration, USA, 2005.

Page 166: Concepts thermodynamiques et d'entropie pour la

148 BIBLIOGRAPHIE

[10] W. Adams, “Road Traffic Considered as a Random Series,” J. Inst. Civil Engineers,

vol. 4, pp. 121–130, 1936.

[11] B. D. Greenshields, “A Study in Highway Capacity,” Highway Research Board,

Proceedings, vol. 14, p. 458, 1935.

[12] L. Pipes, “An Operational Analysis of Traffic Dynamics,” Journal of Applied Phy-

sics, vol. 24, no. 3, pp. 274–281, 1953.

[13] P. Gipps, “A behavioural car-following model for computer simulation,” Transpor-

tation Research Part B : Methodological, vol. 15, no. 2, pp. 105–111, 1981.

[14] X. Zhao and Z. Gao, “A new car-following model : full velocity and acceleration

difference model,” The European Physical Journal B, vol. 47, no. 1, pp. 145–150,

Sep. 2005.

[15] M. Lighthill and G. Whitham, “On kinematic waves II : a theory of traffic flow on

long crowded roads,” in Proceedings of the Royal Society, London Series A, vol. 229,

1955, pp. 317–345.

[16] P. Richards, “Shockwaves on the highway,” Operations Research, vol. 4, no. 1, pp.

42–51, 1956.

[17] C. F. Daganzo, “The cell transmission model, part II : Network traffic,” Transporta-

tion Research Part B : Methodological, vol. 29, no. 2, pp. 79–93, Apr. 1995.

[18] H. Zhang and W. Jin, “Kinematic Wave Traffic Flow Model for Mixed Traffic,”

Transportation Research Record, vol. 1802, no. 1, pp. 197–204, Jan. 2002.

[19] J. Wardrop, “Some Theoretical Aspects of Road Traffic Research,” in Proceedings

of the Institution of Civil Engineers, Part II, vol. 1, no. 2, 1952, pp. 325–362.

[20] N. Vandaele, T. V. Woensel, and A. Verbruggen, “A queueing based traffic flow

model,” Transportation Research Part D : Transport and Environment, vol. 5, no. 2,

pp. 121–135, 2000.

[21] J. Kamata and T. Oda, “Detectors for road traffic,” Concise encyclopedia of traffic

and transportation systems, 1991.

[22] L. A. Klein, M. K. Mills, and D. R. P. Gibson, Traffic Detector Handbook. U.S.

Department of Transportation Federal Highway Administration, 2006.

[23] S. Avner, R. Glachet, M. Pintado, and F. Boillot, “L’image au service de la gestion

du trafic urbain,” TRANSPORT ENVIRONNEMENT CIRCULATION, vol. 160, pp.

9–13, 2000.

Page 167: Concepts thermodynamiques et d'entropie pour la

BIBLIOGRAPHIE 149

[24] C. Chaudy, J. Delaigle, and M. Macq, “Analyse du trafic routier par caméra intelli-

gente : MvTraffic,” UCL, Tech. Rep., 2004.

[25] F. Webster, Traffic signal settings, ser. Road research technical paper. London :

Great Britain Road Research Laboratory, 1958, no. 39.

[26] J. T. Morgan and J. D. C. Little, “Synchronizing Traffic Signals for Maximal Band-

width,” Operations Research, vol. 12, pp. 896–912, 1964.

[27] J. D. C. Little, “The Synchronization of Traffic Signals by Mixed-Integer Linear

Programming,” Operations Research, vol. 14, no. 4, pp. 568–594, Jul. 1966.

[28] N. A. Chaudhary, A. Pinnoi, and C. Messer, “Proposed enhancements to

MAXBAND-86 program,” Transportation Research Record, vol. 1324, 1991.

[29] N. H. Gartner, S. F. Assmann, L. F., and D. L. Hom, “A multiband approach to arte-

rial traffic signal optimization,” Transportation Research Part B : Methodological,

vol. 25, pp. 55–74, 1991.

[30] C. Stamatiadis and N. H. Gartner, “MULTIBAND-96 : a program for variable band-

width progression optimization of multiarterial traffic networks,” U.S. Dept. Transp.,

Washington, DC, Transp. Res. Record 1554, 1996.

[31] D. I. Robertson, “TANSYT method for area traffic control,” Traffic Engineering &

Control, vol. 10, pp. 276–281, 1969.

[32] D. Hale, Traffic Network Study Tool : TRANSYT-7F, United States Version. Mc-

Trans Center in the University of Florida, Gainesville, Jan. 2005.

[33] M. T. Li and A. C. Gan, “Signal timing optimazation for oversaturated networks

using TRANSYT-7F,” in 78th Annu. Meeting Transportation Research Board, 1999.

[34] M. Bielli, G. Ambrosino, and M. Boero, Artificial intelligence applications to traffic

engineering. VSP International Science Publishers, 1994.

[35] P. Lowrie, “The Sydney coordinated adaptive traffic system - principles, methodo-

logy, algorithms,” in International Conference on Road Traffic Signalling, London,

United Kingdom, 1982, pp. 67–70.

[36] P. Hunt, D. Robertson, R. Bretherton, and R. Winton, “SCOOT-a traffic responsive

method of coordinating signals,” Transport and Road Research Laboratory, Tech.

Rep. LR 1014 Monograph, 1981.

Page 168: Concepts thermodynamiques et d'entropie pour la

150 BIBLIOGRAPHIE

[37] R. D. Bretherton, P. Hunt, D. Robertson, and M. Royle, “The SCOOT on-line traffic

signal optimisation technique,” Traffic Engineering and Control, vol. 23, no. 4, pp.

190–192, 1982.

[38] D. Bretherton, “Current Developments in SCOOT : Version 3,” Transportation Re-

search Record : Journal of the Transportation Research Board, vol. 1554, pp. 48–52,

1996.

[39] R. Bretherton, “The use of SCOOT for traffic management,” in INTERNATIONAL

CONFERENCE ON ROAD TRAFFIC CONTROL, 1986, pp. 81–85.

[40] N. H. Gartner, “OPAC : A DEMAND-RESPONSIVE STRATEGY FOR TRAFFIC

SIGNAL CONTROL,” in Transportation Research Record 906. Washington, DC :

U.S. Dept. Transp., 1983.

[41] N. H. Gartner, F. J. Pooran, and C. M. Andrews, “Implementation of the OPAC

adaptive control strategy in a traffic signal network,” in Proceedings of the IEEE

4th International Conference on Intelligent Transportation Systems, Oakland, CA,

2001, pp. 195–200.

[42] D. Gazis and R. Potts, “The Oversaturated Intersection,” in Proceedings of the Se-

cond International Symposium on the Theory of Road Traffic Flow, 1963, pp. 221–

237.

[43] D. C. Gazis, Traffic Theory. Boston : MA : Kluwer, 2002.

[44] M. Papageorgiou, C. Diakaki, V. Dinopoulou, A. Kotsialos, and Y. Wang, “Review

of road traffic control strategies,” Proceedings of the IEEE, vol. 91, no. 12, pp. 2043–

2067, 2003.

[45] G. C. D’Ans and D. C. Gazis, “Optimal Control of Oversaturated Store-and-Forward

Transportation Networks,” Transportation Science, vol. 10, no. 1, pp. 1 –19, Feb.

1976.

[46] P. G. Michalopoulos and G. Stephanopoulos, “Oversaturated signal systems with

queue length constraints ii : System of intersections,” Transportation Research,

vol. 11, pp. 413–421, 1977.

[47] J. H. Lim, S. H. Hwang, I. H. Suh, and Z. Bien, “Hierarchical optimal control of

oversaturated urban networks,” Int. J. Control, vol. 33, p. 727¨C737, 1981.

[48] E. J. Davison and U. Ozguner, “Decentralized control of traffic networks,” IEEE

Transactions on Automatic Control, vol. 28, p. 677¨C688, 1983.

Page 169: Concepts thermodynamiques et d'entropie pour la

BIBLIOGRAPHIE 151

[49] A. K. Rathi, “A control scheme for high traffic density sectors,” Transportation Re-

search Part B : Methodological, vol. 22, pp. 81–101, 1988.

[50] K.-J. Kim and M. G. H. Bell, “Development of an integrated traffic control strategy

for both urban signalised and motorway networks,” in Proceedings of 1st Meeting

EUROWorking Group on Urban Traffic and Transportation, Landshut, Germany,

1992.

[51] C. Diakaki, “Integrated control of traffic flow in corridor networks,” Ph.D. Thesis,

Department of Production Engineering and Management, Technical University of

Crete, Chania, Greece, 1999.

[52] K. Aboudolas, M. Papageorgiou, and E. Kosmatopoulos, “Store-and-forward based

methods for the signal control problem in large-scale congested urban road net-

works,” Transportation Research Part C : Emerging Technologies, vol. 17, no. 2,

pp. 163–174, Apr. 2009.

[53] E. Kosmatopoulos, M. Papageorgiou, C. Bielefeldt, V. Dinopoulou, R. Morris,

J. Mueck, A. Richards, and F. Weichenmeier, “International comparative field eva-

luation of a traffic-responsive signal control strategy in three cities,” Transportation

Research Part A : Policy and Practice, vol. 40, no. 5, pp. 399–413, Jun. 2006.

[54] W. M. Haddad, Q. Hui, S. G. Nersesov, and V. Chellaboina, “Thermodynamic mo-

deling, energy equipartition, and nonconservation of entropy for discrete-time dy-

namical systems,” Advances in Difference Equations, vol. 2005, no. 3, pp. 275–318,

2005.

[55] Y. A. Cengel and M. Boles, Thermodynamics : An Engineering Approach, 4th ed.

McGraw-Hill Science/Engineering/Math, Nov. 2001.

[56] J. C. Willems, “Dissipative dynamical systems part I : General theory,” Archive for

Rational Mechanics and Analysis, vol. 45, no. 5, pp. 321–351, 1972.

[57] G. H. Hardy, J. E. Littlewood, and G. Pólya, Inequalities, 1st ed. London : Cam-

bridge University Press, 1934.

[58] A. W. Marshall, I. Olkin, and B. C. Arnold, Inequalities : Theory of Majorization

and Its Applications, 2nd ed., ser. Springer Series in Statistics. New York, USA :

Springer, 2011.

[59] F. Robert, Matrices nonnégatives et normes vectorielles, ser. Cours de DEA. Gre-

noble : Institut IMAG, 1973.

Page 170: Concepts thermodynamiques et d'entropie pour la

152 BIBLIOGRAPHIE

[60] J. C. Hennet, “Une extension du lemme de Farkas et son application au problème

de régulation linéaire sous contrainte,” Comptes rendus de l’Académie des sciences.

Série 1, Mathématique, vol. 308, no. 13, pp. 415–419, 1989.

[61] S. Boyd, L. E. Ghaoui, E. Feron, and V. Balakrishnan, Linear matrix inequalities in

system and control theory. SIAM, 1994.

[62] G. Zames, “On the input-output stability of time-varying nonlinear feedback systems

part one : Conditions derived using concepts of loop gain, conicity, and positivity,”

IEEE Transactions on Automatic Control, vol. 11, no. 2, pp. 228–238, 1966.

[63] J. C. Willems, “Dissipative dynamical systems Part II : Linear systems with quadra-

tic supply rates,” Archive for Rational Mechanics and Analysis, vol. 45, no. 5, pp.

352–393, 1972.

[64] V. M. Popov, Hyperstability of Control Systems. New York : Springer-Verlag, 1973.

[65] B. Brogliato, R. Lozano, B. Maschke, O. Egeland et al., Dissipative systems analysis

and control : theory and applications, 2nd ed. London : Springer Verlag, 2007.

[66] J. Doyle, A. Packard, and K. Zhou, “Review of LFTs, LMIs, and µ,” in Proceedings

of the 30th IEEE Conference on Decision and Control, 1991. IEEE, Dec. 1991, pp.

1227–1232 vol.2.

[67] S. Boyd and L. Vandenberghe, Convex Optimization. Cambridge University Press,

Mar. 2004.

[68] M. Grant and S. Boyd, “CVX : Matlab Software for Disciplined Convex Program-

ming, version 1.21,” Apr. 2011.

[69] S. Chen, “Real-time traffic signal control for over-saturated networks,” Ph.D. Thesis,

Texas Tech University, Nov. 2007.