85
Table des matières 1 Introduction générale 1 1.1 Introduction ..................................... 1 1.2 Présentation du laboratoire d’accueil ....................... 2 1.2.1 Description générale du laboratoire LIRMM ............... 2 1.2.2 Les départements du LIRMM ....................... 2 1.2.3 L’équipe DEXTER ............................. 3 1.3 Contexte et problématique ............................. 3 1.4 Cahier des charges et Objectifs .......................... 4 2 Etat de l’art 5 2.1 Les systèmes mécaniques sous-actionnés ..................... 5 2.2 Le pendule inversé classique ............................ 6 2.2.1 Description du pendule ........................... 6 2.2.2 Modèle dynamique ............................. 6 2.2.3 Représentation d’état et linéarisation ................... 8 2.2.4 Analyse du système en boucle ouverte .................. 9 2.3 Le pendule inversé de Furuta ............................ 10 2.3.1 Description du pendule ........................... 10 2.3.2 Modèle dynamique ............................. 11 2.3.3 Représentation d’état et linéarisation ................... 12 2.3.4 Analyse en boucle ouverte ......................... 13 2.4 Le pendule inversé Segway ............................. 14 2.4.1 Description du pendule ........................... 14 2.4.2 Modèle dynamique ............................. 14 2.4.3 Représentation d’état et linéarisation ................... 15 2.4.4 Analyse en boucle ouverte ......................... 16 2.5 Le pendule inversé gyroscopique .......................... 17 2.5.1 Description du pendule ........................... 17 i

Tabledesmatièreschemori/Temp/Salma/rapport.pdfRapport de stage de Mastère 3 1.4. CahierdeschargesetObjectifs par volant d’inertie. Ce système est conçue au sein du LIRMM. Il

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

  • Table des matières

    1 Introduction générale 1

    1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

    1.2 Présentation du laboratoire d’accueil . . . . . . . . . . . . . . . . . . . . . . . 2

    1.2.1 Description générale du laboratoire LIRMM . . . . . . . . . . . . . . . 2

    1.2.2 Les départements du LIRMM . . . . . . . . . . . . . . . . . . . . . . . 2

    1.2.3 L’équipe DEXTER . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

    1.3 Contexte et problématique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

    1.4 Cahier des charges et Objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . 4

    2 Etat de l’art 5

    2.1 Les systèmes mécaniques sous-actionnés . . . . . . . . . . . . . . . . . . . . . 5

    2.2 Le pendule inversé classique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

    2.2.1 Description du pendule . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

    2.2.2 Modèle dynamique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

    2.2.3 Représentation d’état et linéarisation . . . . . . . . . . . . . . . . . . . 8

    2.2.4 Analyse du système en boucle ouverte . . . . . . . . . . . . . . . . . . 9

    2.3 Le pendule inversé de Furuta . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

    2.3.1 Description du pendule . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

    2.3.2 Modèle dynamique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

    2.3.3 Représentation d’état et linéarisation . . . . . . . . . . . . . . . . . . . 12

    2.3.4 Analyse en boucle ouverte . . . . . . . . . . . . . . . . . . . . . . . . . 13

    2.4 Le pendule inversé Segway . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

    2.4.1 Description du pendule . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

    2.4.2 Modèle dynamique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

    2.4.3 Représentation d’état et linéarisation . . . . . . . . . . . . . . . . . . . 15

    2.4.4 Analyse en boucle ouverte . . . . . . . . . . . . . . . . . . . . . . . . . 16

    2.5 Le pendule inversé gyroscopique . . . . . . . . . . . . . . . . . . . . . . . . . . 17

    2.5.1 Description du pendule . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

    i

  • Table des matières

    2.5.2 Modèle dynamique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172.5.3 Représentation d’état . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192.5.4 Analyse en boucle ouverte . . . . . . . . . . . . . . . . . . . . . . . . . 19

    2.6 Le pendule inversé stabilisé par volant d’inertie . . . . . . . . . . . . . . . . . 20

    3 Etude du pendule inversé stabilisé par volant d’inertie 21

    3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213.2 Description du système . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223.3 Schéma de principe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233.4 Modèle dynamique non linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . 24

    3.4.1 Principe mécanique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253.4.2 Lagrangien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263.4.3 Dynamique du pendule . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

    3.5 Représentation d’état et linéarisation . . . . . . . . . . . . . . . . . . . . . . . 283.6 Analyse du système en boucle ouverte . . . . . . . . . . . . . . . . . . . . . . . 28

    4 Solution1 :Approches de commande prédictive 30

    4.1 Principe générale des techniques de commande prédictive . . . . . . . . . . . . 304.2 Approche1 : La Commande Prédictive Généralisée (GPC) . . . . . . . . . . . . 33

    4.2.1 Principe de la commande . . . . . . . . . . . . . . . . . . . . . . . . . . 334.2.2 Formulation de La GPC avec état final nul . . . . . . . . . . . . . . . . 344.2.3 Modèle de représentation . . . . . . . . . . . . . . . . . . . . . . . . . . 37

    4.3 Approche2 : La commande Prédictive non linéaire . . . . . . . . . . . . . . . . 374.3.1 Principe de la commande prédictive non linéaire . . . . . . . . . . . . . 374.3.2 La génération des trajectoires . . . . . . . . . . . . . . . . . . . . . . . 384.3.3 L’optimisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

    5 Application des approches prédictives sur le pendule inversé 40

    5.1 Application de La GPC sur le Pendule inversé . . . . . . . . . . . . . . . . . . 405.1.1 Simulations dans le cas nominal . . . . . . . . . . . . . . . . . . . . . . 40

    Résultats de Simulations . . . . . . . . . . . . . . . . . . . . . . . . . . 40Interprétations des résultats . . . . . . . . . . . . . . . . . . . . . . . . 40

    5.1.2 Test de Robustesse de la commande . . . . . . . . . . . . . . . . . . . 42Robustesse vis-à-vis des incertitudes paramétriques . . . . . . . . . . . . 42Robustesse vis-à-vis des non-linéarités . . . . . . . . . . . . . . . . . . 43

    5.1.3 Expérimentation : Application en temps réel . . . . . . . . . . . . . . . 44Scénario1 : Cas nominal . . . . . . . . . . . . . . . . . . . . . . . . . . 44

    ii Nahla TOUATI

  • Table des matières

    Scénario2 : Cas de rejet des perturbations ponctuelles . . . . . . . . . . 44

    Scénario3 : Cas de rejet des perturbations persistantes . . . . . . . . . . 45

    Scénario4 : Combinaison de deux types de perturbations . . . . . . . . . 45

    5.2 Application de La commande prédictive non linéaire sur le Pendule inversé . . 46

    5.2.1 Simulations dans le cas nominal . . . . . . . . . . . . . . . . . . . . . . 46

    Résultats de Simulations . . . . . . . . . . . . . . . . . . . . . . . . . . 46

    Interprétations des résultats . . . . . . . . . . . . . . . . . . . . . . . . 47

    5.2.2 Robustesse vis-à-vis des incertitudes paramétriques . . . . . . . . . . . 47

    6 Solution 2 :Approches de commande adaptative 53

    6.1 Principe générale des approches adaptatives . . . . . . . . . . . . . . . . . . . 53

    6.2 Approche1 : La commande adaptative à modèle de référence(MRAC) . . . . . 56

    L’estimation des paramètres . . . . . . . . . . . . . . . . . . . . . . . . 57

    Calcul d’un correcteur RST robuste . . . . . . . . . . . . . . . . . . . . 58

    6.3 Approche2 : La commande par retour d’état adaptative . . . . . . . . . . . . . 60

    Principe de la commande . . . . . . . . . . . . . . . . . . . . . . . . . . 60

    Modèle de représentation . . . . . . . . . . . . . . . . . . . . . . . . . . 60

    Estimation des paramètres . . . . . . . . . . . . . . . . . . . . . . . . . 61

    7 Application des approches adaptatives sur le pendule inversé 62

    7.1 Application de la commande MRAC sur le Pendule inversé . . . . . . . . . . . 62

    7.1.1 Simulations dans le cas nominal . . . . . . . . . . . . . . . . . . . . . . 62

    Résultats des simulations . . . . . . . . . . . . . . . . . . . . . . . . . . 62

    Interprétation des résultats . . . . . . . . . . . . . . . . . . . . . . . . . 62

    7.1.2 Test de Robustesse de la commande . . . . . . . . . . . . . . . . . . . 63

    Robustesse vis-à-vis des incertitudes paramétriques . . . . . . . . . . . . 63

    Robustesse vis-à-vis des non-linéarités . . . . . . . . . . . . . . . . . . 64

    Robustesse vis-à-vis des variations des paramètres . . . . . . . . . . . . 64

    7.2 Application de La commande par retour d’état adaptative sur le Pendule inversé 65

    7.2.1 Simulations dans le cas nominal . . . . . . . . . . . . . . . . . . . . . . 65

    Résultats des simulations . . . . . . . . . . . . . . . . . . . . . . . . . . 65

    Interprétation des résultats . . . . . . . . . . . . . . . . . . . . . . . . . 66

    7.2.2 Test de Robustesse de la commande . . . . . . . . . . . . . . . . . . . 67

    Robustesse vis-à-vis des incertitudes paramétriques . . . . . . . . . . . . 67

    Robustesse vis-à-vis des non-linéarités . . . . . . . . . . . . . . . . . . 67

    Robustesse vis-à-vis des variations des paramètres . . . . . . . . . . . . 68

    Rapport de stage de Mastère iii

  • Table des matières

    8 Conclusion et perspectives 76

    8.1 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 768.2 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

    iv Nahla TOUATI

  • Table des figures

    2.1 Le pendubot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

    2.2 Schéma du principe de pendule inversé classique [20] . . . . . . . . . . . . . . 6

    2.3 Schéma de principe de pendule inversé de Furuta[17] . . . . . . . . . . . . . . 11

    2.4 Photo d’un prototype segway . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

    2.5 Modélisation du segway [3] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

    2.6 Le pendule gyroscopique [2] . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

    2.7 Modélisation du pendule gyroscopique [15] . . . . . . . . . . . . . . . . . . . . 18

    3.1 Le pendule inversé stabilisé par volant d’inertie [13] . . . . . . . . . . . . . . . 21

    3.2 Vue de la plate forme expérimentale du pendule inversé stabilisé par volantd’inertie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

    3.3 Illustrations des points d’équilibre . . . . . . . . . . . . . . . . . . . . . . . . . 25

    3.4 Modèle mécanique équivalent . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

    4.1 Stratégie de la commande prédictive [12] . . . . . . . . . . . . . . . . . . . . . 32

    4.2 Structure de base de la commande prédictive [4] . . . . . . . . . . . . . . . . . 33

    5.1 Dynamique du pendule et de volant d’inertie pour le cas de la GPC . . . . . . 41

    5.2 Couple et puissance mécanique . . . . . . . . . . . . . . . . . . . . . . . . . . 42

    5.3 Plage d’utilisation du moteur dans le cas de la GPC . . . . . . . . . . . . . . . 43

    5.4 Robustesse vis-à-vis des incertitudes du paramètre I . . . . . . . . . . . . . . . 43

    5.5 Evolution des états de système non linéaire dans le cas de la GPC . . . . . . . 44

    5.6 La commande et la puissance de système non linéaire dans le cas de la GPC . 45

    5.7 Résultats d’expérimentation de cas nominal . . . . . . . . . . . . . . . . . . . 46

    5.8 Résultats d’expérimentation du cas de rejet de perturbations ponctuelles . . . 47

    5.9 La perturbation persistante sur le pendule inversé . . . . . . . . . . . . . . . . 48

    5.10 Résultats d’expérimentation du cas de rejet de perturbations persistantes . . . 48

    5.11 La combinaison de deux types de perturbations sur le pendule inversé . . . . . 49

    5.12 Résultats d’expérimentation du cas de rejet de la combinaison des perturbations 49

    v

  • Table des figures

    5.13 L’évolutions des états du système pour le cas de la commande non linéaire . . 505.14 L’évolutions du couple et de la puissance pour le cas de la commande non linéaire 515.15 L’évolutions du paramètre d’optimisation . . . . . . . . . . . . . . . . . . . . . 515.16 Plage d’utilisation du moteur dans le cas de la commande non linéaire . . . . . 525.17 Test de robustesse de la commande prédictive non linéaire . . . . . . . . . . . 52

    6.1 Principe des systèmes de commande adaptative [5] . . . . . . . . . . . . . . . . 546.2 Commande adaptative supervisée [10] . . . . . . . . . . . . . . . . . . . . . . . 546.3 Commande adaptative à gain préprogrammé [5] . . . . . . . . . . . . . . . . . 556.4 Correcteur auto-ajustable [5] . . . . . . . . . . . . . . . . . . . . . . . . . . . . 556.5 Commande adaptative à modèle de référence [5] . . . . . . . . . . . . . . . . . 566.6 Structure d’un régulateur RST [8] . . . . . . . . . . . . . . . . . . . . . . . . . 586.7 Commande par retour d’état linéaire [8] . . . . . . . . . . . . . . . . . . . . . 60

    7.1 Dynamique du pendule et de volant d’inertie dans le cas de la commande MRAC 637.2 Couple et puissance mécanique dans le cas de la commande MRAC . . . . . . 647.3 Evolution des paramètres du pendules inversé dans le cas de la commande MRAC 657.4 Plage d’utilisation du moteur dans le cas de la commande MRAC . . . . . . . 667.5 La sortie du système . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 667.6 La commande du système . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 677.7 Evolution des états de système non linéaire dans le cas de la commande MRAC 687.8 Couple et puissance mécanique de système non linéaire dans le cas de la com-

    mande MRAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 697.9 Evolution des paramètre de système non linéaire dans le cas de la commande

    MRAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 697.10 La position angulaire du pendule inversé . . . . . . . . . . . . . . . . . . . . . 707.11 Evolution des paramètres de système . . . . . . . . . . . . . . . . . . . . . . . 707.12 Dynamique du pendule et de volant d’inertie dans le cas de la RE adaptative . 717.13 Couple et puissance mécanique dans le cas de la RE adaptative . . . . . . . . 717.14 ’évolution des paramètres du pendules inversé dans le cas de la RE adaptative 727.15 Plage d’utilisation du moteur dans le cas de la RE adaptative . . . . . . . . . 727.16 Robustesse vis-à-vis des incertitudes du paramètre I pour la RE adaptative . . 737.17 Evolution des états de système non linéaire . . . . . . . . . . . . . . . . . . . . 747.18 Couple et puissance mécanique de système non linéaire . . . . . . . . . . . . . 757.19 Evolution des paramètre de système non linéaire . . . . . . . . . . . . . . . . . 75

    vi Nahla TOUATI

  • Chapitre 1

    Introduction générale

    1.1 Introduction

    Devant les problèmes délicats de modélisation et de commande de systèmes complexes, les ou-tils utilisés deviennent de plus en plus pointus. L’un des axes les plus importants de rechercheau sein du LIRMM concerne la commande de systèmes complexes.Le travail envisagé dans le cadre de ce stage rentre dans le contexte de conception de lois decommande pour la stabilisation des systèmes mécaniques sous-actionnés.Dans ce contexte notre choix s’est porté sur le pendule inversé stabilisé par volant d’inertie.C’est un système mécanique sous actionné largement étudié dans la communauté automati-cienne, vu sa dynamique non linéaire et instable. La commande à concevoir, doit être capablede stabiliser le pendule inversé autour de son point d’équilibre instable et de le maintenir danscet état.Pour atteindre cet objectif, deux solutions sont proposées : la première consiste à proposer deslois de commande issues des techniques prédictives ( commande prédictive généralisée(GPC), et commande prédictive non linéaire), la deuxième quant à elle consiste à proposer descommandes issues des techniques adaptatives ( commande adaptative à modèle de référence(MRAC) , et commande par retour d’état adaptative).Ces approches seront appliquées en simulation (environnement matlab), puis validées en tempsréel sur la plate forme expérimentale du pendule inversé stabilisé par volant d’inertie dispo-nible au LIRMM. La comparaison entre ces deux familles d’approches, selon différents critères(rapidité, robustesse, . . .),permettra de choisir la meilleur à appliquer sur le système réel.

    1

  • 1.2. Présentation du laboratoire d’accueil

    1.2 Présentation du laboratoire d’accueil

    1.2.1 Description générale du laboratoire LIRMM

    Le Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier (LIRMM)est une Unité Mixte de Recherche (UMR)de l’Université Montpellier 2 (UM2) et du CentreNational de la Recherche Scientifique (CNRS).Le LIRMM couvre un large spectre de compétences dans les domaines des Sciences et Tech-nologies de l’Information et de la Communication (STIC). Ces activités de recherche sontréparties au sein de trois départements scientifiques de recherche :– Informatique (INFO)– Microélectronique (MIC)– Robotique (ROB)

    1.2.2 Les départements du LIRMM

    Le département informatique :Les thématiques de ce département intègrent l’essentiel de la recherche menée actuellementen informatique :

    Algorithmique : bioinformatique, cryptographie, graphes, réseaux ;

    Bases de Données et Systèmes d’Information : intégration de données, fouille de don-nées, maintien de la cohérence ;

    Génie Logiciel : langages de programmation, objets, composants, modèles ;

    Intelligence Artificielle : apprentissage, contraintes, représentation des connaissances, sys-tèmes multi-agents ;

    Interaction Homme/Machine : hypermédia, langage naturel, visualisation, Web séman-tique et e-learning.

    Le département microélectronique :Ce département mène depuis plusieurs années des recherches de pointe dans les domaines dela conception et du test de systèmes intégrés et de microsystèmes, et plus précisément, sur lesaspects ayant traits à la modélisation et à la méthodologie. Les activités de recherche conduitesau sein du département de Microélectronique s’articulent autour de deux équipe-projets quilui sont propres ainsi qu’une équipe-projet commune avec le département Robotique :– Conception et test de systèmes microélectroniques (SysMIC) ;– DEambulation et Mouvement ARtificiel (DEMAR) et Modélisation et commande du sys-

    tème sensori-moteur humain, neuroprothèses.

    2 Nahla TOUATI

  • Chapitre 1. Introduction générale

    Le département robotique :Ce département mène des recherches en automatique/robotique, traitement du signal et del’image, productique et informatique industrielle. Les activités de recherche conduites au seindu département Robotique s’articulent autour de cinq équipes projets :

    – DEMAR : (DEambulation et Mouvement ARtificiel) et Modélisation et commande du sys-tème sensori-moteur humain, neuroprothèses ;

    – DEXTER : Conception, commande, manipulation, robotique parallèle, robotique médicale ;– ICAR : (Image, Computing and Augmented Reality) Image, signal, vision, modélisation 3D,

    informatique graphique, réalité virtuelle ;– NERO : (NEtwork RObots) Commande collaborative de flottilles de véhicules sous-marins

    et terrestres ;– IDH : (Interaction Digital Humain)

    1.2.3 L’équipe DEXTER

    L’équipe-projet DEXTER se positionne résolument suivant un axe mécatronique avec pourobjectif de concevoir, réaliser et commander des robots performants et robustes destinés à lamanipulation. Les thèmes scientifiques abordés sont la définition de méthodologies de concep-tion, le développement de protocoles d’estimation et la synthèse de lois de commandes. Lesoutils théoriques développés sont validés et mis en oeuvre dans le domaine de la robotiqueparallèle pour des applications de manipulation rapide et de la robotique médicale pour desapplications de manipulation fine.L’équipe possède dans les deux domaines de la robotique parallèle et médicale une visibilitéet une lisibilité nationale et internationale.Les contributions majeures de l’équipe sont donc réparties en 4 thèmes :

    – Robots médicaux et chirurgicaux ;– Robots parallèles et redondance ;– Robots parallèles à forts débattements angulaires ;– Identification et commande de robots.

    L’équipe est composée de 9 chercheurs/enseignants chercheurs et 13 thésards.

    1.3 Contexte et problématique

    Mon travail s’inscrit dans le cadre d’un projet de Mastère réalisé au sein de l’équipe DEXTERdu laboratoire d’Informatique de Robotique et de Microélectronique de Montpellier(LIRMM).Il consiste à appliquer différentes lois de commandes sur le système du pendule inversé stabilisé

    Rapport de stage de Mastère 3

  • 1.4. Cahier des charges et Objectifs

    par volant d’inertie. Ce système est conçue au sein du LIRMM. Il est très utile dans leslaboratoires d’automatiques. En effet, il présente l’avantage d’avoir une dynamique proche decelles de systèmes beaucoup plus complexes tels que les fusées, les avions à décollage vertical(PVTOL) , certains robots bipèdes , les bâteaux . . . De plus il s’avère être l’outil idéal pourtester rapidement et à moindre coût différentes techniques de commande allant de la plusclassique à la plus novatrice.Notre travail alors consiste à développer des lois de commandes (prédictives et adaptatives) quiagissent sur le volant pour amener le pendule de sa position de repos à sa position d’équilibreinstable et de le maintenir dans cet état.

    1.4 Cahier des charges et Objectifs

    Le travail à réaliser consiste à développer des lois de commande pour stabiliser le penduleinversé à volant d’inertie. Cette étude devra respecter le cahier de charge suivant :– Les lois de commande développées ,telles que la commande prédictive généralisée (GPC),

    la commande adaptative à modèle de référence (MRAC) et la commande par retour d’étatadaptative, sont des approches linéaires qui doivent être appliquées sur un système linéaire,or le pendule inversé à volant d’inertie est un système non linéaire quant doit le linéariser.

    – les lois de commandes développées doivent être capable de stabiliser le pendule inversé àvolant d’inertie autour de sa position d’équilibre instable et de le maintenir dans cet état

    – Les lois de commandes développées doivent satisfaire une certaine robustesse vis-à-vis denon linéarité système vu quand applique une approche de commande linéaire sur un systèmeinitialement non linéaire (linéarisé autour de l’équilibre)

    – Les lois de commandes développées doivent satisfaire une certaine robustesse vis-à-vis desincertitudes paramétriques.

    – Les lois de commandes adaptatives développées doivent être robustes vis-à-vis des variationsdes paramètres de systèmes quant mesure à chaque pas d’échantillonnage.

    4 Nahla TOUATI

  • Chapitre 2

    Etat de l’art

    2.1 Les systèmes mécaniques sous-actionnés

    Les systèmes mécaniques sous-actionnés sont définis comme étant des systèmes dont le nombred’actionneurs est inférieur au nombre de degrés de liberté [19].La conception de ces systèmes peut être plus économique, plus simple et plus fiable que lessystèmes complètement actionnés mais leur control est généralement plus complexe [19].Il existe plusieurs systèmes sous actionnés dans la robotique tels que Le pendubot (cf.figure2.1) , l’acrobot et les pendules inversés [20].

    Figure 2.1 – Le pendubot

    Le pendule inversé est un système classique très intéressant et largement étudié dans la com-munauté automaticienne, vu sa dynamique non linéaire et instable. Il a toujours constitué undéfi intéressant pour le contrôle .Ils existent plusieurs types des pendules inversés : tels que les pendules inversés classiques, de

    5

  • 2.2. Le pendule inversé classique

    Furuta, gyroscopiques . . . On détaillera dans ce qui suit les principes,les modèles dynamiqueset les comportements en boucles ouvertes correspondants à chaque types de ces pendulesinversés.

    2.2 Le pendule inversé classique

    2.2.1 Description du pendule

    Le pendule inversé classique (cf. figure 2.2) est un système mécanique sous actionné à deuxdegrés de liberté et un seul actionneur. Il est constitué d’un chariot libre en translation le longd’un rail de guidage, et un pendule pesant solidaire du chariot et libre en rotation [20].Le mouvement du pendule se limite quant à lui au plan vertical formé par le chariot et lapiste.Par une force F (cf. figure 2.2) appliquée au chariot et variable à chaque pas du temps, sonprincipe de base consiste à maintenir le pendule inversé en position d’équilibre instable enfaisant en sorte que l’angle θ qu’il fait avec la verticale soit le plus proche possible de laconsigne θd = 0 (position verticale) [20].

    Figure 2.2 – Schéma du principe de pendule inversé classique [20]

    2.2.2 Modèle dynamique

    En considérant une tige rigide de masse négligeable. On définit donc :

    – θ : l’angle entre la tige et la verticale,– m : la masse du pendule,– M : la masse du chariot,– l : la longueur de la tige,– g : l’accélération de la pesanteur.

    6 Nahla TOUATI

  • Chapitre 2. Etat de l’art

    On peut établir les équations du mouvement à partir de la mécanique lagrangienne [14] : ennotant x(t) la position du chariot, θ(t) : l’angle du pendule par rapport à la verticale , lesystème étant soumis à la gravité g et à une force F, extérieure et selon l’axe x, le lagrangienest défini par :

    L = T − V (2.1)

    Avec :– T : l’énergie cinétique totale de système,– V : l’énergie potentielle totale de système.On a ainsi :

    L =1

    2MV 21 +

    1

    2mV 22 −mgl cos θ (2.2)

    Avec V1 la vitesse du chariot et V2 celle de la masse m.On peut exprimer V1 et V2 à partir de x et θ :

    V 21 = ẋ2 (2.3)

    V 22 = (ẋ2 + lθ̇cosθ)2 + (lθ̇sinθ)2 (2.4)

    Ce qui peut s’écrire encore :

    V 22 = ẋ2 + 2ẋlθ̇cosθ + l2θ̇2 (2.5)

    Le lagrangien résultant est alors donné par :

    L =1

    2(M +m)ẋ2 +mlθ̇cosθ + 1/2ml2θ̇2 −mglcosθ (2.6)

    Les équations de la dynamique du système sont obtenues en se basant sur l’équation d’EulerLagrange :

    d

    dt

    ∂L

    ∂q̇− ∂L∂q

    = Qi (2.7)

    Avec– q(t) : vecteur des coordonnées généralisées ;– q̇(t) : vecteur des vitesses généralisées ;– Qi : vecteur des forces généralisées ;– L :le lagrangien.

    Rapport de stage de Mastère 7

  • 2.2. Le pendule inversé classique

    Les équations d’Euler-Lagrange qui dépendent des coordonnées généralisées indépendantes denotre système ( x et θ ) sont les suivantes :

    d

    dt

    ∂L

    ∂ẋ− ∂L∂x

    = F (2.8)

    d

    dt

    ∂L

    ∂θ̇− ∂L∂θ

    = 0 (2.9)

    En simplifiant ces équations, on obtient les équations non-linéaires du mouvement du pendule :

    (M +m)ẍ+mlθ̈cosθ −mlθ̇sinθ = F (2.10)

    ml(−gsinθ − ẍcosθ + lθ̈) = 0 (2.11)

    2.2.3 Représentation d’état et linéarisation

    La dynamique non-linéaire du système va être linéariser autour de l’équilibre afin d’obtenirun système qui s’écrit sous la forme suivante de la forme suivante : ẋ = Ax+Bu . En prenantcomme vecteur d’état x = [ x ẋ θ θ̇ ]T et u = F .Le système dynamique non-linéaire peut s’écrire sous la forme : ẋ = f(x(t), u(t)) , en dévelop-pant la fonction f en série de Taylor du premier ordre autour de l’équilibre (x0 est le vecteurnul) , on peut écrire alors le système linéarisé sous la forme suivante [16] :

    ẋ = Ax+Bu (2.12)

    avec :

    A =∂f

    ∂x |x=x0et B =

    ∂f

    ∂u |x=x0(2.13)

    La représentation d’état du système autour de sa position d’équilibre instable est donné par :ẋ = Ax+Buy = Cx (2.14)avec :

    A =

    0 1 0 0

    0 0 −mgM

    0

    0 0 0 1

    0 0 (M+m)gMl

    0

    , B =x

    θ

    θ̇

    et C =[

    0 0 1 0]

    (2.15)

    8 Nahla TOUATI

  • Chapitre 2. Etat de l’art

    Paramètre Valeur

    M [Kg] 0.5

    m[Kg] 0.2

    l[m] 0.2

    g[ms−2] 9.81

    Table 2.1 – Paramètres du pendule inversé classique

    2.2.4 Analyse du système en boucle ouverte

    Afin d’étudier le comportement de système en boucle ouverte, on doit savoir les valeurs nu-mériques des paramètres de système qui se résument dans le tableau 2.4 :

    Etude de la stabilité en boucle ouverte :

    Les pôles du système (valeurs propres de la matrice A) en boucle ouverte sont calculés encherchant les solutions de l’équation caractéristique det(A − λI) = 0 [11]. Dans le cas dupendule inversé classique, l’équation caractéristique s’écrit :λ2(λ2 + (M+m)g

    Ml) = 0

    Cette équation admet un pôle nul donc le pendule inversé classique est un système instable.La commandabilité du système :

    On dit que le système continu est commandable à l’instant t1 s’il est possible de trouver unvecteur d’entrée U(t) (avec t > t1 ), qui permet d’atteindre à partir de l’état X(t1) un étatX(t2) quelconque en un temps fini t2 − t1 [11].On définit la matrice de commandabilité C, de dimensionn,de la façon suivante :

    C = [B AB A2B . . . An−1B] (2.16)

    Le système est dit complètement commandable si et seulement si : rang(C) = dim(X) = n),Lamatrice C est alors dite de rang plein [11].Dans le cas du pendule inversé classique : C = [B AB A2B A3B] avec n = 4. Soit :

    C =

    0 2 0 26.16

    2 0 26.16 0

    0 −6.6667 0 −91.56−6.6667 0 −91.56 0

    (2.17)

    det(C) = 4 6= 0 ⇒ Rang(C) = 4 = n⇒ Le système est donc complètement commandable.L’observabilité du système :

    Rapport de stage de Mastère 9

  • 2.3. Le pendule inversé de Furuta

    On dit que le système continu est observable à l’instant t1 si à partir de la connaissance duvecteur de sortie Y et du vecteur d’entrée U, il est possible en un temps fini t2 > t1 dedéterminer l’état X(t1) [11].On définit la matrice d’observabilité O, de dimension n, de la façon suivante :

    O =

    C

    CA...

    CAn−1

    (2.18)

    Le système est dit complètement observable si et seulement si : rang(O) = dim(X) = n),Lamatrice O est alors dite de rang plein [11].

    Dans le cas du pendule inversé classique : O =

    C

    CA

    CA2

    CA3

    , avec n = 4. Soit

    O =

    0 0 1 0

    0 0 0 1

    0 0 45.78 0

    0 0 1.047 0

    (2.19)

    det(O) = 0 ⇒ Rang(O) < n⇒ Le système n’est pas observable.

    2.3 Le pendule inversé de Furuta

    2.3.1 Description du pendule

    Le pendule inversé de Furuta (cf. figure2.3) a été conçu par K. Furuta. C’est un système àdeux degrés de liberté et un actionneur. Le bras actionné en rotation permet une course infiniece qui facilite la conception du contrôle.A l’autre extrémité du bras vient s’ajouter un pendule libre en rotation dans le plan verticalorthogonal au bras [17].La rotation du bras actionné permet de balancer le pendule inversé de Furuta , qui se déplacelibrement dans le plan perpendiculaire à celui du bras rotatif, jusqu’à atteindre la positiond’équilibre.

    10 Nahla TOUATI

  • Chapitre 2. Etat de l’art

    Figure 2.3 – Schéma de principe de pendule inversé de Furuta[17]

    2.3.2 Modèle dynamique

    La figure 2.3 représente le schéma du principe du pendule inversé de Furuta ainsi que sesparamètres :

    – θ1, θ̇1 et θ̈1 sont la position, la vitesse et l’accélération angulaire du bras rotatif,– θ2, θ̇2 et θ̈2 sont la position, la vitesse et l’accélération angulaire du pendule,– J1 et J2 sont respectivement les moments d’inertie du bras et du pendule autour de leur

    centre de masse,– l1 et l2 sont respectivement les distances qui séparent les centres de rotation du bras rotatifet du pendule de leurs centres de masse,

    – m1 et m2 sont les masses respectives du bras et du pendule,– g est l’accélération de pesanteur, g = 9.81ms−2 ;– L1et L2 sont respectivement les longueurs du bras et du pendule,– τe est le couple moteur.

    Les équations de la dynamique de système sont obtenues en se basant sur l’équation d’Euler-Lagrange (2.7). L’énergie cinétique totale de système est la somme de l’énergie cinétique dubras rotatif et celle du pendule.Avec :

    – L’énergie cinétique du bras rotatif s’écrit :

    T1 =1

    2m1L

    21θ̇1

    2+

    1

    2J1θ̇1

    2(2.20)

    Rapport de stage de Mastère 11

  • 2.3. Le pendule inversé de Furuta

    – L’énergie cinétique du pendule est donnée par :

    T2 =1

    2J2θ̈2

    2+

    1

    2m2[(L1θ̇1 +

    1

    2θ̇2cosθ2)

    2 + (l2θ̇2sinθ̇2)2] (2.21)

    L’énergie potentielle totale du système est la somme des énergies potentielles du bras et celledu pendule.– L’énergie potentielle du bras rotatif V1 est nulle ;– L’énergie potentielle du pendule est :

    V2 = m2gl2cosθ2 (2.22)

    le lagrangien de système est définit comme suit :

    L = T1 + T2 − V1 − V2 (2.23)

    L’application de l’équation de lagrange donne les équations de la dynamique qui s’écrivent :

    (J1 +m2L21)θ̈1 + (m2L1l2cosθ2)θ̈2 − (m2L1l2sinθ2)θ̇2

    2= τe (2.24)

    (m2L1l2cosθ2)θ̈1 + (J2 +m2l22)θ̈2 + (m2l2gsinθ2) = 0 (2.25)

    2.3.3 Représentation d’état et linéarisation

    En prenant comme vecteur d’état x = [ θ1 θ̇1 θ2 θ̇2 ]T et u = τe et en considérant le prin-cipe de linéarisation autour du point de l’équilibre instable x0 = [ 0 0 0 0 ]T , on trouve lareprésentation d’état du système qui s’écrit sous la forme suivante :ẋ = Ax+Buy = Cx (2.26)Posons– h1 = J1 +m2L21 ;– h2 = m2L1l2 ;– h3 = J2 +m2l22 ;– h4 = m2l2g .Les matrices d’état du pendule inversé de Furuta sont définies alors par :

    A =

    0 1 0 0

    0 −h3c1 h2h4 h2c20 0 0 1

    0 h2c1hlh3−h22

    − h4h3−

    h22h1

    − c2h3−

    h22h1

    , B =

    0h3

    hlh3−h220−h2

    hlh3−h22

    et C =[

    1 0 0 0

    0 0 1 0

    ](2.27)

    12 Nahla TOUATI

  • Chapitre 2. Etat de l’art

    Paramètre Valeur Paramètre Valeur

    m1[Kg] 0.83 l1[m] 0.3

    m2[Kg] 0.1 l2[m] 0.1

    L1[m] 0.6 J1[Kgm−2] 0.00208

    L2[m] 0.3 J2[Kgm−2] 0.001

    τe[Nm] 0.0981 g[ms−2] 9.81

    Table 2.2 – Paramètres du pendule de Furuta

    2.3.4 Analyse en boucle ouverte

    Les valeurs de paramètres de système se résument dans le tableau 2.2 :Etude de la stabilité en boucle ouverte :

    L’équation caractéristique du pendule inversé de Furuta est :λB(λ) = 0. La présence d’un pôlenul pour cette équation montre que le système du pendule inversé de Furuta est instable.La commandabilité du système :

    La matrice de commandabilité correspondante au pendule inversé de Furuta est la suivante :C = [B AB A2B A3B] avec n = 4. Soit :

    C =

    0 2.93 −1.4401 0.70778

    2.93 −1.44 0.7078 −0.34790 0 0 0

    −8.78 −4.46 −6.58 −5.5397

    (2.28)

    det(C) = 4 6= 0 ⇒ Rang(C) = 4 = n.

    ⇒ Le système est donc complètement commandable.L’observabilité du système :

    La matrice d’observabilité du pendule inversé de Furuta est la suivante :

    O =

    1 0 0 0

    0 0 1 0

    0 1 0 0

    0 −4.915 14.65 00 0 0 0

    0 0.2416 −7.203 00 0 0 0

    (2.29)

    Rapport de stage de Mastère 13

  • 2.4. Le pendule inversé Segway

    det(O) = 0 ⇒ Rang(O) < n⇒ Le système n’est pas observable.

    2.4 Le pendule inversé Segway

    2.4.1 Description du pendule

    Le segway (cf.figure 2.4) est un véhicule à deux roues en auto balance, il est capable de roulersur une surface plane. Son principe est basé sur le développement de résultat dynamique dupendule inversé. La capacité de balance sur deux roues est très efficace pour la mobilité et pourla facilité de changement de direction dans un espace serré. Le prototype est équipé de quelquescapteurs pour mesurer l’angle, la vitesse de rotation et la vitesse linéaire de déplacement [9].

    Figure 2.4 – Photo d’un prototype segway

    2.4.2 Modèle dynamique

    La figure 2.5 représente le paramétrage cinématique ainsi que les paramètres du segway :Les paramètres du segway sont les suivants :– J(Nm2) : Moment dŠinertie dŠune roue par rapport à son axe ,– K(Nm2) : Moment dŠinertie du chassis par rapport lŠaxe des roues,– Met m sont respectivement les masses du châssis et de la roue ,– R(m) : rayon de la roue ,– h(m) : Hauteur du chassis ,– θ(rad) : angle de rotation ,– C est le couple moteur ,– g est l’accélération de pesanteur, g = 9.81ms−2.

    14 Nahla TOUATI

  • Chapitre 2. Etat de l’art

    Figure 2.5 – Modélisation du segway [3]

    LŠétude mécanique, faisant intervenir les paramètres du segway, sŠeffectue simplement enutilisant les outils de mécanique du solide (théorèmes du moment et de la résultante cinétique,roulement sans glissement, etc) ainsi que la mécanique lagrangienne [16].Les équations du mouvement du segaway sont les suivante :

    (K + 2m+2J

    h2)ẍ+Mh(θ̈ cos θ − θ̇2) = 2C

    R(2.30)

    (K +Mh2)θ̈ +Mh(ẍ cos θ −Mgh sin θ = −2C (2.31)

    2.4.3 Représentation d’état et linéarisation

    En prenant comme vecteur d’état x = [ x ẋ θ θ̇ ]T etu = C et en considérant le principe delinéarisation autour du point de l’équilibre instable x0 = [ 0 0 0 0 ]T , on trouve la représenta-tion d’état du système qui s’écrit sous la forme suivante :ẋ = Ax+Buy = Cx (2.32)Les matrices d’état du Segway sont définies alors par :

    A =

    0 1 0 0

    0 0 g(1− 43LMchassis

    X) 0

    0 0 0 1

    0 0 gMchassisX

    0

    , B =

    04LY3X− 1

    MchassisL

    0YX

    et C =[

    1 0 0 0

    0 0 1 0

    ](2.33)

    Rapport de stage de Mastère 15

  • 2.4. Le pendule inversé Segway

    2.4.4 Analyse en boucle ouverte

    L’étude du système en boucle ouverte nécessite la connaissance des paramètres du systèmequi se résume dans le tableau 2.3 :

    Paramètre Valeur

    Mchassis[Kg] 90

    Mroue[Kg] 7

    m[Kg] 0.7

    R[m] 0.2

    L[m] 1

    Table 2.3 – Paramètres du Segway

    Etude de la stabilité en boucle ouverte :

    Les valeurs propres de la matrice d’état A sont :4.3955,−4.3955 et une racine double nulles.La présence de deux pôles nuls et un pôle positif montre l’instabilité du segway.La commandabilité du système :

    La matrice de commandabilé de système s’écrit sous la forme suivante : C = [B AB A2B A3B]avec n = 4. Soit :

    C =

    0 0.237 0 255.36

    0.237 0 255.36 0

    0 −16 0 −309.12−16 0 −309.12 0

    (2.34)det(C) = 4 6= 0 ⇒ Rang(C) = 4 = n.

    ⇒ Le système est donc complètement commandable.L’observabilité du système :

    La matrice d’observabilité de système est la suivante :

    O =

    1 0 0 0

    0 0 1 0

    0 1 0 0

    0 0 0 1

    0 0 −15.96 00 0 19.32 0

    0 0 0 −15.960 0 0 19.32

    (2.35)

    16 Nahla TOUATI

  • Chapitre 2. Etat de l’art

    det(O) = 4 6= 0 ⇒ Rang(O) = 4 = n.

    ⇒ Le système est donc observable.

    2.5 Le pendule inversé gyroscopique

    2.5.1 Description du pendule

    Il s’agit d’un pendule avec une masse symétrique (disque) fixé à l’extrémité qui est libre detourner sur un axe parallèle à l’axe de rotation du pendule. C’est un système donc à deuxdegrés de liberté. Le disque est actionné par un moteur à courant continu et le couple généréepar l’accélération angulaire du disque peut être utilisé pour activer le système de control[15].

    Figure 2.6 – Le pendule gyroscopique [2]

    2.5.2 Modèle dynamique

    La figure 2.7 sert à la modélisation du pendule gyroscopique :Les paramètres du pendule gyroscopique sont les suivants :

    – θ : l’angle formé entre la tige et la verticale ;– m1 : la masse du pendule ;– I1 : le moment d’inertie du pendule ;– I2 : le moment d’inertie du disque ;– m2 : la masse du disque ;– l1 : la longueur du pendule ;– g : l’accélération de la pesanteur.

    Rapport de stage de Mastère 17

  • 2.5. Le pendule inversé gyroscopique

    Figure 2.7 – Modélisation du pendule gyroscopique [15]

    On peut établir les équations du mouvement à partir de la mécanique lagrangienne : en notantq1 l’angle du pendule, q2 l’angle de la disque et τ le couple moteur. Le lagrangien est : L = T−V. Avec :

    – T : l’énergie cinétique totale de système ;– V : l’énergie potentielle totale de système.

    On a ainsi :

    T =1

    2m1vG1 + I1q̇1

    2 +1

    2m2vG2 + I2q̇2

    2 (2.36)

    V = (m1lc1 +m2l1)g cos(q1) (2.37)

    On trouve alors les équations suivantes :

    d11q̈1 + d12q̈2 + φ(q1) = 0 (2.38)

    d21q̈1 + d22q̈2 = τ (2.39)

    Avec :d11 = m1l

    2c1 +m2l

    21 + I1 + I2 ;

    d12 = d22 = d21 = I2 ;φq1 = −(m1lc1 +m2l1)gsinq1 = mgsinq1 ;m = m1lc1 +m2l1 .

    18 Nahla TOUATI

  • Chapitre 2. Etat de l’art

    2.5.3 Représentation d’état

    On prend comme vecteur d’état du système le vecteur : x = [ q1 q̇1 q̇2 ]T

    On commence par la linéarisation des équations de mouvement autour de la position d’équilibreinstable.Pour θ = 0, sinθ ' θ.En remplaçant ces linéarisations dans le système d’équations on trouvela représentation d’état suivante :

    q̇1

    q̈1

    q̈2

    =

    0 1 0mg

    d12−d11 0 0

    − mgd12−d11 0 0

    q1

    q̇1

    q̇2

    +

    01

    d12−d11d11

    d12(d11−d12)

    Cθ (2.40)

    y =[

    1 0 0]

    q1

    q̇1

    q̇2

    (2.41)

    2.5.4 Analyse en boucle ouverte

    L’étude de système en boucle ouverte nécessite la connaissance des paramètres de système quise résume dans le tableau suivant :

    Paramètre Valeur

    m1(Kg) 0.02

    m2(Kg) 0.3

    l1(m) 0.125

    lc1(m) 0.063

    I1(Kgm2) 47.10−6

    l2(Kgm2) 32.10−6

    Table 2.4 – Paramètres du pendule gyroscopique

    Etude de la stabilité en boucle ouverte :L’ équation caractéristique de système admet deux racines : 0 et 1.0609 ce qui implique l’in-stabilité du système.La gouvernabilité du système :La matrice de gouvernabilité de système s’écrit sous la forme suivante :Go = [B AB A2B]

    Rapport de stage de Mastère 19

  • 2.6. Le pendule inversé stabilisé par volant d’inertie

    avec n = 3. Soit :

    Go =

    0 −208 0−208 0 1.6491.104

    208 0 −1.64991.104

    (2.42)Rang(Go) = n = 3

    ⇒ Le système est entièrement gouvernable.L’observabilité du système :La matrice d’observabilité de système est la suivante :

    Ob =

    1 0 0

    0 1 0

    −79.1261 0 0

    (2.43)Rang(Ob) = 2 < n

    ⇒ Le système est est non observable.

    2.6 Le pendule inversé stabilisé par volant d’inertie

    Le pendule inversé stabilisé par volant d’inertie est constitué d’un pendule libre en rotationautour d’un axe lié au sol, l’autre extrémité du pendule étant reliée à un disque actionné quine peut que tourner.le principe de fonctionnement de ce pendule est assez simple ,la rotation de volant d’inertieprovoque par les effets dynamiques qu’il induit, la rotation du pendule autour de sa liaisonpassive avec le bâti.Le principe de base, le fonctionnement et la modélisation de ce pendule seront détaillés dansle chapitre 3.

    20 Nahla TOUATI

  • Chapitre 3

    Etude du pendule inversé stabilisé par

    volant d’inertie

    3.1 Introduction

    Le pendule inversé stabilisé par un volant d’inertie (cf. figure3.1) est un système constituéd’un volant d’inertie et d’un pendule. En effet la rotation de du volant d’inertie provoque parles effets dynamiques qu’elle induit la rotation du pendule autour de sa liaison passive avec lebâti [13]. Notre but est de trouver la meilleur commande qui agit sur le volant pour amenerle pendule à sa position d’équilibre instable et de le maintenir dans cet état.Dans ce chapitre, on s’intéresse à la description du pendule inversé, la modélisation mécaniqueainsi que l’étude du système de pendule en boucle ouverte.

    Figure 3.1 – Le pendule inversé stabilisé par volant d’inertie [13]

    21

  • 3.2. Description du système

    3.2 Description du système

    Architecture de la maquetteLa maquette du pendule inversé (cf. figure 3.2) est constituée de cinq composants principaux :un calculateur, un inclinomètre, un groupe moteur/variateur/réducteur et deux codeurs.

    PC de commande

    Alimentation(12V)

    Variateurde vitesse

    Carte interface(MAGMA)

    Inclinomètre

    Pendule

    Volant d’inertie

    Figure 3.2 – Vue de la plate forme expérimentale du pendule inversé stabilisé par volantd’inertie

    Le calculateur : appelé aussi PC de commande, est le coeur du système car c’est lui quiest en charge d’interroger les différents capteurs, de calculer la loi de commande et depiloter le variateur.

    Le variateur de vitesse : doit être en mesure de fournir une puissance électrique de 200W( caractéristiques du moteur), d’asservir le moteur en couple et de fonctionner en mode4 quadrants (essentiel pour recycler l’énergie réactive produite par le moteur en phasede freinage).

    Inclinomètre : est un capteur capable de mesurer la position angulaire du pendule parrapport à la verticale. Pour respecter l’intégrité de la maquette, il est inconcevable d’in-corporer un codeur incrémental sur l’axe de rotation du pendule pour la mesure de saposition angulaire (solution généralement adaptée pour ce type de mesure).

    Moteur : Le dimensionnement du moteur électrique est étroitement lié au dimensionnementdu volant d’inertie, étant donné qu’il est dédié exclusivement à son entraînement. Plusqu’un simple actionneur, c’est un moteur couplé avec un réducteur et un codeur incré-mental. Le réducteur permet dans le cadre de ce projet, de privilégier le couple aux

    22 Nahla TOUATI

  • Chapitre 3. Etude du pendule inversé stabilisé par volant d’inertie

    dépens de la vitesse de rotation. Le codeur incrémental ,quant à lui, est mesurer laposition angulaire et par conséquent celle du volant d’inertie.

    Système d’exploitation : Le temps d’exécution d’une tâche et sa répétitivité sont deuxcontraintes fortes dans le domaine de la commande temps-réel. Le non respect de l’uned’elles peut avoir des conséquences graves, aussi bien sur le comportement du système quesur son environnement direct. C’est à ce titre, que le système d’exploitation implémentésur le calculateur est un système temps réel strict. Dans le cas de pendule inversé lenoyau temps réel utilisé est le RTX(Real-time Extension for Control of Windows) dechez Ardence.

    deux codeurs : pour mesurer l’angle du pendule et la position angulaire du volant d’inertie

    Récapitulatif des variables du systèmeLe tableau 3.1 regroupe l’ensemble des notations qui seront utilisées dans la modélisation (cf.section3.4)du pendule inversé stabilisé par volant d’inertie.

    Variable Unité Description

    C1 Nm Couple perturbateur

    C2 Nm Couple appliqué du volant d’inertie sur le pendule

    θ1 rad Position angulaire du pendule

    θ̇1 rad.s−1 Vitesse angulaire du pendule

    θ̈1 rad.s−2 Accélération angulaire du pendule

    θ2 rad Position angulaire du volant

    θ̇2 rad.s−1 Vitesse angulaire du volant

    θ̈2 rad.s−2 Accélération angulaire du volant

    θr rad Position angulaire de référence

    θ̇r rad.s−1 Vitesse angulaire de référence

    θ̈r rad.s−2 Accélération angulaire de référence

    Table 3.1 – Récapitulatif des variables utilisées dans la modélisation

    Le tableau 3.2 regroupe l’ensemble de ses paramètres géométriques et dynamiques :

    3.3 Schéma de principe

    Le pendule inversé stabilisé par volant d’inertie (cf. figure3.1) est un système mécanique sousactionné. Dans , il dispose de deux axes de rotation et un seul actionneur (le volant d’inertie).

    Rapport de stage de Mastère 23

  • 3.4. Modèle dynamique non linéaire

    Paramètre Description Valeur unité

    m1 Masse du pendule 3.30810 Kg

    m2 Masse du volant 3.33081 Kg

    l1 Distance pivot / centre de gravité du pendule 0.06 m

    l2 Distance pivot / centre de gravité du pendule 0.044 m

    i1 Moment d’inertie du pendule 0.0314683 Kgm2

    i2 Moment d’inertie du volant d’inertie 0.0004176 Kgm2

    E2 Épaisseur du volant d’inertie 0.02 m

    RE2 Rayon extérieur du volant d’inertie 0.04 m

    RI2 Rayon intérieur du volant d’inertie 0.03 m

    g Accélération due à la gravité terrestre 9.81 ms−2

    Table 3.2 – Paramètres géométriques et dynamiques du système

    La figure 3.3 montre que le système est constitué de trois corps : un bâti (0), une tige rigideou pendule (1) et un volant d’inertie (2). La tige rigide est en rotation libre (liaison passive)autour du bâti alors que le volant d’inertie possède un axe de rotation solidaire de cette mêmetige. Le schéma de la figure3.3 met en exergue la géométrie du système dans un référentielGaliléen [13]. Le pendule inversé présente deux points d’équilibres :• Le point d’équilibre stable : qui correspond à l’état dans lequel le pendule est dirigévers le bas. En l’absence d’une quelconque force de contrôle, le système reste naturellementdans cet état.• Le point d’équilibre instable : qui correspond à l’état dans lequel le pendule est pointévers le haut. Ce point d’équilibre est dit instable car en l’absence d’une force de contrôle, lependule, sous l’effet d’une quelconque perturbation liée à son environnement, est incapable derester dans cette position.

    3.4 Modèle dynamique non linéaire

    Afin d’élaborer le modèle dynamique du pendule inversé stabilisé par volant d’inertie, leshypothèses suivantes sont considérées :

    – Hypothèse 1 : Les masses du pendule et de la roue d’inertie sont considérés comme étantdes masses ponctuelles situées à leur centre de gravité (respectivement G1 et G2).

    – Hypothèse 2 : L’étude de la dynamique du pendule inversé est réalisée en négligeant lesphénomènes mécaniques liés aux frottements.

    24 Nahla TOUATI

  • Chapitre 3. Etude du pendule inversé stabilisé par volant d’inertie

    Figure 3.3 – Illustrations des points d’équilibre

    – Hypothèse 3 : La dynamique du moteur actionneur associée au volant d’inertie n’est pasprise en compte dans le cadre de la modélisation du système.

    3.4.1 Principe mécanique

    En appliquant le principe fondamental de la dynamique (PFD) , on peut démontrer trèssimplement la façon dont la partie actionné (volant d’inertie) agit sur l’angle du pendule afinde l’asservir en position verticale .Cette démonstration s’appuie sur un modèle mécanique équivalent (cf. figure 3.4 le volantd’inertie est remplacée par une barre rectiligne pour modéliser de manière imagée le coupleinduit par sa rotation), pour en faciliter sa compréhension [13]. Les équations du principefondamental de la dynamique du pendule inversé stabilisé par volant d’inertie sont :

    ~Mo ~FA + ~Mo ~FB + ~Mo ~FG1 + ~Mo ~FG2 =∑

    ~MD (3.1)

    Soit :

    ~CV I + ~CP =∑

    ~MD (3.2)

    avec :

    ~CV I = ~Mo ~FA + ~Mo ~FB (3.3)

    Rapport de stage de Mastère 25

  • 3.4. Modèle dynamique non linéaire

    et

    ~CP = ~Mo ~FG1 + ~Mo ~FG2 (3.4)

    Le pendule est mis en mouvement lorsque le couple généré par le volant d’inertie CV I estsupérieur ou inférieur au moment résistant (MD −MP ). La synthèse ci-après précise l’état dusystème en fonction de ces différences de moment :- ~MMoment = ~0 le pendule en équilibre statique ;- ~MMoment > ~0 le pendule est en phase ascendante ;- ~MMoment < ~0 le pendule est en phase descendante.Remarque : Dans la réalité, les forces mises en jeu pour mettre en rotation le volant d’inertiesont réparties d’une façon homogène sur la totalité de sa circonférence.

    Figure 3.4 – Modèle mécanique équivalent

    3.4.2 Lagrangien

    Le modèle dynamique du pendule inversé stabilisé par volant d’inertie est obtenu en applicantle formalisme de Lagrange [?]. Cette approche nécessite le calcul des énergies cinétiques etpotentielles des différents composants du système en fonction de coordonnées généralisées. LeFormalisme d’Euler-Lagrange repose sur l’équation de Lagrange :

    d

    dt

    ∂L

    ∂q̇i− ∂L∂qi

    = Qi (3.5)

    avec L = T − V– L : le lagrangien– T : l’énergie cinétique totale du système

    26 Nahla TOUATI

  • Chapitre 3. Etude du pendule inversé stabilisé par volant d’inertie

    – V : l’énergie potentielle totale du système– Qi= : Forces généralisées associées à qi

    – q =

    [q1

    q2

    ]=

    [θ1

    θ2

    ]: le vecteur de coordonnées généralisées

    L’énergie cinétique totale T : T = TP + TV I , avec :-TP = 12(m1V

    2G1 + i1θ̇1

    2) , avec VG1 = l1θ̇1

    -TV I = 12(m2V2G2 + i2θ̇2

    2) , avec VG2 = l2θ̇2

    Donc :

    T =1

    2(m1l

    21 +m2l

    22 + i1)θ̇1 + i2(θ̇1 + θ̇2) (3.6)

    L’énergie potentielle totale V : V = VPendule + VV olantInertie, avec :

    VPendule = m1l1g cos θ1 (3.7)

    VV olantInertie = m2l2g cos θ1 (3.8)

    Donc :

    V = (m1l1 +m2l2)g cos θ1 (3.9)

    L = T − V Donc :

    L =1

    2Iθ̇2 + i2(θ̇1 + θ̇2)− m̄lg cos θ1 (3.10)

    Avec : m̄l = m1l1 +m2l2 et I = m1l21 +m2l22 + i1

    3.4.3 Dynamique du pendule

    Les équations de la dynamique du pendule inversé stabilisé par volant d’inertie déduites deséquations d’Euler-Lagrange décrivent l’accélération angulaire du pendule θ̈1 et l’accélérationangulaire du volant d’inertie θ̈2.

    θ̈1 =1

    I[C1 − C2 + m̄lg sin θ1] :Accélération angulaire du pendule (3.11)

    θ̈2 =1

    Ii2[−i2C1 + (i2 + I)C2 − i2m̄lg sin θ1] :Accélération angulaire du volant d’inertie(3.12)

    Les équations de la dynamique du pendule inversé sont mises sous la forme :

    G(x)ẍ+H(x, ẋ)ẋ+ I(x) = Qx (3.13)

    Donc : [I + i2 i2

    i2 i2

    ] [θ̈1

    θ̈2

    ]+

    [−m̄lg sin θ1

    0

    ]=

    [C1

    C2

    ](3.14)

    Rapport de stage de Mastère 27

  • 3.5. Représentation d’état et linéarisation

    3.5 Représentation d’état et linéarisation

    La représentation d’état du pendule inversé stabilisé par volant d’inertie est obtenue par lalinéarisation de son modèle dynamique autour du point d’équilibre instable [16]. En prenantcomme vecteur d’état X = [ θ1 θ̇1 θ2 θ̇2 ]T et U = C1Les équations d’état sont de la forme :

    Ẋ = AX +BC1Y = CX (3.15)Avec :

    A =

    0 1 0 0

    a21 0 0 0

    0 0 0 1

    a42 0 0 0

    , B =

    0

    b1

    0

    b2

    et C =[c1 0 0 0

    ](3.16)

    Avec : a21 = m̄lgI = −a41 , b1 =1I

    = −b2 et c1 = 1.Remarque : Le couple perturbateur est considéré nul pour simplifier l’étude du pendule inversé.

    3.6 Analyse du système en boucle ouverte

    Etude de la stabilité en boucle ouverte :

    Les pôles du système en boucle ouverte sont calculés en cherchant les solutions de l’équationcaractéristique det(A− λI) = 0. Dans le cas du pendule inversé stabilisé par volant d’inertie,l’équation caractéristique est :λ(λ2 − a21) = 0 et les pôles sont : 0 ;

    √a21 ; −

    √a21

    La présence de pôles à partie réelle nulle ou positive, vient confirmer le fait que le penduleinversé stabilisé par volant d’inertie est un système naturellement instable.La commandabilité du système :

    La gouvernabilité a un impact direct sur la conception de la loi de commande d’un système.Un système est dit gouvernable, s’il existe une commande permettant d’amener le systèmedepuis l’état x(t0) vers l’état x(t1).Un système est entièrement gouvernable si le rang de sa matrice de gouvernabilité (Go =[B AB . . . An−1B]) est égal à la dimension du système (n).

    28 Nahla TOUATI

  • Chapitre 3. Etude du pendule inversé stabilisé par volant d’inertie

    Dans le cas de notre système : C = [B AB A2B A3B] avec n = 4. Soit :

    C =

    0 22.7 0 −1078.6

    −22.7 0 −10786 00 2417.4 0 1078.6

    2417.4 0 1078.6 0

    (3.17)

    det(C) = 4 6= 0 ⇒ Rang(C) = 4 = n.

    ⇒ Le système est donc complètement commandable.L’observabilité du système :

    L’observabilité est une propriété fondamentale pour la conception d’un observateur d’état. Unsystème est dit observable, si la connaissance de son vecteur de sortie entre les instants t0 et t1permet de déduire l’état x(t1). Un système est entièrement observable si le rang de sa matriced’observabilité (Ob = [CT [CA]T . . . [CAn−1]T ]T ) est égal à n la dimension du système.La matrice d’observabilité du pendule inversé stabilisé par volant d’inertie est la suivante :

    O =

    1 0 0 0

    0 1 0 0

    47.4793 0 0 0

    0 47.4793 0 0

    (3.18)

    det(O) = 0 ⇒ Rang(O) < n⇒ Le système n’est pas observable.

    Rapport de stage de Mastère 29

  • Chapitre 4

    Solution1 :Approches de commande

    prédictive

    4.1 Principe générale des techniques de commande pré-

    dictive

    Introduction à la commande prédictive

    La commande prédictive est née à la fin des années 1970 et s’est considérablement développéedepuis, à la foie dans la communauté de la recherche en automatique et dans l’industrie.Le terme de commande prédictive ne désigne pas une stratégie de commande spécifique maisun ensemble de méthodes de l’automatique qui utilisent explicitement un modèle du processusà commander, afin d’obtenir le signal de commande par la minimisation d’une fonction de coût. Ces méthodes donnent des correcteurs linéaires qui ont pratiquement tous la même structureet qui se basent tous sur les idées suivantes [4] :

    – Utilisation d’un modèle pour prédire les sorties du procédé des instants futurs (notion d’horizon de prédiction) ;

    – Calcul de la séquence des commandes qui minimise une fonction de coût dans le futur (notiond’ horizon de commande) ;

    – Chaque instant d’échantillonnage, l’horizon de prédiction est déplacé vers le futur, et seule lapremière des commandes calculées est effectivement appliquée au système (notion d’ horizonfuyant).

    Avantages et inconvénients de la commande prédictiveLa commande prédictive présente un certain nombre d’avantages, par rapport aux autresméthodes, parmi lesquels on trouve [4] :

    – son principe très intuitif et le réglage relativement facile de ses paramètres ;

    30

  • Chapitre 4. Solution1 :Approches de commande prédictive

    – elle peut être utilisée pour commander une grande variété de processus, ceux avec desdynamiques simples ceux plus complexes, par exemple les systèmes grand retards, phasenon minimale ou instables ;

    – le correcteur obtenu est une loi de commande linéaire facile à implémenter et qui requiertpeu de temps de calcul ;

    – le traitement de contraintes sur le système commander peut être inclus.

    Bien sûr, il y a aussi quelques désavantages [4] tels que :

    – Bien que le correcteur obtenu soit simple à programmer, son obtention est beaucoup pluscomplexe que pour les correcteurs de type PID classiques ;

    – Dans le cas d’une commande prédictive, un nombre important de calculs doit être menéchaque instant d’échantillonnage. Lorsque des contraintes sont considérées, le nombre descalculs nécessaires est encore plus grand.

    – Le plus grand des inconvénients est le besoin d’un modèle approprié du système. L’algo-rithme de calcul du correcteur prédictif se base sur une connais- sance a priori du modèle,il est donc évident que les bénéfices obtenus avec la commande prédictive sont affectés parles écarts qui peuvent exister entre le processus réel et le modèle utilisé.

    Principe générale de la commande prédictiveLe principe général de tous les correcteurs de la classe prédictive se caractérise par la stratégiesuivante, représentée sur la figure 4.1 :

    1. les sorties futures sur un horizon déterminé de taille N, appelé l’ horizon de prédiction,sont prédites chaque instant k l’aide du modèle du processus. Ces prédictions sont notéesy(k+j|k) avec j = 1..N . Elles dépendent des valeurs connues jusqu’à l’instant k (entréeset sorties passées) et des commandes futures u(k + j|k) avec j = 1..N − 1, , qui sontcelles envoyer au système et qui doivent être calculées ;

    2. l’ensemble des commandes futures est calculé en optimisant un critère déterminé pourgarder le process aussi proche que possible de la trajectoire de référence r(k+j).Ce critèreprend généralement la forme d’une fonction quadratique des erreurs entre le signal desortie prédit et les consignes futures. L’énergie de commande est incluse dans la fonctionde coût dans la plupart des cas. Une solution explicite peut être obtenue si le critèreest quadratique, le modèle linéaire et s’il n’y a pas de contraintes, sinon une méthoded’optimisation itérative doit être utilisée. Des hypothèses sont également faites sur lastructure de la loi de commande future, comme par exemple qu’elle sera constante àpartir d’un instant donné (horizon de commande).

    3. La commande u(k|k) est envoyée au système et les autres valeurs de commande sontoubliées, parce qu’à l’instant d’échantillonnage suivant la mesure y(k+1) est déjà connue

    Rapport de stage de Mastère 31

  • 4.1. Principe générale des techniques de commande prédictive

    et que l’étape n1 est répétée avec cette nouvelle valeur, toutes les séquences étant misesà jour. Alors on calcule la commande u(k + 1|k + 1) , qui est différente de u(k + 1|k) àcause des nouvelles informations prises en compte.

    Figure 4.1 – Stratégie de la commande prédictive [12]

    Modélisation du système

    Pour l’implémentation de la stratégie prédictive, la structure de base de la figure 4.2 est miseen oeuvre. Un modèle sert à prédire les futures sorties du système, grâce aux valeurs couranteset passées de la commande et aux commandes optimales futures. Ces dernières sont calculéespar une méthode d’optimisation, qui prend en compte la fonction de coût (qui dépend aussides consignes futures), et éventuellement des contraintes [12]. Le modèle du système joue doncun rôle central dans le correcteur. Le modèle choisi doit être capable de rendre compte de ladynamique du processus pour prédire précisément les sorties futures et aussi doit être simpleimplémenter et comprendre.La description du procédé peut être sous forme de fonction de transfert ou la représentationdans l’espace d’état, qui décrit facilement les systèmes multivariables.

    32 Nahla TOUATI

  • Chapitre 4. Solution1 :Approches de commande prédictive

    Figure 4.2 – Structure de base de la commande prédictive [4]

    4.2 Approche1 : La Commande Prédictive Généralisée (GPC)

    4.2.1 Principe de la commande

    Proposée par Clarke en 1987, la commande prédictive généralisée (GPC ) est devenue l’un desalgorithmes de commande prédictive les plus répandus. Elle a montré de bonnes performanceset un certain degré de robustesse. Elle peut traiter beaucoup de problèmes de commandepour une large étendue de systèmes et met en jeu un nombre raisonnable de paramètres, quel’utilisateur doit spécifier en fonction de sa connaissance a priori du procédé commander et deses objectifs de commande [4].L’idée de la base de la commande GPC est de calculer une séquence de commandes futures detelle façon qu’une fonction coût à plusieurs composantes soit minimale sur un certain horizonde prédiction. L’indice à optimiser est une fonction quadratique qui mesure la distance entrela sortie prédite du système et une séquence de référence, plus une fonction quadratique quimesure l’effort de commande. Les spécificités de la commande GPC sont l’existence d’unesolution optimale analytique (en l’absence de contraintes), le fait qu’elle soit compatible avecdes systèmes instables ou à phase non minimale, et enfin la notion d’horizon de commande etd’increments de commande [4].

    Rapport de stage de Mastère 33

  • 4.2. Approche1 : La Commande Prédictive Généralisée (GPC)

    4.2.2 Formulation de La GPC avec état final nul

    Le choix de cette formulation de GPC est dû au fait que la formulation avec fonction de trans-fert ne garantie pas le contrôl des différents états de notre système, donc on a pensé à uneformulation qui intervient tout les états de système et qui introduit une condition (sorte de pé-nalité) à l’état final du système qui doit être nul [6](θ1 = 0rad , θ̇1 = 0rads−1 et θ̈2 = 0rads−2

    ).Modèle de représentation de la GPC avec état final nul

    Pour cette approche, on doit utiliser la représentation d’état du système échantillonné quis’écrit sous la forme : x(k + 1) = Ax(k) +B∆u(k)y(k) = Cx(k) (4.1)avec : A, B et C sont les matrices de représentations d’état.La fonction côut

    Le critère quadratique utilisé par la procédure de la commande est de la forme suivante :

    J(N1, Np, Nu, Q, λ) = (x(k +Np)− wx(k +Np))TQ(x(k +Np)− wx(k +Np))

    +

    Np∑j=N1

    (y(k + j)− w(k + j))T (y(k + j)− w(k + j)) +Nu∑j=1

    λ(j)(∆u(k + j − 1))T (∆u(k + j − 1))(4.2)

    avec :– wx : l’état désiré du système à la fin de prédiction– N1 : Horizon d’initialisation– Np : Horizon de prédiction– Nu : Horizon de commande– Q : Pondération sur les états de systèmes– λ : Pondération sur la commandeCalcul de prédiction de la grandeur de sortie

    Pour minimiser le coût, on doit tout d’abord calculer la sortie prédite du système y(k+j),j = 1 . . . Np à chaque pas d’échantillonnage en se basant sur les informations disponibles surle système aux instants qui précédent l’instant k.On a :

    x(k + 1) = Ax(k) +Bδu(k)

    x(k + 2) = Ax(k + 1) +Bδu(k + 1) = A2x(k) +Bu(k + 1)

    x(k + 1) = Ax(k) +Bδu(k) = A3x(k) + A2B∆u(k) + AB∆u(k + 1) +B∆u(k + 2)

    34 Nahla TOUATI

  • Chapitre 4. Solution1 :Approches de commande prédictive

    ...

    x(k + j) = Ajx(k) +

    j−1∑i=0

    Aj−i−1Bδu(k + i) (4.3)

    Donc la sortie estimée du système à j pas s’écrit sous la forme :

    y(k + j) = CAjx(k) +

    j−1∑i=0

    CAj−i−1Bδu(k + i) (4.4)

    Si on utilise maintenant, l’approche de la commande (GPC) qui pour tout i ≥ Nu donneu(k + i) = 0, et si on note :

    y =

    y(k + 1)

    y(k + 2)...

    y(k +N1)...

    y(k +Np)

    et ∆u =

    ∆u(k)

    δu(k + 1)

    δu(k + 2)...

    δu(k +Nu)

    (4.5)

    on peut écrire la sortie prédite sous la forme suivante :

    y = G∆u+ f (4.6)

    avec G et f sont données par :

    G =

    CB 0 0 . . . 0

    CAB CB 0 . . . 0...

    ...... . . .

    ...CAN1−1B CAN1−2B CAN1−3B . . . 0

    ......

    ... . . ....

    CANp−1B CANp−2B CANp−3B . . . CANp−NuB

    et f =

    CA

    CA2

    ...CAN1

    ...CANp

    x(k) (4.7)

    Si on prend en compte le critère coût, la sortie prédite se réécrit de la façon suivante :

    y =

    CAN1−1 CAN1−2 CAN1−3 . . . 0

    ......

    ... . . ....

    CANp−1 CANp−2 CANp−3 . . . CANp−Nu

    ∆u+CAN1

    ...CANp

    x(k) (4.8)Calcul de la commande optimale

    On doit maintenant calculer la loi de commande qui dérive du critère 4.2. On considère dans

    Rapport de stage de Mastère 35

  • 4.2. Approche1 : La Commande Prédictive Généralisée (GPC)

    la suite que : wx = 0, w(k+ j) = 0 pour tout j, N1 = 1,Np = Nu = N , Q ≥ 0 et λ(j) = λ > 0.le critère 4.2 peut s’écrire alors sous la forme suivante :

    JN = xT (k+N)(Q+CTC)x(k+N)+

    ∑y(k + j)Ty(k + j) + λ∆u(k + j − 1)T∆u(k + j − 1)

    = xT (k +N)(Q+ CTC)x(k +N) +∑

    xT (k +N)TCTCx(k + j) + λ∆u(k + j − 1)T∆u(k + j − 1)(4.9)

    L’évolution de l’état du système est donnée par :

    x(k +N) = ANx(k) +∑

    i = 0N−1AN−i−1B∆u(k + i)

    = ANx(k) + [AN−1B AN−2B . . .B]

    ∆u(k)

    ∆u(k + 1)...

    ∆u(k +N − 1)

    = ANx(k) + C̄∆u (4.10)

    Le critère coût maintenant peut s’écrire de la façon suivante :

    JN =1

    2[H + 2C̄TQC̄]∆u+ [b+ 2xT (k)(AN)TQC̄]∆u+ f0 + x

    T (k)(AN)TQANx(k) (4.11)

    Avec :– H = 2[GTG+ λI] ;– b = 2fTG ;– f0 = fTf .Les matrices G et f sont définis dans 4.7. Le critère coût 4.11 se réécrit sous la forme suivante :

    JN =1

    2∆uH̄∆u+ b̄∆u+ f̄0 (4.12)

    Avec :– H̄ = 2[GTG+ λI + C̄TQC̄] ;– b̄ = 2xT (k)[LTG+ (AN)TQC̄] ;– f̄0 = xT (k)[LTL+ (AN)TQAN ]x(k) .La commande optimale est obtenue à partir de l’annulation du dérivé partiel du critère J parrapport à ∆u : δj

    δ∆u= 0. Le vecteur optimal ∆u s’écrit alors comme suit :

    ∆u∗ = −H̄−1b̄T

    36 Nahla TOUATI

  • Chapitre 4. Solution1 :Approches de commande prédictive

    = −(GTG+ λI + C̄TQC̄)−1(GTL+ C̄TQAN)x(k)

    = −Kx(k) (4.13)

    On note bien que la séquence de commande envoyée au procédé est le premier élément duvecteur ∆u .

    4.2.3 Modèle de représentation

    La représentation d’état de notre système dans le cas discret est de la forme X(k + 1) =f(x(k), u), avec X = [ θ1(k + 1) θ̇1(k + 1) θ̇2(k + 1) ]T , or pour appliquer la GPC avecétat final nul, on doit représenter le système sous la forme suivante X(k + 1) = f(x(k),∆u)[6].La représentation initiale de notre système est la suivante :X(k + 1) = AX(k) +Buy(k) = CX(k) (4.14)On a ∆u(k) = u(k)− u(k − 1), on peut donc représenter le système sous la forme suivante :[

    X(k + 1)

    u(k)

    ]=

    [A B

    0 1

    ] [X(k)

    u(k − 1)

    ]+

    [B

    1

    ]u (4.15)

    y(k) =[C 0

    ] [ X(k)u(k − 1)

    ](4.16)

    4.3 Approche2 : La commande Prédictive non linéaire

    4.3.1 Principe de la commande prédictive non linéaire

    Le problème simple issu de la minimisation du critère prédictif dans le cas d’un système linéaireinvariant se complique singulièrement lorsque l’on envisage le cas de la commande prédictived’un système non-linéaire.Cette approche s’applique aux systèmes non-linéaires en se basant pour la prédiction no-tamment sur un modèle non-linéaire du système,évitant ainsi le recours à une linéarisationpréalable. Elle repose sur la résolution d’un problème d’optimisation à chaque pas d’échan-tillonnage. Ce dernier consiste à minimiser une fonction coût sur un horizon de prédiction [12].

    Rapport de stage de Mastère 37

  • 4.3. Approche2 : La commande Prédictive non linéaire

    Le principal obstacle dans la synthèse de lois de commande pour les systèmes non linéaires estla présence des non linéarités dans le modèle et d’autre part, qu’il existe un nombre importantde techniques efficaces de synthèse dans le cas de modèles linéaires. Si l’on est capable pardes transformations adéquates de transformer le modèle non linéaire en un modèle linéaire,on peut ensuite utiliser les techniques de synthèse de lois de commande des systèmes linéaires.C’est la philosophie de la linéarisation par bouclage [7].Donc, cette technique consiste à chercher un changement de variables non linéaire dans lequel la nouvelle formulation soit linéaire.Donc susceptible d’appliquer toutes les méthodes ettechniques des systèmes linéaires.On a l’équation de mouvement de suivante pour le pendule inversé :

    θ̈1 =1

    I[−u+ m̄lg sin θ1] (4.17)

    On choisit la commande u sous la forme :

    u = m̄lg sin θ1 − Iv (4.18)

    On trouve θ̈1 = v , la dynamique est alors linéaire.Pour la poursuite de trajectoires de référence, la sortie doit suivre une trajectoire de référenceθ1desiree (θ1 → θ1d )et de même pour θ̇1 → ˙θ1det θ̈1 → θ̈1d.Il suffit donc de choisir :

    v = (θ̈1 − θ̈1d)−Kv(θ̇1 − ˙θ1d)−Kp(θ1 − θ1d) (4.19)

    Le choix de θ1d, ˙θ1d et θ̈2d sera détaillé dans la section suivante.

    4.3.2 La génération des trajectoires

    Le principe de la commande prédictive non linéaire consiste à définir une trajectoire de réfé-rence à suivre pour la sortie de système.Le choix de la trajectoire de référence doit amener lesystème vers la position d’équilibre instable donc θ1d(∝) = 0.dans notre cas on a choisit une trajectoire de référence de second ordre.Les systèmes du second ordre, sont représentés par une équation différentielle linéaire du se-cond ordre :

    d2y

    dt2+ 2ξw

    dy

    dt+ w2y = v0w

    2 (4.20)

    Avec :y :la réponse désiré de système (θ1d) ;

    38 Nahla TOUATI

  • Chapitre 4. Solution1 :Approches de commande prédictive

    ξ :Coefficient d’amortissementw :pulsation proprev0 :gain statiqueLa réponse indicielle de système qui amène la sortie(θ1) de sa position initiale vers θ1 = 0 estla suivante, avec v0 : la condition initiale de pendule au début de chaque horizon de prédiction.

    θ1d = v0[1√

    1− ξ2e−ξwt sin(wt

    √1− ξ2 + arccos(ξ))] (4.21)

    D’ou

    ˙θ1d = v0we−ξwt[cos(wt

    √1− ξ2 + arccos(ξ))− ξ sin(wt

    √1− ξ2 + arccos(ξ))√

    1− ξ2] (4.22)

    et

    θ̈1d = v0we−ξwt[

    xξ2√1− ξ2

    sin(wt√

    1− ξ2 + arccos(ξ))− 2ξw cos(wt√

    1− ξ2 + arccos(ξ))](4.23)

    4.3.3 L’optimisation

    La fonction coût J à optimiser pour notre problème est la vitesse de volant au carré à la finde chaque horizon de prédiction. Donc, J = θ̇2(tf ) avec tf est l’horizon de prédiction.Le choix de cette fonction est dû au fait qu’on veut contrôler la vitesse de volant et essayer dela minimiser au maximum en utilisant une commande que ne dépend que de θ1.Sur chaque horizon de prédiction, on cherche à trouver ξ optimal qui correspond au minimumde J, on l’applique sur cet horizon et on recommence le cycle pour l’horizon suivant.

    Rapport de stage de Mastère 39

  • Chapitre 5

    Application des approches prédictives sur

    le pendule inversé

    5.1 Application de La GPC sur le Pendule inversé

    5.1.1 Simulations dans le cas nominal

    Résultats de Simulations

    L’objectif de cette simulation est de stabiliser le pendule inversé stabilisé par volant d’inertieà partir de la condition initiale X0 = [θ1 = 18◦ θ̇1 = 0 θ̇2 = 0]T .On fixe les paramètres de la GPC à :

    – L’horizon d’initialisation N1 = 1 ;– L’horizon de prédiction N2 = 40 ;– L’horizon de commande Nu = 40 ;– La pondération sur la commande λ = 40 ;– La pondération sur les états Q = I(3, 3).

    La figure 5.1 présente l’évolution de la position et de la vitesse du pendule, ainsi que la vitessedu volant d’inertie.La figure 5.2 présente l’évolution de la commande, et la puissance mécanique du volant d’iner-tie.

    Interprétations des résultats

    D’après la figure 5.1 on remarque que la position angulaire du pendule oscille autour de 0radentre (18 degré et 13 degré), elle se stabilise complètement au bout de 1,45s.Les vitesses angulaires du pendule et du volant d’inertie oscillent aussi autour de 0 et sont

    40

  • Chapitre 5. Application des approches prédictives sur le pendule inversé

    Figure 5.1 – Dynamique du pendule et de volant d’inertie pour le cas de la GPC

    nulles à partir d’1.2s.Pour la vitesse du volant d’inertie, on constate qu’elle oscille entre 5067 et -1321tr/min .Ces résultats semblent satisfaisante cependant, cette vérification n’est pas suffisante. Il fautvérifier aussi que la puissance maximale des moteurs actionneurs n’est pas atteinte. Pour celal’idée consiste à tracer la vitesse angulaire de l’arbre du moteur (valeur absolue en tour/min)en fonction du couple moteur (valeur absolue), et vérifier qu’on reste bien dans la région d’ad-missibilité donnée par le constructeur.Le rapport des réducteurs de vitesse, utilisé avec notre moteur estR = 13

    3. Les formules sui-

    vantes sont utilisées pour passer de la vitesse du volant d’inertie à la vitesse niveau moteur,et du couple du volant d’inertie au couple niveau moteur :

    Vmoteur =Vvolant ×R× 60

    2π(5.1)

    Cmoteur =CvolantR

    (5.2)

    Le test de la puissance admissible des moteurs est concrétisé donc par le tracé de la vitesseniveau moteur en fonction du couple niveau moteur. Il est superposé au gabarit de la puissanceadmissible. Si le tracé reste bien à l’intérieur du gabarit, on en déduit que les puissances sont

    Rapport de stage de Mastère 41

  • 5.1. Application de La GPC sur le Pendule inversé

    Figure 5.2 – Couple et puissance mécanique

    admissibles. Dans le cas de notre scénario de simulation ces courbes sont tracées sur la figure5.3 , qui justifie que la puissance maximale reste bien dans la zone admissible.

    5.1.2 Test de Robustesse de la commande

    Robustesse vis-à-vis des incertitudes paramétriques

    Le test de la robustesse de la commande nous permet de vérifier si la commande appliquéepeut s’adapter aux incertitudes des paramètres de système qui peuvent être dû à la précisiondes capteurs , les forces de frottements, les facteurs externes imprévisible. Ces derniers n’ontpas été prise en compte dans la modélisation du système.On choisit d’introduire une incertitude ∆I sur le paramètre I qui est une combinaison deplusieurs paramètres : I = m1l21 +m2l22 + I1 et on observe ce que se passe sur la sortie.On remarque bien d’après la figure 5.4 que le système peut surmonter cette incertitude etamener le système vers la stabilisation.

    42 Nahla TOUATI

  • Chapitre 5. Application des approches prédictives sur le pendule inversé

    Figure 5.3 – Plage d’utilisation du moteur dans le cas de la GPC

    Figure 5.4 – Robustesse vis-à-vis des incertitudes du paramètre I

    Robustesse vis-à-vis des non-linéarités

    Le pendule inversé est un système non linéarisé qu’on linéarise autour de la position d’équilibre.On veut voir ici si, on appliquant la commande linéaire sur le système non linéaire est ce qu’onpeut arriver à stabiliser le système et à le maintenir dans cet état.Les figures 5.5 et 5.6 illustrent l’évolution des états et de la commande de notre système.Même si on applique la commande sur le système non linéaire, on constate que le pendulearrive à se stabiliser ainsi que touts les états de système.

    Rapport de stage de Mastère 43

  • 5.1. Application de La GPC sur le Pendule inversé

    Figure 5.5 – Evolution des états de système non linéaire dans le cas de la GPC

    5.1.3 Expérimentation : Application en temps réel

    Scénario1 : Cas nominal

    Les courbes ci dessous de la figure 5.7 mettent en évidence les résultats de l’expérimentationdans le cas nominal sur le pendule inversé pour une durée de 30 secondes.D’après ces courbes ,on remarque que la position et la vitesse angulaire du pendule ainsi que lavitesse du volant d’inertie oscillent autour de 0rd jusqu’à atteindre la valeur nulle. On trouvedes erreurs entre la simulation et l’expérimentation qui sont dûes à différents facteurs tels quela précision des capteurs , les forces de frottements et les facteurs externes imprévisible. Cesderniers n’ont pas été prise en compte lors de la modélisation du système.

    Scénario2 : Cas de rejet des perturbations ponctuelles

    Cet essai met en évidence la robustesse de la commande vis à vis des perturbations ponctuellessur le système réel qui interviennent à t = 9s, t = 14s, t = 20s et t = 24s.Les résultats des expérimentations se résument sur la figure 5.8 :

    On remarque l’effet de perturbations(les pics sur les courbes) mais le système tend toujoursà revenir à la position d’équilibre après la perturbation.

    44 Nahla TOUATI

  • Chapitre 5. Application des approches prédictives sur le pendule inversé

    Figure 5.6 – La commande et la puissance de système non linéaire dans le cas de la GPC

    Scénario3 : Cas de rejet des perturbations persistantes

    On applique maintenant une force constante(perturbation persistante) sur le système du pen-dule inversé quand le voit sur la figure 5.9 :

    Les résultats d’expérimentations sont illustrés sur la figure 5.10 :Le système cherche à compenser la valeur de la perturbation et par la suite appliquer unecommande plus élevée pour atteindre la position d’équilibre.

    Scénario4 : Combinaison de deux types de perturbations

    On essai maintenant d’appliquer au système la combinaison de deux types de perturbationsponctuelles et persistantes(cf.figure 5.11.

    Les résultats d’expérimentations sont illustrés sur la figure 5.12 :On observe des pics sur les courbes relatives à la perturbation constante.Le système cherche à compenser la valeur de la perturbation constante et par la suite appliquerune commande plus élevée pour atteindre la position d’équilibre.

    Rapport de stage de Mastère 45

  • 5.2. Application de La commande prédictive non linéaire sur le Pendule inversé

    Figure 5.7 – Résultats d’expérimentation de cas nominal

    5.2 Application de La commande prédictive non linéaire

    sur le Pendule inversé

    5.2.1 Simulations dans le cas nominal

    Résultats de Simulations

    L’objectif de cette simulation est de stabiliser le pendule inversé stabilisé par volant d’inertieà partir de la condition initiale X0 = [θ1 = 18◦ θ̇1 = 0 θ2 = 0 θ̇2 = 0]T .On fixe les paramètres de la commande prédictive non linéaire à :

    – L’horizon de prédiction H = 0.45s.– La pulsation propre w = 10.– Kp = 200.– Kv = 20.

    La figure 5.13 présente l’évolutions des états de système :La figure présente 5.2.1 l’évolution de la commande ainsi que la puissance.la figure5.15 présente l’évolution du paramètre d’optimisation ξ à chaque horizon de prédic-

    46 Nahla TOUATI

  • Chapitre 5. Application des approches prédictives sur le pendule inversé

    Figure 5.8 – Résultats d’expérimentation du cas de rejet de perturbations ponctuelles

    tion :

    Interprétations des résultats

    On remarque bien la convergence de θ1, θ̇1 et θ̇2 vers 0.On remarque aussi que θ1 et θ̇1 suivent les trajectoires de références dont on a parlé dans lechapitre précédant.Le test de la puissance admissible des moteurs montre bien que les puissances sont admissiblestant que la puissance maximale reste bien dans la zone admissible (cf.figure5.16).

    5.2.2 Robustesse vis-à-vis des incertitudes paramétriques

    Le test de la robustesse de la commande nous permet de vérifier si la commande appliquéepeut s’adapter aux incertitudes des paramètres de système.On choisit d’introduire une incertitude ∆I sur le paramètre I qui est une combinaison deplusieurs paramètres :I = m1l21 + m2l22 + I1 et on observe ce que se passe sur la sortie et lacommande (cf.figure 5.17). On remarque bien que le système peut surmonter cette incertitudeet amener le système vers la stabilisation.

    Rapport de stage de Mastère 47

  • 5.2. Application de La commande prédictive non linéaire sur le Pendule inversé

    masse

    perturbante

    Figure 5.9 – La perturbation persistante sur le pendule inversé

    Figure 5.10 – Résultats d’expérimentation du cas de rejet de perturbations persistantes

    48 Nahla TOUATI

  • Chapitre 5. Application des approches prédictives sur le pendule inversé

    perturbationpersistante

    perturbationponctuelle

    Figure 5.11 – La combinaison de deux types de perturbations sur le pendule inversé

    Figure 5.12 – Résultats d’expérimentation du cas de rejet de la combinaison des perturbations

    Rapport de stage de Mastère 49

  • 5.2. Application de La commande prédictive non linéaire sur le Pendule inversé

    Figure 5.13 – L’évolutions des états du système pour le cas de la commande non linéaire

    50 Nahla TOUATI

  • Chapitre 5. Application des approches prédictives sur le pendule inversé

    Figure 5.14 – L’évolutions du couple et de la puissance pour le cas de la commande nonlinéaire

    Figure 5.15 – L’évolutions du paramètre d’optimisation

    Rapport de stage de Mastère 51

  • 5.2. Application de La commande prédictive non linéaire sur le Pendule inversé

    Figure 5.16 – Plage d’utilisation du moteur dans le cas de la commande non linéaire

    Figure 5.17 – Test de robustesse de la commande prédictive non linéaire

    52 Nahla TOUATI

  • Chapitre 6

    Solution 2 :Approches de commande

    adaptative

    6.1 Principe générale des approches adaptatives

    Le début des recherches sur la commande adaptative date des années 1950. Cependant à causede l’insuffisance de résultats théoriques et de l’absence des moyens techniques performants, cesrecherches furent très vite abandonnés. Les progrès rapides de l’électronique et des résultatsthéoriques fondamentaux établie dans les années1960 devraient susciter de nouveau l’intérêtpou ce sujet durant les années1970. Depuis lors des études considérables ont été réalisées etaujourd’hui elle sont mises en oeuvre à l’aide des microprocesseurs,micro-ordinateurs ou cir-cuits spécialisés [5].La commande adaptative est un ensemble des techniques destinées à ajuster automatiquementles paramètres du correcteur des systèmes de commande lorsque les caractéristiques du pro-cessus et les perturbations sont inconnues ou varient dans le temps. Son utilisation requiertla mesure d’un certain indice de performance qui est comparé à l’indice désiré. Suivant l’écartobtenu, le mécanisme d’adaptation (algorithme d’adaptation) modifie les paramètres du cor-recteur ajustable afin de maintenir l’indice de performance à la valeur désirée [5].Par principe ce type de commande est non linéaire puisqu’il comporte deux boucles de contreréaction imbriquées (cf.figure 6.1) : la boucle de correction et la boucle d’adaptation. Le prin-cipe de la commande adaptative est illustré dans la figure suivante : Ils existent principalementdeux classes de commande adaptatives,la commande adaptative directe et indirecte(cf.figure6.2).

    Commande adaptative indirecte : Un modèle de comportement d’entrée-sortie du sys-tème à commander y est continûment mis à jour et est utilisé pour la synthèse durégulateur comme s’il était le meilleur modèle de commande que l’on aurait utilisé (cf.

    53

  • 6.1. Principe générale des approches adaptatives

    Figure 6.1 – Principe des systèmes de commande adaptative [5]

    figure 6.2.a). Les paramètres du régulateur sont ainsi adapt