27
Séminaire FERIA Systèmes Décisionnels 18 janvier 2005 Elodie Chanthery Sylvain Damiani Décision en ligne pour engins autonomes

Elodie Chanthery Sylvain Damiani - Laboratoire … · Suivi de Situation capteurs ... ∨ par des fonctions de pénalisation dans le critère ... Wolfe, application d’un simplexe

Embed Size (px)

Citation preview

Séminaire FERIA

Systèmes Décisionnels

18 janvier 2005

Elodie Chanthery

Sylvain Damiani

Décision en ligne pourengins autonomes

Page 2 FERIA - Systèmes Décisionnels

PlanPlan

≡ Contexte

∨ Environnement opérationnel

∨ de l’autonomie opérationnelle à l’autonomie décisionnelle

∨ domaines applicatifs

∨ objectifs et contraintes

≡ But : prendre la meilleure décision

≡ Les méthodes d’optimisation

≡ Deux exemples

∨ drone

∨ satellite

Page 3 FERIA - Systèmes Décisionnels

Contexte de la présentationContexte de la présentation

Processus de

Suivi de

Situation

capteursProcessus

de Décision /

Planification

environnement

opérateur

actionneurs

Mission

Communication

autonomie

charges utiles

engin

Décisiondistribuée

Page 4 FERIA - Systèmes Décisionnels

De l’autonomie opérationnelle ...De l’autonomie opérationnelle ...

≡ Niveau d’autonomie ↔ interaction entre l’engin et lesopérateurs

∨ autonomie avec abstraction des décisions opérateur

≡ Niveau 0 : engin téléopéré : autonomie opérationnelle,l’engin réalise des fonctions de commande de bas

niveau

≡ Exemple

Concept Victor 6000 © Ifremer - Alris Communication

Page 5 FERIA - Systèmes Décisionnels

… Aux besoins en autonomie décisionnelle… Aux besoins en autonomie décisionnelle

≡ Communications fortement limitées entre l’engin et les

opérateurs

≡ Environnement mal connu, incertain, dynamique,

changeant, hostile, dangereux

≡ Evénements dont l’occurrence est imprévisible

∨ ex : nouveau danger, nouveaux objectifs

→ Besoins en autonomie décisionnelle

Page 6 FERIA - Systèmes Décisionnels

Contexte: domaines applicatifsContexte: domaines applicatifs

≡ Robotique terrestre

≡ Robotique sous-marine

≡ Avions sans pilote (drones)

≡ Hélicoptères

≡ Satellites

≡ Applications civiles et militaires

Page 7 FERIA - Systèmes Décisionnels

Objectifs et contraintesObjectifs et contraintes

Objectifs

≡ Développer la décision autonome en ligne

≡ Réagir aux imprévus

≡ Optimiser la décision en fonction de l’état et de

l’environnement

Contraintes sur la prise de décision

≡ Limitation en CPU, en mémoire vive

≡ Interruptions possibles

≡ Temps de réponse en accord avec les exigences du

problème

Solution Développer des algorithmes anytime si

possible, ou gloutons

Page 8 FERIA - Systèmes Décisionnels

PlanPlan

≡ Contexte

∨ Environnement opérationnel

∨ de l’autonomie opérationnelle à l’autonomie décisionnelle

∨ domaines applicatifs

∨ objectifs et contraintes

≡ But : prendre la meilleure décision

≡ Les méthodes d’optimisation

≡ Deux exemples

∨ drone

∨ satellite

Page 9 FERIA - Systèmes Décisionnels

Objectifs de la planificationObjectifs de la planification

≡ Sélectionner un sous-ensemble d’objectifs

≡ Eventuellement les ordonner

≡ Sortie : un plan ou une décision

≡ Instants de décision

≡ Décision et raisonnement

act_2 t

act_1 tHorizon de décision

Horizon de raisonnement

act_1 tTemps pour raisonner

Page 10 FERIA - Systèmes Décisionnels

Contraintes sur la décision :prise en compte des ressourcesContraintes sur la décision :prise en compte des ressources

≡ Contraintes dures

∨ contraintes physiques

∨ cadre du modèle

ex: quantité de carburant embarqué, degré de déchargemaximal d’une batterie, contraintes dynamiques sur l’engin(vitesses min, max)

≡ Contraintes molles

→ si non respectées, dégradation de la qualité de la solution

ex: finir la mission avec plus ou moins de carburant

≡ Prise en compte des contraintes sur les ressources

∨ par des inégalités Ce(re) ≥ 0

∨ par des fonctions de pénalisation dans le critère

∨ vérification de l’applicabilité du plan après optimisation

Page 11 FERIA - Systèmes Décisionnels

Critères de qualité de la solutionCritères de qualité de la solution

≡ Utilité globale maximale, fonction du niveau d’énergie,

du niveau de mémoire, des observations

≡ Différence entre des coûts et des gains

≡ Autres critères possibles: longueur, coût, durée ...

≡ Particularité de certains problèmes réels

∨ pas d’inégalité triangulaire pour les coûts, coûts non additifs

∨ ressources non décomposables

)m,e,j(Umax *

m,e,ij≤

min J = Re(re) -�∈Eoo

ooooo )'r,'t,r,(tR

récompenses coûts

Page 12 FERIA - Systèmes Décisionnels

PlanPlan

≡ Contexte

∨ Environnement opérationnel

∨ de l’autonomie opérationnelle à l’autonomie décisionnelle

∨ domaines applicatifs

∨ objectifs et contraintes

≡ But : prendre la meilleure décision

≡ Les méthodes d’optimisation

≡ Deux exemples

∨ drone

∨ satellite

Page 13 FERIA - Systèmes Décisionnels

Les algorithmes anytimeLes algorithmes anytime

≡ Caractéristiques

∨ Solution valide à chaque instant

∨ Qualité du résultat croissante à durée de raisonnementcroissante

� utilisation au mieux du temps disponible

≡ Utilisation

∨ 1 activité : toujours actif, relancé à chaque événement

∨ Plusieurs activités : optimisation du temps laissé pour ladécision concernant chaque activité (deliberation scheduling)

Utilité

Temps de calcul

Page 14 FERIA - Systèmes Décisionnels

La programmation dynamiqueLa programmation dynamique

≡ Caractéristiques

∨ Résolution d'un problème de manière itérative

∨ Réutilisation directe de résultats de sous-problèmes

≡ Avantages

∨ Si chaque sous-problème est une solution valide

et si la qualité du résultat ↑ quand le niveau du sous-problème ↑

� algorithme anytime

∨ Optimalité, complexité en temps réduite

≡ Inconvénients

∨ Complexité en espace non négligeable

∨ Fragilité

≡ Autres méthodes (non optimales)

∨ Gloutons + recherche locale

∨ Gloutons stochastiques

Page 15 FERIA - Systèmes Décisionnels

Recherche arborescenteRecherche arborescente

≡ Caractéristiques∨ Recherche d’un plan pas à pas

∨ Optimisation de sous-problèmes durant la recherche

≡ Justifications

∨ Problème où la propriété de l’inégalité triangulaire ne s’applique pas

∨ Ressources non décomposables sur les arcs

→ Algorithmes utilisant le déroutement (Ford, Dijkstra) impossible

≡ Avantages

∨ Prise en comptes de contraintes temporelles sur les nœuds

∨ Gestion de ressources non décomposables

≡ Inconvénient

∨ Complexité → nécessité d’une bonne méthode d’élagage

Page 16 FERIA - Systèmes Décisionnels

Recherche arborescenteFormalisme utiliséRecherche arborescenteFormalisme utilisé

≡ N ensemble des nœuds (étapes du plan)

≡ W = {W1, …, Wp} une partition de N

≡ relation S : S(Wi) est l’ensemble des successeurs de Wi

≡ But : trouver une séquence d’états W1, …, Wq telle que

∨ W1 = Ws

∨ Wq = We

∨ ∀ i, Wi+1 ∈S(Wi) en minimisant le critère et en respectant lescontraintes

Page 17 FERIA - Systèmes Décisionnels

Recherche arborescenteFormalisme utilisé (suite)Recherche arborescenteFormalisme utilisé (suite)

≡ Niveau I réalisation des objectifs

∨ Définition d’un objectif

≡ Niveau II : chemin et ordonnancement

∨ il existe un ou plusieurs arcs entre n1∈N et n2∈N ssi il existe i et j

tels que: n1∈Wi, n2 ∈Wj et Wj ∈S(Wi)

∨ Spécialisation des nœuds, modes d’accès

∨ Mi,j sous-ensemble des modes d’accès autorisés entre ni et nj

∨ Fenêtres temporelles sur les nœuds : tjmin ≤ tj ≤ tjmax

∨ Ressources décomposables, non décomposables et contraintes

Page 18 FERIA - Systèmes Décisionnels

Recherche arborescente de type A*algorithme utiliséRecherche arborescente de type A*algorithme utilisé

DébutInitialisation

Placer IW dans Liste Ptant que Liste P n’est pas vide faire

pour tout v dans S(û) faire

Construire l’itinéraire de IW jusqu’à vOptimiser J en choisissant les dates pour chaque nœud en respectant les contraintesCalculer J = gX de IW à v

si v ∈We et gX < BORNE alors BORNE = gXElaguer l’arbre d’exploration

finMettre les éléments de S(û) dans Liste PEffacer û de P

finfin

Chercher une première solution admissible de coût C0; BORNE = Co

≡ Méthode de recherche d’une première solution admissible

≡ 4 méthodes d’évaluation du coût d’un nœud courant à un nœud fin

≡ 2 méthodes d’élagage

≡ 4 méthodes de rangement

≡ gestion des modes d’accès

^

pour tous les modes d’accès appliqués à v faire

fin

Calculer l’évaluation du critère de v jusqu’à un nœud fin

Mettre les éléments de S(û) dans Liste P

Elaguer l’arbre d’exploration

Prise en compte descontraintes temporelles

Optimisation d’un critère non linéairesous contraintes linéaires• utilisation de l’algorithme de Frank &Wolfe, application d’un simplexe• prise en compte des contraintes nonlinéaires par des termes de pénalisation

Page 19 FERIA - Systèmes Décisionnels

PlanPlan

≡ Contexte

∨ Environnement opérationnel

∨ de l’autonomie opérationnelle à l’autonomie décisionnelle

∨ domaines applicatifs

∨ objectifs et contraintes

≡ But : prendre la meilleure décision

≡ Les méthodes d’optimisation

≡ Deux exemples

∨ drone

∨ satellite

Page 20 FERIA - Systèmes Décisionnels

Planification de mission pour un Véhicule AérienAutonomePlanification de mission pour un Véhicule AérienAutonome

≡ Mission militaire d’observation

≡ Choix d’un engin de type MALE

≡ Environnement 3D dynamique,

incertain et dangereux

≡ Planification a priori

Objectifs

- Sélectionner et ordonner le meilleur

sous-ensemble d’objectifs à réaliser

- Déterminer les vitesses le long de

l’itinéraire

- Maximiser les gains, minimiser les coûts,

respecter les contraintes

Page 21 FERIA - Systèmes Décisionnels

≡ Première solution : < 5s

≡ Modes d’accès (= de navigation) : critère mais temps de calcul

✕ 50 et ✕ 14 dans les plus mauvais cas

≡ Méthodes de rangement: temps de calcul ÷ 4

Les tests : mode « nominal »Les tests : mode « nominal »

≡ Utilisation de la recherche arborescente

Page 22 FERIA - Systèmes Décisionnels

Les tests : replanification en ligneLes tests : replanification en ligne

≡ Modes d’accès (= de navigation)

critère avec 2 modes de navigation possible << critère avec mode unique

≡ Fin des calculs en moins de 0,5 s, première (et meilleure) solution

donnée en 0,06 s

Page 23 FERIA - Systèmes Décisionnels

Gestion autonome d'un satellite de surveillanceGestion autonome d'un satellite de surveillance

≡ 2 activités :

∨ Observation

∨ Télédéchargement

Page 24 FERIA - Systèmes Décisionnels

Gestion de l'observation à bordGestion de l'observation à bord

≡ Caractéristiques d'une observation :

∨ Dates de début et de fin connues et fixées

∨ Angle de dépointage constant

∨ Consommation de ressources connue

∨ Utilité associée à la réalisation

u(1)

u(2)

u(3)

u(4)

HDHR

t

Date courante

?

Page 25 FERIA - Systèmes Décisionnels

Gestion de l'observation à bordGestion de l'observation à bord

≡ Utilisation de la programmation dynamique

∨ Sens direct

∨ Prise en compte des ressources

U i u i max j C i U j

V i max j i U j max V i 1 ,U i

U i , m ,e u i max j C i ,m ' ,e ' U j , m ' , e '

Mémoire utilisée

Observations

0 1 2 3

Niveau maximal

Page 26 FERIA - Systèmes Décisionnels

Gestion de l'observation à bordGestion de l'observation à bord

• Utilisation de la programmation dynamique

• Sens direct

• Prise en compte des ressources

• Discrétisation

U i u i max j C i U j

U i , m ,e u i max j C i ,m ' ,e ' U j , m ' , e '

Mémoire utilisée

Observations

0 1 2 3

Niveau maximal

Niveau intermédiaire

V i max j i U j max V i 1 ,U i

Page 27 FERIA - Systèmes Décisionnels

ConclusionsConclusions

≡ Prise de décision en ligne pour engins autonomes

∨ Importance de la prise en compte des ressources

∨ Critères variés

∨ Spécificité des problèmes réels : ressources nondécomposables

∨ Algorithmes anytime

≡ Méthodes adaptées à un problème donné

∨ Programmation dynamique

∨ Recherche arborescente

≡ Développement d’un ou plusieurs modules de

planification à intégrer avec un superviseur

≡ La réalisation du plan sera non optimale (en global) en

cas d’aléas