Upload
trannguyet
View
215
Download
0
Embed Size (px)
Citation preview
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Approche Évolutionniste de la Robotique
Stéphane Doncieux1
ISIR - Université Paris 6http://animatlab.lip6.fr http://www.isir.fr
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
1 Principes des AE
2 Évaluation et pression sélective
3 Simulation vs réalité
4 Que faire évoluer ?
5 Outils
6 Problèmes ouverts
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Principes des AlgorithmesÉvolutionnistes
Principes, définitions et exemples
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Principe
1 Génération aléatoire d’unensemble de solutionspotentielles
2 Évaluation des solutions3 Sélection des meilleurs.
Arrêt si critères de finatteints
4 Génération de nouveauxindividus
5 Retour en 2
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Définitions (1)
Génotypedescription d’une solution
Ex : liste de paramètres
Phénotypesolutions que l’on souhaite
optimiserEx : forme d’un profil d’aile
d’avion
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Définitions (2)
Fonction de Fitness : critère à maximiser (ou minimiser)spécifié par l’utilisateur
Ex : Maximisation de la portance
Algorithme de sélection : choix des individus conservés à partirde la fitness : conservation des X% des meilleurs, choix avec
une probabilité proportionnelle au rang...
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Génotype & opérateurs génétiques
L’opérateur de mutation modifiealéatoirement une partie du
génotype.L’opérateur de croisementéchange des morceaux degenotype entre individus.
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Ce que la robotique change à l’AE
Le génotype sert à décrire unepartie du robot.L’évaluation est plus complexe :
observation ducomportement du robotcalcul non instantanné !note unique (ou presque) àdéterminer à partir d’uneséquence d’observations
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Quelques exemples
Évitement d’obstacles(Braitenberg)
Marche d’un robot hexapode
Contrôle des battements d’un robot à ailes battantes
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Hypothèse fondamentale
La pression sélective a un pouvoir structurant suffisant pourfaire émerger des comportements adaptés à l’environnementdu robot et à ses moyens d’interaction avec celui-ci.
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Motivations
de la biologie et de la vieartificielle ...
comprendre le vivant, lespressions qui l’ont mené àsa forme actuelleconcevoir desécosystèmes peuplés decréatures capables des’adapter à leurenvironnement
à l’ingénierie
reproduire les mécanismesadaptatifs qui ont conduit àl’apparition de créaturesvivantes adaptées à quasimenttous les milieux et les adapter àla robotique.
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Motivations
Approche animat :émergence de comportements efficacesexploitation de caractéristiques propres à la dynamiqued’un robot particulier.
→ le robot doit apprendre par lui-même comment remplir satâche au travers de ses interactions avec l’environnement...
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Intérêt des algorithmes évolutionnistes
Bonnes performances moyennesNe nécessite pas de propriétés mathématiquesparticulièresPeu de contraintes sur le système à concevoir
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Principales problématiques
Contexte :ressources computationnelles limitées : populations detaille réduite par rapport à un équivalent quelconque enbiologie et temps d’évaluation limitéquantité de robots très faible, robustesse mécaniquelimitée !
Problématiques :Comment réaliser la pression sélective et, question liée,quel retour du comportement du robot ? Probleme dubootstrapLiens simulation-réalite (pbe d’experimentation sur ledispositif reel)Quel espace de recherche et comment l’explorer ?
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Évaluation et pression sélective
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Évaluation
Métaphore de la théorie Darwinienne de la sélection desespèces, mais dans la nature, il n’y a pas vraiment de fonctionà maximiser...
Fitness implicite Pas decomportement imposé.
Exemple : maximisation de ladurée de vie, reproduction par
rencontre des individus.→ le comportement généré
dépend de l’environnement...
vs
Fitness explicite On cherche uncomportement précis.
Exemple : avancer le plus vite,éviter les obstacles...
→ le comportement global estimposé, pas les commandes
motrices précises (ce n’est pas dusupervisé)
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Fitness implicite
Approche de type "écosystème virtuel" : un monde virtuel estpeuplé de différentes entités :
inanimées : obstacles, sources de nourritureanimées : animats de différents types
Les interactions entre les différentes entités créent unedynamique qui, bien qu’elle soit très simplifiée, peut rappelercelle d’écosystèmes naturels.
Motivation : vie artificielle
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Fitness implicite
La pression sélective repose sur la définition de la notion desurvie dans l’environnement, survie souvent liée à l’accès auxressources.
Exemple [Pichler et Canamero 2007] : définition d’un "budgeténergétique"
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Fitness implicite
Quelques résultats :
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Fitness explicite
Approche "ingénieur" : la pression sélective est exercéedirectement à partir de critères intéressant l’expérimentateur.
L’influence de l’environnement est amoindrie :les individus sont observés dans un contexte similaire(conditions initiales identiques)une note ou un ensemble de notes sont tirées del’observation du comportement de l’animatune sélection est opérée sur la base de ces notes,indépendamment de l’environnement
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Fitness explicite
Définition de la fitness :Description qualitative du comportementChoix des observablesObservation pendant la durée de vieCondensation des observations en un ou plusieurs critères(selon AE mono- ou multi-objectifs)
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Fitness explicite
Quelques problèmes classiques :
condenser des observations en un ou plusieurs critères aune grande influence sur les résultats. Ex : suivi detrajectoiredéfinition des critères. Ex : éviter des obstaclessystème adaptatif = système opportuniste. Ex : marcher leplus loin en simulation
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Fitness explicite
Ne pas prendre en compte un état à un instant donné, maisune observation sur la durée.Observer et analyser les solutions générées.
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Fitness explicite
Ne pas prendre en compte un état à un instant donné, maisune observation sur la durée.Observer et analyser les solutions générées.
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Fitness explicite
Être incrémental dans la façon de noter un individu : lespremiers individus feront de toute façon n’importe quoi...
Parmi les ”mauvais individus”, la fitness doit pouvoir discriminerceux qui sont sur la ”bonne voie” des autres.
Exemple : suivi de trajectoirepoints de passageécart moyen à des vecteurs vitesse relative instantannés
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Pression sélective
Comment exercer la pression pour que l’évolution puisse suivreun chemin continu depuis un individu généré aléatoirementvers la solution au problème complet ?
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Multi-critère : définitions
Définitionsx1 domine x2 si :
1 x1 est aussi bon que x2sur tous les objectifs
2 x1 est strictementmeilleur que x2 sur aumoins un objectif
l’ensemble des solutionsdominantes est appelé lefront de Pareto.
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Multi-objectifs & Algorithmes Évolutionnistes
Exemple : MOGA algorithm (Fonseca 1993)
La selection est basée sur le rang des individus.rank(i) = 1 + nbdomine(i)
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Multi-objectifs & Algorithmes Évolutionnistes
Le rang est modulé par un sharing factor pour assurer unebonne couverture du front de pareto.
f (i) = rank(i) + σshare(i) 0 < σshare(i) < 1
f1
f2
do share
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Exemple : contrôle d’un pendule inversé (1)
Objectif : contrôler x et θ
θ
x
F
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Exemple : contrôle d’un pendule inversé (2)
Génération 120
Approche mono-objectif
100.2
100.4
100.6
100.8
101
101.2
100.2 100.4 100.6 100.8 101 101.2
populationpareto front
Approche multi-objectifs
100.2
100.4
100.6
100.8
101
101.2
100.2 100.4 100.6 100.8 101 101.2
populationpareto front
x : performance sur x , y : performance sur θvaleur maximum : 101
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Exemple : contrôle d’un pendule inversé (2)
Génération 220
Approche mono-objectif
100.2
100.4
100.6
100.8
101
101.2
100.2 100.4 100.6 100.8 101 101.2
populationpareto front
Approche multi-objectifs
100.2
100.4
100.6
100.8
101
101.2
100.2 100.4 100.6 100.8 101 101.2
populationpareto front
x : performance sur x , y : performance sur θvaleur maximum : 101
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Exemple : contrôle d’un pendule inversé (2)
Génération 320
Approche mono-objectif
100.2
100.4
100.6
100.8
101
101.2
100.2 100.4 100.6 100.8 101 101.2
populationpareto front
Approche multi-objectifs
100.2
100.4
100.6
100.8
101
101.2
100.2 100.4 100.6 100.8 101 101.2
populationpareto front
x : performance sur x , y : performance sur θvaleur maximum : 101
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Exemple : contrôle d’un pendule inversé (2)
Génération 420
Approche mono-objectif
100.2
100.4
100.6
100.8
101
101.2
100.2 100.4 100.6 100.8 101 101.2
populationpareto front
Approche multi-objectifs
100.2
100.4
100.6
100.8
101
101.2
100.2 100.4 100.6 100.8 101 101.2
populationpareto front
x : performance sur x , y : performance sur θvaleur maximum : 101
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Exemple : contrôle d’un pendule inversé (2)
Génération 520
Approche mono-objectif
100.2
100.4
100.6
100.8
101
101.2
100.2 100.4 100.6 100.8 101 101.2
populationpareto front
Approche multi-objectifs
100.2
100.4
100.6
100.8
101
101.2
100.2 100.4 100.6 100.8 101 101.2
populationpareto front
x : performance sur x , y : performance sur θvaleur maximum : 101
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Exemple : contrôle d’un pendule inversé (2)
Génération 620
Approche mono-objectif
100.2
100.4
100.6
100.8
101
101.2
100.2 100.4 100.6 100.8 101 101.2
populationpareto front
Approche multi-objectifs
100.2
100.4
100.6
100.8
101
101.2
100.2 100.4 100.6 100.8 101 101.2
populationpareto front
x : performance sur x , y : performance sur θvaleur maximum : 101
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Exemple : contrôle d’un pendule inversé (2)
Génération 720
Approche mono-objectif
100.2
100.4
100.6
100.8
101
101.2
100.2 100.4 100.6 100.8 101 101.2
populationpareto front
Approche multi-objectifs
100.2
100.4
100.6
100.8
101
101.2
100.2 100.4 100.6 100.8 101 101.2
populationpareto front
x : performance sur x , y : performance sur θvaleur maximum : 101
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Exemple : contrôle d’un pendule inversé (2)
Génération 820
Approche mono-objectif
100.2
100.4
100.6
100.8
101
101.2
100.2 100.4 100.6 100.8 101 101.2
populationpareto front
Approche multi-objectifs
100.2
100.4
100.6
100.8
101
101.2
100.2 100.4 100.6 100.8 101 101.2
populationpareto front
x : performance sur x , y : performance sur θvaleur maximum : 101
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Exemple : contrôle d’un pendule inversé (2)
Génération 920
Approche mono-objectif
100.2
100.4
100.6
100.8
101
101.2
100.2 100.4 100.6 100.8 101 101.2
populationpareto front
Approche multi-objectifs
100.2
100.4
100.6
100.8
101
101.2
100.2 100.4 100.6 100.8 101 101.2
populationpareto front
x : performance sur x , y : performance sur θvaleur maximum : 101
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Multi-critères et pression sélective
Intérêts du multi-critères :Obtention simultanée de l’ensemble des meilleurscompromisFacilite le maintien de diversitéPression adaptative
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Multi-critères et pression sélective
Intérêts du multi-critères :Obtention simultanée de l’ensemble des meilleurscompromisFacilite le maintien de diversitéPression adaptative
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Multi-critères et pression sélective
Pression adaptative : contexte d’une tâche "composite"
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Multi-critères et pression sélective
Pression adaptative : contexte d’une tâche "composite"
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Multi-critères et pression sélective
Pression adaptative : contexte d’une tâche "composite"
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Multi-critères et pression sélective
Pression adaptative : contexte d’une tâche "composite" [Mouret& Doncieux 2008]
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Simulation vs réalité
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Simulation vs réalité
Approche robotique réelle
Tout faire sur le robot réel :expériences de Floreano àl’EPFL→ Les caractéristiques durobot et de son environnementpeuvent être exploitées.Limitations : dispositifexpérimental, solutions initialesau comportementpotentiellement dangereuxpour le robot.
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Simulation vs réalité
Approche robotique réelleEmbodied Evolution [Watson etal. 2002] :
population de robots réelsévaluation ducomportement enconditions réellessi efficace : envoi dugénotype aux robotsavoisinants
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Simulation vs réalité
Principe de Miglino, Lund et Nolfi (1995)
Construction du modèle à partir de perceptions réellesAjout de différents types de bruits (gaussien, “conservatif”)Si différence entre les comportements simulation/réalité :réaliser quelques générations supplémentaires sur le robotréel...
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Simulation vs réalité
Exemple : évitement d’obstacles sur un robot Khépéra
Mesure des perceptions réelles du Khépéra pour 180orientations et 20 distances différentes par rapports auxdeux types d’objets de l’environnement (murs et obstaclescirculaires)Si plusieurs obstacles : sommation des perceptions3 conditions :
Pas de bruitbruit blancbruit “conservatif” : on considère les perceptions en unpoint x + δx , y + δy
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Simulation vs réalité
Exemple : évitement d’obstacles sur un robot KhépéraRésultat (par ordre décroissant des meilleures fitness) :
1 Sans bruit : baisse des performances lors du passage auréel
2 Avec bruit blanc : baisse faible des performancesmoyennes, très faible pour le meilleur contrôleur
3 Avec buit conservatif : aucune différence (voire meilleuresperformances)
Problème : mesures des perceptions réelles du robot pourconstruire le modèle très fastidieuses...
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Simulation vs réalité
Principe de Jakobi et de la simulation minimale (1997)
Définition d’un ensemble d’interactions de base et d’unensemble d’aspects liés à l’implémentationRéalisation de la simulation :
interactions de base : modélisées depuis des mesuresréelles et ajout d’un bruit faibleaspects liés à l’implémentation : implémentation variabled’un test à l’autre
Force l’évolution à ne pas exploiter de caractéristiques peurobustesLimitation implicite : seuls les phénomènes physiquesprécisément simulés pourront être exploités...
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Simulation vs réalité
Exemple : Choix d’une direction en fonction d’une lumière
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Simulation vs réalité
Exemple : Choix d’une direction en fonction d’une lumière
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Simulation vs réalité
Exemple : Choix d’une direction en fonction d’une lumière
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Simulation vs réalité
Approche mixte Simulation/Réalité.Commencer en simulation et finir en réalité :
Recherche initiale rapideAjustement final sur le système réel
→ pose moins de problèmes car les comportements évaluéssur le système réel sont, a priori, plus proches de celui attenduet donc moins dangereux...
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Simulation vs réalité
Dans les approches précédentes, frontière nette entre lasimulation et la réalité : principes généraux de conception de lasimulation
Pas d’exploitation des capacités adaptatives de l’évolution !Ce que l’on pourrait espérer :
passage automatique simulation-réalitéadaptation automatique du modèleadaptation en ligne du comportement à des changementsde contexte
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Simulation vs réalité
Dans les approches précédentes, frontière nette entre lasimulation et la réalité : principes généraux de conception de lasimulation
Pas d’exploitation des capacités adaptatives de l’évolution !Ce que l’on pourrait espérer :
passage automatique simulation-réalitéadaptation automatique du modèleadaptation en ligne du comportement à des changementsde contexte
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Simulation vs réalité
Dans les approches précédentes, frontière nette entre lasimulation et la réalité : principes généraux de conception de lasimulation
Pas d’exploitation des capacités adaptatives de l’évolution !Ce que l’on pourrait espérer :
passage automatique simulation-réalitéadaptation automatique du modèleadaptation en ligne du comportement à des changementsde contexte
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Simulation vs réalité
Dans les approches précédentes, frontière nette entre lasimulation et la réalité : principes généraux de conception de lasimulation
Pas d’exploitation des capacités adaptatives de l’évolution !Ce que l’on pourrait espérer :
passage automatique simulation-réalitéadaptation automatique du modèleadaptation en ligne du comportement à des changementsde contexte
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Simulation vs réalité
Passage automatique simulation réalité
Évaluation mixte en simulation et sur le systeme réel
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Simulation vs réalité
Anytime Learning [Schultz et Grefenstette 2003]
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Simulation vs réalité
Anytime Learning [Schultz et Grefenstette 2003]
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Simulation vs réalité
Anytime Learning [Schultz et Grefenstette 2003]
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Simulation vs réalité
Adaptation automatique du modèle
La différence entre l’évaluation en simulation et sur le systèmeréel peut guider l’adaptation du modèle : erreur à minimiser,approche "Back to reality" [Zagal et al. 2004]
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Simulation vs réalité
Adaptation automatique du modèle
Co-évolution système-test (Estimation-Exploration Algorithm :EEA) [Bongard et Lipson 2005]
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Simulation vs réalité
Robots résilients [Bongard etal. 2006] :
contruction d’un modèleinterne par AE : applicationau robot réel des actionsles plus discriminantesoptimisation ducomportement sur lemodèle obtenuapplication au robot réelretour à la phase demodélisation
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Simulation vs réalité
L’avenir est à la co-évolution modèle-comportement !
Mais il reste du travail :problème des capteurs : quel retour d’information du réel ?problème de la représentation de l’environnement
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Que faire évoluer ?
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Que faire évoluer ?
À définir pour concevoir un système à l’aide algorithmeévolutionniste :
Fitness et évaluationCodage génétiqueOpérateur de mutationOpérateur de croisement
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Que faire évoluer ?
Paramètres du robotContrôleCapteursMorphologie complète
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Que faire évoluer ?Paramètres
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Évolution de paramètres
Approche AE classique (algorithmes génétiques, stratégiesévolutionnistes).
Optimisation du Black Widow[Grasmeyer 2001]
Évolution des paramètres ducontrôleur de l’Aibo [Hornby2000]
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Que faire évoluer ?Contrôle
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Évolution du contrôle
Principe : obtenir un programme capable de faire exhiber uncomportement désiré à un robot.Paradigmes exploitables :
“Programmes”Systèmes à base de règlesRéseaux de neuronesContrôleurs adhoc
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Évolution du contrôle : programmes (sous formed’arbres)
Programmation génétique : principe
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Évolution du contrôle : programmes (sous formed’arbres)
Programmation génétique : croisement
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Évolution du contrôle : programmes (sous formed’arbres)
Programmation génétique : mutation
Mutation paramétriqueMutation structurelle :
pas systématiquement utilisée...consiste à remplacer un sous-arbre par un autre généréaléatoirementsouvent couplé à une grammaire permettant de restreindreet d’orienter la recherche vers des solutions pertinentes
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Évolution du contrôle : programmes (sous formed’arbres)
Programmation génétique : exemplesÉvolution d’un contrôleur debattement d’ailes [Augustssonet al 2002] Évolution d’un programme
assembleur pour un Khépera[Nordin & Banzhaf 1997 ]
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Évolution du contrôle : systèmes à base de règles
Principe : ensemble de règles “Conditions→ actions”
Les conditions portent sur les valeurs de capteurs ou surun état interneLes actions sont envoyées aux effecteurs ou modifientl’état interne
Systèmes à base de règles floues & systèmes de classeurs
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Évolution du contrôle : systèmes à base de règles
Systèmes à base de règles floues.La logique floue est utilisée sur les parties :
condition et action (règles de Mamdani)condition seulement, action = fonction linéaire des entrées(règles Takagi-Sugeno-Kang ou TSK)
0
1Loin
3m2,50m
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Évolution du contrôle : systèmes à base de règles
Qu’est-ce qui évolue là-dedans ?Le découpage en ensembles flous de l’espace desconditionsLes paramètres des actions (ensembles flous oucoefficients)
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Évolution du contrôle : systèmes à base de règles
Comparé à des approches classiques du contrôle sur unhélicoptère :
contrôle linéaire robuste multi-variablenonlinear tracking controllogique floue avec réglage par évolution
Rôle de l’AE : optimiser les paramètres de règles flouesdéfinies manuellement.
[Shim & al 1998]
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Évolution du contrôle : systèmes à base de règles
Résultats :performances très bonnes pour un vol quasi stationnaire(logique floue + évolution équivalent à contrôle linéairerobuste multi-variable)perturbations et incertitudes sont bien géréesle contrôle non linéaire est plus efficace sur un domaineplus large (mais nécessite une connaissance très précisedu système...).
Conclusion : Solution compétitive. Cependant l’évolution n’avaitqu’un rôle très faible, que se passe-t-il si on lui laisse plus delatitude ?
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Évolution du contrôle : systèmes à base de règles
Principe des systèmes de classeurs.règles du type : 010#1#→ 110Actions : valeurs binaires envoyées aux actuateursConditions : valeurs issues des capteurs, langage ternaire
0 : capteur inactif1 : capteur actif# : valeur indifférente
La condition est un ET logique entre toutes les valeurs descapteurs.Exemple : 010#1#→ règle active lorsque :
capteurs 0 et 2 inactifs
capteurs 1 et 4 actifs
capteurs 3 et 5 non prises en compte
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Évolution du contrôle : systèmes à base de règles
Qu’est-ce qui évolue là-dedans ?→ chaînes binaires ou ternaires (taille fixe imposée), nombrede règles.2 familles principales de contrôleurs basées sur des systèmesde classeurs : approches Michigan et Pittsburgh
Approche Pittsburgh : la population est un ensemble decontrôleurs, qui sont eux-mêmes des ensembles de règlesApproche Michigan : la population est un ensemble derègles, les contrôleurs sont donc constitués de plusieursindividus.
Expériences de F. Flacher
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Évolution du contrôle : réseaux de neurones
Σ
Fonction Entrées Sortied’activation
Calculdu potentiel
Réseau de neurones
Neurones d’entrée
Neuronesde sortie
Neurone
Définitions :Potentiel : potentiel demembraneActivation : valeur de sortiedu neurone
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Évolution du contrôle : réseaux de neurones
Évolution d’un réseau de neurones :
structure fixe : évolution de paramètresstructure générée par l’AE :
permet de trouver des structures adaptées à un problèmeProblème : quelle représentation génétique pour unestructure de type graphe ? Enjeux :
quel espace de recherche ?comment l’explorer ?
→ objet du prochain cours !
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Que faire évoluer ?Capteurs
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Influence des capteurs sur le contrôle
Expérience des Didabots. Objectif : ranger l’arène, i.e.regrouper les cubes par tas.
[Maris & te Boekhorst 1996]
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Influence des capteurs sur le contrôle
Première configuration
[Maris & te Boekhorst 1996] [Pfeifer 2000]
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Influence des capteurs sur le contrôle
Seconde configuration
[Maris & te Boekhorst 1996] [Pfeifer 2000]
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Évolution de capteurs
Objectifs : exploiter les caractéristiques des capteurs pourrésoudre une tâche a priori complexe avec un contrôleursimple.
Très efficace, mais plus difficile à mettre en oeuvre que del’évolution de contrôleur...
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Évolution de capteurs
Évolution de la position de capteurs de lumière à donner enentrée de capteurs élémentaires de mouvement.
[Lichtensteiger & Eggenberger 1999]
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Que faire évoluer ?Morphologie complète
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Influence de la morphologie sur le contrôle
Asimo de Honda vs Denise de l’université de Delft
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Évolution de la morphologie complète
Expériences de [Sims 1994] : évolution demorphologie-contrôle pour des robots dans un univers virtuelpour différentes tâches :
marchenagesautcompétition
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Évolution de la morphologie complète
Expériences de [Sims 1994] : évolution demorphologie-contrôle
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Évolution de la morphologie complète
[Sims 1994]
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Évolution de la morphologie complète
Projet Framsticks [Komosinski, Ulatowski 1998]
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Évolution de la morphologie complète
Projet Golem [Lipson, Pollack 2000]
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Outils
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Outils AE standards
AE standardsGaLib http ://lancet.mit.edu/ga/OpenBEAGLE http ://beagle.gel.ulaval.ca/EO http ://eodev.sourceforge.net/
AE & robotique
Darwin 2K http ://darwin2k.sourceforge.net/Framsticks http ://www.frams.alife.pl/findex.html
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
SFERESPlate-Forme logicielle d’évolution artificielle et de simulation.Utilisée dans toutes les expériences du projet ROBUR.Objectif : maximiser la réutilisation de code et accélérer ledéveloppement de nouveaux composants dans desexpériences de conception automatique de contrôleursd’agents simulés.
Evolution
Population
Evaluator
Chromosome
Fitness
Individual
Genome
Simulator
Agent
Sensor
Architecture
Effector
SimuFitness
Distribuée souslicence libreCeCILL. cfhttp ://sferes.lip6.fr
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Problèmes ouverts
Évolution = génération d’un individu adapté
Objectif : tendre vers la génération d’individus adaptatifs.
Solution explorée : ajouter de l’apprentissage...
Autre avantage : meilleure exploitation du temps passé àl’évaluation.
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
Problèmes ouverts
Passage à l’échelle dans la complexité des comportementsgénérés : problème du “bootstrap”.
Objectif : générer par évolution des comportements decomplexité croissante.
Solution explorée : incrémentalité dans la complexité :approche de type co-évolution ou multi-critères.
Autre avantage : réduire la dépendance à la stratégied’évaluation.
Principes des AE Évaluation et pression sélective Simulation vs réalité Que faire évoluer ? Outils Problèmes ouverts
That’s all folks...EMail : [email protected] web :
Page AnimatLab : http ://animatlab.lip6.frSite de l’ISIR : http ://www.isir.frSFERES : http ://sferes.lip6.fr