Upload
sofia-zahid
View
217
Download
5
Embed Size (px)
Citation preview
SMA ARCHITECTURES
Geacutenie logiciel Systegravemes Reacutepartis
Intelligence Artificielle
Geacutenie Informatique
Paradigme Objet
TechnologiesReacuteseaux
MeacutetaphoreBiologique
MeacutetaphoreSociologique
Le choix dune deacutecomposition
Etant donneacute un pb agrave reacutesoudre comment choisir les agents qui vontintervenir dans le systegraveme et comment leur reacutepartir la compeacutetence
Grand nombre de deacutecompositions possiblesndash objetndash spatialendash fonctionnellendash etc
Diffeacuterents grains possibles
ndash socieacuteteacutendash individundash organendash cellulendash atomendash
4
Point de vue Agent Organisation
IA connaissances et croyances
savoir-faire et intentions
communication
conflits et coheacuterence
controcircle et coordination
Vie Artificielle comportement
perception
adaptation
couplage agrave lenvironnement
influences et deacutependances
co-deacutetermination
individucollectif
Geacutenie Logiciel encapsulation
heacuteritage
distribution
ouverture
Les diffeacuterents concepts et composants drsquoun SMA
Problegraveme central de quel comportement doter les agents et comment les faire interagir entre eux et avec lrsquoenvironnement pour reacutepondre au laquoproblegravemeraquo poseacute Meacutethode laquoVoyelleraquo deacutefinir les composants drsquoun systegraveme multi-agents selon
bullAgents
bullEnvironnement
bullInteraction
bullOrganisation
bull(Utilisateur) cf cours Anne Boyer laquoAssistant Intelligentraquo
Le choix dun modegravele dagent
Agents cognitifs - Intelligence Artificielle Distribueacutee
agent = meacutetaphore psychologiquendash connaissance deacutecrite en termes drsquoeacutetats mentauxndash comportement intentionnel (buts et plans explicites)
systegraveme = meacutetaphore sociologique
Agents reacuteactifs - Vie Artificielle
agent = meacutetaphore animalendash connaissances reacuteduites agrave lrsquoassociation de stimuli et de reacuteponsesndash comportement dirigeacute par les perceptions
systegraveme = meacutetaphore socio-biologique
AgentsLagent (Ferber 95)
ndash entiteacute reacuteelle ou virtuelle plongeacutee dans un environnement sur lequel elle est capable dagir
ndash qui dispose dune capaciteacute de perception et de repreacutesentation partielle de cet environnement
ndash qui peut communiquer avec dautres agents
ndash qui est mue par un ensemble de tendances (objectifs individuels fonctions de satisfaction de survie)
ndash qui possegravede un comportement autonome tendant agrave satisfaire ses objectifs conseacutequence de ses observations de sa connaissance et des interactions quelle entretient avec les autres agents
ndash qui est capable eacuteventuellement de se reproduire
bull point de vue local imparfait incertainbull ressources limiteacuteesbull Adaptation amp Apprentissage Deacutependance aux autres amp Socialiteacute
Une Recherche de Compromis
Communication
AutonomyAdaptation
Il est autonome mais ouvert agrave la communication
Il est autonome mais ouvert agrave
ladaptation
Il sadapte mais cherche agrave produire
son point de vue
Modegraveles dAgents
Environnement
Perception Action
behaviour-based layer
localplanning layer
cooperativeplanning layer
Kn
ow
led
ge A
bst
ract
ion
hierarchical agentknowledge base
agent control unit
social models
mental models
world models
bull Agent purement situeacute ndash lenvironnement possegravede une meacutetrique ndash les agents sont situeacutes agrave une position dans lenvironnement
qui deacutetermine ce quils perccediloiventndash ils peuvent se deacuteplacerndash il ny a pas communications directes entre agents elle se
font via lenvironnement
bull Agent purement communiquant ndash il ny a pas denvironnement au sens physique du terme ndash les agents nont pas dancrage physique ndash ils communiquent via des informations qui circulent entre
les agents
Concept 1 Agent
Situeacute ou Communiquant
Cognitif ou Reacuteactif
bull Agent cognitif ndash repreacutesentation explicite de lenvironnement et des autres agentsndash peut tenir compte de son passeacute et dispose dun but explicitendash mode social dorganisation (planification engagement)ndash petit nombre dagents (1020) heacuteteacuterogegravenes agrave gros grain
bull Les relations entre agents seacutetablissent en fonction des collaborations neacutecessaires agrave la reacutesolution du problegraveme
bull Agent reacuteactifndash pas de repreacutesentation explicite de lenvironnementndash pas de meacutemoire de son histoire ni de but explicitendash comportement de type stimulus reacuteponsendash mode biologique dorganisationndash grand nombre dagents (gt100) homogegravenes agrave grain fin
bull La structure du systegraveme eacutemerge des comportements et non dune volonteacute dorganisation
Deacutefinir - Architecture interne -Degreacute de couplage de lrsquoagent agrave lrsquoenvironnement on peut consideacuterer plusieurs cateacutegories drsquoagent
Fort reacuteactif Comportement dirigeacute par les changements de lrsquoenvironnement
hybride
Faible deacutelibeacuteratif (cognitif) Comportement dirigeacute par les buts agrave satisfaire
Couplage agrave lrsquoenvironnement
ARCHITECTURES REACTIFS-COGNITIFS
Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)
Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs
3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute
(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions
2 caracteacuteristiques
bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de
regravegles situation rarraction
bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute
-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs
Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute
Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur
Exercice les robots explorateurs
Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure
suivante)
Dans le cadre de larchitecture agrave subsomption deacutefinir
- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions
Mecircme question pour un ensemble de robots coopeacuteratifs
Figure
Problegraveme
Reacuteponses modules comportementaux =
Explorer
Preacutelever
Aller agrave la base
Deacuteposer
Eacuteviter obstacle
Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)
regravegle 1 si deacutetecte un obstacle alors changer de direction
regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon
regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)
regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever
regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement
Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire
Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement
Architecture agrave subsomptions
Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction
regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5
Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption
Robots explorateurs de Mars (Steels89)
Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip
Exemple de regravegles pour robots coopeacuteratifs
poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par
regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques
radioactives et suivre gradient (retour)
=gt une nouvelle regravegle
regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient
(aller)
Hieacuterarchie des prioriteacutes de deacuteclenchement
La hieacuterarchie de comportements
regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5
regravegle6 gt regravegle 5
le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Geacutenie logiciel Systegravemes Reacutepartis
Intelligence Artificielle
Geacutenie Informatique
Paradigme Objet
TechnologiesReacuteseaux
MeacutetaphoreBiologique
MeacutetaphoreSociologique
Le choix dune deacutecomposition
Etant donneacute un pb agrave reacutesoudre comment choisir les agents qui vontintervenir dans le systegraveme et comment leur reacutepartir la compeacutetence
Grand nombre de deacutecompositions possiblesndash objetndash spatialendash fonctionnellendash etc
Diffeacuterents grains possibles
ndash socieacuteteacutendash individundash organendash cellulendash atomendash
4
Point de vue Agent Organisation
IA connaissances et croyances
savoir-faire et intentions
communication
conflits et coheacuterence
controcircle et coordination
Vie Artificielle comportement
perception
adaptation
couplage agrave lenvironnement
influences et deacutependances
co-deacutetermination
individucollectif
Geacutenie Logiciel encapsulation
heacuteritage
distribution
ouverture
Les diffeacuterents concepts et composants drsquoun SMA
Problegraveme central de quel comportement doter les agents et comment les faire interagir entre eux et avec lrsquoenvironnement pour reacutepondre au laquoproblegravemeraquo poseacute Meacutethode laquoVoyelleraquo deacutefinir les composants drsquoun systegraveme multi-agents selon
bullAgents
bullEnvironnement
bullInteraction
bullOrganisation
bull(Utilisateur) cf cours Anne Boyer laquoAssistant Intelligentraquo
Le choix dun modegravele dagent
Agents cognitifs - Intelligence Artificielle Distribueacutee
agent = meacutetaphore psychologiquendash connaissance deacutecrite en termes drsquoeacutetats mentauxndash comportement intentionnel (buts et plans explicites)
systegraveme = meacutetaphore sociologique
Agents reacuteactifs - Vie Artificielle
agent = meacutetaphore animalendash connaissances reacuteduites agrave lrsquoassociation de stimuli et de reacuteponsesndash comportement dirigeacute par les perceptions
systegraveme = meacutetaphore socio-biologique
AgentsLagent (Ferber 95)
ndash entiteacute reacuteelle ou virtuelle plongeacutee dans un environnement sur lequel elle est capable dagir
ndash qui dispose dune capaciteacute de perception et de repreacutesentation partielle de cet environnement
ndash qui peut communiquer avec dautres agents
ndash qui est mue par un ensemble de tendances (objectifs individuels fonctions de satisfaction de survie)
ndash qui possegravede un comportement autonome tendant agrave satisfaire ses objectifs conseacutequence de ses observations de sa connaissance et des interactions quelle entretient avec les autres agents
ndash qui est capable eacuteventuellement de se reproduire
bull point de vue local imparfait incertainbull ressources limiteacuteesbull Adaptation amp Apprentissage Deacutependance aux autres amp Socialiteacute
Une Recherche de Compromis
Communication
AutonomyAdaptation
Il est autonome mais ouvert agrave la communication
Il est autonome mais ouvert agrave
ladaptation
Il sadapte mais cherche agrave produire
son point de vue
Modegraveles dAgents
Environnement
Perception Action
behaviour-based layer
localplanning layer
cooperativeplanning layer
Kn
ow
led
ge A
bst
ract
ion
hierarchical agentknowledge base
agent control unit
social models
mental models
world models
bull Agent purement situeacute ndash lenvironnement possegravede une meacutetrique ndash les agents sont situeacutes agrave une position dans lenvironnement
qui deacutetermine ce quils perccediloiventndash ils peuvent se deacuteplacerndash il ny a pas communications directes entre agents elle se
font via lenvironnement
bull Agent purement communiquant ndash il ny a pas denvironnement au sens physique du terme ndash les agents nont pas dancrage physique ndash ils communiquent via des informations qui circulent entre
les agents
Concept 1 Agent
Situeacute ou Communiquant
Cognitif ou Reacuteactif
bull Agent cognitif ndash repreacutesentation explicite de lenvironnement et des autres agentsndash peut tenir compte de son passeacute et dispose dun but explicitendash mode social dorganisation (planification engagement)ndash petit nombre dagents (1020) heacuteteacuterogegravenes agrave gros grain
bull Les relations entre agents seacutetablissent en fonction des collaborations neacutecessaires agrave la reacutesolution du problegraveme
bull Agent reacuteactifndash pas de repreacutesentation explicite de lenvironnementndash pas de meacutemoire de son histoire ni de but explicitendash comportement de type stimulus reacuteponsendash mode biologique dorganisationndash grand nombre dagents (gt100) homogegravenes agrave grain fin
bull La structure du systegraveme eacutemerge des comportements et non dune volonteacute dorganisation
Deacutefinir - Architecture interne -Degreacute de couplage de lrsquoagent agrave lrsquoenvironnement on peut consideacuterer plusieurs cateacutegories drsquoagent
Fort reacuteactif Comportement dirigeacute par les changements de lrsquoenvironnement
hybride
Faible deacutelibeacuteratif (cognitif) Comportement dirigeacute par les buts agrave satisfaire
Couplage agrave lrsquoenvironnement
ARCHITECTURES REACTIFS-COGNITIFS
Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)
Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs
3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute
(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions
2 caracteacuteristiques
bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de
regravegles situation rarraction
bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute
-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs
Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute
Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur
Exercice les robots explorateurs
Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure
suivante)
Dans le cadre de larchitecture agrave subsomption deacutefinir
- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions
Mecircme question pour un ensemble de robots coopeacuteratifs
Figure
Problegraveme
Reacuteponses modules comportementaux =
Explorer
Preacutelever
Aller agrave la base
Deacuteposer
Eacuteviter obstacle
Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)
regravegle 1 si deacutetecte un obstacle alors changer de direction
regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon
regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)
regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever
regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement
Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire
Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement
Architecture agrave subsomptions
Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction
regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5
Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption
Robots explorateurs de Mars (Steels89)
Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip
Exemple de regravegles pour robots coopeacuteratifs
poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par
regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques
radioactives et suivre gradient (retour)
=gt une nouvelle regravegle
regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient
(aller)
Hieacuterarchie des prioriteacutes de deacuteclenchement
La hieacuterarchie de comportements
regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5
regravegle6 gt regravegle 5
le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Le choix dune deacutecomposition
Etant donneacute un pb agrave reacutesoudre comment choisir les agents qui vontintervenir dans le systegraveme et comment leur reacutepartir la compeacutetence
Grand nombre de deacutecompositions possiblesndash objetndash spatialendash fonctionnellendash etc
Diffeacuterents grains possibles
ndash socieacuteteacutendash individundash organendash cellulendash atomendash
4
Point de vue Agent Organisation
IA connaissances et croyances
savoir-faire et intentions
communication
conflits et coheacuterence
controcircle et coordination
Vie Artificielle comportement
perception
adaptation
couplage agrave lenvironnement
influences et deacutependances
co-deacutetermination
individucollectif
Geacutenie Logiciel encapsulation
heacuteritage
distribution
ouverture
Les diffeacuterents concepts et composants drsquoun SMA
Problegraveme central de quel comportement doter les agents et comment les faire interagir entre eux et avec lrsquoenvironnement pour reacutepondre au laquoproblegravemeraquo poseacute Meacutethode laquoVoyelleraquo deacutefinir les composants drsquoun systegraveme multi-agents selon
bullAgents
bullEnvironnement
bullInteraction
bullOrganisation
bull(Utilisateur) cf cours Anne Boyer laquoAssistant Intelligentraquo
Le choix dun modegravele dagent
Agents cognitifs - Intelligence Artificielle Distribueacutee
agent = meacutetaphore psychologiquendash connaissance deacutecrite en termes drsquoeacutetats mentauxndash comportement intentionnel (buts et plans explicites)
systegraveme = meacutetaphore sociologique
Agents reacuteactifs - Vie Artificielle
agent = meacutetaphore animalendash connaissances reacuteduites agrave lrsquoassociation de stimuli et de reacuteponsesndash comportement dirigeacute par les perceptions
systegraveme = meacutetaphore socio-biologique
AgentsLagent (Ferber 95)
ndash entiteacute reacuteelle ou virtuelle plongeacutee dans un environnement sur lequel elle est capable dagir
ndash qui dispose dune capaciteacute de perception et de repreacutesentation partielle de cet environnement
ndash qui peut communiquer avec dautres agents
ndash qui est mue par un ensemble de tendances (objectifs individuels fonctions de satisfaction de survie)
ndash qui possegravede un comportement autonome tendant agrave satisfaire ses objectifs conseacutequence de ses observations de sa connaissance et des interactions quelle entretient avec les autres agents
ndash qui est capable eacuteventuellement de se reproduire
bull point de vue local imparfait incertainbull ressources limiteacuteesbull Adaptation amp Apprentissage Deacutependance aux autres amp Socialiteacute
Une Recherche de Compromis
Communication
AutonomyAdaptation
Il est autonome mais ouvert agrave la communication
Il est autonome mais ouvert agrave
ladaptation
Il sadapte mais cherche agrave produire
son point de vue
Modegraveles dAgents
Environnement
Perception Action
behaviour-based layer
localplanning layer
cooperativeplanning layer
Kn
ow
led
ge A
bst
ract
ion
hierarchical agentknowledge base
agent control unit
social models
mental models
world models
bull Agent purement situeacute ndash lenvironnement possegravede une meacutetrique ndash les agents sont situeacutes agrave une position dans lenvironnement
qui deacutetermine ce quils perccediloiventndash ils peuvent se deacuteplacerndash il ny a pas communications directes entre agents elle se
font via lenvironnement
bull Agent purement communiquant ndash il ny a pas denvironnement au sens physique du terme ndash les agents nont pas dancrage physique ndash ils communiquent via des informations qui circulent entre
les agents
Concept 1 Agent
Situeacute ou Communiquant
Cognitif ou Reacuteactif
bull Agent cognitif ndash repreacutesentation explicite de lenvironnement et des autres agentsndash peut tenir compte de son passeacute et dispose dun but explicitendash mode social dorganisation (planification engagement)ndash petit nombre dagents (1020) heacuteteacuterogegravenes agrave gros grain
bull Les relations entre agents seacutetablissent en fonction des collaborations neacutecessaires agrave la reacutesolution du problegraveme
bull Agent reacuteactifndash pas de repreacutesentation explicite de lenvironnementndash pas de meacutemoire de son histoire ni de but explicitendash comportement de type stimulus reacuteponsendash mode biologique dorganisationndash grand nombre dagents (gt100) homogegravenes agrave grain fin
bull La structure du systegraveme eacutemerge des comportements et non dune volonteacute dorganisation
Deacutefinir - Architecture interne -Degreacute de couplage de lrsquoagent agrave lrsquoenvironnement on peut consideacuterer plusieurs cateacutegories drsquoagent
Fort reacuteactif Comportement dirigeacute par les changements de lrsquoenvironnement
hybride
Faible deacutelibeacuteratif (cognitif) Comportement dirigeacute par les buts agrave satisfaire
Couplage agrave lrsquoenvironnement
ARCHITECTURES REACTIFS-COGNITIFS
Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)
Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs
3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute
(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions
2 caracteacuteristiques
bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de
regravegles situation rarraction
bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute
-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs
Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute
Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur
Exercice les robots explorateurs
Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure
suivante)
Dans le cadre de larchitecture agrave subsomption deacutefinir
- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions
Mecircme question pour un ensemble de robots coopeacuteratifs
Figure
Problegraveme
Reacuteponses modules comportementaux =
Explorer
Preacutelever
Aller agrave la base
Deacuteposer
Eacuteviter obstacle
Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)
regravegle 1 si deacutetecte un obstacle alors changer de direction
regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon
regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)
regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever
regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement
Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire
Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement
Architecture agrave subsomptions
Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction
regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5
Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption
Robots explorateurs de Mars (Steels89)
Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip
Exemple de regravegles pour robots coopeacuteratifs
poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par
regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques
radioactives et suivre gradient (retour)
=gt une nouvelle regravegle
regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient
(aller)
Hieacuterarchie des prioriteacutes de deacuteclenchement
La hieacuterarchie de comportements
regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5
regravegle6 gt regravegle 5
le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
4
Point de vue Agent Organisation
IA connaissances et croyances
savoir-faire et intentions
communication
conflits et coheacuterence
controcircle et coordination
Vie Artificielle comportement
perception
adaptation
couplage agrave lenvironnement
influences et deacutependances
co-deacutetermination
individucollectif
Geacutenie Logiciel encapsulation
heacuteritage
distribution
ouverture
Les diffeacuterents concepts et composants drsquoun SMA
Problegraveme central de quel comportement doter les agents et comment les faire interagir entre eux et avec lrsquoenvironnement pour reacutepondre au laquoproblegravemeraquo poseacute Meacutethode laquoVoyelleraquo deacutefinir les composants drsquoun systegraveme multi-agents selon
bullAgents
bullEnvironnement
bullInteraction
bullOrganisation
bull(Utilisateur) cf cours Anne Boyer laquoAssistant Intelligentraquo
Le choix dun modegravele dagent
Agents cognitifs - Intelligence Artificielle Distribueacutee
agent = meacutetaphore psychologiquendash connaissance deacutecrite en termes drsquoeacutetats mentauxndash comportement intentionnel (buts et plans explicites)
systegraveme = meacutetaphore sociologique
Agents reacuteactifs - Vie Artificielle
agent = meacutetaphore animalendash connaissances reacuteduites agrave lrsquoassociation de stimuli et de reacuteponsesndash comportement dirigeacute par les perceptions
systegraveme = meacutetaphore socio-biologique
AgentsLagent (Ferber 95)
ndash entiteacute reacuteelle ou virtuelle plongeacutee dans un environnement sur lequel elle est capable dagir
ndash qui dispose dune capaciteacute de perception et de repreacutesentation partielle de cet environnement
ndash qui peut communiquer avec dautres agents
ndash qui est mue par un ensemble de tendances (objectifs individuels fonctions de satisfaction de survie)
ndash qui possegravede un comportement autonome tendant agrave satisfaire ses objectifs conseacutequence de ses observations de sa connaissance et des interactions quelle entretient avec les autres agents
ndash qui est capable eacuteventuellement de se reproduire
bull point de vue local imparfait incertainbull ressources limiteacuteesbull Adaptation amp Apprentissage Deacutependance aux autres amp Socialiteacute
Une Recherche de Compromis
Communication
AutonomyAdaptation
Il est autonome mais ouvert agrave la communication
Il est autonome mais ouvert agrave
ladaptation
Il sadapte mais cherche agrave produire
son point de vue
Modegraveles dAgents
Environnement
Perception Action
behaviour-based layer
localplanning layer
cooperativeplanning layer
Kn
ow
led
ge A
bst
ract
ion
hierarchical agentknowledge base
agent control unit
social models
mental models
world models
bull Agent purement situeacute ndash lenvironnement possegravede une meacutetrique ndash les agents sont situeacutes agrave une position dans lenvironnement
qui deacutetermine ce quils perccediloiventndash ils peuvent se deacuteplacerndash il ny a pas communications directes entre agents elle se
font via lenvironnement
bull Agent purement communiquant ndash il ny a pas denvironnement au sens physique du terme ndash les agents nont pas dancrage physique ndash ils communiquent via des informations qui circulent entre
les agents
Concept 1 Agent
Situeacute ou Communiquant
Cognitif ou Reacuteactif
bull Agent cognitif ndash repreacutesentation explicite de lenvironnement et des autres agentsndash peut tenir compte de son passeacute et dispose dun but explicitendash mode social dorganisation (planification engagement)ndash petit nombre dagents (1020) heacuteteacuterogegravenes agrave gros grain
bull Les relations entre agents seacutetablissent en fonction des collaborations neacutecessaires agrave la reacutesolution du problegraveme
bull Agent reacuteactifndash pas de repreacutesentation explicite de lenvironnementndash pas de meacutemoire de son histoire ni de but explicitendash comportement de type stimulus reacuteponsendash mode biologique dorganisationndash grand nombre dagents (gt100) homogegravenes agrave grain fin
bull La structure du systegraveme eacutemerge des comportements et non dune volonteacute dorganisation
Deacutefinir - Architecture interne -Degreacute de couplage de lrsquoagent agrave lrsquoenvironnement on peut consideacuterer plusieurs cateacutegories drsquoagent
Fort reacuteactif Comportement dirigeacute par les changements de lrsquoenvironnement
hybride
Faible deacutelibeacuteratif (cognitif) Comportement dirigeacute par les buts agrave satisfaire
Couplage agrave lrsquoenvironnement
ARCHITECTURES REACTIFS-COGNITIFS
Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)
Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs
3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute
(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions
2 caracteacuteristiques
bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de
regravegles situation rarraction
bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute
-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs
Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute
Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur
Exercice les robots explorateurs
Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure
suivante)
Dans le cadre de larchitecture agrave subsomption deacutefinir
- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions
Mecircme question pour un ensemble de robots coopeacuteratifs
Figure
Problegraveme
Reacuteponses modules comportementaux =
Explorer
Preacutelever
Aller agrave la base
Deacuteposer
Eacuteviter obstacle
Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)
regravegle 1 si deacutetecte un obstacle alors changer de direction
regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon
regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)
regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever
regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement
Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire
Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement
Architecture agrave subsomptions
Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction
regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5
Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption
Robots explorateurs de Mars (Steels89)
Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip
Exemple de regravegles pour robots coopeacuteratifs
poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par
regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques
radioactives et suivre gradient (retour)
=gt une nouvelle regravegle
regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient
(aller)
Hieacuterarchie des prioriteacutes de deacuteclenchement
La hieacuterarchie de comportements
regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5
regravegle6 gt regravegle 5
le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Les diffeacuterents concepts et composants drsquoun SMA
Problegraveme central de quel comportement doter les agents et comment les faire interagir entre eux et avec lrsquoenvironnement pour reacutepondre au laquoproblegravemeraquo poseacute Meacutethode laquoVoyelleraquo deacutefinir les composants drsquoun systegraveme multi-agents selon
bullAgents
bullEnvironnement
bullInteraction
bullOrganisation
bull(Utilisateur) cf cours Anne Boyer laquoAssistant Intelligentraquo
Le choix dun modegravele dagent
Agents cognitifs - Intelligence Artificielle Distribueacutee
agent = meacutetaphore psychologiquendash connaissance deacutecrite en termes drsquoeacutetats mentauxndash comportement intentionnel (buts et plans explicites)
systegraveme = meacutetaphore sociologique
Agents reacuteactifs - Vie Artificielle
agent = meacutetaphore animalendash connaissances reacuteduites agrave lrsquoassociation de stimuli et de reacuteponsesndash comportement dirigeacute par les perceptions
systegraveme = meacutetaphore socio-biologique
AgentsLagent (Ferber 95)
ndash entiteacute reacuteelle ou virtuelle plongeacutee dans un environnement sur lequel elle est capable dagir
ndash qui dispose dune capaciteacute de perception et de repreacutesentation partielle de cet environnement
ndash qui peut communiquer avec dautres agents
ndash qui est mue par un ensemble de tendances (objectifs individuels fonctions de satisfaction de survie)
ndash qui possegravede un comportement autonome tendant agrave satisfaire ses objectifs conseacutequence de ses observations de sa connaissance et des interactions quelle entretient avec les autres agents
ndash qui est capable eacuteventuellement de se reproduire
bull point de vue local imparfait incertainbull ressources limiteacuteesbull Adaptation amp Apprentissage Deacutependance aux autres amp Socialiteacute
Une Recherche de Compromis
Communication
AutonomyAdaptation
Il est autonome mais ouvert agrave la communication
Il est autonome mais ouvert agrave
ladaptation
Il sadapte mais cherche agrave produire
son point de vue
Modegraveles dAgents
Environnement
Perception Action
behaviour-based layer
localplanning layer
cooperativeplanning layer
Kn
ow
led
ge A
bst
ract
ion
hierarchical agentknowledge base
agent control unit
social models
mental models
world models
bull Agent purement situeacute ndash lenvironnement possegravede une meacutetrique ndash les agents sont situeacutes agrave une position dans lenvironnement
qui deacutetermine ce quils perccediloiventndash ils peuvent se deacuteplacerndash il ny a pas communications directes entre agents elle se
font via lenvironnement
bull Agent purement communiquant ndash il ny a pas denvironnement au sens physique du terme ndash les agents nont pas dancrage physique ndash ils communiquent via des informations qui circulent entre
les agents
Concept 1 Agent
Situeacute ou Communiquant
Cognitif ou Reacuteactif
bull Agent cognitif ndash repreacutesentation explicite de lenvironnement et des autres agentsndash peut tenir compte de son passeacute et dispose dun but explicitendash mode social dorganisation (planification engagement)ndash petit nombre dagents (1020) heacuteteacuterogegravenes agrave gros grain
bull Les relations entre agents seacutetablissent en fonction des collaborations neacutecessaires agrave la reacutesolution du problegraveme
bull Agent reacuteactifndash pas de repreacutesentation explicite de lenvironnementndash pas de meacutemoire de son histoire ni de but explicitendash comportement de type stimulus reacuteponsendash mode biologique dorganisationndash grand nombre dagents (gt100) homogegravenes agrave grain fin
bull La structure du systegraveme eacutemerge des comportements et non dune volonteacute dorganisation
Deacutefinir - Architecture interne -Degreacute de couplage de lrsquoagent agrave lrsquoenvironnement on peut consideacuterer plusieurs cateacutegories drsquoagent
Fort reacuteactif Comportement dirigeacute par les changements de lrsquoenvironnement
hybride
Faible deacutelibeacuteratif (cognitif) Comportement dirigeacute par les buts agrave satisfaire
Couplage agrave lrsquoenvironnement
ARCHITECTURES REACTIFS-COGNITIFS
Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)
Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs
3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute
(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions
2 caracteacuteristiques
bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de
regravegles situation rarraction
bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute
-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs
Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute
Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur
Exercice les robots explorateurs
Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure
suivante)
Dans le cadre de larchitecture agrave subsomption deacutefinir
- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions
Mecircme question pour un ensemble de robots coopeacuteratifs
Figure
Problegraveme
Reacuteponses modules comportementaux =
Explorer
Preacutelever
Aller agrave la base
Deacuteposer
Eacuteviter obstacle
Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)
regravegle 1 si deacutetecte un obstacle alors changer de direction
regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon
regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)
regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever
regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement
Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire
Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement
Architecture agrave subsomptions
Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction
regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5
Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption
Robots explorateurs de Mars (Steels89)
Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip
Exemple de regravegles pour robots coopeacuteratifs
poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par
regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques
radioactives et suivre gradient (retour)
=gt une nouvelle regravegle
regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient
(aller)
Hieacuterarchie des prioriteacutes de deacuteclenchement
La hieacuterarchie de comportements
regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5
regravegle6 gt regravegle 5
le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Le choix dun modegravele dagent
Agents cognitifs - Intelligence Artificielle Distribueacutee
agent = meacutetaphore psychologiquendash connaissance deacutecrite en termes drsquoeacutetats mentauxndash comportement intentionnel (buts et plans explicites)
systegraveme = meacutetaphore sociologique
Agents reacuteactifs - Vie Artificielle
agent = meacutetaphore animalendash connaissances reacuteduites agrave lrsquoassociation de stimuli et de reacuteponsesndash comportement dirigeacute par les perceptions
systegraveme = meacutetaphore socio-biologique
AgentsLagent (Ferber 95)
ndash entiteacute reacuteelle ou virtuelle plongeacutee dans un environnement sur lequel elle est capable dagir
ndash qui dispose dune capaciteacute de perception et de repreacutesentation partielle de cet environnement
ndash qui peut communiquer avec dautres agents
ndash qui est mue par un ensemble de tendances (objectifs individuels fonctions de satisfaction de survie)
ndash qui possegravede un comportement autonome tendant agrave satisfaire ses objectifs conseacutequence de ses observations de sa connaissance et des interactions quelle entretient avec les autres agents
ndash qui est capable eacuteventuellement de se reproduire
bull point de vue local imparfait incertainbull ressources limiteacuteesbull Adaptation amp Apprentissage Deacutependance aux autres amp Socialiteacute
Une Recherche de Compromis
Communication
AutonomyAdaptation
Il est autonome mais ouvert agrave la communication
Il est autonome mais ouvert agrave
ladaptation
Il sadapte mais cherche agrave produire
son point de vue
Modegraveles dAgents
Environnement
Perception Action
behaviour-based layer
localplanning layer
cooperativeplanning layer
Kn
ow
led
ge A
bst
ract
ion
hierarchical agentknowledge base
agent control unit
social models
mental models
world models
bull Agent purement situeacute ndash lenvironnement possegravede une meacutetrique ndash les agents sont situeacutes agrave une position dans lenvironnement
qui deacutetermine ce quils perccediloiventndash ils peuvent se deacuteplacerndash il ny a pas communications directes entre agents elle se
font via lenvironnement
bull Agent purement communiquant ndash il ny a pas denvironnement au sens physique du terme ndash les agents nont pas dancrage physique ndash ils communiquent via des informations qui circulent entre
les agents
Concept 1 Agent
Situeacute ou Communiquant
Cognitif ou Reacuteactif
bull Agent cognitif ndash repreacutesentation explicite de lenvironnement et des autres agentsndash peut tenir compte de son passeacute et dispose dun but explicitendash mode social dorganisation (planification engagement)ndash petit nombre dagents (1020) heacuteteacuterogegravenes agrave gros grain
bull Les relations entre agents seacutetablissent en fonction des collaborations neacutecessaires agrave la reacutesolution du problegraveme
bull Agent reacuteactifndash pas de repreacutesentation explicite de lenvironnementndash pas de meacutemoire de son histoire ni de but explicitendash comportement de type stimulus reacuteponsendash mode biologique dorganisationndash grand nombre dagents (gt100) homogegravenes agrave grain fin
bull La structure du systegraveme eacutemerge des comportements et non dune volonteacute dorganisation
Deacutefinir - Architecture interne -Degreacute de couplage de lrsquoagent agrave lrsquoenvironnement on peut consideacuterer plusieurs cateacutegories drsquoagent
Fort reacuteactif Comportement dirigeacute par les changements de lrsquoenvironnement
hybride
Faible deacutelibeacuteratif (cognitif) Comportement dirigeacute par les buts agrave satisfaire
Couplage agrave lrsquoenvironnement
ARCHITECTURES REACTIFS-COGNITIFS
Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)
Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs
3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute
(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions
2 caracteacuteristiques
bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de
regravegles situation rarraction
bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute
-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs
Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute
Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur
Exercice les robots explorateurs
Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure
suivante)
Dans le cadre de larchitecture agrave subsomption deacutefinir
- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions
Mecircme question pour un ensemble de robots coopeacuteratifs
Figure
Problegraveme
Reacuteponses modules comportementaux =
Explorer
Preacutelever
Aller agrave la base
Deacuteposer
Eacuteviter obstacle
Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)
regravegle 1 si deacutetecte un obstacle alors changer de direction
regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon
regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)
regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever
regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement
Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire
Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement
Architecture agrave subsomptions
Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction
regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5
Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption
Robots explorateurs de Mars (Steels89)
Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip
Exemple de regravegles pour robots coopeacuteratifs
poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par
regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques
radioactives et suivre gradient (retour)
=gt une nouvelle regravegle
regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient
(aller)
Hieacuterarchie des prioriteacutes de deacuteclenchement
La hieacuterarchie de comportements
regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5
regravegle6 gt regravegle 5
le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
AgentsLagent (Ferber 95)
ndash entiteacute reacuteelle ou virtuelle plongeacutee dans un environnement sur lequel elle est capable dagir
ndash qui dispose dune capaciteacute de perception et de repreacutesentation partielle de cet environnement
ndash qui peut communiquer avec dautres agents
ndash qui est mue par un ensemble de tendances (objectifs individuels fonctions de satisfaction de survie)
ndash qui possegravede un comportement autonome tendant agrave satisfaire ses objectifs conseacutequence de ses observations de sa connaissance et des interactions quelle entretient avec les autres agents
ndash qui est capable eacuteventuellement de se reproduire
bull point de vue local imparfait incertainbull ressources limiteacuteesbull Adaptation amp Apprentissage Deacutependance aux autres amp Socialiteacute
Une Recherche de Compromis
Communication
AutonomyAdaptation
Il est autonome mais ouvert agrave la communication
Il est autonome mais ouvert agrave
ladaptation
Il sadapte mais cherche agrave produire
son point de vue
Modegraveles dAgents
Environnement
Perception Action
behaviour-based layer
localplanning layer
cooperativeplanning layer
Kn
ow
led
ge A
bst
ract
ion
hierarchical agentknowledge base
agent control unit
social models
mental models
world models
bull Agent purement situeacute ndash lenvironnement possegravede une meacutetrique ndash les agents sont situeacutes agrave une position dans lenvironnement
qui deacutetermine ce quils perccediloiventndash ils peuvent se deacuteplacerndash il ny a pas communications directes entre agents elle se
font via lenvironnement
bull Agent purement communiquant ndash il ny a pas denvironnement au sens physique du terme ndash les agents nont pas dancrage physique ndash ils communiquent via des informations qui circulent entre
les agents
Concept 1 Agent
Situeacute ou Communiquant
Cognitif ou Reacuteactif
bull Agent cognitif ndash repreacutesentation explicite de lenvironnement et des autres agentsndash peut tenir compte de son passeacute et dispose dun but explicitendash mode social dorganisation (planification engagement)ndash petit nombre dagents (1020) heacuteteacuterogegravenes agrave gros grain
bull Les relations entre agents seacutetablissent en fonction des collaborations neacutecessaires agrave la reacutesolution du problegraveme
bull Agent reacuteactifndash pas de repreacutesentation explicite de lenvironnementndash pas de meacutemoire de son histoire ni de but explicitendash comportement de type stimulus reacuteponsendash mode biologique dorganisationndash grand nombre dagents (gt100) homogegravenes agrave grain fin
bull La structure du systegraveme eacutemerge des comportements et non dune volonteacute dorganisation
Deacutefinir - Architecture interne -Degreacute de couplage de lrsquoagent agrave lrsquoenvironnement on peut consideacuterer plusieurs cateacutegories drsquoagent
Fort reacuteactif Comportement dirigeacute par les changements de lrsquoenvironnement
hybride
Faible deacutelibeacuteratif (cognitif) Comportement dirigeacute par les buts agrave satisfaire
Couplage agrave lrsquoenvironnement
ARCHITECTURES REACTIFS-COGNITIFS
Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)
Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs
3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute
(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions
2 caracteacuteristiques
bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de
regravegles situation rarraction
bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute
-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs
Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute
Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur
Exercice les robots explorateurs
Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure
suivante)
Dans le cadre de larchitecture agrave subsomption deacutefinir
- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions
Mecircme question pour un ensemble de robots coopeacuteratifs
Figure
Problegraveme
Reacuteponses modules comportementaux =
Explorer
Preacutelever
Aller agrave la base
Deacuteposer
Eacuteviter obstacle
Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)
regravegle 1 si deacutetecte un obstacle alors changer de direction
regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon
regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)
regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever
regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement
Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire
Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement
Architecture agrave subsomptions
Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction
regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5
Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption
Robots explorateurs de Mars (Steels89)
Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip
Exemple de regravegles pour robots coopeacuteratifs
poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par
regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques
radioactives et suivre gradient (retour)
=gt une nouvelle regravegle
regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient
(aller)
Hieacuterarchie des prioriteacutes de deacuteclenchement
La hieacuterarchie de comportements
regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5
regravegle6 gt regravegle 5
le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Une Recherche de Compromis
Communication
AutonomyAdaptation
Il est autonome mais ouvert agrave la communication
Il est autonome mais ouvert agrave
ladaptation
Il sadapte mais cherche agrave produire
son point de vue
Modegraveles dAgents
Environnement
Perception Action
behaviour-based layer
localplanning layer
cooperativeplanning layer
Kn
ow
led
ge A
bst
ract
ion
hierarchical agentknowledge base
agent control unit
social models
mental models
world models
bull Agent purement situeacute ndash lenvironnement possegravede une meacutetrique ndash les agents sont situeacutes agrave une position dans lenvironnement
qui deacutetermine ce quils perccediloiventndash ils peuvent se deacuteplacerndash il ny a pas communications directes entre agents elle se
font via lenvironnement
bull Agent purement communiquant ndash il ny a pas denvironnement au sens physique du terme ndash les agents nont pas dancrage physique ndash ils communiquent via des informations qui circulent entre
les agents
Concept 1 Agent
Situeacute ou Communiquant
Cognitif ou Reacuteactif
bull Agent cognitif ndash repreacutesentation explicite de lenvironnement et des autres agentsndash peut tenir compte de son passeacute et dispose dun but explicitendash mode social dorganisation (planification engagement)ndash petit nombre dagents (1020) heacuteteacuterogegravenes agrave gros grain
bull Les relations entre agents seacutetablissent en fonction des collaborations neacutecessaires agrave la reacutesolution du problegraveme
bull Agent reacuteactifndash pas de repreacutesentation explicite de lenvironnementndash pas de meacutemoire de son histoire ni de but explicitendash comportement de type stimulus reacuteponsendash mode biologique dorganisationndash grand nombre dagents (gt100) homogegravenes agrave grain fin
bull La structure du systegraveme eacutemerge des comportements et non dune volonteacute dorganisation
Deacutefinir - Architecture interne -Degreacute de couplage de lrsquoagent agrave lrsquoenvironnement on peut consideacuterer plusieurs cateacutegories drsquoagent
Fort reacuteactif Comportement dirigeacute par les changements de lrsquoenvironnement
hybride
Faible deacutelibeacuteratif (cognitif) Comportement dirigeacute par les buts agrave satisfaire
Couplage agrave lrsquoenvironnement
ARCHITECTURES REACTIFS-COGNITIFS
Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)
Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs
3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute
(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions
2 caracteacuteristiques
bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de
regravegles situation rarraction
bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute
-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs
Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute
Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur
Exercice les robots explorateurs
Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure
suivante)
Dans le cadre de larchitecture agrave subsomption deacutefinir
- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions
Mecircme question pour un ensemble de robots coopeacuteratifs
Figure
Problegraveme
Reacuteponses modules comportementaux =
Explorer
Preacutelever
Aller agrave la base
Deacuteposer
Eacuteviter obstacle
Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)
regravegle 1 si deacutetecte un obstacle alors changer de direction
regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon
regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)
regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever
regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement
Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire
Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement
Architecture agrave subsomptions
Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction
regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5
Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption
Robots explorateurs de Mars (Steels89)
Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip
Exemple de regravegles pour robots coopeacuteratifs
poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par
regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques
radioactives et suivre gradient (retour)
=gt une nouvelle regravegle
regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient
(aller)
Hieacuterarchie des prioriteacutes de deacuteclenchement
La hieacuterarchie de comportements
regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5
regravegle6 gt regravegle 5
le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Modegraveles dAgents
Environnement
Perception Action
behaviour-based layer
localplanning layer
cooperativeplanning layer
Kn
ow
led
ge A
bst
ract
ion
hierarchical agentknowledge base
agent control unit
social models
mental models
world models
bull Agent purement situeacute ndash lenvironnement possegravede une meacutetrique ndash les agents sont situeacutes agrave une position dans lenvironnement
qui deacutetermine ce quils perccediloiventndash ils peuvent se deacuteplacerndash il ny a pas communications directes entre agents elle se
font via lenvironnement
bull Agent purement communiquant ndash il ny a pas denvironnement au sens physique du terme ndash les agents nont pas dancrage physique ndash ils communiquent via des informations qui circulent entre
les agents
Concept 1 Agent
Situeacute ou Communiquant
Cognitif ou Reacuteactif
bull Agent cognitif ndash repreacutesentation explicite de lenvironnement et des autres agentsndash peut tenir compte de son passeacute et dispose dun but explicitendash mode social dorganisation (planification engagement)ndash petit nombre dagents (1020) heacuteteacuterogegravenes agrave gros grain
bull Les relations entre agents seacutetablissent en fonction des collaborations neacutecessaires agrave la reacutesolution du problegraveme
bull Agent reacuteactifndash pas de repreacutesentation explicite de lenvironnementndash pas de meacutemoire de son histoire ni de but explicitendash comportement de type stimulus reacuteponsendash mode biologique dorganisationndash grand nombre dagents (gt100) homogegravenes agrave grain fin
bull La structure du systegraveme eacutemerge des comportements et non dune volonteacute dorganisation
Deacutefinir - Architecture interne -Degreacute de couplage de lrsquoagent agrave lrsquoenvironnement on peut consideacuterer plusieurs cateacutegories drsquoagent
Fort reacuteactif Comportement dirigeacute par les changements de lrsquoenvironnement
hybride
Faible deacutelibeacuteratif (cognitif) Comportement dirigeacute par les buts agrave satisfaire
Couplage agrave lrsquoenvironnement
ARCHITECTURES REACTIFS-COGNITIFS
Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)
Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs
3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute
(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions
2 caracteacuteristiques
bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de
regravegles situation rarraction
bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute
-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs
Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute
Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur
Exercice les robots explorateurs
Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure
suivante)
Dans le cadre de larchitecture agrave subsomption deacutefinir
- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions
Mecircme question pour un ensemble de robots coopeacuteratifs
Figure
Problegraveme
Reacuteponses modules comportementaux =
Explorer
Preacutelever
Aller agrave la base
Deacuteposer
Eacuteviter obstacle
Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)
regravegle 1 si deacutetecte un obstacle alors changer de direction
regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon
regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)
regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever
regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement
Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire
Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement
Architecture agrave subsomptions
Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction
regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5
Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption
Robots explorateurs de Mars (Steels89)
Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip
Exemple de regravegles pour robots coopeacuteratifs
poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par
regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques
radioactives et suivre gradient (retour)
=gt une nouvelle regravegle
regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient
(aller)
Hieacuterarchie des prioriteacutes de deacuteclenchement
La hieacuterarchie de comportements
regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5
regravegle6 gt regravegle 5
le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
bull Agent purement situeacute ndash lenvironnement possegravede une meacutetrique ndash les agents sont situeacutes agrave une position dans lenvironnement
qui deacutetermine ce quils perccediloiventndash ils peuvent se deacuteplacerndash il ny a pas communications directes entre agents elle se
font via lenvironnement
bull Agent purement communiquant ndash il ny a pas denvironnement au sens physique du terme ndash les agents nont pas dancrage physique ndash ils communiquent via des informations qui circulent entre
les agents
Concept 1 Agent
Situeacute ou Communiquant
Cognitif ou Reacuteactif
bull Agent cognitif ndash repreacutesentation explicite de lenvironnement et des autres agentsndash peut tenir compte de son passeacute et dispose dun but explicitendash mode social dorganisation (planification engagement)ndash petit nombre dagents (1020) heacuteteacuterogegravenes agrave gros grain
bull Les relations entre agents seacutetablissent en fonction des collaborations neacutecessaires agrave la reacutesolution du problegraveme
bull Agent reacuteactifndash pas de repreacutesentation explicite de lenvironnementndash pas de meacutemoire de son histoire ni de but explicitendash comportement de type stimulus reacuteponsendash mode biologique dorganisationndash grand nombre dagents (gt100) homogegravenes agrave grain fin
bull La structure du systegraveme eacutemerge des comportements et non dune volonteacute dorganisation
Deacutefinir - Architecture interne -Degreacute de couplage de lrsquoagent agrave lrsquoenvironnement on peut consideacuterer plusieurs cateacutegories drsquoagent
Fort reacuteactif Comportement dirigeacute par les changements de lrsquoenvironnement
hybride
Faible deacutelibeacuteratif (cognitif) Comportement dirigeacute par les buts agrave satisfaire
Couplage agrave lrsquoenvironnement
ARCHITECTURES REACTIFS-COGNITIFS
Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)
Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs
3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute
(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions
2 caracteacuteristiques
bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de
regravegles situation rarraction
bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute
-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs
Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute
Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur
Exercice les robots explorateurs
Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure
suivante)
Dans le cadre de larchitecture agrave subsomption deacutefinir
- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions
Mecircme question pour un ensemble de robots coopeacuteratifs
Figure
Problegraveme
Reacuteponses modules comportementaux =
Explorer
Preacutelever
Aller agrave la base
Deacuteposer
Eacuteviter obstacle
Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)
regravegle 1 si deacutetecte un obstacle alors changer de direction
regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon
regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)
regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever
regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement
Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire
Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement
Architecture agrave subsomptions
Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction
regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5
Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption
Robots explorateurs de Mars (Steels89)
Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip
Exemple de regravegles pour robots coopeacuteratifs
poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par
regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques
radioactives et suivre gradient (retour)
=gt une nouvelle regravegle
regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient
(aller)
Hieacuterarchie des prioriteacutes de deacuteclenchement
La hieacuterarchie de comportements
regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5
regravegle6 gt regravegle 5
le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Cognitif ou Reacuteactif
bull Agent cognitif ndash repreacutesentation explicite de lenvironnement et des autres agentsndash peut tenir compte de son passeacute et dispose dun but explicitendash mode social dorganisation (planification engagement)ndash petit nombre dagents (1020) heacuteteacuterogegravenes agrave gros grain
bull Les relations entre agents seacutetablissent en fonction des collaborations neacutecessaires agrave la reacutesolution du problegraveme
bull Agent reacuteactifndash pas de repreacutesentation explicite de lenvironnementndash pas de meacutemoire de son histoire ni de but explicitendash comportement de type stimulus reacuteponsendash mode biologique dorganisationndash grand nombre dagents (gt100) homogegravenes agrave grain fin
bull La structure du systegraveme eacutemerge des comportements et non dune volonteacute dorganisation
Deacutefinir - Architecture interne -Degreacute de couplage de lrsquoagent agrave lrsquoenvironnement on peut consideacuterer plusieurs cateacutegories drsquoagent
Fort reacuteactif Comportement dirigeacute par les changements de lrsquoenvironnement
hybride
Faible deacutelibeacuteratif (cognitif) Comportement dirigeacute par les buts agrave satisfaire
Couplage agrave lrsquoenvironnement
ARCHITECTURES REACTIFS-COGNITIFS
Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)
Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs
3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute
(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions
2 caracteacuteristiques
bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de
regravegles situation rarraction
bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute
-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs
Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute
Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur
Exercice les robots explorateurs
Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure
suivante)
Dans le cadre de larchitecture agrave subsomption deacutefinir
- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions
Mecircme question pour un ensemble de robots coopeacuteratifs
Figure
Problegraveme
Reacuteponses modules comportementaux =
Explorer
Preacutelever
Aller agrave la base
Deacuteposer
Eacuteviter obstacle
Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)
regravegle 1 si deacutetecte un obstacle alors changer de direction
regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon
regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)
regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever
regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement
Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire
Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement
Architecture agrave subsomptions
Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction
regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5
Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption
Robots explorateurs de Mars (Steels89)
Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip
Exemple de regravegles pour robots coopeacuteratifs
poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par
regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques
radioactives et suivre gradient (retour)
=gt une nouvelle regravegle
regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient
(aller)
Hieacuterarchie des prioriteacutes de deacuteclenchement
La hieacuterarchie de comportements
regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5
regravegle6 gt regravegle 5
le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Deacutefinir - Architecture interne -Degreacute de couplage de lrsquoagent agrave lrsquoenvironnement on peut consideacuterer plusieurs cateacutegories drsquoagent
Fort reacuteactif Comportement dirigeacute par les changements de lrsquoenvironnement
hybride
Faible deacutelibeacuteratif (cognitif) Comportement dirigeacute par les buts agrave satisfaire
Couplage agrave lrsquoenvironnement
ARCHITECTURES REACTIFS-COGNITIFS
Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)
Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs
3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute
(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions
2 caracteacuteristiques
bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de
regravegles situation rarraction
bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute
-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs
Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute
Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur
Exercice les robots explorateurs
Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure
suivante)
Dans le cadre de larchitecture agrave subsomption deacutefinir
- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions
Mecircme question pour un ensemble de robots coopeacuteratifs
Figure
Problegraveme
Reacuteponses modules comportementaux =
Explorer
Preacutelever
Aller agrave la base
Deacuteposer
Eacuteviter obstacle
Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)
regravegle 1 si deacutetecte un obstacle alors changer de direction
regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon
regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)
regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever
regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement
Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire
Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement
Architecture agrave subsomptions
Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction
regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5
Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption
Robots explorateurs de Mars (Steels89)
Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip
Exemple de regravegles pour robots coopeacuteratifs
poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par
regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques
radioactives et suivre gradient (retour)
=gt une nouvelle regravegle
regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient
(aller)
Hieacuterarchie des prioriteacutes de deacuteclenchement
La hieacuterarchie de comportements
regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5
regravegle6 gt regravegle 5
le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
ARCHITECTURES REACTIFS-COGNITIFS
Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)
Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs
3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute
(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions
2 caracteacuteristiques
bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de
regravegles situation rarraction
bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute
-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs
Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute
Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur
Exercice les robots explorateurs
Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure
suivante)
Dans le cadre de larchitecture agrave subsomption deacutefinir
- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions
Mecircme question pour un ensemble de robots coopeacuteratifs
Figure
Problegraveme
Reacuteponses modules comportementaux =
Explorer
Preacutelever
Aller agrave la base
Deacuteposer
Eacuteviter obstacle
Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)
regravegle 1 si deacutetecte un obstacle alors changer de direction
regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon
regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)
regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever
regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement
Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire
Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement
Architecture agrave subsomptions
Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction
regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5
Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption
Robots explorateurs de Mars (Steels89)
Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip
Exemple de regravegles pour robots coopeacuteratifs
poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par
regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques
radioactives et suivre gradient (retour)
=gt une nouvelle regravegle
regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient
(aller)
Hieacuterarchie des prioriteacutes de deacuteclenchement
La hieacuterarchie de comportements
regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5
regravegle6 gt regravegle 5
le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)
Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs
3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute
(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)
(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions
2 caracteacuteristiques
bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de
regravegles situation rarraction
bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute
-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs
Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute
Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur
Exercice les robots explorateurs
Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure
suivante)
Dans le cadre de larchitecture agrave subsomption deacutefinir
- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions
Mecircme question pour un ensemble de robots coopeacuteratifs
Figure
Problegraveme
Reacuteponses modules comportementaux =
Explorer
Preacutelever
Aller agrave la base
Deacuteposer
Eacuteviter obstacle
Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)
regravegle 1 si deacutetecte un obstacle alors changer de direction
regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon
regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)
regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever
regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement
Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire
Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement
Architecture agrave subsomptions
Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction
regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5
Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption
Robots explorateurs de Mars (Steels89)
Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip
Exemple de regravegles pour robots coopeacuteratifs
poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par
regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques
radioactives et suivre gradient (retour)
=gt une nouvelle regravegle
regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient
(aller)
Hieacuterarchie des prioriteacutes de deacuteclenchement
La hieacuterarchie de comportements
regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5
regravegle6 gt regravegle 5
le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
2 caracteacuteristiques
bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de
regravegles situation rarraction
bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute
-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs
Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute
Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur
Exercice les robots explorateurs
Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure
suivante)
Dans le cadre de larchitecture agrave subsomption deacutefinir
- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions
Mecircme question pour un ensemble de robots coopeacuteratifs
Figure
Problegraveme
Reacuteponses modules comportementaux =
Explorer
Preacutelever
Aller agrave la base
Deacuteposer
Eacuteviter obstacle
Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)
regravegle 1 si deacutetecte un obstacle alors changer de direction
regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon
regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)
regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever
regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement
Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire
Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement
Architecture agrave subsomptions
Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction
regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5
Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption
Robots explorateurs de Mars (Steels89)
Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip
Exemple de regravegles pour robots coopeacuteratifs
poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par
regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques
radioactives et suivre gradient (retour)
=gt une nouvelle regravegle
regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient
(aller)
Hieacuterarchie des prioriteacutes de deacuteclenchement
La hieacuterarchie de comportements
regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5
regravegle6 gt regravegle 5
le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute
Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur
Exercice les robots explorateurs
Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure
suivante)
Dans le cadre de larchitecture agrave subsomption deacutefinir
- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions
Mecircme question pour un ensemble de robots coopeacuteratifs
Figure
Problegraveme
Reacuteponses modules comportementaux =
Explorer
Preacutelever
Aller agrave la base
Deacuteposer
Eacuteviter obstacle
Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)
regravegle 1 si deacutetecte un obstacle alors changer de direction
regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon
regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)
regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever
regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement
Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire
Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement
Architecture agrave subsomptions
Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction
regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5
Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption
Robots explorateurs de Mars (Steels89)
Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip
Exemple de regravegles pour robots coopeacuteratifs
poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par
regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques
radioactives et suivre gradient (retour)
=gt une nouvelle regravegle
regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient
(aller)
Hieacuterarchie des prioriteacutes de deacuteclenchement
La hieacuterarchie de comportements
regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5
regravegle6 gt regravegle 5
le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Exercice les robots explorateurs
Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure
suivante)
Dans le cadre de larchitecture agrave subsomption deacutefinir
- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions
Mecircme question pour un ensemble de robots coopeacuteratifs
Figure
Problegraveme
Reacuteponses modules comportementaux =
Explorer
Preacutelever
Aller agrave la base
Deacuteposer
Eacuteviter obstacle
Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)
regravegle 1 si deacutetecte un obstacle alors changer de direction
regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon
regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)
regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever
regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement
Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire
Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement
Architecture agrave subsomptions
Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction
regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5
Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption
Robots explorateurs de Mars (Steels89)
Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip
Exemple de regravegles pour robots coopeacuteratifs
poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par
regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques
radioactives et suivre gradient (retour)
=gt une nouvelle regravegle
regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient
(aller)
Hieacuterarchie des prioriteacutes de deacuteclenchement
La hieacuterarchie de comportements
regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5
regravegle6 gt regravegle 5
le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Figure
Problegraveme
Reacuteponses modules comportementaux =
Explorer
Preacutelever
Aller agrave la base
Deacuteposer
Eacuteviter obstacle
Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)
regravegle 1 si deacutetecte un obstacle alors changer de direction
regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon
regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)
regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever
regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement
Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire
Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement
Architecture agrave subsomptions
Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction
regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5
Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption
Robots explorateurs de Mars (Steels89)
Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip
Exemple de regravegles pour robots coopeacuteratifs
poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par
regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques
radioactives et suivre gradient (retour)
=gt une nouvelle regravegle
regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient
(aller)
Hieacuterarchie des prioriteacutes de deacuteclenchement
La hieacuterarchie de comportements
regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5
regravegle6 gt regravegle 5
le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Reacuteponses modules comportementaux =
Explorer
Preacutelever
Aller agrave la base
Deacuteposer
Eacuteviter obstacle
Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)
regravegle 1 si deacutetecte un obstacle alors changer de direction
regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon
regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)
regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever
regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement
Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire
Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement
Architecture agrave subsomptions
Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction
regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5
Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption
Robots explorateurs de Mars (Steels89)
Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip
Exemple de regravegles pour robots coopeacuteratifs
poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par
regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques
radioactives et suivre gradient (retour)
=gt une nouvelle regravegle
regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient
(aller)
Hieacuterarchie des prioriteacutes de deacuteclenchement
La hieacuterarchie de comportements
regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5
regravegle6 gt regravegle 5
le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)
regravegle 1 si deacutetecte un obstacle alors changer de direction
regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon
regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)
regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever
regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement
Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire
Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement
Architecture agrave subsomptions
Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction
regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5
Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption
Robots explorateurs de Mars (Steels89)
Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip
Exemple de regravegles pour robots coopeacuteratifs
poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par
regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques
radioactives et suivre gradient (retour)
=gt une nouvelle regravegle
regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient
(aller)
Hieacuterarchie des prioriteacutes de deacuteclenchement
La hieacuterarchie de comportements
regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5
regravegle6 gt regravegle 5
le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Architecture agrave subsomptions
Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction
regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5
Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption
Robots explorateurs de Mars (Steels89)
Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip
Exemple de regravegles pour robots coopeacuteratifs
poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par
regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques
radioactives et suivre gradient (retour)
=gt une nouvelle regravegle
regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient
(aller)
Hieacuterarchie des prioriteacutes de deacuteclenchement
La hieacuterarchie de comportements
regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5
regravegle6 gt regravegle 5
le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption
Robots explorateurs de Mars (Steels89)
Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip
Exemple de regravegles pour robots coopeacuteratifs
poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par
regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques
radioactives et suivre gradient (retour)
=gt une nouvelle regravegle
regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient
(aller)
Hieacuterarchie des prioriteacutes de deacuteclenchement
La hieacuterarchie de comportements
regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5
regravegle6 gt regravegle 5
le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Exemple de regravegles pour robots coopeacuteratifs
poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par
regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques
radioactives et suivre gradient (retour)
=gt une nouvelle regravegle
regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient
(aller)
Hieacuterarchie des prioriteacutes de deacuteclenchement
La hieacuterarchie de comportements
regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5
regravegle6 gt regravegle 5
le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
La hieacuterarchie de comportements
regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5
regravegle6 gt regravegle 5
le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Avec pose des marques ( Coopeacuteration)
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement
Autres Architectures
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif
Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes
Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer
Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)
Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions
Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle
bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents
bull Forte redondance des actions de base (flee-from-) en cas de
comportements similaires
bull Difficile agrave concevoir et agrave tester
ndash multipliciteacute des liens
ndash dynamique importante
bull Bonne ouverture agrave lapprentissagendash renforcement des liens
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Modegraveles EMF (lrsquoEthoModeling Framework)
Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)
(sert de base pour le projet MANTA)
EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Agents Reacuteactifs
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Agent cognitif versus Agent reacuteactif
bullRepreacutesentation du monde
Symbolique
bullComportement
Orienteacute but
bullFondements
IA
(Denett Bratmanhellip)
bullRepreacutesentation du monde
Sub-symbolique (perceptions)
bullComportement
Reacuteflexe
bullFondements
Inspiration eacutethologique bio
(Brooks)
SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un
contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et
drsquoadaptation agrave lrsquoenvironnement
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie
Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations
bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning
Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole
Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne
De quoi ai-je besoin pour la faire fonctionner Une batterie neuve
Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve
Le garage ne sais pas que je veux une batterie neuve
Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo
Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de
moyen qui reacutealise cette fonction
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Agents cognitifs architecture BDI laquoBeliefs Desires
Intentionsraquo
Face agrave une deacutecision laquoPractical reasoningraquo
bullAvoir certaines informations connaissances sur le problegraveme
(laquocroyancesraquo)
bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite
atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires
bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Mise agrave jour agrave partir des croyances et des perceptions
Informations sur lrsquoenvironnement courantFonction deacuteterminant les options
possibles selon les intentions et les croyances
Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant
lrsquoengagement vis agrave vis des intentions (abandon
maintien)
Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter
Principe drsquoune architecture BDI
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Agents Cognitifs
3APL DEMO
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Agents Hybrides Architecture multi-niveaux
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Agent structureacute en couches
bullSouvent mais pas toujours architectures deacutelibeacuteratives
bullPrise de deacutecision en seacuteparant les niveaux software
bullChaque couche raisonne agrave un niveau drsquoabstraction
bullLes couches interagissent
Couches de 2 types
bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche
bullCouches horizontales chaque couche est directement connecteacutee agrave la perception
(in) et lrsquoaction (out)
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le
comportement proactif
Possibiliteacute de concevoir plusieurs couches
Topologie information et controcircle de flux entre plusieurs couches
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Horizontal
Chaque couche agit comme un agent indeacutependance simpliciteacute
pour n comportements diffeacuterents on impleacutemente n couches
compeacutetition entre couches gestion des incoheacuterences
Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile
Vertical
Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle
Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux
Couches Avantages et inconveacutenients
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Exemple TOURINGMACHINES (Innes A Ferguson 92)
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
TOURINGMACHINES
3 couches produisent des suggestions drsquoaction
bullReacuteactive impleacutemente des regravegles de situation-action comme dans
lrsquoarchitecture de subsumption de Brooks
bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une
librairie de squelettes de plans
bullModeacutelisation modegravele du monde autres agents soi preacutedit les
conflits geacutenegravere des buts et les reacutesout
Domaine drsquoutilisation veacutehicules multiples
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Exemple INTERRAP
(Integration of Reactive Behavior and Rational Planning)
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
INTERRAP
Architecture en couches verticale avec 2 passes
Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES
Chaque couche est associeacutee agrave une base de connaissances
Les couches interagissent De bas vers le haut (bottom-up) activation
De haut vers le bas (top-down) exeacutecution
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Concept 2 Interaction
DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa
tacircche
bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble
drsquoactions reacuteciproques
bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par
les influences des autres
Exemples
bullConstruction drsquoune maison par plusieurs ouvriers
bullCollision de voitures
bullMise en commun drsquoexpertises
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Le choix de techniques de coordination
Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles
Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources
ndash algorithmique reacutepartiendash regravegles sociales
neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote
arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite
ndash environnement reconnaissance dintentions
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Situations drsquointeraction
Classement des situations drsquointeraction selon les buts les
ressources et les compeacutetences des agents
bullButs compatibles ou incompatibles
bullRessources suffisantes ou insuffisantes
bullCompeacutetences suffisantes ou insuffisantes
rArrIndiffeacuterence coopeacuteration antagonisme
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Classement des situations drsquointeractions (Ferber 95)
Indiffeacuterence Coopeacuterationou ou Antagonisme
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Le choix dun modegravele de communication
Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)
Symbolique (messages)meacutedium (reacuteseau voix vision)participants
ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)
Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
La Communication un moyen de geacuterer les interactions
Probleacutematique de la communication Quelques questions agrave se poser
bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)
bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation
(coordination eacuteviter les activiteacutes redondantes
neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec
des agents concurrents ou eacutegoiumlstes)
bullQuand les agents communiquent-ils
Demande ou besoin drsquoun agent hellip
bullQue communiquent-ils Croyances intentions tacircches hellip
bullComment les agents communiquent-ils
Langage de communication compreacutehensible
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
2 types de communication
bullCommunication indirecte Partage drsquoinformations- via un tableau noir
- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs
bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip
-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Fondements de la communication directe
Sources multiples Linguistique philosophie du langage psychologie cognitive et
sociale sociologie
Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G
Perrier L Knittel)
Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en
L3 de F Duval )
Intention dans les communications
bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit
raquo en L3 ISC de M Rebuschi)
Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72
Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Actes de langage (Aperccedilu)
Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage
(pragmatique)
Cadre drsquoanalyse des eacutechanges inter humains
laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]
rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention
Intention pas toujours eacutevidente
laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)
laquoil fait froidraquo (affirmation)
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Actes de langages
On distingue trois composantes agrave lrsquoacte
1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun
langage donneacute (acte de dire quelque chose )
2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte
donneacute exprimant une intention (rArrintention du locuteur)
noteacute A=F(P) Acte=Force(Proposition)
P le contenu propositionnel et F la force illocutoire
3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire
(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Actes de langages verbes performatifs
Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes
performatifs pour restreindre les ambiguiumlteacutes drsquoun message
bullExemples convaincre promettre ordonner
Exemples de classes de force
bullAssertif (assertion ou fait) penser affirmer dire informer
bullDirectif (commande) demander avertir reacuteclamer supplier
bullCommissif (engagement) promettre garantir refuser
bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier
bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Actes de langages Succegraves et satisfaction
Accomplissement associeacute agrave des conditions de succegraves et de satisfaction
Indiquent dans quel cadre lrsquoacte reacuteussit
conditions de succegraves
bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation
bullsrsquoappuient principalement sur F
Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait
fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip
conditions de satisfaction
bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte
bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute
Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Langages de communication baseacutes sur les actes de
langage
Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment
communiquer entre agents
Deacutefinition de langages de communication entre agents = ACL (Agent
communication Language) KQML(Knowledge Query and Manipulation
Language) etc
KQML
bullDeacutefinition drsquoun ensemble de performatifs
bullPrincipalement assertifs et directifs
bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF
LISP PROLOG KQML (imbrication de messages KQML)
bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
KQML
Syntaxe agrave 3 niveaux
bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression
du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets
de concepts et de relations dans un domaine drsquointeacuterecirct )
bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message
bullContenu
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
KQML
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Un Exemple
(inform
sender A
receiver B
reply-with laptop
language KIF
ontology ordinateurs
content (=(prix HP-Jet) (scalar 1500 USD))
reply-by 10
conversation-id conv01
)
Sender lrsquoeacutemetteur du message
Receiverle destinataire du message
reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure
Language le langage dans lequel le contenu est repreacutesenteacute
Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le
content
Content le contenu du message (lrsquoinformation transporteacutee par la performative)
reply-by impose un deacutelai pour la reacuteponse
conversation-id identificateur de la conversation
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
KQML
Permettre aux agents cognitifs de coopeacuterer
Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)
Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)
Indeacutependant de lontologie utiliseacutee
=gt Peu de contraintes de deacuteveloppement
Mais hellip
Manque de certains performatifs (ex engagement)
Incoheacuterence ou inutiliteacute de certains performatifs
Ambiguiteacute et impreacutecision
Manque de deacutefinition et de formalisation
Pas de cadre pour geacuterer les agents
Solution Premier pas vers la normalisation drsquoun ACL
Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les
composer rArrFIPA (Fundation for Intelligent Physical Agents
wwwfipaorg )
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
ACL FIPA
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
KIF en quelques mots
bullKnowledge Interchange Format (effort DARPA)
bullLangage de description bullLisible par une machine et un humain
bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre
bullune speacutecification pour la syntaxe
bullune speacutecification pour la seacutemantique
bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))
ouencore
bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Concept 3 Environnement
1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme
doteacute drsquoun ensemble drsquoobjets du problegraveme
1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =
lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le
monde
--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Environnement
1 Speacutecification de lrsquoenvironnement
Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend
- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs
- S capteurs
Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip
Intelligence Artificielle IADSMA
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
-Complegravetementpartiellement observable
bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)
-Deacuteterministestochastique
bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave
lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique
2 Proprieacuteteacutes de lrsquoenvironnement
Intelligence Artificielle IADSMA
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
- Eacutepisodiqueseacutequentiel
bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer
- Statiquedynamique
bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)
Intelligence Artificielle IADSMA
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
- Discretcontinu
bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions
bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps
Taxi est continu pour tout
- Mono-agentMulti-agent
bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))
Intelligence Artificielle IADSMA
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Proprieacuteteacutes de lrsquoenvironnement
Situation la plus difficile
ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent
Exemple conduite automatiseacutee drsquoun taxi
Intelligence Artificielle Agents Intelligents
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles
- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment
- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute
- Pour reacutesumer
Externe
Fixeacutee par le concepteur
Propre agrave la tacircche
Intelligence Artificielle IADSMA
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Concept 4 Organisation
Le choix dun modegravele dorganisation 3 points de vue
organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles
organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute
systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations
environnement(s)ndash eacutechanges coalitions
Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste
Organisation
Notion duale
bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect
statique
bullProcessus de construction dune structure auto-organisation reacute-organisation
eacutemergence aspect dynamique
Quelques inspirations
bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive
bullBiologie hellip
Approche organisationnelle approche eacutemergentiste