73
SMA ARCHITECTURES

Ch3 sma-architectures-2012

Embed Size (px)

Citation preview

Page 1: Ch3 sma-architectures-2012

SMA ARCHITECTURES

Geacutenie logiciel Systegravemes Reacutepartis

Intelligence Artificielle

Geacutenie Informatique

Paradigme Objet

TechnologiesReacuteseaux

MeacutetaphoreBiologique

MeacutetaphoreSociologique

Le choix dune deacutecomposition

Etant donneacute un pb agrave reacutesoudre comment choisir les agents qui vontintervenir dans le systegraveme et comment leur reacutepartir la compeacutetence

Grand nombre de deacutecompositions possiblesndash objetndash spatialendash fonctionnellendash etc

Diffeacuterents grains possibles

ndash socieacuteteacutendash individundash organendash cellulendash atomendash

4

Point de vue Agent Organisation

IA connaissances et croyances

savoir-faire et intentions

communication

conflits et coheacuterence

controcircle et coordination

Vie Artificielle comportement

perception

adaptation

couplage agrave lenvironnement

influences et deacutependances

co-deacutetermination

individucollectif

Geacutenie Logiciel encapsulation

heacuteritage

distribution

ouverture

Les diffeacuterents concepts et composants drsquoun SMA

Problegraveme central de quel comportement doter les agents et comment les faire interagir entre eux et avec lrsquoenvironnement pour reacutepondre au laquoproblegravemeraquo poseacute Meacutethode laquoVoyelleraquo deacutefinir les composants drsquoun systegraveme multi-agents selon

bullAgents

bullEnvironnement

bullInteraction

bullOrganisation

bull(Utilisateur) cf cours Anne Boyer laquoAssistant Intelligentraquo

Le choix dun modegravele dagent

Agents cognitifs - Intelligence Artificielle Distribueacutee

agent = meacutetaphore psychologiquendash connaissance deacutecrite en termes drsquoeacutetats mentauxndash comportement intentionnel (buts et plans explicites)

systegraveme = meacutetaphore sociologique

Agents reacuteactifs - Vie Artificielle

agent = meacutetaphore animalendash connaissances reacuteduites agrave lrsquoassociation de stimuli et de reacuteponsesndash comportement dirigeacute par les perceptions

systegraveme = meacutetaphore socio-biologique

AgentsLagent (Ferber 95)

ndash entiteacute reacuteelle ou virtuelle plongeacutee dans un environnement sur lequel elle est capable dagir

ndash qui dispose dune capaciteacute de perception et de repreacutesentation partielle de cet environnement

ndash qui peut communiquer avec dautres agents

ndash qui est mue par un ensemble de tendances (objectifs individuels fonctions de satisfaction de survie)

ndash qui possegravede un comportement autonome tendant agrave satisfaire ses objectifs conseacutequence de ses observations de sa connaissance et des interactions quelle entretient avec les autres agents

ndash qui est capable eacuteventuellement de se reproduire

bull point de vue local imparfait incertainbull ressources limiteacuteesbull Adaptation amp Apprentissage Deacutependance aux autres amp Socialiteacute

Une Recherche de Compromis

Communication

AutonomyAdaptation

Il est autonome mais ouvert agrave la communication

Il est autonome mais ouvert agrave

ladaptation

Il sadapte mais cherche agrave produire

son point de vue

Modegraveles dAgents

Environnement

Perception Action

behaviour-based layer

localplanning layer

cooperativeplanning layer

Kn

ow

led

ge A

bst

ract

ion

hierarchical agentknowledge base

agent control unit

social models

mental models

world models

bull Agent purement situeacute ndash lenvironnement possegravede une meacutetrique ndash les agents sont situeacutes agrave une position dans lenvironnement

qui deacutetermine ce quils perccediloiventndash ils peuvent se deacuteplacerndash il ny a pas communications directes entre agents elle se

font via lenvironnement

bull Agent purement communiquant ndash il ny a pas denvironnement au sens physique du terme ndash les agents nont pas dancrage physique ndash ils communiquent via des informations qui circulent entre

les agents

Concept 1 Agent

Situeacute ou Communiquant

Cognitif ou Reacuteactif

bull Agent cognitif ndash repreacutesentation explicite de lenvironnement et des autres agentsndash peut tenir compte de son passeacute et dispose dun but explicitendash mode social dorganisation (planification engagement)ndash petit nombre dagents (1020) heacuteteacuterogegravenes agrave gros grain

bull Les relations entre agents seacutetablissent en fonction des collaborations neacutecessaires agrave la reacutesolution du problegraveme

bull Agent reacuteactifndash pas de repreacutesentation explicite de lenvironnementndash pas de meacutemoire de son histoire ni de but explicitendash comportement de type stimulus reacuteponsendash mode biologique dorganisationndash grand nombre dagents (gt100) homogegravenes agrave grain fin

bull La structure du systegraveme eacutemerge des comportements et non dune volonteacute dorganisation

Deacutefinir - Architecture interne -Degreacute de couplage de lrsquoagent agrave lrsquoenvironnement on peut consideacuterer plusieurs cateacutegories drsquoagent

Fort reacuteactif Comportement dirigeacute par les changements de lrsquoenvironnement

hybride

Faible deacutelibeacuteratif (cognitif) Comportement dirigeacute par les buts agrave satisfaire

Couplage agrave lrsquoenvironnement

ARCHITECTURES REACTIFS-COGNITIFS

Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)

Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs

3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute

(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions

2 caracteacuteristiques

bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de

regravegles situation rarraction

bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute

-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs

Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute

Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur

Exercice les robots explorateurs

Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure

suivante)

Dans le cadre de larchitecture agrave subsomption deacutefinir

- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions

Mecircme question pour un ensemble de robots coopeacuteratifs

Figure

Problegraveme

Reacuteponses modules comportementaux =

Explorer

Preacutelever

Aller agrave la base

Deacuteposer

Eacuteviter obstacle

Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)

regravegle 1 si deacutetecte un obstacle alors changer de direction

regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon

regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)

regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever

regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement

Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire

Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement

Architecture agrave subsomptions

Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction

regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5

Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption

Robots explorateurs de Mars (Steels89)

Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip

Exemple de regravegles pour robots coopeacuteratifs

poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par

regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques

radioactives et suivre gradient (retour)

=gt une nouvelle regravegle

regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient

(aller)

Hieacuterarchie des prioriteacutes de deacuteclenchement

La hieacuterarchie de comportements

regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5

regravegle6 gt regravegle 5

le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 2: Ch3 sma-architectures-2012

Geacutenie logiciel Systegravemes Reacutepartis

Intelligence Artificielle

Geacutenie Informatique

Paradigme Objet

TechnologiesReacuteseaux

MeacutetaphoreBiologique

MeacutetaphoreSociologique

Le choix dune deacutecomposition

Etant donneacute un pb agrave reacutesoudre comment choisir les agents qui vontintervenir dans le systegraveme et comment leur reacutepartir la compeacutetence

Grand nombre de deacutecompositions possiblesndash objetndash spatialendash fonctionnellendash etc

Diffeacuterents grains possibles

ndash socieacuteteacutendash individundash organendash cellulendash atomendash

4

Point de vue Agent Organisation

IA connaissances et croyances

savoir-faire et intentions

communication

conflits et coheacuterence

controcircle et coordination

Vie Artificielle comportement

perception

adaptation

couplage agrave lenvironnement

influences et deacutependances

co-deacutetermination

individucollectif

Geacutenie Logiciel encapsulation

heacuteritage

distribution

ouverture

Les diffeacuterents concepts et composants drsquoun SMA

Problegraveme central de quel comportement doter les agents et comment les faire interagir entre eux et avec lrsquoenvironnement pour reacutepondre au laquoproblegravemeraquo poseacute Meacutethode laquoVoyelleraquo deacutefinir les composants drsquoun systegraveme multi-agents selon

bullAgents

bullEnvironnement

bullInteraction

bullOrganisation

bull(Utilisateur) cf cours Anne Boyer laquoAssistant Intelligentraquo

Le choix dun modegravele dagent

Agents cognitifs - Intelligence Artificielle Distribueacutee

agent = meacutetaphore psychologiquendash connaissance deacutecrite en termes drsquoeacutetats mentauxndash comportement intentionnel (buts et plans explicites)

systegraveme = meacutetaphore sociologique

Agents reacuteactifs - Vie Artificielle

agent = meacutetaphore animalendash connaissances reacuteduites agrave lrsquoassociation de stimuli et de reacuteponsesndash comportement dirigeacute par les perceptions

systegraveme = meacutetaphore socio-biologique

AgentsLagent (Ferber 95)

ndash entiteacute reacuteelle ou virtuelle plongeacutee dans un environnement sur lequel elle est capable dagir

ndash qui dispose dune capaciteacute de perception et de repreacutesentation partielle de cet environnement

ndash qui peut communiquer avec dautres agents

ndash qui est mue par un ensemble de tendances (objectifs individuels fonctions de satisfaction de survie)

ndash qui possegravede un comportement autonome tendant agrave satisfaire ses objectifs conseacutequence de ses observations de sa connaissance et des interactions quelle entretient avec les autres agents

ndash qui est capable eacuteventuellement de se reproduire

bull point de vue local imparfait incertainbull ressources limiteacuteesbull Adaptation amp Apprentissage Deacutependance aux autres amp Socialiteacute

Une Recherche de Compromis

Communication

AutonomyAdaptation

Il est autonome mais ouvert agrave la communication

Il est autonome mais ouvert agrave

ladaptation

Il sadapte mais cherche agrave produire

son point de vue

Modegraveles dAgents

Environnement

Perception Action

behaviour-based layer

localplanning layer

cooperativeplanning layer

Kn

ow

led

ge A

bst

ract

ion

hierarchical agentknowledge base

agent control unit

social models

mental models

world models

bull Agent purement situeacute ndash lenvironnement possegravede une meacutetrique ndash les agents sont situeacutes agrave une position dans lenvironnement

qui deacutetermine ce quils perccediloiventndash ils peuvent se deacuteplacerndash il ny a pas communications directes entre agents elle se

font via lenvironnement

bull Agent purement communiquant ndash il ny a pas denvironnement au sens physique du terme ndash les agents nont pas dancrage physique ndash ils communiquent via des informations qui circulent entre

les agents

Concept 1 Agent

Situeacute ou Communiquant

Cognitif ou Reacuteactif

bull Agent cognitif ndash repreacutesentation explicite de lenvironnement et des autres agentsndash peut tenir compte de son passeacute et dispose dun but explicitendash mode social dorganisation (planification engagement)ndash petit nombre dagents (1020) heacuteteacuterogegravenes agrave gros grain

bull Les relations entre agents seacutetablissent en fonction des collaborations neacutecessaires agrave la reacutesolution du problegraveme

bull Agent reacuteactifndash pas de repreacutesentation explicite de lenvironnementndash pas de meacutemoire de son histoire ni de but explicitendash comportement de type stimulus reacuteponsendash mode biologique dorganisationndash grand nombre dagents (gt100) homogegravenes agrave grain fin

bull La structure du systegraveme eacutemerge des comportements et non dune volonteacute dorganisation

Deacutefinir - Architecture interne -Degreacute de couplage de lrsquoagent agrave lrsquoenvironnement on peut consideacuterer plusieurs cateacutegories drsquoagent

Fort reacuteactif Comportement dirigeacute par les changements de lrsquoenvironnement

hybride

Faible deacutelibeacuteratif (cognitif) Comportement dirigeacute par les buts agrave satisfaire

Couplage agrave lrsquoenvironnement

ARCHITECTURES REACTIFS-COGNITIFS

Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)

Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs

3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute

(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions

2 caracteacuteristiques

bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de

regravegles situation rarraction

bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute

-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs

Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute

Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur

Exercice les robots explorateurs

Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure

suivante)

Dans le cadre de larchitecture agrave subsomption deacutefinir

- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions

Mecircme question pour un ensemble de robots coopeacuteratifs

Figure

Problegraveme

Reacuteponses modules comportementaux =

Explorer

Preacutelever

Aller agrave la base

Deacuteposer

Eacuteviter obstacle

Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)

regravegle 1 si deacutetecte un obstacle alors changer de direction

regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon

regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)

regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever

regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement

Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire

Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement

Architecture agrave subsomptions

Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction

regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5

Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption

Robots explorateurs de Mars (Steels89)

Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip

Exemple de regravegles pour robots coopeacuteratifs

poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par

regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques

radioactives et suivre gradient (retour)

=gt une nouvelle regravegle

regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient

(aller)

Hieacuterarchie des prioriteacutes de deacuteclenchement

La hieacuterarchie de comportements

regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5

regravegle6 gt regravegle 5

le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 3: Ch3 sma-architectures-2012

Le choix dune deacutecomposition

Etant donneacute un pb agrave reacutesoudre comment choisir les agents qui vontintervenir dans le systegraveme et comment leur reacutepartir la compeacutetence

Grand nombre de deacutecompositions possiblesndash objetndash spatialendash fonctionnellendash etc

Diffeacuterents grains possibles

ndash socieacuteteacutendash individundash organendash cellulendash atomendash

4

Point de vue Agent Organisation

IA connaissances et croyances

savoir-faire et intentions

communication

conflits et coheacuterence

controcircle et coordination

Vie Artificielle comportement

perception

adaptation

couplage agrave lenvironnement

influences et deacutependances

co-deacutetermination

individucollectif

Geacutenie Logiciel encapsulation

heacuteritage

distribution

ouverture

Les diffeacuterents concepts et composants drsquoun SMA

Problegraveme central de quel comportement doter les agents et comment les faire interagir entre eux et avec lrsquoenvironnement pour reacutepondre au laquoproblegravemeraquo poseacute Meacutethode laquoVoyelleraquo deacutefinir les composants drsquoun systegraveme multi-agents selon

bullAgents

bullEnvironnement

bullInteraction

bullOrganisation

bull(Utilisateur) cf cours Anne Boyer laquoAssistant Intelligentraquo

Le choix dun modegravele dagent

Agents cognitifs - Intelligence Artificielle Distribueacutee

agent = meacutetaphore psychologiquendash connaissance deacutecrite en termes drsquoeacutetats mentauxndash comportement intentionnel (buts et plans explicites)

systegraveme = meacutetaphore sociologique

Agents reacuteactifs - Vie Artificielle

agent = meacutetaphore animalendash connaissances reacuteduites agrave lrsquoassociation de stimuli et de reacuteponsesndash comportement dirigeacute par les perceptions

systegraveme = meacutetaphore socio-biologique

AgentsLagent (Ferber 95)

ndash entiteacute reacuteelle ou virtuelle plongeacutee dans un environnement sur lequel elle est capable dagir

ndash qui dispose dune capaciteacute de perception et de repreacutesentation partielle de cet environnement

ndash qui peut communiquer avec dautres agents

ndash qui est mue par un ensemble de tendances (objectifs individuels fonctions de satisfaction de survie)

ndash qui possegravede un comportement autonome tendant agrave satisfaire ses objectifs conseacutequence de ses observations de sa connaissance et des interactions quelle entretient avec les autres agents

ndash qui est capable eacuteventuellement de se reproduire

bull point de vue local imparfait incertainbull ressources limiteacuteesbull Adaptation amp Apprentissage Deacutependance aux autres amp Socialiteacute

Une Recherche de Compromis

Communication

AutonomyAdaptation

Il est autonome mais ouvert agrave la communication

Il est autonome mais ouvert agrave

ladaptation

Il sadapte mais cherche agrave produire

son point de vue

Modegraveles dAgents

Environnement

Perception Action

behaviour-based layer

localplanning layer

cooperativeplanning layer

Kn

ow

led

ge A

bst

ract

ion

hierarchical agentknowledge base

agent control unit

social models

mental models

world models

bull Agent purement situeacute ndash lenvironnement possegravede une meacutetrique ndash les agents sont situeacutes agrave une position dans lenvironnement

qui deacutetermine ce quils perccediloiventndash ils peuvent se deacuteplacerndash il ny a pas communications directes entre agents elle se

font via lenvironnement

bull Agent purement communiquant ndash il ny a pas denvironnement au sens physique du terme ndash les agents nont pas dancrage physique ndash ils communiquent via des informations qui circulent entre

les agents

Concept 1 Agent

Situeacute ou Communiquant

Cognitif ou Reacuteactif

bull Agent cognitif ndash repreacutesentation explicite de lenvironnement et des autres agentsndash peut tenir compte de son passeacute et dispose dun but explicitendash mode social dorganisation (planification engagement)ndash petit nombre dagents (1020) heacuteteacuterogegravenes agrave gros grain

bull Les relations entre agents seacutetablissent en fonction des collaborations neacutecessaires agrave la reacutesolution du problegraveme

bull Agent reacuteactifndash pas de repreacutesentation explicite de lenvironnementndash pas de meacutemoire de son histoire ni de but explicitendash comportement de type stimulus reacuteponsendash mode biologique dorganisationndash grand nombre dagents (gt100) homogegravenes agrave grain fin

bull La structure du systegraveme eacutemerge des comportements et non dune volonteacute dorganisation

Deacutefinir - Architecture interne -Degreacute de couplage de lrsquoagent agrave lrsquoenvironnement on peut consideacuterer plusieurs cateacutegories drsquoagent

Fort reacuteactif Comportement dirigeacute par les changements de lrsquoenvironnement

hybride

Faible deacutelibeacuteratif (cognitif) Comportement dirigeacute par les buts agrave satisfaire

Couplage agrave lrsquoenvironnement

ARCHITECTURES REACTIFS-COGNITIFS

Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)

Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs

3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute

(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions

2 caracteacuteristiques

bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de

regravegles situation rarraction

bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute

-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs

Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute

Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur

Exercice les robots explorateurs

Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure

suivante)

Dans le cadre de larchitecture agrave subsomption deacutefinir

- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions

Mecircme question pour un ensemble de robots coopeacuteratifs

Figure

Problegraveme

Reacuteponses modules comportementaux =

Explorer

Preacutelever

Aller agrave la base

Deacuteposer

Eacuteviter obstacle

Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)

regravegle 1 si deacutetecte un obstacle alors changer de direction

regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon

regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)

regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever

regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement

Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire

Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement

Architecture agrave subsomptions

Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction

regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5

Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption

Robots explorateurs de Mars (Steels89)

Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip

Exemple de regravegles pour robots coopeacuteratifs

poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par

regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques

radioactives et suivre gradient (retour)

=gt une nouvelle regravegle

regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient

(aller)

Hieacuterarchie des prioriteacutes de deacuteclenchement

La hieacuterarchie de comportements

regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5

regravegle6 gt regravegle 5

le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 4: Ch3 sma-architectures-2012

4

Point de vue Agent Organisation

IA connaissances et croyances

savoir-faire et intentions

communication

conflits et coheacuterence

controcircle et coordination

Vie Artificielle comportement

perception

adaptation

couplage agrave lenvironnement

influences et deacutependances

co-deacutetermination

individucollectif

Geacutenie Logiciel encapsulation

heacuteritage

distribution

ouverture

Les diffeacuterents concepts et composants drsquoun SMA

Problegraveme central de quel comportement doter les agents et comment les faire interagir entre eux et avec lrsquoenvironnement pour reacutepondre au laquoproblegravemeraquo poseacute Meacutethode laquoVoyelleraquo deacutefinir les composants drsquoun systegraveme multi-agents selon

bullAgents

bullEnvironnement

bullInteraction

bullOrganisation

bull(Utilisateur) cf cours Anne Boyer laquoAssistant Intelligentraquo

Le choix dun modegravele dagent

Agents cognitifs - Intelligence Artificielle Distribueacutee

agent = meacutetaphore psychologiquendash connaissance deacutecrite en termes drsquoeacutetats mentauxndash comportement intentionnel (buts et plans explicites)

systegraveme = meacutetaphore sociologique

Agents reacuteactifs - Vie Artificielle

agent = meacutetaphore animalendash connaissances reacuteduites agrave lrsquoassociation de stimuli et de reacuteponsesndash comportement dirigeacute par les perceptions

systegraveme = meacutetaphore socio-biologique

AgentsLagent (Ferber 95)

ndash entiteacute reacuteelle ou virtuelle plongeacutee dans un environnement sur lequel elle est capable dagir

ndash qui dispose dune capaciteacute de perception et de repreacutesentation partielle de cet environnement

ndash qui peut communiquer avec dautres agents

ndash qui est mue par un ensemble de tendances (objectifs individuels fonctions de satisfaction de survie)

ndash qui possegravede un comportement autonome tendant agrave satisfaire ses objectifs conseacutequence de ses observations de sa connaissance et des interactions quelle entretient avec les autres agents

ndash qui est capable eacuteventuellement de se reproduire

bull point de vue local imparfait incertainbull ressources limiteacuteesbull Adaptation amp Apprentissage Deacutependance aux autres amp Socialiteacute

Une Recherche de Compromis

Communication

AutonomyAdaptation

Il est autonome mais ouvert agrave la communication

Il est autonome mais ouvert agrave

ladaptation

Il sadapte mais cherche agrave produire

son point de vue

Modegraveles dAgents

Environnement

Perception Action

behaviour-based layer

localplanning layer

cooperativeplanning layer

Kn

ow

led

ge A

bst

ract

ion

hierarchical agentknowledge base

agent control unit

social models

mental models

world models

bull Agent purement situeacute ndash lenvironnement possegravede une meacutetrique ndash les agents sont situeacutes agrave une position dans lenvironnement

qui deacutetermine ce quils perccediloiventndash ils peuvent se deacuteplacerndash il ny a pas communications directes entre agents elle se

font via lenvironnement

bull Agent purement communiquant ndash il ny a pas denvironnement au sens physique du terme ndash les agents nont pas dancrage physique ndash ils communiquent via des informations qui circulent entre

les agents

Concept 1 Agent

Situeacute ou Communiquant

Cognitif ou Reacuteactif

bull Agent cognitif ndash repreacutesentation explicite de lenvironnement et des autres agentsndash peut tenir compte de son passeacute et dispose dun but explicitendash mode social dorganisation (planification engagement)ndash petit nombre dagents (1020) heacuteteacuterogegravenes agrave gros grain

bull Les relations entre agents seacutetablissent en fonction des collaborations neacutecessaires agrave la reacutesolution du problegraveme

bull Agent reacuteactifndash pas de repreacutesentation explicite de lenvironnementndash pas de meacutemoire de son histoire ni de but explicitendash comportement de type stimulus reacuteponsendash mode biologique dorganisationndash grand nombre dagents (gt100) homogegravenes agrave grain fin

bull La structure du systegraveme eacutemerge des comportements et non dune volonteacute dorganisation

Deacutefinir - Architecture interne -Degreacute de couplage de lrsquoagent agrave lrsquoenvironnement on peut consideacuterer plusieurs cateacutegories drsquoagent

Fort reacuteactif Comportement dirigeacute par les changements de lrsquoenvironnement

hybride

Faible deacutelibeacuteratif (cognitif) Comportement dirigeacute par les buts agrave satisfaire

Couplage agrave lrsquoenvironnement

ARCHITECTURES REACTIFS-COGNITIFS

Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)

Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs

3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute

(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions

2 caracteacuteristiques

bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de

regravegles situation rarraction

bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute

-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs

Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute

Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur

Exercice les robots explorateurs

Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure

suivante)

Dans le cadre de larchitecture agrave subsomption deacutefinir

- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions

Mecircme question pour un ensemble de robots coopeacuteratifs

Figure

Problegraveme

Reacuteponses modules comportementaux =

Explorer

Preacutelever

Aller agrave la base

Deacuteposer

Eacuteviter obstacle

Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)

regravegle 1 si deacutetecte un obstacle alors changer de direction

regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon

regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)

regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever

regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement

Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire

Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement

Architecture agrave subsomptions

Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction

regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5

Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption

Robots explorateurs de Mars (Steels89)

Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip

Exemple de regravegles pour robots coopeacuteratifs

poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par

regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques

radioactives et suivre gradient (retour)

=gt une nouvelle regravegle

regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient

(aller)

Hieacuterarchie des prioriteacutes de deacuteclenchement

La hieacuterarchie de comportements

regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5

regravegle6 gt regravegle 5

le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 5: Ch3 sma-architectures-2012

Les diffeacuterents concepts et composants drsquoun SMA

Problegraveme central de quel comportement doter les agents et comment les faire interagir entre eux et avec lrsquoenvironnement pour reacutepondre au laquoproblegravemeraquo poseacute Meacutethode laquoVoyelleraquo deacutefinir les composants drsquoun systegraveme multi-agents selon

bullAgents

bullEnvironnement

bullInteraction

bullOrganisation

bull(Utilisateur) cf cours Anne Boyer laquoAssistant Intelligentraquo

Le choix dun modegravele dagent

Agents cognitifs - Intelligence Artificielle Distribueacutee

agent = meacutetaphore psychologiquendash connaissance deacutecrite en termes drsquoeacutetats mentauxndash comportement intentionnel (buts et plans explicites)

systegraveme = meacutetaphore sociologique

Agents reacuteactifs - Vie Artificielle

agent = meacutetaphore animalendash connaissances reacuteduites agrave lrsquoassociation de stimuli et de reacuteponsesndash comportement dirigeacute par les perceptions

systegraveme = meacutetaphore socio-biologique

AgentsLagent (Ferber 95)

ndash entiteacute reacuteelle ou virtuelle plongeacutee dans un environnement sur lequel elle est capable dagir

ndash qui dispose dune capaciteacute de perception et de repreacutesentation partielle de cet environnement

ndash qui peut communiquer avec dautres agents

ndash qui est mue par un ensemble de tendances (objectifs individuels fonctions de satisfaction de survie)

ndash qui possegravede un comportement autonome tendant agrave satisfaire ses objectifs conseacutequence de ses observations de sa connaissance et des interactions quelle entretient avec les autres agents

ndash qui est capable eacuteventuellement de se reproduire

bull point de vue local imparfait incertainbull ressources limiteacuteesbull Adaptation amp Apprentissage Deacutependance aux autres amp Socialiteacute

Une Recherche de Compromis

Communication

AutonomyAdaptation

Il est autonome mais ouvert agrave la communication

Il est autonome mais ouvert agrave

ladaptation

Il sadapte mais cherche agrave produire

son point de vue

Modegraveles dAgents

Environnement

Perception Action

behaviour-based layer

localplanning layer

cooperativeplanning layer

Kn

ow

led

ge A

bst

ract

ion

hierarchical agentknowledge base

agent control unit

social models

mental models

world models

bull Agent purement situeacute ndash lenvironnement possegravede une meacutetrique ndash les agents sont situeacutes agrave une position dans lenvironnement

qui deacutetermine ce quils perccediloiventndash ils peuvent se deacuteplacerndash il ny a pas communications directes entre agents elle se

font via lenvironnement

bull Agent purement communiquant ndash il ny a pas denvironnement au sens physique du terme ndash les agents nont pas dancrage physique ndash ils communiquent via des informations qui circulent entre

les agents

Concept 1 Agent

Situeacute ou Communiquant

Cognitif ou Reacuteactif

bull Agent cognitif ndash repreacutesentation explicite de lenvironnement et des autres agentsndash peut tenir compte de son passeacute et dispose dun but explicitendash mode social dorganisation (planification engagement)ndash petit nombre dagents (1020) heacuteteacuterogegravenes agrave gros grain

bull Les relations entre agents seacutetablissent en fonction des collaborations neacutecessaires agrave la reacutesolution du problegraveme

bull Agent reacuteactifndash pas de repreacutesentation explicite de lenvironnementndash pas de meacutemoire de son histoire ni de but explicitendash comportement de type stimulus reacuteponsendash mode biologique dorganisationndash grand nombre dagents (gt100) homogegravenes agrave grain fin

bull La structure du systegraveme eacutemerge des comportements et non dune volonteacute dorganisation

Deacutefinir - Architecture interne -Degreacute de couplage de lrsquoagent agrave lrsquoenvironnement on peut consideacuterer plusieurs cateacutegories drsquoagent

Fort reacuteactif Comportement dirigeacute par les changements de lrsquoenvironnement

hybride

Faible deacutelibeacuteratif (cognitif) Comportement dirigeacute par les buts agrave satisfaire

Couplage agrave lrsquoenvironnement

ARCHITECTURES REACTIFS-COGNITIFS

Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)

Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs

3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute

(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions

2 caracteacuteristiques

bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de

regravegles situation rarraction

bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute

-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs

Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute

Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur

Exercice les robots explorateurs

Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure

suivante)

Dans le cadre de larchitecture agrave subsomption deacutefinir

- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions

Mecircme question pour un ensemble de robots coopeacuteratifs

Figure

Problegraveme

Reacuteponses modules comportementaux =

Explorer

Preacutelever

Aller agrave la base

Deacuteposer

Eacuteviter obstacle

Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)

regravegle 1 si deacutetecte un obstacle alors changer de direction

regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon

regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)

regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever

regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement

Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire

Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement

Architecture agrave subsomptions

Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction

regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5

Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption

Robots explorateurs de Mars (Steels89)

Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip

Exemple de regravegles pour robots coopeacuteratifs

poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par

regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques

radioactives et suivre gradient (retour)

=gt une nouvelle regravegle

regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient

(aller)

Hieacuterarchie des prioriteacutes de deacuteclenchement

La hieacuterarchie de comportements

regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5

regravegle6 gt regravegle 5

le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 6: Ch3 sma-architectures-2012

Le choix dun modegravele dagent

Agents cognitifs - Intelligence Artificielle Distribueacutee

agent = meacutetaphore psychologiquendash connaissance deacutecrite en termes drsquoeacutetats mentauxndash comportement intentionnel (buts et plans explicites)

systegraveme = meacutetaphore sociologique

Agents reacuteactifs - Vie Artificielle

agent = meacutetaphore animalendash connaissances reacuteduites agrave lrsquoassociation de stimuli et de reacuteponsesndash comportement dirigeacute par les perceptions

systegraveme = meacutetaphore socio-biologique

AgentsLagent (Ferber 95)

ndash entiteacute reacuteelle ou virtuelle plongeacutee dans un environnement sur lequel elle est capable dagir

ndash qui dispose dune capaciteacute de perception et de repreacutesentation partielle de cet environnement

ndash qui peut communiquer avec dautres agents

ndash qui est mue par un ensemble de tendances (objectifs individuels fonctions de satisfaction de survie)

ndash qui possegravede un comportement autonome tendant agrave satisfaire ses objectifs conseacutequence de ses observations de sa connaissance et des interactions quelle entretient avec les autres agents

ndash qui est capable eacuteventuellement de se reproduire

bull point de vue local imparfait incertainbull ressources limiteacuteesbull Adaptation amp Apprentissage Deacutependance aux autres amp Socialiteacute

Une Recherche de Compromis

Communication

AutonomyAdaptation

Il est autonome mais ouvert agrave la communication

Il est autonome mais ouvert agrave

ladaptation

Il sadapte mais cherche agrave produire

son point de vue

Modegraveles dAgents

Environnement

Perception Action

behaviour-based layer

localplanning layer

cooperativeplanning layer

Kn

ow

led

ge A

bst

ract

ion

hierarchical agentknowledge base

agent control unit

social models

mental models

world models

bull Agent purement situeacute ndash lenvironnement possegravede une meacutetrique ndash les agents sont situeacutes agrave une position dans lenvironnement

qui deacutetermine ce quils perccediloiventndash ils peuvent se deacuteplacerndash il ny a pas communications directes entre agents elle se

font via lenvironnement

bull Agent purement communiquant ndash il ny a pas denvironnement au sens physique du terme ndash les agents nont pas dancrage physique ndash ils communiquent via des informations qui circulent entre

les agents

Concept 1 Agent

Situeacute ou Communiquant

Cognitif ou Reacuteactif

bull Agent cognitif ndash repreacutesentation explicite de lenvironnement et des autres agentsndash peut tenir compte de son passeacute et dispose dun but explicitendash mode social dorganisation (planification engagement)ndash petit nombre dagents (1020) heacuteteacuterogegravenes agrave gros grain

bull Les relations entre agents seacutetablissent en fonction des collaborations neacutecessaires agrave la reacutesolution du problegraveme

bull Agent reacuteactifndash pas de repreacutesentation explicite de lenvironnementndash pas de meacutemoire de son histoire ni de but explicitendash comportement de type stimulus reacuteponsendash mode biologique dorganisationndash grand nombre dagents (gt100) homogegravenes agrave grain fin

bull La structure du systegraveme eacutemerge des comportements et non dune volonteacute dorganisation

Deacutefinir - Architecture interne -Degreacute de couplage de lrsquoagent agrave lrsquoenvironnement on peut consideacuterer plusieurs cateacutegories drsquoagent

Fort reacuteactif Comportement dirigeacute par les changements de lrsquoenvironnement

hybride

Faible deacutelibeacuteratif (cognitif) Comportement dirigeacute par les buts agrave satisfaire

Couplage agrave lrsquoenvironnement

ARCHITECTURES REACTIFS-COGNITIFS

Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)

Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs

3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute

(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions

2 caracteacuteristiques

bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de

regravegles situation rarraction

bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute

-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs

Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute

Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur

Exercice les robots explorateurs

Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure

suivante)

Dans le cadre de larchitecture agrave subsomption deacutefinir

- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions

Mecircme question pour un ensemble de robots coopeacuteratifs

Figure

Problegraveme

Reacuteponses modules comportementaux =

Explorer

Preacutelever

Aller agrave la base

Deacuteposer

Eacuteviter obstacle

Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)

regravegle 1 si deacutetecte un obstacle alors changer de direction

regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon

regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)

regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever

regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement

Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire

Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement

Architecture agrave subsomptions

Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction

regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5

Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption

Robots explorateurs de Mars (Steels89)

Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip

Exemple de regravegles pour robots coopeacuteratifs

poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par

regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques

radioactives et suivre gradient (retour)

=gt une nouvelle regravegle

regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient

(aller)

Hieacuterarchie des prioriteacutes de deacuteclenchement

La hieacuterarchie de comportements

regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5

regravegle6 gt regravegle 5

le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 7: Ch3 sma-architectures-2012

AgentsLagent (Ferber 95)

ndash entiteacute reacuteelle ou virtuelle plongeacutee dans un environnement sur lequel elle est capable dagir

ndash qui dispose dune capaciteacute de perception et de repreacutesentation partielle de cet environnement

ndash qui peut communiquer avec dautres agents

ndash qui est mue par un ensemble de tendances (objectifs individuels fonctions de satisfaction de survie)

ndash qui possegravede un comportement autonome tendant agrave satisfaire ses objectifs conseacutequence de ses observations de sa connaissance et des interactions quelle entretient avec les autres agents

ndash qui est capable eacuteventuellement de se reproduire

bull point de vue local imparfait incertainbull ressources limiteacuteesbull Adaptation amp Apprentissage Deacutependance aux autres amp Socialiteacute

Une Recherche de Compromis

Communication

AutonomyAdaptation

Il est autonome mais ouvert agrave la communication

Il est autonome mais ouvert agrave

ladaptation

Il sadapte mais cherche agrave produire

son point de vue

Modegraveles dAgents

Environnement

Perception Action

behaviour-based layer

localplanning layer

cooperativeplanning layer

Kn

ow

led

ge A

bst

ract

ion

hierarchical agentknowledge base

agent control unit

social models

mental models

world models

bull Agent purement situeacute ndash lenvironnement possegravede une meacutetrique ndash les agents sont situeacutes agrave une position dans lenvironnement

qui deacutetermine ce quils perccediloiventndash ils peuvent se deacuteplacerndash il ny a pas communications directes entre agents elle se

font via lenvironnement

bull Agent purement communiquant ndash il ny a pas denvironnement au sens physique du terme ndash les agents nont pas dancrage physique ndash ils communiquent via des informations qui circulent entre

les agents

Concept 1 Agent

Situeacute ou Communiquant

Cognitif ou Reacuteactif

bull Agent cognitif ndash repreacutesentation explicite de lenvironnement et des autres agentsndash peut tenir compte de son passeacute et dispose dun but explicitendash mode social dorganisation (planification engagement)ndash petit nombre dagents (1020) heacuteteacuterogegravenes agrave gros grain

bull Les relations entre agents seacutetablissent en fonction des collaborations neacutecessaires agrave la reacutesolution du problegraveme

bull Agent reacuteactifndash pas de repreacutesentation explicite de lenvironnementndash pas de meacutemoire de son histoire ni de but explicitendash comportement de type stimulus reacuteponsendash mode biologique dorganisationndash grand nombre dagents (gt100) homogegravenes agrave grain fin

bull La structure du systegraveme eacutemerge des comportements et non dune volonteacute dorganisation

Deacutefinir - Architecture interne -Degreacute de couplage de lrsquoagent agrave lrsquoenvironnement on peut consideacuterer plusieurs cateacutegories drsquoagent

Fort reacuteactif Comportement dirigeacute par les changements de lrsquoenvironnement

hybride

Faible deacutelibeacuteratif (cognitif) Comportement dirigeacute par les buts agrave satisfaire

Couplage agrave lrsquoenvironnement

ARCHITECTURES REACTIFS-COGNITIFS

Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)

Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs

3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute

(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions

2 caracteacuteristiques

bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de

regravegles situation rarraction

bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute

-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs

Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute

Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur

Exercice les robots explorateurs

Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure

suivante)

Dans le cadre de larchitecture agrave subsomption deacutefinir

- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions

Mecircme question pour un ensemble de robots coopeacuteratifs

Figure

Problegraveme

Reacuteponses modules comportementaux =

Explorer

Preacutelever

Aller agrave la base

Deacuteposer

Eacuteviter obstacle

Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)

regravegle 1 si deacutetecte un obstacle alors changer de direction

regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon

regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)

regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever

regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement

Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire

Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement

Architecture agrave subsomptions

Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction

regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5

Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption

Robots explorateurs de Mars (Steels89)

Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip

Exemple de regravegles pour robots coopeacuteratifs

poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par

regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques

radioactives et suivre gradient (retour)

=gt une nouvelle regravegle

regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient

(aller)

Hieacuterarchie des prioriteacutes de deacuteclenchement

La hieacuterarchie de comportements

regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5

regravegle6 gt regravegle 5

le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 8: Ch3 sma-architectures-2012

Une Recherche de Compromis

Communication

AutonomyAdaptation

Il est autonome mais ouvert agrave la communication

Il est autonome mais ouvert agrave

ladaptation

Il sadapte mais cherche agrave produire

son point de vue

Modegraveles dAgents

Environnement

Perception Action

behaviour-based layer

localplanning layer

cooperativeplanning layer

Kn

ow

led

ge A

bst

ract

ion

hierarchical agentknowledge base

agent control unit

social models

mental models

world models

bull Agent purement situeacute ndash lenvironnement possegravede une meacutetrique ndash les agents sont situeacutes agrave une position dans lenvironnement

qui deacutetermine ce quils perccediloiventndash ils peuvent se deacuteplacerndash il ny a pas communications directes entre agents elle se

font via lenvironnement

bull Agent purement communiquant ndash il ny a pas denvironnement au sens physique du terme ndash les agents nont pas dancrage physique ndash ils communiquent via des informations qui circulent entre

les agents

Concept 1 Agent

Situeacute ou Communiquant

Cognitif ou Reacuteactif

bull Agent cognitif ndash repreacutesentation explicite de lenvironnement et des autres agentsndash peut tenir compte de son passeacute et dispose dun but explicitendash mode social dorganisation (planification engagement)ndash petit nombre dagents (1020) heacuteteacuterogegravenes agrave gros grain

bull Les relations entre agents seacutetablissent en fonction des collaborations neacutecessaires agrave la reacutesolution du problegraveme

bull Agent reacuteactifndash pas de repreacutesentation explicite de lenvironnementndash pas de meacutemoire de son histoire ni de but explicitendash comportement de type stimulus reacuteponsendash mode biologique dorganisationndash grand nombre dagents (gt100) homogegravenes agrave grain fin

bull La structure du systegraveme eacutemerge des comportements et non dune volonteacute dorganisation

Deacutefinir - Architecture interne -Degreacute de couplage de lrsquoagent agrave lrsquoenvironnement on peut consideacuterer plusieurs cateacutegories drsquoagent

Fort reacuteactif Comportement dirigeacute par les changements de lrsquoenvironnement

hybride

Faible deacutelibeacuteratif (cognitif) Comportement dirigeacute par les buts agrave satisfaire

Couplage agrave lrsquoenvironnement

ARCHITECTURES REACTIFS-COGNITIFS

Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)

Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs

3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute

(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions

2 caracteacuteristiques

bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de

regravegles situation rarraction

bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute

-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs

Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute

Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur

Exercice les robots explorateurs

Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure

suivante)

Dans le cadre de larchitecture agrave subsomption deacutefinir

- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions

Mecircme question pour un ensemble de robots coopeacuteratifs

Figure

Problegraveme

Reacuteponses modules comportementaux =

Explorer

Preacutelever

Aller agrave la base

Deacuteposer

Eacuteviter obstacle

Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)

regravegle 1 si deacutetecte un obstacle alors changer de direction

regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon

regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)

regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever

regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement

Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire

Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement

Architecture agrave subsomptions

Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction

regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5

Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption

Robots explorateurs de Mars (Steels89)

Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip

Exemple de regravegles pour robots coopeacuteratifs

poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par

regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques

radioactives et suivre gradient (retour)

=gt une nouvelle regravegle

regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient

(aller)

Hieacuterarchie des prioriteacutes de deacuteclenchement

La hieacuterarchie de comportements

regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5

regravegle6 gt regravegle 5

le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 9: Ch3 sma-architectures-2012

Modegraveles dAgents

Environnement

Perception Action

behaviour-based layer

localplanning layer

cooperativeplanning layer

Kn

ow

led

ge A

bst

ract

ion

hierarchical agentknowledge base

agent control unit

social models

mental models

world models

bull Agent purement situeacute ndash lenvironnement possegravede une meacutetrique ndash les agents sont situeacutes agrave une position dans lenvironnement

qui deacutetermine ce quils perccediloiventndash ils peuvent se deacuteplacerndash il ny a pas communications directes entre agents elle se

font via lenvironnement

bull Agent purement communiquant ndash il ny a pas denvironnement au sens physique du terme ndash les agents nont pas dancrage physique ndash ils communiquent via des informations qui circulent entre

les agents

Concept 1 Agent

Situeacute ou Communiquant

Cognitif ou Reacuteactif

bull Agent cognitif ndash repreacutesentation explicite de lenvironnement et des autres agentsndash peut tenir compte de son passeacute et dispose dun but explicitendash mode social dorganisation (planification engagement)ndash petit nombre dagents (1020) heacuteteacuterogegravenes agrave gros grain

bull Les relations entre agents seacutetablissent en fonction des collaborations neacutecessaires agrave la reacutesolution du problegraveme

bull Agent reacuteactifndash pas de repreacutesentation explicite de lenvironnementndash pas de meacutemoire de son histoire ni de but explicitendash comportement de type stimulus reacuteponsendash mode biologique dorganisationndash grand nombre dagents (gt100) homogegravenes agrave grain fin

bull La structure du systegraveme eacutemerge des comportements et non dune volonteacute dorganisation

Deacutefinir - Architecture interne -Degreacute de couplage de lrsquoagent agrave lrsquoenvironnement on peut consideacuterer plusieurs cateacutegories drsquoagent

Fort reacuteactif Comportement dirigeacute par les changements de lrsquoenvironnement

hybride

Faible deacutelibeacuteratif (cognitif) Comportement dirigeacute par les buts agrave satisfaire

Couplage agrave lrsquoenvironnement

ARCHITECTURES REACTIFS-COGNITIFS

Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)

Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs

3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute

(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions

2 caracteacuteristiques

bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de

regravegles situation rarraction

bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute

-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs

Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute

Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur

Exercice les robots explorateurs

Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure

suivante)

Dans le cadre de larchitecture agrave subsomption deacutefinir

- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions

Mecircme question pour un ensemble de robots coopeacuteratifs

Figure

Problegraveme

Reacuteponses modules comportementaux =

Explorer

Preacutelever

Aller agrave la base

Deacuteposer

Eacuteviter obstacle

Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)

regravegle 1 si deacutetecte un obstacle alors changer de direction

regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon

regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)

regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever

regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement

Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire

Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement

Architecture agrave subsomptions

Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction

regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5

Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption

Robots explorateurs de Mars (Steels89)

Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip

Exemple de regravegles pour robots coopeacuteratifs

poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par

regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques

radioactives et suivre gradient (retour)

=gt une nouvelle regravegle

regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient

(aller)

Hieacuterarchie des prioriteacutes de deacuteclenchement

La hieacuterarchie de comportements

regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5

regravegle6 gt regravegle 5

le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 10: Ch3 sma-architectures-2012

bull Agent purement situeacute ndash lenvironnement possegravede une meacutetrique ndash les agents sont situeacutes agrave une position dans lenvironnement

qui deacutetermine ce quils perccediloiventndash ils peuvent se deacuteplacerndash il ny a pas communications directes entre agents elle se

font via lenvironnement

bull Agent purement communiquant ndash il ny a pas denvironnement au sens physique du terme ndash les agents nont pas dancrage physique ndash ils communiquent via des informations qui circulent entre

les agents

Concept 1 Agent

Situeacute ou Communiquant

Cognitif ou Reacuteactif

bull Agent cognitif ndash repreacutesentation explicite de lenvironnement et des autres agentsndash peut tenir compte de son passeacute et dispose dun but explicitendash mode social dorganisation (planification engagement)ndash petit nombre dagents (1020) heacuteteacuterogegravenes agrave gros grain

bull Les relations entre agents seacutetablissent en fonction des collaborations neacutecessaires agrave la reacutesolution du problegraveme

bull Agent reacuteactifndash pas de repreacutesentation explicite de lenvironnementndash pas de meacutemoire de son histoire ni de but explicitendash comportement de type stimulus reacuteponsendash mode biologique dorganisationndash grand nombre dagents (gt100) homogegravenes agrave grain fin

bull La structure du systegraveme eacutemerge des comportements et non dune volonteacute dorganisation

Deacutefinir - Architecture interne -Degreacute de couplage de lrsquoagent agrave lrsquoenvironnement on peut consideacuterer plusieurs cateacutegories drsquoagent

Fort reacuteactif Comportement dirigeacute par les changements de lrsquoenvironnement

hybride

Faible deacutelibeacuteratif (cognitif) Comportement dirigeacute par les buts agrave satisfaire

Couplage agrave lrsquoenvironnement

ARCHITECTURES REACTIFS-COGNITIFS

Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)

Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs

3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute

(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions

2 caracteacuteristiques

bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de

regravegles situation rarraction

bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute

-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs

Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute

Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur

Exercice les robots explorateurs

Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure

suivante)

Dans le cadre de larchitecture agrave subsomption deacutefinir

- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions

Mecircme question pour un ensemble de robots coopeacuteratifs

Figure

Problegraveme

Reacuteponses modules comportementaux =

Explorer

Preacutelever

Aller agrave la base

Deacuteposer

Eacuteviter obstacle

Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)

regravegle 1 si deacutetecte un obstacle alors changer de direction

regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon

regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)

regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever

regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement

Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire

Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement

Architecture agrave subsomptions

Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction

regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5

Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption

Robots explorateurs de Mars (Steels89)

Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip

Exemple de regravegles pour robots coopeacuteratifs

poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par

regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques

radioactives et suivre gradient (retour)

=gt une nouvelle regravegle

regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient

(aller)

Hieacuterarchie des prioriteacutes de deacuteclenchement

La hieacuterarchie de comportements

regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5

regravegle6 gt regravegle 5

le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 11: Ch3 sma-architectures-2012

Cognitif ou Reacuteactif

bull Agent cognitif ndash repreacutesentation explicite de lenvironnement et des autres agentsndash peut tenir compte de son passeacute et dispose dun but explicitendash mode social dorganisation (planification engagement)ndash petit nombre dagents (1020) heacuteteacuterogegravenes agrave gros grain

bull Les relations entre agents seacutetablissent en fonction des collaborations neacutecessaires agrave la reacutesolution du problegraveme

bull Agent reacuteactifndash pas de repreacutesentation explicite de lenvironnementndash pas de meacutemoire de son histoire ni de but explicitendash comportement de type stimulus reacuteponsendash mode biologique dorganisationndash grand nombre dagents (gt100) homogegravenes agrave grain fin

bull La structure du systegraveme eacutemerge des comportements et non dune volonteacute dorganisation

Deacutefinir - Architecture interne -Degreacute de couplage de lrsquoagent agrave lrsquoenvironnement on peut consideacuterer plusieurs cateacutegories drsquoagent

Fort reacuteactif Comportement dirigeacute par les changements de lrsquoenvironnement

hybride

Faible deacutelibeacuteratif (cognitif) Comportement dirigeacute par les buts agrave satisfaire

Couplage agrave lrsquoenvironnement

ARCHITECTURES REACTIFS-COGNITIFS

Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)

Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs

3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute

(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions

2 caracteacuteristiques

bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de

regravegles situation rarraction

bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute

-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs

Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute

Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur

Exercice les robots explorateurs

Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure

suivante)

Dans le cadre de larchitecture agrave subsomption deacutefinir

- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions

Mecircme question pour un ensemble de robots coopeacuteratifs

Figure

Problegraveme

Reacuteponses modules comportementaux =

Explorer

Preacutelever

Aller agrave la base

Deacuteposer

Eacuteviter obstacle

Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)

regravegle 1 si deacutetecte un obstacle alors changer de direction

regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon

regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)

regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever

regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement

Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire

Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement

Architecture agrave subsomptions

Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction

regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5

Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption

Robots explorateurs de Mars (Steels89)

Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip

Exemple de regravegles pour robots coopeacuteratifs

poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par

regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques

radioactives et suivre gradient (retour)

=gt une nouvelle regravegle

regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient

(aller)

Hieacuterarchie des prioriteacutes de deacuteclenchement

La hieacuterarchie de comportements

regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5

regravegle6 gt regravegle 5

le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 12: Ch3 sma-architectures-2012

Deacutefinir - Architecture interne -Degreacute de couplage de lrsquoagent agrave lrsquoenvironnement on peut consideacuterer plusieurs cateacutegories drsquoagent

Fort reacuteactif Comportement dirigeacute par les changements de lrsquoenvironnement

hybride

Faible deacutelibeacuteratif (cognitif) Comportement dirigeacute par les buts agrave satisfaire

Couplage agrave lrsquoenvironnement

ARCHITECTURES REACTIFS-COGNITIFS

Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)

Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs

3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute

(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions

2 caracteacuteristiques

bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de

regravegles situation rarraction

bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute

-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs

Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute

Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur

Exercice les robots explorateurs

Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure

suivante)

Dans le cadre de larchitecture agrave subsomption deacutefinir

- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions

Mecircme question pour un ensemble de robots coopeacuteratifs

Figure

Problegraveme

Reacuteponses modules comportementaux =

Explorer

Preacutelever

Aller agrave la base

Deacuteposer

Eacuteviter obstacle

Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)

regravegle 1 si deacutetecte un obstacle alors changer de direction

regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon

regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)

regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever

regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement

Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire

Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement

Architecture agrave subsomptions

Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction

regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5

Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption

Robots explorateurs de Mars (Steels89)

Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip

Exemple de regravegles pour robots coopeacuteratifs

poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par

regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques

radioactives et suivre gradient (retour)

=gt une nouvelle regravegle

regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient

(aller)

Hieacuterarchie des prioriteacutes de deacuteclenchement

La hieacuterarchie de comportements

regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5

regravegle6 gt regravegle 5

le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 13: Ch3 sma-architectures-2012

ARCHITECTURES REACTIFS-COGNITIFS

Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)

Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs

3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute

(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions

2 caracteacuteristiques

bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de

regravegles situation rarraction

bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute

-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs

Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute

Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur

Exercice les robots explorateurs

Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure

suivante)

Dans le cadre de larchitecture agrave subsomption deacutefinir

- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions

Mecircme question pour un ensemble de robots coopeacuteratifs

Figure

Problegraveme

Reacuteponses modules comportementaux =

Explorer

Preacutelever

Aller agrave la base

Deacuteposer

Eacuteviter obstacle

Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)

regravegle 1 si deacutetecte un obstacle alors changer de direction

regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon

regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)

regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever

regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement

Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire

Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement

Architecture agrave subsomptions

Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction

regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5

Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption

Robots explorateurs de Mars (Steels89)

Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip

Exemple de regravegles pour robots coopeacuteratifs

poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par

regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques

radioactives et suivre gradient (retour)

=gt une nouvelle regravegle

regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient

(aller)

Hieacuterarchie des prioriteacutes de deacuteclenchement

La hieacuterarchie de comportements

regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5

regravegle6 gt regravegle 5

le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 14: Ch3 sma-architectures-2012

Agents reacuteactifs Architecture agrave subsomptions (R Brooks 1986)

Architecture agrave subsomption (architecture interne) la + connue des architectures drsquoagents reacuteactifs

3 ideacutees cleacutes comportement intelligent peut ecirctre geacuteneacutereacute

(1) sans repreacutesentation explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(2) sans raisonnement abstrait explicite (agrave lrsquoencontre de lrsquoIA symbolique)

(3) lrsquointelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes due aux interactions

2 caracteacuteristiques

bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de

regravegles situation rarraction

bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute

-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs

Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute

Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur

Exercice les robots explorateurs

Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure

suivante)

Dans le cadre de larchitecture agrave subsomption deacutefinir

- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions

Mecircme question pour un ensemble de robots coopeacuteratifs

Figure

Problegraveme

Reacuteponses modules comportementaux =

Explorer

Preacutelever

Aller agrave la base

Deacuteposer

Eacuteviter obstacle

Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)

regravegle 1 si deacutetecte un obstacle alors changer de direction

regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon

regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)

regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever

regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement

Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire

Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement

Architecture agrave subsomptions

Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction

regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5

Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption

Robots explorateurs de Mars (Steels89)

Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip

Exemple de regravegles pour robots coopeacuteratifs

poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par

regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques

radioactives et suivre gradient (retour)

=gt une nouvelle regravegle

regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient

(aller)

Hieacuterarchie des prioriteacutes de deacuteclenchement

La hieacuterarchie de comportements

regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5

regravegle6 gt regravegle 5

le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 15: Ch3 sma-architectures-2012

2 caracteacuteristiques

bullLa prise de deacutecision drsquoun agent est reacutealiseacutee agrave travers un ensemble de modules comportementaux correspondant agrave la tacircche agrave reacutealiser Comportement impleacutementeacute sous la forme de

regravegles situation rarraction

bullLa reacutesolution de conflit lorsque plusieurs comportements peuvent ecirctre deacuteclencheacutes agrave un instant donneacute

-arranger les modules drsquoaction dans une hieacuterarchie de subsomptions selon diffeacuterentes couches-les hauts niveaux peuvent inhiber les niveaux infeacuterieurs

Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute

Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur

Exercice les robots explorateurs

Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure

suivante)

Dans le cadre de larchitecture agrave subsomption deacutefinir

- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions

Mecircme question pour un ensemble de robots coopeacuteratifs

Figure

Problegraveme

Reacuteponses modules comportementaux =

Explorer

Preacutelever

Aller agrave la base

Deacuteposer

Eacuteviter obstacle

Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)

regravegle 1 si deacutetecte un obstacle alors changer de direction

regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon

regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)

regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever

regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement

Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire

Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement

Architecture agrave subsomptions

Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction

regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5

Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption

Robots explorateurs de Mars (Steels89)

Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip

Exemple de regravegles pour robots coopeacuteratifs

poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par

regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques

radioactives et suivre gradient (retour)

=gt une nouvelle regravegle

regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient

(aller)

Hieacuterarchie des prioriteacutes de deacuteclenchement

La hieacuterarchie de comportements

regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5

regravegle6 gt regravegle 5

le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 16: Ch3 sma-architectures-2012

Lrsquoarchitecture de Subsomption fondeacutee sur des couches organiseacutees de bas en haut agrave partir des organes sensorimoteurs en une hieacuterarchie de modules agrave comportement limiteacute

Chaque niveau a un rapport de dominance sur le module de niveau infeacuterieur

Exercice les robots explorateurs

Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure

suivante)

Dans le cadre de larchitecture agrave subsomption deacutefinir

- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions

Mecircme question pour un ensemble de robots coopeacuteratifs

Figure

Problegraveme

Reacuteponses modules comportementaux =

Explorer

Preacutelever

Aller agrave la base

Deacuteposer

Eacuteviter obstacle

Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)

regravegle 1 si deacutetecte un obstacle alors changer de direction

regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon

regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)

regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever

regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement

Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire

Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement

Architecture agrave subsomptions

Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction

regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5

Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption

Robots explorateurs de Mars (Steels89)

Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip

Exemple de regravegles pour robots coopeacuteratifs

poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par

regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques

radioactives et suivre gradient (retour)

=gt une nouvelle regravegle

regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient

(aller)

Hieacuterarchie des prioriteacutes de deacuteclenchement

La hieacuterarchie de comportements

regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5

regravegle6 gt regravegle 5

le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 17: Ch3 sma-architectures-2012

Exercice les robots explorateurs

Lobjectif est de reacutealiser un collectif de robots pour explorer une planegravete eacuteloigneacuteeLe but de ces robots est de collecter des eacutechantillons de minerai sur le sol Lalocalisation de ces eacutechantillons est inconnue au deacutepart Les robots meacutemorisent lalocalisation de la base dougrave ils viennent et ougrave ils doivent ramener les mineraiscollecteacutes Ils nont pas de carte de la reacutegion agrave explorer par contre ils savent quecette reacutegion comporte des obstacles infranchissables Pour simplifier on supposequun robot possegravede une eacutenergie lui permettant de fonctionner indeacutefiniment (figure

suivante)

Dans le cadre de larchitecture agrave subsomption deacutefinir

- les regravegles ou modules comportementaux drsquoun robot lsquosolitairersquo- la hieacuterarchie de subsomptions

Mecircme question pour un ensemble de robots coopeacuteratifs

Figure

Problegraveme

Reacuteponses modules comportementaux =

Explorer

Preacutelever

Aller agrave la base

Deacuteposer

Eacuteviter obstacle

Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)

regravegle 1 si deacutetecte un obstacle alors changer de direction

regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon

regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)

regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever

regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement

Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire

Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement

Architecture agrave subsomptions

Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction

regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5

Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption

Robots explorateurs de Mars (Steels89)

Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip

Exemple de regravegles pour robots coopeacuteratifs

poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par

regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques

radioactives et suivre gradient (retour)

=gt une nouvelle regravegle

regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient

(aller)

Hieacuterarchie des prioriteacutes de deacuteclenchement

La hieacuterarchie de comportements

regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5

regravegle6 gt regravegle 5

le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 18: Ch3 sma-architectures-2012

Figure

Problegraveme

Reacuteponses modules comportementaux =

Explorer

Preacutelever

Aller agrave la base

Deacuteposer

Eacuteviter obstacle

Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)

regravegle 1 si deacutetecte un obstacle alors changer de direction

regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon

regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)

regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever

regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement

Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire

Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement

Architecture agrave subsomptions

Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction

regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5

Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption

Robots explorateurs de Mars (Steels89)

Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip

Exemple de regravegles pour robots coopeacuteratifs

poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par

regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques

radioactives et suivre gradient (retour)

=gt une nouvelle regravegle

regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient

(aller)

Hieacuterarchie des prioriteacutes de deacuteclenchement

La hieacuterarchie de comportements

regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5

regravegle6 gt regravegle 5

le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 19: Ch3 sma-architectures-2012

Reacuteponses modules comportementaux =

Explorer

Preacutelever

Aller agrave la base

Deacuteposer

Eacuteviter obstacle

Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)

regravegle 1 si deacutetecte un obstacle alors changer de direction

regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon

regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)

regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever

regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement

Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire

Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement

Architecture agrave subsomptions

Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction

regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5

Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption

Robots explorateurs de Mars (Steels89)

Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip

Exemple de regravegles pour robots coopeacuteratifs

poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par

regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques

radioactives et suivre gradient (retour)

=gt une nouvelle regravegle

regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient

(aller)

Hieacuterarchie des prioriteacutes de deacuteclenchement

La hieacuterarchie de comportements

regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5

regravegle6 gt regravegle 5

le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 20: Ch3 sma-architectures-2012

Modules comportementaux pour robot sous forme de regravegles (non coopeacuteratif)

regravegle 1 si deacutetecte un obstacle alors changer de direction

regravegle 2 si porte un eacutechantillon et agrave la base alors deacuteposer lrsquoeacutechantillon

regravegle 3 si porte un eacutechantillon et pas agrave la base alors suivre gradient (retour)

regravegle 4 si deacutetecte un eacutechantillon alors le preacutelever

regravegle 5 si vrai alors se deacuteplacer aleacuteatoirement

Imaginons que le robot ait le choix entre la regravegle 1 et la regravegle3 Que doit-il faire

Mecircme question pour les regravegles 4 et 3=gt hieacuterarchie de deacuteclenchement

Architecture agrave subsomptions

Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction

regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5

Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption

Robots explorateurs de Mars (Steels89)

Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip

Exemple de regravegles pour robots coopeacuteratifs

poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par

regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques

radioactives et suivre gradient (retour)

=gt une nouvelle regravegle

regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient

(aller)

Hieacuterarchie des prioriteacutes de deacuteclenchement

La hieacuterarchie de comportements

regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5

regravegle6 gt regravegle 5

le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 21: Ch3 sma-architectures-2012

Architecture agrave subsomptions

Hieacuterarchie des prioriteacutes de deacuteclenchement des modules drsquoaction

regravegle1 gt regravegle2 gt regravegle3 gt regravegle4 gt regravegle5

Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption

Robots explorateurs de Mars (Steels89)

Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip

Exemple de regravegles pour robots coopeacuteratifs

poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par

regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques

radioactives et suivre gradient (retour)

=gt une nouvelle regravegle

regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient

(aller)

Hieacuterarchie des prioriteacutes de deacuteclenchement

La hieacuterarchie de comportements

regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5

regravegle6 gt regravegle 5

le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 22: Ch3 sma-architectures-2012

Exemple drsquoimplantation de lrsquoarchitecture agrave subsomption

Robots explorateurs de Mars (Steels89)

Prioriteacute Niveau 5 gt prioriteacute Niveau 4 gt hellip

Exemple de regravegles pour robots coopeacuteratifs

poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par

regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques

radioactives et suivre gradient (retour)

=gt une nouvelle regravegle

regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient

(aller)

Hieacuterarchie des prioriteacutes de deacuteclenchement

La hieacuterarchie de comportements

regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5

regravegle6 gt regravegle 5

le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 23: Ch3 sma-architectures-2012

Exemple de regravegles pour robots coopeacuteratifs

poser 2 marques au retour et enlever 1 agrave lrsquoaller la regravegle 3 est remplaceacutee par

regravegle 3bis si porte un eacutechantillon et pas agrave la base alors lacirccher 2 marques

radioactives et suivre gradient (retour)

=gt une nouvelle regravegle

regravegle 6 si perccediloit des marques alors retirer 1 marque et suivre le gradient

(aller)

Hieacuterarchie des prioriteacutes de deacuteclenchement

La hieacuterarchie de comportements

regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5

regravegle6 gt regravegle 5

le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 24: Ch3 sma-architectures-2012

La hieacuterarchie de comportements

regravegle1 gt regravegle2 gtregravegle3bisgt regravegle4 gtregravegle6gt regravegle5

regravegle6 gt regravegle 5

le robot choisira preacutefeacuterentiellement de suivre une marque plutocirct que de se deacuteplacer aleacuteatoirement

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 25: Ch3 sma-architectures-2012

Avec pose des marques ( Coopeacuteration)

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 26: Ch3 sma-architectures-2012

Modegraveles en eacutethologie IRMbull Konrad Lorenz (~1950 Innate Releasing Mechanism)bull Modegravele d activation de comportement

Autres Architectures

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 27: Ch3 sma-architectures-2012

Niveau 1 - Niveau des principaux instincts(buts profonds) Ex instinct reproductif

Niveau 2 - Niveau des instincts secondaires(sous-buts) Excombat soins aux jeunes

Niveau 3 - Comportements consommatoires(seacutequences fixes dactions ) Exchasser parader menacer

Niveau 4 5 et 6 - subdivisions dactions de base raquo (actions)

Modegraveles en eacutethologie Nikolaas Tinbergen Modegravele hieacuterarchique de seacutelection de comportements ( psychologie finaliste) Distingue entre comportements appeacutetitifs et consommatoires

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 28: Ch3 sma-architectures-2012

Modegraveles ANA Patti Maes 91 - Agent Network Architecture Modegravele semi-hieacuterarchique de seacutelection dactions

Caracteacuteristiquesbull Mixte Ethologie Vie Artificielle

bull Bien adapteacute agrave des agents ayant des comportements diffeacuterents

bull Forte redondance des actions de base (flee-from-) en cas de

comportements similaires

bull Difficile agrave concevoir et agrave tester

ndash multipliciteacute des liens

ndash dynamique importante

bull Bonne ouverture agrave lapprentissagendash renforcement des liens

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 29: Ch3 sma-architectures-2012

Modegraveles EMF (lrsquoEthoModeling Framework)

Modegravele non hieacuterarchique de seacutelection de tacircches (IRM + fixed action patterns)

(sert de base pour le projet MANTA)

EMF Proposeacute par A Drogoul (1991-2000) Utilise le modegravele drsquoactiviteacute instictive deKonrad Lorenz Les fondements de lrsquoethologie 1984 Champs Flammarion

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 30: Ch3 sma-architectures-2012

Agents Reacuteactifs

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 31: Ch3 sma-architectures-2012

Agent cognitif versus Agent reacuteactif

bullRepreacutesentation du monde

Symbolique

bullComportement

Orienteacute but

bullFondements

IA

(Denett Bratmanhellip)

bullRepreacutesentation du monde

Sub-symbolique (perceptions)

bullComportement

Reacuteflexe

bullFondements

Inspiration eacutethologique bio

(Brooks)

SMA Cognitifs accent mis sur laction la deacutecision et linteraction dans un

contexte collectif (inspiration socio-mimeacutetique) Capaciteacutes drsquoapprentissage et

drsquoadaptation agrave lrsquoenvironnement

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 32: Ch3 sma-architectures-2012

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Fondeacutes sur des extensions de la logique laquoPractical Reasoningraquo (raisonnement pratique) en philosophie

Deux processusbullDeacutecider quels buts poursuivre Quoi hArrdeacutelibeacuterations

bullDeacutecider comment les reacutealiser Comment hArrmeans-end reasoning

Analyse laquodes fins et des moyensraquo (Aristote)laquoBUT Je veux emmener mon fils agrave lrsquoeacutecole

Quelle est la diffeacuterence entre ce que jrsquoai et ce que je veux une distance Qursquoest-ce qui change une distance Mon automobile Mon automobile est en panne

De quoi ai-je besoin pour la faire fonctionner Une batterie neuve

Qui a des batteries neuves Un garage Je veux que le garage mette une batterie neuve

Le garage ne sais pas que je veux une batterie neuve

Quelle est la difficulteacute De communication Qursquoest-ce qui permet de communiquer Un teacuteleacutephone hellipraquo

Analyse sous forme de seacutequences de fin de fonction neacutecessaire et de

moyen qui reacutealise cette fonction

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 33: Ch3 sma-architectures-2012

Agents cognitifs architecture BDI laquoBeliefs Desires

Intentionsraquo

Face agrave une deacutecision laquoPractical reasoningraquo

bullAvoir certaines informations connaissances sur le problegraveme

(laquocroyancesraquo)

bullEnvisager les options possibles et les eacutetats que lrsquoagent souhaite

atteindre (laquodesiresraquo) les eacutetats peuvent ecirctre contradictoires

bullChoisir certains eacutetats agrave atteindre (laquoIntentionsraquo)

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 34: Ch3 sma-architectures-2012

Mise agrave jour agrave partir des croyances et des perceptions

Informations sur lrsquoenvironnement courantFonction deacuteterminant les options

possibles selon les intentions et les croyances

Ensemble des options courantesProcessus de deacutelibeacuteration deacuteterminant

lrsquoengagement vis agrave vis des intentions (abandon

maintien)

Ensemble des intentions sur lesquelles se focalise lrsquoagentProcessus de seacutelection de lrsquoaction agrave exeacutecuter

Principe drsquoune architecture BDI

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 35: Ch3 sma-architectures-2012

Agents Cognitifs

3APL DEMO

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 36: Ch3 sma-architectures-2012

Agents Hybrides Architecture multi-niveaux

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 37: Ch3 sma-architectures-2012

Agent structureacute en couches

bullSouvent mais pas toujours architectures deacutelibeacuteratives

bullPrise de deacutecision en seacuteparant les niveaux software

bullChaque couche raisonne agrave un niveau drsquoabstraction

bullLes couches interagissent

Couches de 2 types

bullCouches verticales perception (in) et action (out) reacutealiseacutees par une mecircme couche

bullCouches horizontales chaque couche est directement connecteacutee agrave la perception

(in) et lrsquoaction (out)

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 38: Ch3 sma-architectures-2012

Conception par couchesTypiquement au moins 2 couches une pour le comportement reacuteactif et une pour le

comportement proactif

Possibiliteacute de concevoir plusieurs couches

Topologie information et controcircle de flux entre plusieurs couches

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 39: Ch3 sma-architectures-2012

Horizontal

Chaque couche agit comme un agent indeacutependance simpliciteacute

pour n comportements diffeacuterents on impleacutemente n couches

compeacutetition entre couches gestion des incoheacuterences

Besoin drsquoune meacutediation entre couches complexiteacute grande et controcircle difficile

Vertical

Complexiteacute faible pas de goulot drsquoeacutetranglement au niveau du controcircle

Moins flexible et peu toleacuterante aux fautes une deacutecision neacutecessite tous les niveaux

Couches Avantages et inconveacutenients

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 40: Ch3 sma-architectures-2012

Exemple TOURINGMACHINES (Innes A Ferguson 92)

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 41: Ch3 sma-architectures-2012

TOURINGMACHINES

3 couches produisent des suggestions drsquoaction

bullReacuteactive impleacutemente des regravegles de situation-action comme dans

lrsquoarchitecture de subsumption de Brooks

bullPlanification reacutealise la proactiviteacute via des plans baseacutes sur une

librairie de squelettes de plans

bullModeacutelisation modegravele du monde autres agents soi preacutedit les

conflits geacutenegravere des buts et les reacutesout

Domaine drsquoutilisation veacutehicules multiples

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 42: Ch3 sma-architectures-2012

Exemple INTERRAP

(Integration of Reactive Behavior and Rational Planning)

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 43: Ch3 sma-architectures-2012

INTERRAP

Architecture en couches verticale avec 2 passes

Les couches ont le mecircme fonctionnement que dans la TOURINGMACHINES

Chaque couche est associeacutee agrave une base de connaissances

Les couches interagissent De bas vers le haut (bottom-up) activation

De haut vers le bas (top-down) exeacutecution

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 44: Ch3 sma-architectures-2012

Concept 2 Interaction

DeacutefinitionsbullToute action (ou ensemble de) qui affecte lrsquoagent dans la reacutealisation de son but de sa

tacircche

bullMise en relation dynamique de deux ou de plusieurs agents par le biais drsquoun ensemble

drsquoactions reacuteciproques

bullExistence drsquoune interaction lorsque la dynamique propre drsquoun agent est perturbeacutee par

les influences des autres

Exemples

bullConstruction drsquoune maison par plusieurs ouvriers

bullCollision de voitures

bullMise en commun drsquoexpertises

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 45: Ch3 sma-architectures-2012

Le choix de techniques de coordination

Motivationscapaciteacutes individuelles insuffisantes (ex charges trop lourdes agrave transporter)coheacuterence (reacuteguler les conflits seacutemantiques buts contradictoires accegravesaux ressources)efficaciteacute traitement de lincertainrecomposition des reacutesultats - solutions partielles

Techniquesplanification centraliseacutee semi-centraliseacutee (synchronisation de plans individuels) deacutecentraliseacuteesynchronisation daccegraves aux ressources

ndash algorithmique reacutepartiendash regravegles sociales

neacutegociationndash numeacuterique symbolique (agreacutegation argumentation) deacutemocratique (vote

arbitrage) utilitarisme (theacuteorie des jeux)sans communication explicite

ndash environnement reconnaissance dintentions

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 46: Ch3 sma-architectures-2012

Situations drsquointeraction

Classement des situations drsquointeraction selon les buts les

ressources et les compeacutetences des agents

bullButs compatibles ou incompatibles

bullRessources suffisantes ou insuffisantes

bullCompeacutetences suffisantes ou insuffisantes

rArrIndiffeacuterence coopeacuteration antagonisme

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 47: Ch3 sma-architectures-2012

Classement des situations drsquointeractions (Ferber 95)

Indiffeacuterence Coopeacuterationou ou Antagonisme

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 48: Ch3 sma-architectures-2012

Le choix dun modegravele de communication

Environnementperception action (ex consommation de ressources)traces (ex pheacuteromones)

Symbolique (messages)meacutedium (reacuteseau voix vision)participants

ndash individuel - point agrave pointndash partageacute - multicastndash global - broadcastndash publish subscribe (eacuteveacutenements)

Actes de langagedire cest faire des phrases ne sont pas vraies ou fausses elles constituent des actions de langageLa communication est pragmatiquendash elle explique geacuteneacuteralement ce qui est accompli plus que ce agrave quoi cela se reacutefegraverendash demander de faire quelque chose est une maniegravere drsquoatteindre un but

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 49: Ch3 sma-architectures-2012

La Communication un moyen de geacuterer les interactions

Probleacutematique de la communication Quelques questions agrave se poser

bullAvec qui les agents communiquent-ils Communication seacutelective ou diffuseacutee (cf reacuteseau drsquoaccointances)

bullPourquoi les agents communiquent-ils Coopeacuteration et coordination drsquoactions ou neacutegociation

(coordination eacuteviter les activiteacutes redondantes

neacutegociation crsquoest lrsquoinverse de la coordination surtout en environnement compeacutetitif ou avec

des agents concurrents ou eacutegoiumlstes)

bullQuand les agents communiquent-ils

Demande ou besoin drsquoun agent hellip

bullQue communiquent-ils Croyances intentions tacircches hellip

bullComment les agents communiquent-ils

Langage de communication compreacutehensible

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 50: Ch3 sma-architectures-2012

2 types de communication

bullCommunication indirecte Partage drsquoinformations- via un tableau noir

- via lrsquoenvironnement pheacuteromones modification de lrsquoenvironnement + capteurs

bullCommunication directe (interaction deacutelibeacuterative) - Envoi de messages point agrave point diffusion totale restreinte hellip

-Suppose diffeacuterentes compeacutetences au sein drsquoun agent drsquoenvoi de reacuteception drsquo interpreacutetation

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 51: Ch3 sma-architectures-2012

Fondements de la communication directe

Sources multiples Linguistique philosophie du langage psychologie cognitive et

sociale sociologie

Linguistique informatique intelligence artificielle (cfcours TAL en M1 SCA de G

Perrier L Knittel)

Pragmatique conversationnelle [Habermas] (cfcours laquo pragmatique du langage raquo en

L3 de F Duval )

Intention dans les communications

bullPrise en compte des eacutetats mentaux (ex BDI)(cfcours laquo philosophie de lrsquoesprit

raquo en L3 ISC de M Rebuschi)

Theacuteorie des actes de langages(Speech Acts) [Austin 62 Searle 72

Vanderveken88](cfcours laquo interaction langagiegravere raquo en L3 Sciences Code C Brassac)

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 52: Ch3 sma-architectures-2012

Actes de langage (Aperccedilu)

Theacuteories des actes de langages sont des theacuteories relatives agrave lrsquoutilisation du langage

(pragmatique)

Cadre drsquoanalyse des eacutechanges inter humains

laquo How to do things with wordsraquo (laquo Quand dire crsquoest faire raquo) [Austin 62]

rArrToute communication est faite avec lrsquoobjectif de satisfaire un but une intention

Intention pas toujours eacutevidente

laquojrsquoai froidraquo peut signifier laquoferme la porteraquo laquodonne moi mon pullraquo (requecirctes deacuteguiseacutees)

laquoil fait froidraquo (affirmation)

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 53: Ch3 sma-architectures-2012

Actes de langages

On distingue trois composantes agrave lrsquoacte

1acte locutoire production drsquoune suite de signes selon les regravegles syntaxiques drsquoun

langage donneacute (acte de dire quelque chose )

2 acte illocutoire acte reacutealiseacute en produisant une suite de signes dans un contexte

donneacute exprimant une intention (rArrintention du locuteur)

noteacute A=F(P) Acte=Force(Proposition)

P le contenu propositionnel et F la force illocutoire

3 acte perlocutoire elle porte sur les effets de lrsquoacte vis agrave vis du destinataire

(changement drsquoeacutetat interne action hellip) (rArrconseacutequence effet sur le destinataire)

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 54: Ch3 sma-architectures-2012

Actes de langages verbes performatifs

Typage des messages Utilisation drsquoun champ laquoforce illocutoireraquo agrave lrsquoaide de verbes

performatifs pour restreindre les ambiguiumlteacutes drsquoun message

bullExemples convaincre promettre ordonner

Exemples de classes de force

bullAssertif (assertion ou fait) penser affirmer dire informer

bullDirectif (commande) demander avertir reacuteclamer supplier

bullCommissif (engagement) promettre garantir refuser

bullDeacuteclaratif (assertion ou fait) deacuteclarer stipuler ratifier

bullExpressif (expression drsquoeacutemotion) feacuteliciter excuser approuver deacuteplorer

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 55: Ch3 sma-architectures-2012

Actes de langages Succegraves et satisfaction

Accomplissement associeacute agrave des conditions de succegraves et de satisfaction

Indiquent dans quel cadre lrsquoacte reacuteussit

conditions de succegraves

bullce qui doit ecirctre veacuterifieacute dans le cadre de lrsquoeacutenonciation

bullsrsquoappuient principalement sur F

Ex lrsquoacte de communication est reacuteussi si le destinataire a compris qursquoil fallait

fermer la porte mais lrsquoacte nrsquoest pas forceacutement satisfait hellip

conditions de satisfaction

bullaspect perlocutoire tiennent compte de lrsquoeacutetat du monde reacutesultant de lrsquoacte

bullsrsquoappuient principalement sur P et sa valeur de veacuteriteacute

Ex lrsquoacte est satisfait si le destinataire ferme effectivement la porte

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 56: Ch3 sma-architectures-2012

Langages de communication baseacutes sur les actes de

langage

Actes de langage = Theacuteorie abondamment utiliseacutee pour speacutecifier comment

communiquer entre agents

Deacutefinition de langages de communication entre agents = ACL (Agent

communication Language) KQML(Knowledge Query and Manipulation

Language) etc

KQML

bullDeacutefinition drsquoun ensemble de performatifs

bullPrincipalement assertifs et directifs

bullPossibiliteacute drsquoutiliser diffeacuterents langages drsquoexpression du contenu eacutechangeacute KIF

LISP PROLOG KQML (imbrication de messages KQML)

bullPermet drsquoinclure dans le message tout ce qui est neacutecessaire agrave sa compreacutehension

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 57: Ch3 sma-architectures-2012

KQML

Syntaxe agrave 3 niveaux

bullMessage pour speacutecifier le type drsquoacte (performatif) le langage drsquo expression

du message (PROLOG )et lrsquoontologie (speacutecification de vocabulaire drsquoobjets

de concepts et de relations dans un domaine drsquointeacuterecirct )

bullCommunication pour identifier lrsquoeacutemetteur le reacutecepteur et le message

bullContenu

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 58: Ch3 sma-architectures-2012

KQML

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 59: Ch3 sma-architectures-2012

Un Exemple

(inform

sender A

receiver B

reply-with laptop

language KIF

ontology ordinateurs

content (=(prix HP-Jet) (scalar 1500 USD))

reply-by 10

conversation-id conv01

)

Sender lrsquoeacutemetteur du message

Receiverle destinataire du message

reply-with identificateur unique du message en vue dune reacutefeacuterence ulteacuterieure

Language le langage dans lequel le contenu est repreacutesenteacute

Ontology le nom de lontologie utiliseacute pour donner un sens aux termes utiliseacutes dans le

content

Content le contenu du message (lrsquoinformation transporteacutee par la performative)

reply-by impose un deacutelai pour la reacuteponse

conversation-id identificateur de la conversation

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 60: Ch3 sma-architectures-2012

KQML

Permettre aux agents cognitifs de coopeacuterer

Indeacutependant du meacutecanisme de transport (TCPIP SMTP ou autre)

Indeacutependant du langage du contenu eacutechangeacute (KIF SQL Prolog ou autre)

Indeacutependant de lontologie utiliseacutee

=gt Peu de contraintes de deacuteveloppement

Mais hellip

Manque de certains performatifs (ex engagement)

Incoheacuterence ou inutiliteacute de certains performatifs

Ambiguiteacute et impreacutecision

Manque de deacutefinition et de formalisation

Pas de cadre pour geacuterer les agents

Solution Premier pas vers la normalisation drsquoun ACL

Deacutefinition drsquoun ensemble minimum de performatifs avec possibiliteacute de les

composer rArrFIPA (Fundation for Intelligent Physical Agents

wwwfipaorg )

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 61: Ch3 sma-architectures-2012

ACL FIPA

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 62: Ch3 sma-architectures-2012

KIF en quelques mots

bullKnowledge Interchange Format (effort DARPA)

bullLangage de description bullLisible par une machine et un humain

bullversion preacutefixeacutee du calcul des preacutedicats du 1erordre

bullune speacutecification pour la syntaxe

bullune speacutecification pour la seacutemantique

bullExemples devinez ce qui est exprimeacutebull(gt ( (width chip1) (length chip1)) ((width chip2) (length chip2)))

ouencore

bull(=gt (and (real-numberx) (even-numbern)) (gt (exptxn) 0)))

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 63: Ch3 sma-architectures-2012

Concept 3 Environnement

1048766Environnement du SMA laquo espace raquo commun aux agents du systegraveme

doteacute drsquoun ensemble drsquoobjets du problegraveme

1048766Environnement drsquoun agent ce qui est exteacuterieur agrave lrsquo agent =

lrsquoenvironnement du SMA + la repreacutesentation des autres agents dans le

monde

--- ET les Caracteacuteristiques deacutejagrave vues helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 64: Ch3 sma-architectures-2012

Environnement

1 Speacutecification de lrsquoenvironnement

Premiegravere eacutetape lors de la conception drsquoun agent deacuteterminer lrsquoenvironnement de la tacirccheCette conception comprend

- P mesure de la performance - E environnement de lrsquoagent (le monde (contexte) dans lequel il eacutevolue) - A effecteurs

- S capteurs

Exemple du taxi automatique - P = seacutecuriteacute vitesse respect des lois confort profitshellip - E = routes autres veacutehicules pieacutetons clientshellip - A = volant acceacuteleacuterateur frein clignotant klaxonhellip - S = cameacuteras sonar indicateur de vitesse capteurs du moteurhellip

Intelligence Artificielle IADSMA

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 65: Ch3 sma-architectures-2012

-Complegravetementpartiellement observable

bull Complegravetement observable si on observe effectivement lrsquoenvironnement entier ou au moins toutes les informations neacutecessaires agrave lrsquoagent pour prendre une deacutecision bull Partiellement si il y a du bruit ou si une partie du monde est simplement masqueacutee (lrsquoaspirateur ne peut pas savoir srsquoil y a de la saleteacute en B quand il est en A)

-Deacuteterministestochastique

bull On parle du point de vue de lrsquoagent Un monde deacuteterministe mais dont lrsquoobservation est partielle pourra paraicirctre stochastique agrave

lrsquoagent bull Un monde est deacuteterministe pour lrsquoagent si le prochain eacutetat ne deacutepend que de lrsquoeacutetat actuel et de lrsquoaction que lrsquoagent va reacutealiser bull Si le monde est deacuteterministe agrave la seule exception des autres agents il est dit strateacutegique

2 Proprieacuteteacutes de lrsquoenvironnement

Intelligence Artificielle IADSMA

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 66: Ch3 sma-architectures-2012

- Eacutepisodiqueseacutequentiel

bull Episodique le changement drsquoeacutetat de lrsquoenvironnement ne deacutepend que de son eacutetat actuel et pas des eacutetats passeacutes (pas de planification possible) bull Seacutequentiel une deacutecision prise agrave un moment donneacute va avoir un impact dans le futur (taxi eacutechecs) Les environnements eacutepisodiques sont plus simples agrave geacuterer

- Statiquedynamique

bull Dynamique lrsquoenvironnement peut changer mecircme si lrsquoagent ne fait rien (taxi automatique) bull Statique le contraire Plus simple agrave geacuterer car lrsquoagent nrsquoa pas agrave surveiller le monde en permanence (mots-croiseacutes bull Semi-dynamique lrsquoenvironnement ne change pas au cours du temps mais lrsquoeacutevaluation de sa performance oui (eacutechecs chronomeacutetreacutes)

Intelligence Artificielle IADSMA

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 67: Ch3 sma-architectures-2012

- Discretcontinu

bull La distinction peut srsquoappliquer -A lrsquoeacutetat du monde -A la faccedilon de geacuterer le temps -Aux percepts -Aux actions

bull Ex jeu drsquoeacutechecs est discret pour tout sauf le temps

Taxi est continu pour tout

- Mono-agentMulti-agent

bull On parle du point de vue de lrsquoagent bull Il peut ecirctre plus efficace en termes de performance de consideacuterer un agent (exteacuterieur) comme un objet ayant un comportement aleacuteatoire bull Compeacutetition multi-agents entrant en conflit (jeu drsquoeacutechecs) bull Coopeacuteration multi-agents oeuvrant ensemble (taxi automatique et les autres veacutehicules (partiellement coopeacuteratifs))

Intelligence Artificielle IADSMA

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 68: Ch3 sma-architectures-2012

Proprieacuteteacutes de lrsquoenvironnement

Situation la plus difficile

ndashPartiellement observablendashStochastiquendashSeacutequentiellendashDynamiquendashContinuendashMulti-agent

Exemple conduite automatiseacutee drsquoun taxi

Intelligence Artificielle Agents Intelligents

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 69: Ch3 sma-architectures-2012

Mesure de performance Formellement la mesure de performance se preacutesente sous la forme drsquoune fonction associant un nombre reacuteel agrave la succession des eacutetats de lrsquoenvironnement V SlowastrarrRougrave S est lrsquoensemble des historiques possibles

- la mesure doit ecirctre la plus objective possible crsquoest pourquoi elle deacutepend de lrsquoenvironnement elle est exteacuterieure agrave lrsquoagent Par exemple un agent humain nrsquoest pas forceacutement objectif quand il srsquoagit de srsquoauto-eacutevaluer certaines personnes se surestiment drsquoautres se sous-estiment

- La mesure doit ecirctre pertinente par rapport agrave lrsquoobjectif souhaiteacute

- Pour reacutesumer

Externe

Fixeacutee par le concepteur

Propre agrave la tacircche

Intelligence Artificielle IADSMA

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 70: Ch3 sma-architectures-2012

Concept 4 Organisation

Le choix dun modegravele dorganisation 3 points de vue

organisations rationnellesndash collectiviteacutes agrave finaliteacutes speacutecifiquesndash objectifs rocircles relations (deacutependances) regravegles

organisations naturelles (veacutegeacutetatives)ndash objectif en lui-mecircme survie (perpeacutetuer lorganisation)ndash stabiliteacute adaptativiteacute

systegravemes ouvertsndash inter-relations deacutependances avec dautres organisations

environnement(s)ndash eacutechanges coalitions

Organisations abstraitesrocircles (client producteur meacutediateur)speacutecialisation des agents (simpliciteacute vs flexibiliteacute)redondance des agents (efficaciteacute vs robustesse)relations (deacutependances hieacuterarchie subordination deacuteleacutegation)protocoles dinteraction coordinationgestion des ressources partageacutees

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste

Page 71: Ch3 sma-architectures-2012

Organisation

Notion duale

bullStructure deacutecrivant comment les membres de lorganisation sont en relation aspect

statique

bullProcessus de construction dune structure auto-organisation reacute-organisation

eacutemergence aspect dynamique

Quelques inspirations

bullMilitaire Entreprise Marcheacute drsquoeacutechange Eacutequipe sportive

bullBiologie hellip

Approche organisationnelle approche eacutemergentiste