29
Intelligence artificielle développementale 27 Mars 2014 [email protected] r http:// www.oliviergeorgeon.com t oliviergeorgeon.com 1/29

Intelligence artificielle développementale 27 Mars 2014 [email protected] t oliviergeorgeon.com1/29

Embed Size (px)

Citation preview

  • Page 1
  • Intelligence artificielle dveloppementale 27 Mars 2014 [email protected] http://www.oliviergeorgeon.com t oliviergeorgeon.com1/29
  • Page 2
  • Plan Organisation dans le temps et lespace. Formalisme du couplage spatio-temporel. Architecture cognitive. Dmonstrations. Travaux pratiques Dveloppez votre agent auto-programmant (suite). oliviergeorgeon.com2/29
  • Page 3
  • Rappel des ides thoriques Le but est dapprendre (dcouvrir, organiser et exploiter) des rgularits dinteraction dans le temps et lespace pour favoriser des critres inns (manger, apprendre, etc.). Pour construire par lui-mme une ontologie de la ralit. A partir dexpriences dinteraction. Dtecter et rpondre des affordances de plus en plus sophistiques. auto-programmation. oliviergeorgeon.com3/29
  • Page 4
  • Propose Trace-Based Reasoning Time Hierarchical abstraction Matching Select Try to Enact More abstraction oliviergeorgeon.com4/29
  • Page 5
  • Example 2 oliviergeorgeon.com5/29
  • Page 6
  • Exemples de comportements appris oliviergeorgeon.com6/29
  • Page 7
  • Exemple 2 oliviergeorgeon.com7/29
  • Page 8
  • Apprentissage de rgularits spatio-squentielles oliviergeorgeon.com8/29
  • Page 9
  • Concept daffordance Capacit dun objet suggrer une utilisation. To afford tre en mesure ou permettre Les objets nous poussent agir (Heinz Werner) Une affordance est une proprit lie au couplage entre un agent et un environnement. Nous connaissons le monde en termes de possibilits dinteraction. oliviergeorgeon.com9/29
  • Page 10
  • Formalisme Agent Environment ObservationAction Formalisation traditionnelle O O A A Agent Environment ExprienceRsultat Apprentissage par exprience R R E E oliviergeorgeon.com10/29 Agent Environment Intended Interaction Enacted Interaction I I I I Radical Interactionism: I = E R X: Interactions composites
  • Page 11
  • How to learn the existence of possibly persistent entities in the environment? How to adapt to different categories of entities? Spatial Radical Interactionism Agent Environment Intended Interaction i I Enacted Interaction e I oliviergeorgeon.com11/29 Spatial position Spatial transformation reprsente le systme vestibulaire. Peut tre implment par un acclromtre. reprsente une information permettant dinfrer la localisation (convergence oculaire, dphasage inter-auriculaire, etc.)
  • Page 12
  • Spatial exemple 1 oliviergeorgeon.com Agent Environment Enacted interaction:.. Spatial position = (1,0) Spatial transformation = (0,0) Intended interaction 12/29
  • Page 13
  • Agent Environment Environment known at time t d e cd X d i cd X d e p1 i p1 i pj Ie pj I Decisional mechanism Problme de rcursivit Comment conserver la rcursivit? oliviergeorgeon.com Spatial position Spatial transformation 13/29
  • Page 14
  • Spatial Exemple 1 oliviergeorgeon.com14/29
  • Page 15
  • Enactive Cognitive Architecture -Lagent se programm lui-mme au cours de son exprience dinteraction. -Larchitecture cognitive ne se programme pas elle-mme. (Kantian space, e.g., Buzsaki 2013, Space, time, and memory) oliviergeorgeon.com15/29
  • Page 16
  • Inspiration des neurosciences oliviergeorgeon.com16/29
  • Page 17
  • Futures inspirations ? oliviergeorgeon.com Cotterill R. (2001). Progress in Neurobiology. 17/29
  • Page 18
  • ECA agent exemple 2 oliviergeorgeon.com18/29
  • Page 19
  • From drives to goals Afforded Simulated oliviergeorgeon.com19/29
  • Page 20
  • Travaux dirigs oliviergeorgeon.com 3eme partie. Salles TP6 et TP7 Groupes de 2 20/29
  • Page 21
  • Exercice Deux expriences possibles E = {e 1,e 2 } Deux rsultats possibles R = {r 1,r 2 } Quatre interactions possibles E x R = {i 11, i 12, i 21, i 22 } Environnements environnement 0 : e 1 -> r 1, e 2 -> r 2 (i 12 et i 21 ne se produisent jamais) environnement 1 : e 1 -> r 2, e 2 -> r 1 (i 11 et i 22 ne se produisent jamais) environnement 2 : e 1 -> r 2, e 2 -> r 2 environnement 3 Systmes motivationnels : motivation 0 : v(i 11 ) = v(i 21 ) = 1, v(i 12 ) = v(i 22 ) = -1 motivation 1 : etc. Implmenter un agent qui apprenne effectuer les interactions positives sans connatre priori son systme motivationnel (motivation 1 ou motivation 2 ) ni son environnement (environnement 1 ou environnement 2 ). Produire un rapport danalyse de comportement bass sur les traces. oliviergeorgeon.com21/29 0) proposedExperience = propositions.get(0).getExperience(); 28/29">
  • Mcanisme de dcision oliviergeorgeon.com List propositions = new ArrayList (); for (Interaction activatedInteraction : getActivatedInteractions()){ Proposition proposition = new Proposition( activatedInteraction.getPostInteraction().getExperience(), activatedInteraction.getWeight() * activatedInteraction.getPostInteraction().getValence()); int index = propositions.indexOf(proposition); if (index < 0) propositions.add(proposition); else propositions.get(index).addProclivity(activatedInteraction.getWeight() * activatedInteraction.getPostInteraction().getValence()); } Collections.sort(propositions); If (propositions.size()> 0) proposedExperience = propositions.get(0).getExperience(); 28/29
  • Page 29
  • Class Proposition Class Proposition implements Comparable // attributs: Experience experience Int proclivity // constructor Proposition(Experience experience, int Proclivity) // methods int compareTo(Proposition proposition) return new Integer(proposition.getProclivity()).compareTo(this.proclivity); boolean equals(Object otherProposition) return ((Proposition)otherProposition).getExperience() == this.experience; void addProclivity(int proclivity) this.proclivity += proclivity; oliviergeorgeon.com29/29