9

Click here to load reader

Thèse - Conception de plateforme e-commerce par modélisation de l'échange conversationnel entre un internaute et des agents artificiels

Embed Size (px)

Citation preview

Page 1: Thèse - Conception de plateforme e-commerce par modélisation de l'échange conversationnel entre un internaute et des agents artificiels

PROPOSITION DE THESE : CONCEPTION DE PLATEFORME E-COMMERCE PAR MODÉLISATION DE L’ÉCHANGE CONVERSATIONNEL ENTRE UN INTERNAUTE ET DES AGENTS ARTIFICIELS

RAMSESDEUX SAS – Laboratoire LACL (université Paris 12)

Mots clefs : conversation automatique, agents conversationnels, page WEB, raisonnement à étape, traitement automatique du langage, langage homme/machine, surveillance du logiciel, agent mobile, optimisation de ressources de calcul, configuration d’une communauté d’agents, Cloud computing.

1. Objectif finalisé de la thèse

Concevoir une nouvelle plateforme de commerce électronique fonctionnant non plus comme un ensemble d’offres en ligne parmi lesquelles l’internaute est appelé à choisir, mais comme un système qui partant d’une demande de l’internaute naviguant dans un site web, se verra offrir exactement ce qu’il cherche grâce à des échanges avec des « assistants de vente » qui travaillent en parallèle à qualifier la demande et trouvent ce que cherche l’internaute grâce à leur capacité déductive.

La plateforme logicielle serait administrée grâce à une interface de configuration d’une communauté d’agents, qui déporterait sur des serveurs distants des traitements de surveillance traditionnellement localisés sur le poste administrateur.

Partant d’une modélisation du langage homme/machine par l’incorporation d’un raisonnement à étapes et des outils d’analyse automatique des textes, il s’agit de construire une plateforme qui dans le contexte de la page WEB, réalise des échanges conversationnels avec l’internaute.

Cette nouvelle application pourra bénéficier des connaissances acquises grâce à l’Ecoute Clients, une plateforme dite « Customer feedback », de retour d’expérience client et d’aide en ligne, développée par la société RAMSESDEUX qui permet à l’opérateur d’un site WEB de savoir ce que pensent les internautes de son site, grâce aux perceptions et aux commentaires qu’ils déposent dans les pages WEB et de les aider en ligne en fonction de leurs demandes.

2. Objectifs Scientifiques de la thèse

2.1. Production scientifique

Production de connaissances sur la gestion automatique d’une conversation entre un internaute et un site WEB comme outil de conversion.

Page 2: Thèse - Conception de plateforme e-commerce par modélisation de l'échange conversationnel entre un internaute et des agents artificiels

Incorporation de raisonnement à étape dans la conversation.

Elaboration d’indicateurs de performances de systèmes mixtes combinant des technologies de traitement automatique de langage avec des technologies d’agents artificiels assurant les échanges conversationnels.

La problématique est l’amélioration des performances des systèmes d’échange conversationnels.

La production de connaissances portera sur les systèmes de dialogue homme/machine utilisant le Chat et proposant des solutions au caractère stochastique des interactions avec les humains.

Les systèmes incorporant le raisonnement par étapes dans la modélisation du langage seront recherchés et comparés.

Une architecture de la plateforme logicielle déportant sur des serveurs distants les traitements de surveillance traditionnellement localisés sur le poste administrateur, pour offrir la configuration de la communauté des agents sera proposée.

Objectif principal

La recherche définira la problématique précisément, à partir d’un état des lieux des systèmes de traitements automatiques du langage utilisant des techniques d’analyse morphologique, syntaxique et sémantique incorporés dans des systèmes de gestion de la conversation.On cherchera à comparer les performances de chaque système identifié.

La mise au point d’un modèle sous-tendu par l'aspect Stochastique et Markovien de langage humain, la réalisation d’un prototype et les tests constituent l’objectif principal de la thèse.

A partir des spécifications du modèle, réalisation d’un prototype et tests1. Test de Turing2. Loebner Prize3. Tests IRC

Le prototype utilisera les données métier de la société RAMSES comme exemple du modèle.Enfin, la généralisation du modèle sera recherchée pour le rendre utilisable dans d’autres métiers comme la banque (conclusion d’un prêt bancaire en ligne) ou l’assurance (conclusion d’un contrat d’assurance)

3. Contexte et positionnement du projet

3.1. Modélisation

La problématique des interactions homme/machine découle de la manière dont ceux-ci communiquent entre eux. De tout temps, l'être humain communique prioritairement par la parole.

Aujourd'hui, on est souvent contraint d'utiliser des dispositifs excluant la voix pour échanger de l'information il s'agit pour l'essentiel du clavier, de la souris, des boutons, des écrans tactiles, etc. Ceci est dû au fait que la reconnaissance

Page 3: Thèse - Conception de plateforme e-commerce par modélisation de l'échange conversationnel entre un internaute et des agents artificiels

vocale sur des phrases longues et courantes est encore une tâche non automatisée de nos jours.

Le traitement numérique actuel associé une telle tâche reste prohibitive en termes de cout de calcul et occasionne des gênes intolérables pour la navigation.

Actuellement le chat, interaction homme/machine via le clavier, est la solution idéale, économique et raisonnable pour un dialogue homme/machine en temps réel. De nombreux projets existent dont Eliza fut le premier prototype simulant un psychothérapeute conçu en 1966 à MIT par Joseph Weizenbaum.

Eliza fut simplement implémenté à l'aide des techniques dites de "pattern matching". Plus récemment Microsoft et AOL ont acquis SmarterChild conçu par Active Buddy aujourd'hui connue sous le nom de Colloquis une compagnie spécialisée dans les systèmes "Automated Service Agents". Colloquis fut racheté par Microsoft en 2006. Actuellement Smarter Child renommé par Microsoft "I'm Initiative" a été arrêté en 2008. La cause essentielle étant un manque d'innovations, en particulier l’incorporation de raisonnement dans la conversation et l'incapacité du modèle de réagir à des situations stochastiques régies par le hasard.

Un chercheur français, Philippe Lemoisson propose un apport innovant dans le domaine de la modélisation du langage homme/machine par l’incorporation d’un raisonnement à étapes pour prendre en compte le caractère stochastique du langage humain.

L’objectif est de mettre à disposition de chacun une intelligence artificielle dédiée au dialogue homme/machine afin de libérer l'homme pour d'autres tâches dites plus valorisantes.

3.2. Architecture

La recherche se situe dans le monde du logiciel et plus particulièrement dans les applications WEB. Une application Web est utilisée les internautes via le réseau pour rendre un service demandé. Son domaine d’utilisation est par construction bornée dans une fenêtre de trafic réseau convenu. Dans ce contexte l’observation de la charge montante d’une application, la détection qu’un temps d’utilisation est hors des bornes habituelles, etc. sont cruciales pour poursuivre l’exploitation dans des conditions normales ou proches.

La surveillance logicielle revêt une part importante du contrôle de l’exploitation mais son impact ne se limite pas à l’exploitation d’une configuration statique de ressources. En effet, l’allocation de nouvelles ressources doit pouvoir être prise en compte comme un événement nouveau au cours de l’exploitation. Cela signifie définir de nouvelles actions adaptatives telles que la migration d’une application sur une nouvelle ressource de calcul ou l’équipement de cette nouvelle ressource pour les besoin de surveillance. A l’inverse, la libération de ressource est aussi à prendre en compte.

3.3. Etat de l'art

L'essentiel des progrès depuis les vingt dernières années concerne l'implémentation algorithmique et non l'algorithme lui même. La technologie à beaucoup progressée ce qui a permis de traiter des masses de données beaucoup plus importantes ne un temps record.

Page 4: Thèse - Conception de plateforme e-commerce par modélisation de l'échange conversationnel entre un internaute et des agents artificiels

Ainsi cette avancée a vu le développement de différents langages spécialisés pour la conversation homme/machine comme par exemple un langage appelé AIML i.e. "Artificial Intelligence Mark up Language", dialecte XML, qui a été développé par Richard Wallace entre 1995 et 2002. Il est à noter que le système reste essentiellement basé sur le "pattern matching" aucun raisonnement n'est intégré à cette formalisation du langage.

MyCyberTwin une compagnie australienne ainsi que Jabberwacky de British programmer Rollo Carpenter utilisent d'autres techniques dites "Strong AI". Malheureusement la plus part des résultats sont assez limités et plutôt insatisfaisants.

L’approche plus fructueuse retenue par Virtuoz et d’autres développeurs d’agents conversationnels, situe l’échange entre l’internaute et les agents artificiels dans le contexte de la page Web ; c’est ainsi que les agents développés par cette société s’appuient sur des dictionnaires et des systèmes d’échanges en répondant à des questions posées par les internautes. Ces agents sont toutefois dépourvus d’intelligence déductive.

Philippe Lemoisson propose dans le Brevet (INPI Mars 2009) un procédé de conversation automatique entre un agent humain et des agents artificiels. Plus particulièrement, l’invention porte sur un système multi-agents MSA (« Multi Agent System » en anglais), l’agent humain et les agents artificiels communiquant entre eux par l’intermédiaire d’un réseau. Cette invention propose une réponse au caractère stochastique de la conversation homme/machine en incorporant un raisonnement à étapes aux conversations avec l’internaute.

Par rapport à l’approche Virtuoz, celle-ci ajoute des raisonnements différentiés des agents artificiels tout en se situant dans le même contexte de la page WEB.

3.4. Positionnement Technique

Implémentation réelle d’automatisation d’échanges conversationnels comportant différentes logiques et différentes priorités entre un internaute et des agents artificiels ; La recherche porte plus précisément sur une encapsulation de composants sémantiques par les composants de la technologie d’échange conversationnel proposée par la société RAMSES (technologie MEC).

3.4.1Composants sémantiquesLes composants sémantiques pourront être apportés par la société Lingway ; LINGWAY est un éditeur de logiciels qui se positionne sur le marché des moteurs de recherche spécialisés (ou « Verticaux »), à forte valeur ajoutée linguistique. Il est un acteur reconnu pour la qualité de son expertise en traitement automatique des langues et notamment en sémantique.

Lingway a développé des dictionnaires déjà très complets (plusieurs dizaines de milliers de mots simples, connectés à des centaines de milliers de sens, et autant de termes composés), adaptés à chaque domaine d’application. Ils sont complétés par de puissants outils d’analyse des textes et de gestion des dictionnaires.

Page 5: Thèse - Conception de plateforme e-commerce par modélisation de l'échange conversationnel entre un internaute et des agents artificiels

3.4.2Technologie MEC Le prototype pourra faire la démonstration de la pertinence de la technologie de gestion automatique d’une conversation entre un terminal utilisateur (l’internaute) et un serveur (L’Ecoute Clients) sur lequel sont programmés une pluralité d’agents artificiels, chaque agent artificiel étant associé à un calcul. Cette technologie (ci après désignée par « technologie MEC » pour Moteur d’Echange Conversationnel) permet le pilotage de la conversation.

Cette technologie se caractérise par une expertise complexe, implémentée par fragments (les composants) de façon totalement compositionnelle : le programmeur n’a pas à se soucier de connecter entre eux les composants ; il doit juste décrire leur déclencheur, les questions et les assertions qu’ils émettent. Une assertion ou une question peuvent jouer le rôle de déclencheur. Assertions et questions sont exprimées à l’aide d’un langage extensible ayant la puissance des graphes conceptuels étoilés. La conversation entre composants est automatiquement contrôlée par le moteur conversationnel.

Un même composant peut travailler en parallèle sur un nombre quelconque de contextes ;

Les composants peuvent encapsuler des raisonnements complexes impliquant des étapes et des calculs, alors que les systèmes experts classiques opèrent des chaînages sur des simples règles « si alors »

3.4.3Agent Mobile La technologie Agent Mobile est un moyen par lequel un code non présent sur une ressource peut le devenir sans y avoir été préalablement installé. De nombreux travaux ont montré l’intérêt de cette technologie pour diminuer le trafic réseau au profit de traitement locaux aux ressources. Ainsi, la surveillance de logiciel n’est plus simplement une activité distante où les données de surveillance sont émises depuis des points de mesure à destination du centre de contrôle. C’est une opération qui s’effectue par vague dont la première correspond à une collecte, la seconde à une adaptation.Les agents mobiles offrent l’aptitude de pouvoir migrer d’une ressource de calcul à une autre afin d’y effectuer un traitement tel que l’exécution d’un script local ou encore un traitement de filtrage sur des données locales. Cette approche est particulièrement adaptée dans le cadre de la surveillance où la quantité de données est souvent importante et répartie sur tous les sites observés. Dans le cas de perte de ressource (panne matérielle), le travail en cours est alors propagé sur un site disponible pour une reprise de l’exécution.Regroupés en espace ou communauté d’agents mobiles, un ensemble d’agents est dédié à une activité importante ce qui permet de gérer de façon séparée les contrôles. Les échanges sont ainsi étanches et il n’y a pas d’impact entre deux communautés.

3.4.4Administration de plate forme logicielleFournir un point d’administration distant correspond à fournir une interface de configuration d’une communauté d’agents, celle-ci est trop technique pour être visible à l’administrateur de la surveillance logicielle. Aussi, une approche serait d’adopter une démarche de type « Cloud computing » c’est-à-dire de déportation sur des serveurs distants des traitements de surveillance traditionnellement localisés sur le poste administrateur.L’idée est de considérer le Software as a service (SaaS) autrement de masquer le

Page 6: Thèse - Conception de plateforme e-commerce par modélisation de l'échange conversationnel entre un internaute et des agents artificiels

logiciel, où le fournisseur Cloud maintient : les applications métier de surveillance ainsi que toutes les applications Web, les bases de données, le matériel serveur, le stockage, et autres qui doivent être surveillé.

3.4.5Débouchés économiques possiblesLa gestion automatique d’une conversation entre un internaute et un site WEB est un outil de conversion. L’orientation métier des agents artificiels convient particulièrement bien aux opérateurs de services.

L’application « métier » retenue relève des études - marketing sur le WEB. C’est la réalisation et l’affichage d’un tableau de bord de pilotage d’un site WEB, construit à partir de l’analyse des avis des internautes.

D’autres applications métier, la banque, l’assurance, les télécommunications, qui sur le web, réalisent des devis nécessitant des questions/réponses et des calculs complexes, sont directement visés. C’est un immense marché très demandeur d’innovations dans la manière de faire du e-commerce.

4. Programme détaillé

4.1. Phase 1 acquisition de connaissances

Durée : 6 mois

Un cycle de recherche appliqué débute par une étape d’acquisition de connaissances qui constitue un premier socle non seulement de connaissance technique mais aussi d’apprentissage de la recherche. En effet, les sources d’informations sont aujourd’hui plus importantes que jamais et la gestion des projets ne permet pas de se disperser aux grés des lectures. Aussi, il est crucial de commencer par l’étude des technologies maîtrisées au sein du groupe de travail « système mobile communiquant » de l’équipe « spécification et vérification de système ». Plus particulièrement les travaux réalisés par Mâamoun Bernichi au cours de sa thèse intitulé « Surveillance logicielle à base d’une communauté d’agents mobiles ».

Enfin la validation de cette première phase de travail est aussi un moyen de sensibiliser le doctorant et lui permettre de se placer par rapport aux attentes de l’équipe projet. La réalisation d’un prototype de monitoring de la charge d’un serveur http en nombre de requête par unité de temps, constitue une première approche de la recherche appliquée que nous comptons mener.

4.2. Phase 2 Prototype de plateforme

L’expertise de RAMSES est retenue ici pour constituer un exemple « d’expertise métier » entrant dans le projet de recherche proposé ici. L'avancée attendue est la modélisation du langage humain permettant de prendre en compte le Caractère aléatoire de l'interaction interaction issue d'un dialogue homme/machine.

L’Ecoute Clients est le service de fidélisation interactif de la société RAMSES.

Le service permet de faire des études de satisfaction par l'analyse des avis (perceptions et commentaires) associés au comportement de l'internaute et de développer la relation consommateur en répondant aux questions contenues

Page 7: Thèse - Conception de plateforme e-commerce par modélisation de l'échange conversationnel entre un internaute et des agents artificiels

dans les avis.

4.2.1Expertise RAMSESLes études réalisées par RAMSES se matérialisent par l’affichage d’un tableau de bord de pilotage du site WEB, dans une interface en ligne, destiné à l’opérateur du site. Le tableau de bord de l’Ecoute Clients comporte des tableaux, graphiques et indicateurs ; il permet de comparer entre elles différentes périodes, établir des tendances, afficher des mesures de satisfaction, de l’image perçue du site etc.….

Pour établir ses rapports d’étude, le service met en œuvre une méthodologie d’interprétation des avis qui fait appel à une technique de codage et à des calculs pour faire émerger les plans de codes.

Le "base knowledge" du modèle est celui fourni par le système de l’Ecoute Clients de Ramses.

4.2.2Conception du modèleL'objectif principal est la mise au point du modèle conversationnel à partir de l’invention, constituant une approche du caractère imprévisible du langage humain et capable de suivre des trajectoires caractérisées par des sauts de contexte.

Un modèle paramétrique sera déterminé.

Codage de l’application.

Il s'ensuivra la phase de réglage des paramètres sur des bases de données typiques existantes.

4.2.3Tests et ImplémentationLes tests dureront au moins six mois et seront automatises. Des statistiques seront recueillies et analysées afin de servir de feedback à l'amélioration du modèle.

L’implémentation se fera coté serveur afin de s'assurer d'une portabilité maximum.

Durée : 12 mois

4.3. Phase 3 : Généralisation de la plateforme sur les

métiers cibles

Dans les domaines comme ceux de la banque, de l’assurance et d’autres services complexes, les devis et propositions adressés en ligne sont limités par l’absence d’échange conversationnel. Seuls des formulaires permettent actuellement l’acquisition des données.

En introduisant l’échange conversationnel, nous permettons une nouvelle forme d’acquisition des données plus souple, qui permettra à des agents artificiels de

Page 8: Thèse - Conception de plateforme e-commerce par modélisation de l'échange conversationnel entre un internaute et des agents artificiels

déduire l’offre et de proposer exactement ce que demande l’internaute.

4.3.1Conception du modèleReprise de la phase de réglage des paramètres sur des bases de données typiques existantes dans les métiers considérés.

Codage de l’application

4.3.2Tests et ImplémentationLes tests dureront au moins trois mois et seront automatises. Des statistiques seront recueillies et analysées afin de servir de feedback à l'amélioration du modèle.

L’implémentation se fera côté serveur afin de s'assurer d'une portabilité maximum.

Durée : 10 mois

4.4. Phase 4 Rédaction de la thèse

Durée : 8 mois

5. Références

[Lemoisson, 2006] “Collaborative theory construction: towards a conversational abstractmachine” LEMOISSON P. Thesis memoir. Université Montpellier II - Sciences et Techniques du Languedoc - (2006-12-15), Jean Sallantin (Dir.), Stefano A. Cerri (coDir.)

http://www.lirmm.fr/~moisson/These/TheseLemoissonVersionFinale.pdf

[Searle, 1969] J.R. Searle, “Speech acts”, Cambridge University Press, 1969.

[Singh, 1998] M.P. Singh, “Agent communication languages: rethinking the principles”, IEEE, Computer, Volume 31, Issue 12, Dec 1998 Page(s):40 – 47

[Velthuijsen, 1992] H. Velthuijsen, “The Nature and Applicability of the Blackboard Architecture”, PTT Research, 1992.

http://ia.ucpel.tche.br/~lpalazzo/Aulas/SWEB/files/sw/ebook-totw.pdf

http://homepages.inf.ed.ac.uk/olemon/lecture1.pdf

http://www.interweave-consulting.com/b/Chapter-12.pdf[A] Bernichi, M. & Mourlin, F.

"Mobile agent communication scheme (an evolving canvas)"International Conference on Systems and Networks Communications, IEEE Computer Society Press (10 pages), Tahiti, French Polynesia, October 2006

[B] Bernichi, M. & Mourlin, F."Software management based on mobile agents"Second International Conference on Systems and Networks Communications, IEEE Computer Society Press (6 pages), Cap Esterel, France, Aout 2007

[C] Dumont, C. & Mourlin, F.

Page 9: Thèse - Conception de plateforme e-commerce par modélisation de l'échange conversationnel entre un internaute et des agents artificiels

"A Mobile Computing Architecture for Numerical Simulation"International Conference on Mobile Ubiquitous Computing, Systems, Services and Technologies, UBICOMM 2007, November 4-9, 2007 - Papeete, French Polynesia (Tahiti) IOS Press (6 pages).

[D] Bernichi, M. & Mourlin, F."Network Management with mobile agent toolkit"NCM2008: 4th International Conference on Networked Computing and Advanced Information Management, September 2-4, 2008, Gyeongju, Korea (IEEE CS) KNC Editor (6 pages)

[E] Dumont, C. & Mourlin, F."Space based architecture for numerical solving"ISE2008: 5th International Conference on Innovation in Software Engineering, 10-12 December 2008 - Vienna, Austria (IEEE CS 6 pages)

[F] Mekki, R. & Mourlin, F."Mobile agent as interoperable mobile service for monitoring "Second International Conference on Systems and Networks Communications, IEEE Computer Society Press, Porto, Portugal, September 2009