203
LE DIALOGUE VERBAL HOMME-MACHINE étude de cas Daniel Luzzati

LE DIALOGUE VERBAL HOMME-MACHINE étude de …luzzati/recherches/historique_files/DVHM... · On a certes imaginé et mis en service des systèmes de consultation de base de données

Embed Size (px)

Citation preview

LE DIALOGUE VERBAL

HOMME-MACHINE

étude de cas

Daniel Luzzati

5

Je me suis efforcé d'apprendre à parler à monordinateur. :- Je lui ai par exemple expliqué ce que signifie«prendre une douche».- Je lui ai montré ce qu'était un syntagme verbal, unverbe à l'infinitif, un déterminant, un substantif ...- Il a compris que «prendre» ne signifiait pastoujours «saisir», qu'une douche servait à se laver,qu'il y fallait un pommeau, de l'eau, un flexible ...- Il a parfaitement assimilé quand et comment onprenait un bain ou une douche, que c'était pour selaver, qu'on était sale avant et propre après, que celacorrespondait à des rites sociaux ...

Maintenant qu’il est capable de dialoguer avec moi,il m'a demandé de lui en faire prendre une.Je n'ai pas osé lui résister ...

... et depuis il reste obstinément muet.

1

Table des matièressee contents p. 4

Introduction........................................................................................................... 5

Chapitre 1 : Le domaine du dialogue homme-machine ................................... 91. Dialogue homme-machine et intelligence artificielle........................................... 10

1.1. Les malentendus du dialogue homme-machine ................................... 101.2. Le problème du sens ........................................................................... 13

1.2.1. Quantitatif et qualitatif ......................................................... 141.2.2. Le thème des automates ....................................................... 16

1.3. Dialogue et compréhension automatique............................................. 191.3.1. La signification intentionnelle .............................................. 191.3.2. La non-normativité .............................................................. 201.3.3. Erreur et dialogue................................................................ 211.3.4. La signification interactionnelle........................................... 22

2. Les tâches .......................................................................................................... 232.1. Buts et actes de langage....................................................................... 232.2. Les fonctions interactives .................................................................... 252.3. Les distorsions de la communication................................................... 282.4. Les applications................................................................................... 30

3. Modélisations et réalisations informatiques ....................................................... 313.1. L'étude du dialogue ............................................................................. 32

3.1.1. Différentes approches .......................................................... 323.1.2. Linguistique et informatique ................................................ 33

3.2. Modélisations du dialogue .................................................................. 343.2.1. Un modèle hiérarchique ...................................................... 343.2.2. Un modèle dynamique ......................................................... 36

3.3. L'approche dynamique ........................................................................ 383.3.1. Le fonctionnement de l'incidence.......................................... 383.3.2. Gestion du dialogue ............................................................. 41

3.4. Les systèmes de DHM........................................................................ 443.4.1. Connaissances statiques ...................................................... 453.4.2. Connaissances dynamiques ................................................. 46

Chapitre 2 : Le corpus........................................................................................ 49

2

1. Présentation ....................................................................................................... 491.1. Principes ............................................................................................. 491.2. Les expérimentations........................................................................... 50

2. Le dialogue SNCF............................................................................................. 512.1. Représentation et modélisation............................................................ 512.2. Les niveaux d'analyse.......................................................................... 552.3. Les liaisons ......................................................................................... 572.4. Évaluation............................................................................................ 58

3. Les questions SNCF.......................................................................................... 623.1. Le sous-corpus.................................................................................... 623.2. Structure sémantique........................................................................... 633.3. Structure syntaxique............................................................................ 653.4. Énonces non normés........................................................................... 673.5. Lexique ............................................................................................... 68

Chapitre 3 : Comportement langagier induit par la machine ......................731. Le dialogue ........................................................................................................73

1.1. Le modèle SNCF ................................................................................741.2. Le modèle genevois.............................................................................77

2. Les requêtes.......................................................................................................802.1. Syntagme verbal introducteur (SVI)....................................................822.2. Syntagme nominal indiquant la tâche (SNT).......................................822.3. Références spatiales ............................................................................832.4. Références temporelles........................................................................842.5. Éléments excédentaires........................................................................852.6. Structure espace/temps........................................................................86

3. Demandes antérieures et demandes initiales.......................................................873.1. Similitudes ..........................................................................................873.2. Enrichissements ..................................................................................893.3. Appauvrissements ...............................................................................913.4. Modifications......................................................................................913.5. Structure..............................................................................................943.6. Bilan....................................................................................................96

Chapitre 4 : L'analyse ......................................................................................1011. Principes..........................................................................................................103

1.1. Cadre linguistique .............................................................................1041.1.1. Structure sémantique .........................................................1041.1.2. Contraintes syntaxiques .....................................................1051.2.3. Contraintes lexicales ..........................................................1071.1.4. Bilan...................................................................................108

1.2. Cadre informatique............................................................................1091.2.1. Problématique....................................................................1091.2.2. L'analyse sélective..............................................................110

2. Fonctionnement ...............................................................................................1162.1. Présentation.......................................................................................1162.2. Lexique .............................................................................................1192.3. Syntaxe .............................................................................................1212.4. Pragmatique ......................................................................................123

2.4.1. Lexique...............................................................................1232.4.2. Pragmatique et interprétation ............................................124

3. Évaluation ........................................................................................................1283.1. Communication homme-machine......................................................128

3

3.1.1. Critères d'évaluation..........................................................1283.1.2. Corpus d'apprentissage.....................................................1313.1.3. Corpus d'évaluation...........................................................132

3.2. Communication homme-homme .......................................................134

Chapitre 5 : Le dialogue ..................................................................................1391. Principes..........................................................................................................139

1.1. Le modèle dynamique .......................................................................1391.2. Sources .............................................................................................1401.3. Des corpus au modèle.......................................................................1421.4. Les axes ............................................................................................1421.5. L'axe régissant...................................................................................1451.6. L'axe incident ....................................................................................1461.7. Utilisation du modèle ........................................................................148

2. Fonctionnement ...............................................................................................1502.1. Présentation.......................................................................................1502.2. Analyse et dialogue ...........................................................................1512.3. Le dialogueur ....................................................................................1532.4. Génération.........................................................................................1582.5. Consultation de la BD.......................................................................1592.6. Le modèle de dialogue.......................................................................1592.7. Quelques exemples ...........................................................................161

3. Évaluation ........................................................................................................1633.1. Corpus d'apprentissage .....................................................................163

3.1.1. Modifications du corpus ....................................................1633.1.2. Erreurs ..............................................................................1643.1.3. Efficacité.............................................................................166

3.2. Corpus d'évaluation...........................................................................1683.3. Bilan..................................................................................................170

3.3.1. Méthode .............................................................................1703.3.2. Comparaison .....................................................................171

Conclusion......................................................................................................... 175

Bibliographie .................................................................................................... 1791. Bibliographie analytique....................................................................... 179

1.1. Articles spécialisés ................................................................ 1791.2. Ouvrages généraux............................................................... 1801.3. Thèses ................................................................................... 1801.4. Thème littéraire et scientifique .............................................. 181

2. Bibliographie alphabétique................................................................... 182

Index ................................................................................................................... 195

4

Contents

Introduction........................................................................................................... 5Chapter 1 : The domain ....................................................................................... 91. Human-Machine dialog and AI.......................................................................... 102. Tasks ................................................................................................................. 233. Systems and modelization.................................................................................. 31

Chapter 2 : The corpus....................................................................................... 491. Presentation ....................................................................................................... 492. Raylwails dialog................................................................................................. 513. Raylwails questions ........................................................................................... 62

Chapter 3 : Linguistic behavior brought about by the machine ..................731. Dialog................................................................................................................732. Questions...........................................................................................................803. Human-Human and Human-machine questions ................................................87

Chapter 4 : Parsing...........................................................................................1011. Principles.........................................................................................................1032. Working ..........................................................................................................1163. Valuation..........................................................................................................128

Chapter 5 : Dialog ............................................................................................1411. Principles.........................................................................................................1412. Working ..........................................................................................................1523. Valuation..........................................................................................................165

Conclusion......................................................................................................... 175

5

Introduction

Parmi les Traitements automatiques du langage (TAL), le Dialogue hommemachine (DHM) est un domaine tout à fait particulier, dans la mesure notamment oùpersonne ne sait réellement ce dont il s'agit, et encore moins ce dont il s'agirademain. Sous des formes diverses, il existe depuis un certain temps déjà dessystèmes de compréhension ou de génération de phrases alors qu'il n'existe guèreque des prototypes de systèmes de dialogue verbal avec une machine, à l'oral commeà l'écrit. On a certes imaginé et mis en service des systèmes de consultation de basede données avec des entrées/sorties écrites ou orales, mais de là à manier l'ellipse, àuser de tropes et à changer de sujet comme avec un interlocuteur humain, on est bienloin du compte.

En fait, il existe une fracture dans cette comparaison entre DHM et interactionhumaine : au nom d'une manipulation terminologique hasardeuse (en l'occurrencel'utilisation de «dialogue»), on identifie artificiellement deux modes decommunication à peu près totalement étrangers. Le DHM en effet n'a sensiblementrien à voir avec un terme qui renvoie à Platon et qui caractérise les différentes formesd'entretien entre deux personnes. C'est une forme nouvelle de communication, avecun interlocuteur dépourvu d'une quelconque personnalité, par l'intermédiaire d'unmédia inéluctablement réducteur et empreint d'une tendance systématique à réduirel'interaction au seul contenu référentiel des énoncés qui la composent. Personned'ailleurs n'a jamais dialogué par écrit si ce n'est sous des formes très particulièrestelles que la correspondance, les textes dramatiques ou, à tout prendre, les «petitsmots» du fond de la classe.

Virtuel ou pas, le DHM est en outre une inéluctable supercherie, en l'occurrencecelle d'une communication non équivalente, nécessairement frauduleuse,inévitablement programmée par quelque apprenti sorcier en mal de subterfuges aussiastucieux qu'équivoques. C'est d'ailleurs cette supercherie qui fait l'intérêt de larecherche dans ces domaines où l'on se transforme toujours un peu en démiurge.On rejoint ainsi, et c'est peut-être ce qui fait de l'IA une aventure scientifique, lesgrands mythes de l'humanité, en l'occurrence aussi bien celui de Faust que ceuxd'Icare ou de Prométhée. L'ordinateur devient un objet auquel on veut conférerquelques bribes d'humanité. On s'arroge ainsi des pouvoirs qui sont normalementréservés au Créateur et, comme le disent les mythes, on risque d'y perdre son âme oude s'y brûler les ailes, à moins que, à l'instar de Pygmalion, l'union du créateur et desa création puisse être fructueuse. Heureusement en tous cas que parmi tous lesmaux sortis de la boîte de Pandore s'est quand même glissée l'espérance !

Après ces observations partiellement désobligeantes à l'égard du DHM, on sedemandera peut-être ce qui peut motiver certains à s'intéresser à ce domaine, voire àécrire un livre sur la question. Comme pour tout ce qui touche aux TAL, la premièreraison réside dans le mystère du sens : la réalisation de systèmes conduit à la

6

simulation, et celle-ci ne peut qu'enrichir la compréhension des mécanismes de lasignification. Le DHM présente ensuite des caractéristiques spécifiques à l'intérieurdes TAL, et notamment la dynamicité, qui s'appréhende entre autres à travers le statutde l'erreur : alors qu'en matière de compréhension de phrases l'erreur se juge en elle-même, par comparaison avec une analyse théoriquement irréprochable, elle ne peutse jauger dans le dialogue qu'en fonction du coût de son éventuelle récupération. LeDHM est ensuite un type nouveau de communication qu'il s'agit d'inventer presqueen même temps que les matériels qui la supportent, et dont la nature sera fonctiondes compétences que l'on parviendra à insuffler à la machine, aussi bien en ce quiconcerne les mécanismes de la compréhension que ceux de la génération ou del'interaction.

* * *

Trois livres sur le dialogue ont paru en France ces dernières années ([Pierrel87], [Moeschler 89], [Bilange 92]). [Pierrel 87] est consacré aux principes et à laréalisation informatique, [Moeschler 89] est le fait d'une linguistique qui s'orientevers les sciences cognitives, et [Bilange 92] est la publication d'un travail de thèse. Al'instar de J.M. Pierrel, nous nous intéressons aux principes du DHM. Comme dansl'ouvrage de J. Moeschler, il s'agit avant tout de linguistique. Comme dans celui d'E.Bilange,une thèse sur le domaine est à l'origine d'un travail en partie consacré à ladescription d'un système. A la différence de ce dernier, le livre ne fait pasdirectement suite au travail universitaire, ce qui a permis la réflexion qui fait l'objetdu premier chapitre.

Outre ces livres spécialisés, il est spécifiquement question du DHM dansplusieurs ouvrages récents, dans lesquels on pourra trouver les présentations dudomaine les plus simples et les plus claires ([Sabah 88 et 89], [Carré et al. 91],[Fuchs et al. 93]). Ces livres sont très généralement consacrés aux traitementsautomatiques du langage, que ce soit sous l'angle des formalismes mis en oeuvre,des applications potentielles, ou des rapports entre linguistique et informatique.Tous considèrent que le DHM est un domaine à part entière, et non simplement lefaire-valoir de méthodes d'analyse, de génération, ou de représentation du sens. A ladifférence de bien des présentations du domaine aux USA, les problèmes inhérentsau dialogue, en l'occurrence les problèmes liés aux mécanismes d'interaction, sont enFrance considérés comme des questions pertinentes.

* * *

Le premier chapitre regroupe les réflexions qui ont fait suite au travailuniversitaire. L'étude de cas est présentée dans les chapitres suivants, ainsi que laméthodologie requise pour travailler de façon ascendante, c'est-à-dire pourdévelopper un système à partir de données verbales authentiques. Le travail enquestion avait en effet pour origine la constitution de corpus de dialogue homme-machine avec machine simulée par la méthode dite du magicien d'Oz, et pouraboutissement le développement, à partir du clavier, d'un système de dialogue quiavait pour vocation de se substituer à l'opératrice qui simulait la machine dans unetâche de renseignements horaires SNCF. Le chapitre 2 est consacré à la descriptiondu corpus, et le chapitre 3 au comportement langagier induit par la machine, c'est-à-

7

dire à l'incidence de l'introduction de la machine sur les productions verbales deslocuteurs. Les chapitres 4 et 5 décrivent la méthodologie employée pour développerle système de dialogue auquel nous avons abouti, tout d'abord pour l'analyse dephrases, puis pour le dialogue.

Il s'agit fondamentalement d'un travail de linguistique qui relève également dessciences cognitives, même si son optique n'est pas précisément l'étude et l'imitationd'un processus humain avec toutes les composantes psychologiques que celasuppose. Le principe qui consiste à partir de l'attesté, de la Parole, pour construire unmodèle, au lieu de se fonder sur la Langue, au travers de principes logico-universalistes, pour se tourner éventuellement vers l'attesté par la suite, constitue eneffet un des pôles des recherches cognitives, du moins dans leurs relations avec lessciences du langage. Il s'agit davantage de linguistique que d'informatique dans lamesure où l'essentiel du travail est consacré à l'étude et à la modélisation de corpusréels dans lesquels les phénomènes de non normativité ne sont jamais éludés. Alorsqu'en général un énoncé est considéré comme pertinent s'il relève de notrecompétence, nous avons considéré qu'un énoncé était pertinent seulement s'il étaitattesté, quitte à discuter de la nature et du degré de cette attestation. Nous avonsensuite considéré que s'il se trouvait des formulations qui nous paraissaientplausibles mais que le système ne savait pas traiter parce qu'elles ne faisaient paspartie du corpus, c'était la pertinence de ces formulations qui était en cause, plutôtque les performances du système.

8

9

CHAPITRE 1

Le domaine du dialoguehomme-machine

Le propos de ce premier chapitre est de situer cette question du DHM parrapport à l'IA et aux sciences cognitives. Le DHM en effet n'est pas une simpleapplication : c'est à bien des égards un domaine spécifique. Ainsi, le problèmecentral de l'IA, à savoir celui du sens, se pose en dialogue d'une façon touteparticulière.

Dans un premier temps (1.), nous allons poser cette question du sens, en tentantd'expliciter les confusions qui entourent parfois le domaine du DHM, puis enprésentant le problème sous forme de paraboles. Nous nous efforcerons enfin demettre la notion de sens à l'épreuve du dialogue, ce qui nous conduira à réfléchir surle concept de norme et à définir différentes instances de sens.

Nous verrons dans un second temps (2.) le problème des tâches, quiconditionne la portée de tout ce qui peut être dit en matière de DHM. Même s'il nefait aucun doute qu'un système automatique ne peut être appelé à dialoguer à proposde n'importe quoi, le fait de s'attaquer à une tâche plus ou moins complexeconditionne le niveau de compréhension qui sera requis. Il manque par ailleurs dansle domaine une typologie des applications, et nous nous efforcerons d'en développercertains aspects.

Nous présenterons pour terminer (3.) différentes modélisations du dialogue, enl'occurrence qui touchent à la gestion de l’interaction, et non qui relèventessentiellement de l’augmentation du niveau de compréhension. Tout en examinantles principes du fonctionnement des systèmes de DHM, nous nous attacheronsnotamment à décrire un modèle dynamique, propre à gérer les phénomènes de noncompréhension caractéristiques du dialogue.

10

1. Dialogue homme-machine et intelligence artificielle

Parmi les traitements automatiques du langage, le DHM est certainement celuidont les contours sont les plus flous, qui prête le plus à malentendu (1.1.). Il permetnéanmoins de poser le problème fondamental du sens (1.2.), et d'envisager ceproblème d'une façon tout à fait spécifique (1.3.).

1.1. Les malentendus du dialogue homme-machine

La notion même de DHM prête à confusion, et donne lieu à divers malentendus.Le premier d'entre eux concerne le dialogue et la communication, et notammentla communication homme-machine. Si l'on prend le problème dans son ensemble,on conçoit en effet que le fait de dialoguer oralement ou par écrit avec une machinen'est que l'une des extensions possibles des divers moyens de communiquer quenous entretenons déjà avec elle. Lorsque l'on utilise un traitement de texte parexemple, le clavier assure le canal de communication homme-machine, et l'écrancelui de la communication machine-homme, et l'on ne peut pas pour autant dire qu'ils'agit là véritablement de dialogue. Ce genre d'application est en somme fort peu«intelligent», même s'il recourt parfois à des formalismes issus de l'IA. Ainsi, dansles traitements de texte, on entre les données, sous forme de caractères, et on dicte àla machine ce qu'il faut en faire, à l'aide d'un code qu'il nous faut assimiler aupréalable. Il en va de même avec la programmation, si ce n'est que l'on repousse leproblème. Les langages informatiques sont également des codes, mais ils permettentde donner des instructions en différé. On donne instruction à la machine d'accepterultérieurement tel ou tel type d'instructions, qui constitueront un nouveau code, deles traiter et, si possible, de les exécuter. Le DHM est en définitive quelque chosequi se programme et qui vise parallèlement à éviter de programmer. Il s'agit d'unemarche vers un confort toujours plus grand dans la communication homme-machine, qui commence avec des langages de programmation proches del'assembleur, qui se poursuit aussi bien avec le développement de langages ditsévolués qu'avec celui de systèmes de questions-réponses plus ou moins complexes,et qui aboutit au DHM interactif.

Nous voudrions maintenant nous efforcer de dégager un deuxième malentendu,qui concerne les rapports entre dialogue et cognition. L'exemple de laprogrammation, dont la réalisation en langage naturel, sous forme de dialogueinteractif, a toujours été un des principaux rêves de l'IA, est à cet égard éclairant : oubien le correspondant connaît le code (i. e. le langage de programmation), et ledialogue se présente comme un accessoire somme toute relativement coûteux, oubien il ne le connaît pas, et il faut non seulement que le système comprenne et vérifie,mais également et surtout qu'il sache traduire en code, c'est-à-dire programmer. Leproblème est moins alors celui du dialogue proprement dit que celui des processuscognitifs mis en oeuvre. Cette remarque s'applique à un très grand nombre dedomaines, pour lesquels, s'il est difficile d'envisager un système de DHM, fût-ce enlangage naturel, c'est en grande partie parce que le domaine en question estextrêmement difficile à modéliser. Pour aborder un grand nombre de tâches, ilfaudrait en effet que le système soit capable d'évoluer dans un univers excessivementvaste et complexe. Dans une application type «pages jaunes» [Hermann et al. 88]

11

par exemple, il ne s'agit moins d'accéder à une BD qui couvre l'ensemble de la viesociale, que d'assister des correspondants qui ne savent pas très bien comment s'yprendre, et dont les questions ne sont pas toujours clairement présentables.Quelqu'un qui cherche par exemple l'adresse d'un taxidermiste en ignore souvent lenom et pourra s'exprimer par des périphrases variées qui pourront supposer desconnaissances encyclopédiques pour être interprétées : quelqu'un qui empaille lesanimaux, qui permet de garder un animal qu'on a aimé, qui fabrique des trophées,qui travaille sur des cadavres d'animaux ...

Un troisième malentendu, qui concerne les rapports entre dialogue etcompréhension, a été très justement mis en évidence par A. Vilnat [Vilnat 84].Jusque dans les années 70 en effet, le dialogue a juste été envisagé comme une desmanifestations de la compréhension [Raphaël 64] [Weizenbaum 66] [Winograd72]. Ce dernier par exemple utilise le dialogue essentiellement pour permettre à sonsystème SHRDLU, au demeurant le plus abondamment cité dans la littératurescientifique relative au langage naturel, de manifester toutes ses qualités, de la façonla plus démonstrative possible. Ce malentendu peut en outre induire des effetspervers. Un système qui dialogue devient en effet intelligent, quel que soit sonniveau de compréhension. Inversement, un système de compréhension auxperformances tout à fait honorables pourra être mal considéré simplement parce qu'ilne manifeste pas le niveau de sa compréhension par le biais du dialogue. Cela a sansdoute eu pour conséquence essentielle de retarder l'approche directe des problèmesde dialogue.

Le quatrième malentendu que nous voudrions évoquer concerne les rapportsentre dialogue et conversation. Même si, théoriquement, on pourrait souhaiterdialoguer avec une machine sur n'importe quel sujet, il est manifeste que cela neprésente d'intérêt que dans un certain nombre de cas. Le DHM, qu'il soit écrit ouoral, n'est pas toujours une solution pertinente et, même dans le cadre de lacommunication homme-machine, d'autres solutions sont souvent mieux adaptées. Ilest ainsi des situations simples, dans lesquelles l'interaction est des plus réduites.C'est notamment le cas dans les systèmes de commande, où le dialogue, s'il estnécessaire, se résume à un questionnaire préétabli. On ne peut pas alors parlervéritablement de dialogue, tant l'interaction est à la fois limitée et figée. Il estinversement des cas excessivement complexes, dans lesquels l'interaction supposeun investissement affectif de la part du correspondant, et notamment lorsque ledialogue ne pourrait être confié à une tierce personne. Les correspondantsrecherchent autant une prise de conscience personnelle qu'un renseignement précis.

On touche alors à ce que l'on peut appeler un «syndrome» ELIZA, du nom dusystème de Weizenbaum [Weizenbaum 66], qui ne comprend rien mais parvient àdonner le change (cf. exemple 1), et à jouer le rôle d'un analyste rogérien (dont latechnique consiste à faire parler son patient en retournant à celui-ci ses propresparoles), et ce à un tel point que la communauté scientifique s'en est trouvéeébranlée, que cela a donné lieu à un débat international et que les patients candidats à«l'analyse automatique» furent extrêmement nombreux (l'auteur raconte parexemple, dans la traduction française de [Weizenbaum 76] : Une fois, ma secrétairequi m'avait vu travailler sur le programme pendant plusieurs mois et savait donc

12

qu'il ne s'agissait que d'un programme d'ordinateur, s'est mise à dialoguer aveclui. Après quelques échanges, elle me demanda de quitter la pièce. Une autre fois,j'ai suggéré d'arranger le système afin de pouvoir examiner le soir lesconversations qui avaient lieu. J'ai été immédiatement couvert d'accusationsaffirmant que cette proposition aboutissait à espionner les pensées les plus intimes; preuve irréfutable que les gens conversaient avec l'ordinateur comme avec unepersonne pouvant normalement et utilement recevoir des confidences). Cela dénotecertes la crédulité de certains, mais cela démontre également que le dialogue enquestion était perçu comme satisfaisant. Les gens ne demandent pas en l'occurrencequ'on les comprenne, mais qu'on les fasse parler, qu'on les incite à s'exprimer. Ils'agit en définitive plus d'une sorte de monologue avec relance que d'un véritabledialogue, et nous limiterions volontiers le champ du DHM aux seuls cas où celui-ciest une solution pertinente à un problème effectif.

Exemple 1 : dialogue réalisé avec le système ELIZA.- Les hommes sont tous les mêmes.- De quelle façon ?- Ils sont toujours en train de nous embêter avec leurs histoires.- Pensez-vous à un exemple précis ?- Eh bien, mon ami m'a fait venir ici.- Votre ami vous a fait venir ici- Il dit que je suis souvent déprimée- Je suis navré d'entendre que vous êtes déprimée- C'est vrai, je suis malheureuse.- Pensez-vous que venir ici vous aidera à ne pas être malheureuse ?- J'ai besoin d'aide, c'est certain.- Que signifie pour vous obtenir de l'aide ?- Peut-être pourrais-je apprendre à m'entendre avec ma mère.- Dites m'en plus sur votre famille.- C'est ma mère qui s'occupe de moi.- Qui d'autre dans la famille s'occupe de vous ?- Mon père.- Votre père.- D'une certaine façon vous êtes comme mon père- Quelle ressemblance voyez-vous ?- Vous n'êtes pas très agressif, mais je pense que vous ne voulez pas que je le remarque.- Qu'est-ce qui vous fait penser que je ne suis pas très agressif ?- Vous ne vous disputez pas avec moi.- Pourquoi pensez-vous que je ne me dispute pas avec vous ?- Vous avez peur de moi.- Vous plaît-il de croire que j'ai peur de vous ?- Mon père a peur de tout le monde.- Qu'est-ce qui vous vient encore à l'esprit lorsque vous pensez à votre père ?- Des tyrans.- Cela a-t-il une relation avec le fait que votre ami vous ait fait venir ici.

Le cinquième et dernier malentendu concerne le dialogue et l'interaction.Tout fonctionne en effet comme si, parce que l'on dispose d'un modèle humain, onétait en situation mimétique. Sous prétexte que l'on pratique quotidiennement ledialogue entre interlocuteurs humains, on voudrait stipuler qu'une machine peut sesubstituer à l'un des partenaires, fût-ce par écrit. Et il n'est pas rare, en l'occurrence,d'entendre mentionner le théâtre comme un exemple de dialogue écrit. Il ne faitaucun doute qu'un ordinateur puisse devenir un personnage de théâtre, et produiredes répliques à la manière de Jean Tardieu, mais il faudrait qu'un dramaturge ysonge au préalable. Quant à voir soit une machine se comporter comme unpersonnage de théâtre normal, soit un de ses correspondants utiliser un telcomportement langagier... En réalité, on crée un type de communication totalementinédit, notamment lorsqu'il s'agit d'écrit. Personne en effet n'a jamais dialogué parécrit, si ce n'est dans des situations très particulières :

13

- Pour le dialogue littéraire, théâtral ou épistolaire, il s'agit, comme nous l'avonsdit, d'un dialogue de convention. C'est une transcription de ce qui est censé avoir étéproduit à l'oral, mais qui n'a en fait existé que dans la tête d'un écrivain.

- Certains malades, qui ne peuvent communiquer oralement, produisent avec leurentourage des dialogues écrits. Ces derniers, qui usent de codes divers, sonttoutefois sans commune mesure avec ce qui peut se passer avec une machine.

- Les systèmes de renseignement actuellement accessibles par Minitel enfinévitent le dialogue proprement dit, non seulement par l'utilisation de menus, maiségalement par celle des pages-écran.

Que ce soit à l'écrit ou à l'oral, le DHM est un dialogue d'un type très particulier,dans la mesure surtout où, nous semble-t-il, les tours de parole sontsystématiquement respectés. Au Minitel par exemple, un énoncé n'est transmis quelorsqu'il est validé par le correspondant. L'interaction est donc fortement limitée,puisque le correspondant et la machine ne peuvent intervenir que lorsqu'ils ont lamain, c'est-à-dire lorsque leur interlocuteur a terminé son intervention. Nousparlerons alors d'interaction alternative, par opposition à l'interactionspontanée de la conversation homme-homme. D'aucuns nous rétorqueront sansdoute que cela est momentanément vrai à l'écrit (le fonctionnement du Minitel en esten l'occurrence directement responsable), mais que cela serait ressenti comme uneinsupportable lourdeur à l'oral. L'objection est certes théoriquement juste, mais elleest caduque dans la pratique. Il n'existe en effet à ce jour aucun vrai système deDHM à entrée vocale, le plus «naturel» restant sans doute celui de D. Béroule[Béroule et Néel 84]. On a en revanche pu observer dans les corpus GRECO quedes correspondants effectifs, nullement préparés ou sélectionnés, se soumettaientspontanément et avec une grande facilité au respect des tours de parole, c'est-à-dire àl'interaction alternative. Ce type d'interaction fait en effet partie de l'inconscientcollectif relatif au DHM, et on peut légitimement s'interroger pour savoir dans quellemesure il serait opportun de se priver d'une telle commodité pour le système dedialogue (nous dissocierions en tout cas la faculté de pouvoir s'interrompre de laréalisation d'une interaction véritablement spontanée).

1.2. Le problème du sens

Plus encore que d'autres traitements automatiques du langage, le DHM estconfronté au problème du sens : un système qui prétend soutenir utilement undialogue doit impérativement extraire une représentation interne de ce que veut luidire son interlocuteur, fût-ce au travers d'une reconnaissance très imparfaite dulexique et de la syntaxe. Pour évoquer cette question, nous procéderons de manièreallégorique, en évoquant la parabole du Tangram et celle des automates.

1.2.1. Quantitatif et qualitatif

Comme toutes les questions relatives aux traitements automatiques du langage, àl'IA et aux sciences cognitives, le DHM se trouve confronté au problème du sens. Letangram est de ce point de vue l'allégorie faite jeu de l'IA et de ses rapports avec leconcept de sens. On doit, à l'aide des 7 pièces de la figure de gauche parvenir àreprésenter des silhouettes semblables à celles de la figure de droite. On peut

14

imaginer, même si cela soulève des problèmes complexes, qu'un calculateur puisse yparvenir très rapidement, alors que bien souvent nous ne réussissons qu'au prix d'uneffort relativement long. Il serait en revanche extrêmement difficile de fairereconnaître à une machine la posture ou l'animal ainsi représentés, alors que nous ensommes immédiatement capables sans hésitation. Tout ce qui touche au sens estainsi infiniment difficile à modéliser, alors que tout ce qui touche à l'organisation estbeaucoup plus aisément automatisable. Cette question du sens -son interprétation, samanipulation, sa représentation- est certainement le problème fondamental de l'IA etdes sciences cognitives (du moins dans leurs rapports avec les traitementsautomatiques du langage), et c'est un problème d'une ampleur comparable aumystère de la cellule en biologie moléculaire. Comme le dit très justement G. Sabah,il faut reconnaître qu'un acte de foi est à la base de l'intelligence artificielle : il fautcroire à l'existence du sens et admettre que ce domaine réservé de l'homme ne sevide pas de sa substance lorsqu'on le formalise [Sabah 88, p. 320].

Figure 1 : parabole du tangram

C'est en définitive une des questions qui justifie l'existence de sciences de laconnaissance. Tout le problème est dans le rapport entre quantitatif et qualitatif.Calculer un grand nombre de combinaisons est du domaine du quantitatif.Reconnaître un animal comme une chèvre, être capable d'en parler et d'en évoquermétaphoriquement le concept est du domaine du qualitatif. Jusqu'à un certain point,on sait aujourd'hui résoudre certains problèmes apparemment qualitatifs de manièrequantitative (aux échecs par exemple). Il est clair toutefois qu'un tel biais n'est pasenvisageable partout et que le fond du problème demeure : parvenir à passer duquantitatif au qualitatif. Comme en biologie moléculaire, nous sommes en outreconfrontés à ce que l'on peut appeler le complexe du médicament. Tout comme enbiologie, où tout néophyte juge d'une recherche en fonction des médicaments quipeuvent en dériver, IA et sciences cognitives sont souvent amenées à être appréciées

15

en fonction des réalisations informatiques obtenues ou susceptibles de l'être.L'existence de résultats palpables ne préjuge toutefois en rien de la portéefondamentale de ce qui a été fait et il est clair que bon nombre de réalisationsinformatiques dénotent le plus souvent davantage un bon déboguage et une habileutilisation des performances de la machine qu'un progrès fondamental. L'expériencedécrite dans les chapitres 4 à 5 du présent ouvrage illustre d'ailleurs bien cetteconstatation : elle aboutit à un système dont les performances sont tout à faithonorables, mais dont l'intérêt, sur le plan strictement informatique, est quasimentnul. Celui-ci réside en l'occurrence dans l'expérience elle-même, qui montre combienla prise en compte des facteurs humains peut améliorer les performances dessystèmes

Tout le problème réside en définitive dans la réduction de l'écart entre un calculdu sens et une compréhension par intuition. Va-t-il se réduisant ? La puissance desmachines augmente, le nombre -et parfois la qualité- des modélisations aussi, maiscela ne comble nullement le saut entre quantitatif et qualitatif ; cela n'apporte pasgrand chose à la résolution éventuelle du problème du sens. On peut d'ailleursrapporter cette question à celle des échecs, dont les traitements automatiques fontl’objet de publications spécialisées (cf. International computer chess associationjournal), et qui constituent une véritable parabole de l’IA : il est prévu d'avoir trèsprochainement une machine capable de battre les plus grands maîtres alors quejusqu'à présent il n'en était pas question ([Levy et Newborn 1990] [Anantharaman etal. 1988] [Anantharaman 1990] [Jansen 1992]), ce qui pourrait laisser penser quel'on passe alors du quantitatif au qualitatif. Mais le jeu des échecs reste un jeu, avecses règles et son univers bien quadrillé, et en tant que tel, les problèmes qu'il posepeuvent être abordés de façon quantitative, c'est-à-dire en termes de nombre desolutions envisagées à la seconde. Les méthodes utilisées sont d'ailleurs desméthodes mathématiques qui exploitent avant tout la puissance de calcul de lamachine. Ce que l'homme parvient à faire par intuition, la machine le fait par la force(on parle alors de brute-force system), en inventoriant la totalité des solutionspossibles et en appliquant des heuristiques de choix. La machine résout ainsi à samanière, c'est-à-dire quantitative, des problèmes que nous résolvons à la nôtre, c'est-à-dire qualitative.

On touche là le problème beaucoup plus général des méthodes stochastiqueset de l'apprentissage : plutôt que de prétendre transmettre analytiquement notresavoir à une machine, ce qui est souvent très difficile et encore plus souventinefficace, on va tenter de laisser le système résoudre le problème de manièreglobale, par ses propres moyens. Les moyens en question sont simplement desmoyens quantitatifs (e.g. les méthodes probabilistes, par exemple en reconnaissancede la parole) et on peut considérer que le problème demeure entier. Même lesmodèles dits «connexionistes» ou «neuronaux», qui prétendent, par une méthodeinspirée de l'observation du fonctionnement de notre cerveau, résoudre desproblèmes d'IA par une approche nettement qualitative, ne parviennent pas àdépasser le stade des principes. Il s'agit de la forme la plus achevée des approchesstochastiques : au lieu de chercher à résoudre analytiquement le problème du sens,on voudrait construire une machine qui se pose elle-même le problème et, endéfinitive, parvienne, même partiellement, à le résoudre. Mais le sens est une

16

«machinerie», au sens d’O. Ducrot [Ducrot 80], qui ne se confond pas avec lasignification, et qui repose au moins autant sur l'énonciation que sur l'énoncé.Comprendre en effet c'est bien autre chose qu'opérer un décodage ou parvenir àsélectionner la bonne solution, et c'est notamment vivre.

Prenons par exemplele film La chèvre, de G. Oury, dont le titre renvoie à unpersonnage stupide et malchanceux, censé porter malheur à tous ceux qu'il côtoie :quel sens cela peut-il avoir pour une machine de comprendre ce titre ? Celasupposerait sans doute d'être à même, dans un premier temps, d'interpréter leréférent usuel et de connaître les modes de vie de l’animal en question (paropposition avec les autres animaux notamment). Cela suppose éventuellement desavoir qu'il peut s'agir d'un ancien instrument de levage ou d'une étoile dûmentrépertoriée. Peut-être cela nécessiterait-il de connaître certains usages métaphoriquesdu concept dans des expressions telles que «prendre la chèvre» ou «la chèvre a prisle loup». Mais nous-mêmes, savons-nous tout cela ? De toute façon c'est un titreauquel nous ne comprenons rien et qui est fait pour cela. Son sens est tout autantd'avoir une signification que de provoquer notre curiosité parce que nous ne lacomprenons pas, ce qui ne va pas pour nous sans la connaissance des acteurs dufilm. En définitive, un titre de film comme celui-là n'a pas de sens modélisable dansla mesure où il est fait pour donner envie d'aller au cinéma et que, si on peutenvisager de représenter en machine ce qu'est l'envie ou le cinéma, il est inconcevablede lui enseigner ce qu'est l'envie d'y aller, sauf à concevoir une machine qui sacherire et aimer. La notion de sens passe ainsi d'abord par l'assimilation du sens de lacompréhension elle-même, par son inscription dans la vie. On peut simplementrétorquer que cela n'a aucun sens (vs aucun intérêt) de vouloir faire comprendre unsemblable titre à une machine. Cela suppose simplement qu'une bonne part desproblèmes qui ont fait tout l'intérêt de l'IA et des sciences cognitives sont absurdes.Tel n'est certainement pas le cas, mais il n'en demeure pas moins que le problème del'inscription dans le réel des problèmes que l'on se pose en laboratoire est unequestion fondamentale.

1.2.2. Le thème des automates

L'ensemble de cette question du sens dans le DHM se retrouve dans le thème àla fois littéraire et scientifique des automates, et notamment au travers de ce que nousappellerons la parabole de Coppélia. L'histoire, due à E.T.A. Hoffmann dans«L'homme au sable» extrait de Contes nocturnes a été reprise tout d’abord dans unopéra comique de M. Carré et J. Barbier, sur une musique de J. Offenbach, sous letitre Les contes d'Hoffmann, puis dans un ballet de Ch. Nuitter sur une musique deL. Delibes, sous le titre Coppélia. Il s'agit dans tous les cas d'un savant fou quifabrique un automate à ce point semblable à une jeune fille qu'un jeune hommeromantique s'en éprend à la folie. Le thème est toutefois traité différemment selonles cas. Dans la version originale ainsi que dans le ballet, Coppélia s'appelle Olympeou Olympie, et Nathanaël, le narrateur, croit qu'elle est la fille du professeurSpallanzani. Dans la nouvelle d'Hoffmann, ce même Spallanzani, pour donner la vueà son automate, a néanmoins besoin du concours de Coppélius, personnagesatanique qui causera sa perte, tout comme celle du narrateur et de sa famille. La vuesymbolise seule les facultés humaines, tout le reste, y compris la parole, étant duressort de l'homme de sciences. C'est donc dans le ballet que la poupée mécanique,

17

chef d'oeuvre du fabricant d'automates Coppélius, s'appelle Coppélia. Franz, unjeune écervelé en tombe follement amoureux, au point d'oublier sa fiancée Swanilda.Coppélius reste un être maléfique, puisqu'il tente, par des passes magnétiques, detransférer à Coppélia la vitalité de Franz. C'est cependant lui qui se laisse abuser, enl'occurrence par Swanilda qui prend un moment la place de l'automate.

Sans qu'il y ait de volonté de tromperie, on a ainsi affaire à une parabole de lasupercherie de l'intelligence artificielle, dans la mesure où il faudra toujours que lacompréhension, si compréhension il y a, ait été programmée, fût-ce au travers demécanismes d'apprentissage, c'est-à-dire que ce soit une forme frauduleuse decompréhension. C'est toutefois avec le DHM que cette supercherie est toutparticulièrement intéressante :

- Supercherie du DHM en tout premier lieu, puisque le dialogue homme-machine, communication non équivalente, s'oppose par principe au dialogue, dont lanature même suppose une équivalence au moins virtuelle de la communication.

- Supercherie du savant ensuite, à la fois démiurge et apprenti sorcier,simultanément Coppélius et Spallanzani, toujours susceptible de se faire berner. LeSpallanzani de Hoffmann est ainsi trompé par Coppélius auquel il a cru devoirrecourir pour dépasser le stade de l'automate, tout comme peut-être l'informaticienqui, sous couvert de sciences cognitives, va chercher des secours du côté despsychologues, des linguistes ou des neurologues, et qui est susceptible de créer unoutil dont il réprouve une utilisation qui le dépasse. Le Coppélius du ballet est luiaussi trompé, mais cette fois par une utilisation frauduleuse de son automate qu'ilcrédite de capacités qu'il a été incapable de lui donner. Ainsi par l'utilisation deméthodes à base d'apprentissage tentons-nous de réaliser des systèmes dont nousserions incapables de décomposer le fonctionnement.

- Supercherie de l'automate-machine également, dont la performativité tientsouvent lieu de réussite. Comme pour ELIZA en effet, une simulation peut fort bienapparaître comme satisfaisante dès lors que les utilisateurs en sont persuadés, alorsque des performances étonnantes peuvent rester totalement ignorées, dès lors que lesutilisateurs ne sont pas convaincus. Ainsi les progrès à venir des systèmes de DHMsont-ils souvent présentés comme davantage tributaires d'une meilleure prise encompte des «facteurs humains» que d'avancées strictement technologiques.

- Supercherie de l'amoureux-utilisateur enfin, perpétuel écervelé, victimeconsentante et ravie de systèmes inexistants, imaginés par des expérimentateurs enmal de données. Tous les réalisateurs de corpus suivant la méthode dite du magiciend'Oz ont ainsi rencontré des pléiades de témoins parfaitement au fait deperformances totalement imaginaires. Sans doute faut-il croire que cette supercheriecorrespond à une attente, comme c'est le cas pour le Nathanaël de Hoffmann : C'estqu'il n'avait jamais eu un auditoire si parfait. Olympie ne brodait ni ne tricotait,elle ne regardait pas par la fenêtre, ne donnait pas à manger à un petit oiseau, nejouait pas avec un petit bichon, ni avec un petit amour de chat, ne roulait pas dansses doigts de petites bandes de papier, ni rien d'autre chose, et n'avait jamaisbesoin de réprimer un bâillement par une petite toux forcée. Bref, elle regardaitson amant dans les yeux, durant des heures, dans une attitude fixe et immuable,sans bouger, sans souffler, et son regard s'animait toujours de plus de vivacité etd'ardeur. Seulement, lorsque à la fin Nathanaël se levait et lui baisait la main oumême la bouche, elle disait : “Ha! ha ! “ et ensuite : “Bonne nuit, mon cher !” Et

18

son cas n'est manifestement pas isolé, puisque après la découverte de l'imposturePour acquérir la conviction certaine de ne pas être épris d'une poupée de bois,plus d'un amant exigea de sa maîtresse qu'elle chantât et dansât un peu hors demesure, qu'elle voulût bien tricoter ou broder et même jouer avec le petit chien, enécoutant la lecture, et ainsi du reste ; mais surtout qu'elle ne se contentât pasd'écouter, et qu'elle parlât aussi quelquefois de manière à faire entrevoir sous sesparoles ce qu'elle pensait et ressentait. Ce genre d'épreuve resserra un certainnombre de liens amoureux qui devinrent d'autant plus agréables, tandis qued'autres se dénouèrent peu à peu.

Le thème littéraire des automates n'est pas réservé à l'histoire de Coppélia et,comme on peut le voir dans la bibliographie, on peut tout aussi bien citerPinnocchio, Le magicien d'Oz , Le Golem de Meyrink ou L'Eve future de Villiersde l'Isle-Adam. L'homme machine, de J.O. de La Mettrie n'a en revanche guère àvoir avec ce thème : il s'agit en l'occurrence d'utiliser le rationalisme de la descriptionanatomique pour décrire la «machine» humaine, c'est-à-dire pour attribuer à l'hommel'automatisme réservé par Descartes aux animaux. Tous ces textes sont néanmoinsdirectement issus de «L'homme au sable», véritable parabole de la question.

Hoffmann intègre d'ailleurs dans sa réflexion le thème scientifique desautomates, domaine de prédilection du professeur Spallanzani. Les automates enquestion sont finalement les ancêtres des ordinateurs, et plus particulièrement dessystèmes d’IA. A cet égard, le cas le plus intéressant est sans nul doute celui deKempelen, gentilhomme autrichien du dix-huitième siècle, qui est l’auteur de deuxmachines renommées : l’automate joueur d’échec et la machine parlante. Cettedernière, aux performances remarquables pour l’époque a certainement influencéHoffmann, en ce sens que c’est sans doute son existence qui l’a incité à inclure laparole dans les performances de l'homme de science, et à réserver la seule vue auxcompétences de Satan. Mais c’est surtout le joueur d’échec qui est intéressant pournotre propos : «il se présentait sous la forme d’un personnage enrubanné assisderrière un bahut. Avant de commencer une partie, Kempelen ouvrait la porte avant,la porte arrière, et le tiroir du bas. Les assistants constataient alors que personne nepouvait être caché dans le meuble. Kempelen fermait les portes, enlevait la pipe de lamain de l’automate, et allait se placer à quelques pas de là en conservant avec lui lapetite caisse qu’il avait sortie du compartiment de droite. La partie pouvait alorss’engager avec la personne qui le désirait. L’automate gagnait presque toujours.Chacun de ses mouvements s’accompagnait d’un bruit ressemblant à celui d’unependule à répétition» [Liénard 68]. Ce qui continue à faire l’intérêt de cet automate,c’est que, en dépit de diverses hypothèses, ses contemporains ne sont pas parvenusà le mettre en défaut. Au delà de la mécanique, qui renvoie moins à un ordinateurque la machine à calculer de Pascal, c’est la supercherie non démasquée du joueurd’échecs qui en fait le précurseur des systèmes d’IA, et plus particulièrement dessystèmes de DHM. Son dialogue, c’est le jeu, communication non équivalente dontil dispose d’une maîtrise paradoxale.

1.3. Dialogue et compréhension automatique

Au sein des traitements automatiques du langage, DHM et compréhensionautomatique du langage naturel rencontrent partiellement les même problèmes, car

19

l'un et l'autre sont confrontés au problème du sens. Les applications actuelles destraitements automatiques de la parole ont rarement à tenir compte du sens. Pour desapplications telles que la dictée vocale, la déroute des approches fondées sur lesconnaissances au profit d'approches d'inspiration stochastique (en l'occurrencel'utilisation de méthodes à base de probabilités de succession) ne fait qu'illustrer lecaractère peu linguistique des options retenues. Pour le dialogue en revanche, qu'ilsoit oral ou écrit, il est absolument inenvisageable de concevoir le développementd'un système sans une maîtrise du sens.

1.3.1. La signification intentionnelle

Le problème central, à la fois en ce qui concerne l'analyse et le dialogue, est ici leproblème des buts. Il s'agit là non pas d'un terme usuel, mais d'un conceptinformatique qui a donné lieu à des modélisations spécifiques. Ce terme désigne uneréalité simple, à savoir que pour comprendre un énoncé on ne peut se satisfaire dusens propositionnel, et qu'il est nécessaire d'accéder en première instance aucontexte, et notamment à la signification intentionnelle

Exemple 2 : échange et «but»H1 : je cherche un garageM1 : où cela ?H2 : y a-t-il un hôtel à Martinville ?

Comprendre un échange comme celui de l'exemple 2 suppose non seulementque le système sache décoder qu'il s'agit d'une question, que Martinville est un nomde lieu, qu'un hôtel loue des chambres, que dans des chambres on peut dormir etc...mais également qu'il soit à même d'inférer à partir de H2 le but poursuivi parl'interlocuteur, en l'occurrence qu'on lui indique un garage, si possible proche d'unhôtel, dans la mesure où il suppose que la nécessaire immobilisation de son véhiculesera trop longue pour lui permettre de repartir dans la journée. D'aucuns objecterontsans doute que cette remarque sur les buts est une remarque linguistique banale,dans la mesure où cela revient à dire que le signe linguistique tire sa significationtout autant de son utilisation que de son référent. Mais l'intérêt des traitementsautomatiques du langage est justement de ne pas distinguer le banal de l'original etde mettre surtout en évidence l'important. En DHM, cette question des buts estcapitale, à telle enseigne que la formulation, c'est-à-dire le sens propositionnel, estsecondaire par rapport à la signification intentionnelle, et un énoncé tel que jevoudrais savoir si le night-club appelé «le Guermante» se trouve bien à Martinvilledevrait être interprété par un système comme une interrogation directe partielle (laréponse attendue ne peut pas se limiter par exemple à un simple «non»), alors que saformulation est celle d'une interrogation indirecte totale. Il est clair ensuite que c'estce night-club-là qui est recherché et non un autre, fût-il à Martinville, et c'est cettepiste-là qu'il faudrait privilégier en cas de réponse négative. De la même manière,dans le cas où la réponse attendue serait un oui ou un non, l'inférence ne peut êtreque contextuelle : il est absolument nécessaire de comprendre le but del'interlocuteur avant de pouvoir lui répondre.

Cette question du maniement des buts, c'est-à-dire de la significationintentionnelle a d'ailleurs été au centre de la quasi-totalité des recherches en

20

intelligence artificielle relatives aux traitements automatiques du langage durant lesannées 1980-1990. Qu'on parle des buts, des plans, des croyances, des foyers oudes univers de référence (termes qui recouvrent des conceptualisations différentes)[Cohen et al. 1990], on en revient toujours au problème de la significationintentionnelle : il est possible de considérer que l'on est parvenu à représenter lesbuts en machine (en ce sens qu'on sait les mettre en rapport avec l'analyse ou mêmeentre eux) dès lors que la tâche est un peu complexe. On est en revanche beaucoupplus embarrassé lorsqu'il s'agit de réaliser des systèmes qui soient capables deconcevoir par eux-mêmes de nouveaux buts. En d'autres termes, on en est au mêmepoint en ce qui concerne la signification intentionnelle qu'en ce qui concerne le senspropositionnel : un système doit nécessairement évoluer dans un univers quadrillés'il veut prétendre à une quelconque efficacité. Or si cette nécessité est une contraintenaturelle en ce qui concerne l'analyse de phrase, dans la mesure où il peut paraîtrelégitime que le système ait une représentation de tout ce qui est explicite (lexique etsyntaxe notamment), c'est une contrainte beaucoup plus gênante pour ce qui est desbuts. Cela revient en effet à tenter de maîtriser l'implicite sans avoir aucune prise surl'imprévu, et cela condamne les tentatives de réalisation à se limiter à l'exécution detâches suffisamment simples et limitées pour qu'une «grammaire» des buts (enl'occurrence une description systématique de tous les éléments constitutifs) puisseservir de base à la réalisation informatique.

1.3.2. La non-normativité

A la différence de l'analyse de phrase, qui suppose très généralement une languestandard normée, le dialogue est nécessairement confronté à la non-normativité. Quece soit à l'oral ou à l'écrit, le dialogue suppose une communication directe où lanorme est d'emblée considérée comme secondaire. Dans les données recueillies avecmachine simulée, on trouve ainsi, au delà de quelques exemples caricaturaux(comme la question suivante, proposée par l'intermédiaire du Minitel, et destinée àun ministre de l'emploi : «il y aurait peut etre des problème de secretprogessionnel???la ligeslation prevois t'elle se tavail???a qui je peux merenseigner???»), une langue qui comporte des phénomènes de bruits et desphénomènes de dislocation analogues à ceux que l'on rencontre usuellement àl'oral. La langue en question n'est pas celle de l'écrit standard. Comme dans lalangue parlée, le dialogue suppose que les énoncés soient conçus et perçus dans lefil de leur énonciation. Même avec un clavier, il est rare que l'on soit tenté de secorriger autrement que par un supplément de message, et on rencontre fréquemmentdivers phénomènes de non normativité comme des télescopages syntaxiques, reprisdans l'exemple 3.

Exemple 3 : phénomènes de télescopage syntaxique- pour les banlieues il faut une communication beaucoup plus rapide de banlieue à banlieue- j'ai 15 ans je suis en troisième pourrais-je quitter l'école pour aller au CFA sans avoir 16 ans.

Ce type de non normativité relève moins d'une «grammaire des fautes» que d'unprocessus énonciatif particulier. La notion de cohérence syntaxique, au lieu des'appliquer à un concept tel que celui de la phrase, s'applique à une fenêtre qui sedéplace au fil de l'énonciation, et qui a pour effet de faire cohabiter des structuressyntaxiques a priori exclusives les unes des autres, pour les banlieues il faut unecommunication beaucoup plus rapide et il faut une communication beaucoup plus

21

rapide de banlieue à banlieue pour le premier exemple ; j'ai 15 ans je suis entroisième pourrais-je quitter l'école pour aller au CFA et je suis en troisièmepourrais-je quitter l'école pour aller au CFA sans avoir 16 ans pour le second.

Dans un certain nombre de cas (lorsque l'importance des phénomènes de nonnormativité rend les techniques d'analyse classiques inopérantes notamment), ledialogue peut conduire au développement de techniques d'analyse spécifiques. Trèssouvent par exemple se pose le problème de l'analyse totale ou de l'analysepartielle : dès lors que les phénomènes de non normativité sont importants, mieuxvaut se limiter à analyser les passages dont on est sûr, et laisser de côté ceux quisont susceptibles de faire difficulté. L'importance de la composante pragmatiquepourra seule pallier dans ce cas les carences d'une analyse par définition lacunaire :cela ne fonctionne que si le système parvient, grâce à la maîtrise de la significationintentionnelle, à prévoir ce qui va être dit.

1.3.3. Erreur et dialogue

Le dialogue a toutefois une spécificité : son caractère dynamique, qui s'opposeau caractère statique de l'analyse de phrase. Cette dynamicité s'illustre avec profit àpartir du concept d'erreur. Face à un écrit standard, une erreur du système se jugerapar rapport à une analyse théoriquement irréprochable admise une fois pour toutes,et elle se jaugera à l'aide de paramètres divers, en fonction de la distance qui sépareral'analyse de référence et l'analyse effectuée par le système. En situation de dialogue,l'erreur ne se juge pas en elle-même. Elle se juge en fonction du coût éventuel de sarécupération. On peut ainsi distinguer différents types d'erreur, ne serait-ce qu'àpartir d'un exemple tel que la demande d'horaire SNCF suivante :

- j'aimerais me rendre à Lorient de Paris tard ce soir et je voudrais savoir dans quelle gareje devais partir

- Les erreurs négligeables sont celles qui n'influencent pas le déroulement dudialogue. Ainsi, même si la partie de la requête portant sur la nature de la gareparisienne n'était pas prise en compte, n'importe quelle réponse inclurait cetteinformation, ce qui retirerait toute pertinence à l'erreur en question.

- Les erreurs à rectification immédiate sont celles qui ne nécessitent qu'unedemande de précision ou de rectification, de la part de la machine. Ainsi, au cas oùl'indication du jour, par l'intermédiaire du démonstratif ce, n'était pas comprise, celasupposerait la formulation immédiate d'une question incidente (Quel jour désirez-vous partir ?) de la part du système.

- Les erreurs à rectification différée sont celles qui supposent que lademande de précision ou de rectification émane du correspondant, à la suite d'uneréponse partiellement fausse de la machine présumée. Ainsi, dans l'hypothèse oùtard resterait incompris, le système proposerait une réponse inadéquate, ce quiconduirait l'interlocuteur à solliciter une nouvelle réponse.

- Les erreurs non rectifiables sont celles qui nécessitent une reprise de toutela séquence de dialogue. Il s'agit en fait des erreurs qui supposent une réelleincompréhension de la requête, comme si le système comprenait que la questionportait sur le trajet Lorient-Paris par exemple : une réponse peut être proposée et le

22

dialogue s'engager sans que l'interlocuteur se rende compte de la méprise (d'oùl'intérêt bien sûr des fréquents échanges confirmatifs en DHM [Bilange 92]).

1.3.4. La signification interactionnelle

Les erreurs sont en tout cas moins importantes en dialogue que le maintien ducanal de communication, qui est indispensable à la récupération éventuelle de ceserreurs. Il existe en somme une forme particulière de sens qui relève de ce que l'onappellera la signification interactionnelle. Considérons en l'occurrence l'exemple 4 :la séquence H6 M8 ne pose, du point de vue dialogique, aucun problème, même sion considère qu'il est très peu probable qu'un système réponde un jour comme enM7. H2, H3, H4 et H5 visent en revanche à satisfaire un seul et même but : savoir letemps qu'il fera «du côté de...», mais tantôt la syntaxe est interrogative et tantôt ellene l'est pas ; parfois l'interrogation est totale (H3), parfois elle est partielle (H2).Signification intentionnelle et sens propositionnel ne rendent ainsi absolument pascompte de cette forme particulière de sens qui fait que, pour des raisons proprementdialogiques :

- H3 est davantage une réponse à M2 qu'une quelconque question, et s'il est toutà fait acceptable de feindre, comme en M3, que c'est une question, c'est parce queMartinville est inconnue et que cela évite toute forme de réitération de M2. Au casoù Martinville serait connue, le système devrait en revanche être capable de fournirimmédiatement en M3 la réponse qui intervient en M5. C'est d'ailleurs l'absence d'untel comportement dialogique qui rend M4 difficilement acceptable : en toute logique,c'est à ce moment-là que le système devrait répondre.

- La maladresse que dénote M4 constitue une erreur négligeable, dans la mesureoù cela ne gêne en aucune façon la poursuite du dialogue. Elle tient à une mauvaiseinterprétation de H4, compris, en rapport avec H3, comme une paraphrase de*connaissez-vous Tansonville, alors que cette intervention devrait être interprétécomme une réponse à M2.

- Indépendamment des mécanismes d'inférence nécessaires à son analyse, H5est, du point de vue de la signification interactionnelle, une réponse à M2, même sicela peut être ressenti comme une paraphrase de *quel temps fera-t-il demain ducôté de Tansonville, qui interviendrait comme une relance à la suite d'uneintervention maladroite du système.

Exemple 4 : exemple de dialogue avec machineH1 : c'est la météo nationale ?M1 : ouiH2 : quel temps fera-t-il demain ?M2 :où cela ?H3 : connaissez-vous Martinville ?M3 : nonH4 : c'est à côté de TansonvilleM4 : ouiH5 : alors de ce côté-làM5 : il y fera un temps superbeH6 : est-ce que les aubépines seront en fleurs ?M6 : je ne sais pasH7 : pourquoi ?M7 : les problèmes de temps perdu ne me concernent pasH8 : tant pis, il fera beau de toute façon, n'est-ce pas ?M8 : oui

23

2. Les tâches

Il n’est en tout cas pas envisageable de prétendre concevoir des systèmes deDHM pour effectuer n’importe quelle tâche, et il est clair que l’application retenueconditionnera les fonctionnalités du système. Une classification des tâches est ainsiimplicitement à la base de tous les travaux dans le domaine, même si cetteclassification est très rarement explicitée. Nous tenterons pour notre part de dégagerquelques orientations, fondées sur des points de vue différents. Dans un premiertemps (2.1.), nous reprendrons certains des classements fondés sur les buts et lesactes de langage. Dans un second temps, nous présenterons le système desfonctions interactives (2.2.), qui s’appuie sur le degré d’implication del’interlocuteur dans l’interaction. Nous tenterons ensuite de classer les tâches enfonction des conditions physiques de la communication (2.3.), puis nous nousattarderons sur quelques applications phares (2.4.).

2.1. Buts et actes de langage

Les quelques classements qui existent actuellement s’inspirent presque tous desthéories pragmatiques, et se fondent sur le contenu intentionnel descommunications. On peut ainsi se fonder sur le type de but poursuivi, c’est-à-diresur une typologie des propos. On trouve par exemple dans [Bourguet 92] uneclassification en cinq niveaux :

- Lorsqu’il n’y pas véritablement de but, en ce sens que la machine effectueuniquement une tâche simple, en réagissant comme un automate en fonction d’unereprésentation interne donnée, il s’agit d’un dialogue dirigé par les états.

- On peut également rencontrer des dialogues dans lesquels il n’y a pas de butbien défini, dans la mesure où il s’agit d’exécuter une série de tâches élémentaires,sans qu’aucune prédiction soit réellement possible. On pourra dans ce cas parlerd’un dialogue dirigé par les objets.

- Lorsque le but est unique, ce dernier est prévisible, et on aura véritablementaffaire à un dialogue dirigé par le but, même si les modes de réalisation diffèrentselon les interlocuteurs.

- Lorsque les buts sont multiples, tout dépendra de la modélisation de la tâche etdes différents types de scénarios mis en oeuvre, qui visent à aider l’utilisateur àcheminer dans le dédale de l’application. On parlera alors de dialogue dirigé parla tâche.

- Le but est parfois flou, et l’utilisateur ne sait pas véritablement ce qu’ilcherche, par exemple lorsqu’il ignore tout de l’application. Il s’agit alors d’undialogue dirigé par les objectifs, dans la mesure où le système doit en toutpremier lieu amener l’utilisateur à identifier quels sont ses buts.

Suivant la complexité du contenu intentionnel, le système devra tolérer une plusou moins grande complexité des interventions de l’utilisateur, ce qui permetd’effectuer une typologie des tâches en se fondant sur les actes de langage. On peutpar exemple reprendre la classification de [Vanderveken 88] qui, à la suite de Searle,distingue notamment six différents actes de discours (énoncés déclaratifs,conditionnels, impératifs, interrogatifs, exclamatifs et optatifs en l’occurrence). Pour

24

notre part, nous serions davantage enclin à intégrer dans une classification destâches concernées par le DHM le nombre et le type d’actes de langageacceptables dans les interventions de l’utilisateur :

- Les tâches les plus simples sont ainsi les tâches où le mode d'interaction sesuffit d'un seul acte de langage par tour de parole (à quelle heure part le prochaintrain pour X ?). Le fait de ne traiter à tout moment qu’une seule chose à la foissimplifie considérablement un système de dialogue. On peut ranger dans cettecatégorie les tâches dans lesquelles les interventions comportent, outre un actedirecteur, un acte d’évaluation par rapport à ce qui a immédiatement précédé (oui, età quelle heure part le prochain train pour X ?), comme dans [Bilange 92].

- Une première façon de rendre les choses plus compliquées est d’admettre unepluralité contrôlée des actes de langage, par exemple en n’acceptant plusieurs actesde langage que s’ils sont de même nature. Un système de demande derenseignements pourra ainsi comporter plusieurs requêtes, à condition qu’ellesportent sur un même objet (je voudrais savoir l’heure du prochain train pour X,son horaire d’arrivée, ainsi que les coordonnées de la correspondance pour Y ?).

- Une tâche dans laquelle il serait nécessaire d’interpréter des énoncéscomportant plusieurs actes de langage serait beaucoup plus difficile à gérer que lesprécédentes. Cela supposerait par exemple que le correspondant puisse ajouter à unerequête un ensemble d’éléments plus ou moins connexes, et que le système soitcapable de les interpréter (à quelle heure part le prochain train pour X, quel est leprix du billet, et surtout dites-moi si les problèmes de grève sont maintenantrésolus et si j’ai une chance d’arriver à l’heure prévue ?).

- Comme on le verra ci-dessous avec les fonctions interactives, une tâche devientparticulièrement délicate à manier dès lors que le correspondant n’intervient plusseulement pour transmettre une information, mais également pour parler de lui-même ou pour influencer l’autre (je voudrais le prochain train pour X, mais à unepériode où je pourrai profiter de ma carte vermeille, parce que maintenant que jel’ai, je n’ai pas l’intention de me faire avoir, comme la dernière fois, où vousm’avez refilé des billets sans réduction, qu’en plus je n’ai même pas pu me fairerembourser).

- Certaines tâches supposent enfin, pour être convenablement menées à bien,que le système soit capable de gérer des actes indirects. L’interprétation des énoncésrequiert alors des capacités de raisonnement toujours délicates à mettre en oeuvre.

2.2. Les fonctions interactives

A partir des énoncés suivants, qui présentent les formulations essentielles de lamodalité de base de tout système de DHM, l’interrogation, on tentera maintenant deprésenter une typologie des dialogues fondée sur le degré d'implicationpersonnelle du locuteur dans le dialogue [Luzzati 92a] :

(a) (Pierre) qu'est-ce qu'il mange / que mange-t-il ?(b) (Pierre) est-ce qu'il mange / mange-t-il ?(c) (Pierre) j'aimerais savoir s'il/qu'est-ce qu'il mange ?(d) (Pierre) (qu’)est-ce qu'il est prévu/possible qu'il mange ?(e) (Pierre) croyez-vous/pensez-vous qu'il mange ?(f) (Pierre) ne mange-t-il pas ?

25

(a) Interrogation partielle qui dénote la recherche effective derenseignements.

(b) Interrogation totale qui pose artificiellement comme thème l'existence duprocès, alors qu'il ne s'agit manifestement pas de savoir si Pierre mange maisd'interroger sur ce qu'il mange.

(c) Normalement, les questions sont formulées directement. Toutefois, onrencontre fréquemment des interrogations indirectes. Tout se passe alors commesi les correspondants, au lieu d'escompter une réponse de leur interlocuteur,escomptaient une réponse dans l'absolu. Le thème, au lieu d'être Pierre, devient le jedu correspondant.

(d) Très souvent, les correspondants formulent des questions modalisées. Laréponse semble alors escomptée sur l'éventualité du procès, puisque le thème devientla possibilité que Pierre mange.

(e) Un peu plus rares sont ce que nous appellerons les questions décalées,comme si la réponse escomptée devait porter sur l'opinion de l'interlocuteur.

(f) De la même manière, on rencontre des questions interro-négatives, où laréponse semble escomptée sur la confirmation de l'existence du procès.

Bien entendu les choses sont rarement simples, et ces différentes oppositionss'entremêlent à loisir dans des données attestées telles que les énoncés repris dansl'exemple 5, qui sont tirés d'un corpus Minitel de questions posées parl'intermédiaire d'un serveur à des personnalités diverses (en l'occurrence le ministrede l'emploi). Ainsi, dans l'exemple (5a), les cas (d) et (e) sont concernés ; dansl'exemple (5b), ce sont les cas (d) et (f) ; la formulation de l'exemple (5c) estassimilable au cas (c). Avec l'exemple (5d) enfin, une succession de formulationsapparaît : le premier segment peut s'interpréter soit comme un thème, soit commeune question partielle ; le second est sans conteste une question modalisée ; laprésence de réellement modifie toutefois la nature du thème et de la réponseescomptée ; ce message se termine enfin par un segment interro-négatif.

Exemple 5 : questions posées au Ministre de l'emploi par l'intermédiaire duserveur Minitel de «Démocratie directe»

(5a) monsieur le ministre vous est-il possible de me faire savoir les raisons quiont justifié l'effacement de réponseà la question 194 posee hier? (242)(5b) ne peut-on pas ... (240)(5c) je voudrais des exemples de ...(234)(5d) place et role des paio et ml dans lesuivi des s.i.v.p. peuvent-ellles rEel-ement remplir un role? n'ont-elles pasete un peu trop facilement exclu parles anpe par ex. (232)

Cette description du fonctionnement de l'interrogation reste incomplète, dans lamesure où les réponses escomptées par les formulations interrogatives sont biensouvent différentes des réponses réellement attendues dans l'interaction. Tout leproblème est en somme de comprendre pourquoi les correspondants utilisent desformulations interrogatives différentes, alors qu'ils attendent manifestement desréponses de même nature. Pour savoir ce que Pierre mange, ils demandentfréquemment s'il ne mange pas ou bien est-il possible qu'il mange. Ainsi, dansl'exemple (5a), le problème est-il de savoir pourquoi la réponse a été effacée, et non

26

s'il est possible de le savoir. De la même manière, dans l'exemple (5d), il s'agit desavoir quel est le rôle des PAIO dans le suivi des SIVP plutôt que d'obtenir uneréponse par oui, par non ou par si, comme le suggère la formulation des deuxderniers segments. On a donc d'une part la réponse escomptée par la formulation,et d'autre part la réponse attendue, et la non concordance entre ces deux types deréponse crée un espace que nous tenterons de combler en avançant la notion defonction interactive.

L'interrogation apparaît ainsi comme l'une des deux modalités fondamentales del'interaction, qu'elle soit orale ou écrite, dans la mesure où une affirmation esttoujours une réponse à une question supposée de l'interlocuteur, et une question,l'amorce d'une réponse attendue, qui concorde ou ne concorde pas avec la réponseescomptée. Cette dimension interactive est toutefois surtout le fait de l'oral, et il estbien rare de pouvoir l'observer à partir d'un corpus écrit. Il est clair que le problèmeposé dépasse le strict cadre de la syntaxe de l'interrogation, et il nous a paruintéressant de revenir aux fonctions du langage, et de les appliquer à l'interaction.Trois d'entre elles sont alors à notre sens particulièrement sollicitées :

- Une fonction informative, proche de la fonction référentielle. Lorsqu'elle esten jeu, le propos est de transmettre une information.

- Une fonction communicative, proche de la fonction conative. Il s'agit dechercher l'autre, de l'affronter, de l'influencer.

- Une fonction existentielle, proche de la fonction expressive. Le locuteur sesoucie surtout de se mettre en avant, de manifester sa présence par sa parole.

Il est difficile de mettre en rapport ces fonctions interactives avec des questionsde pure syntaxe. Les problèmes d'interaction sont par essence des problèmescontextuels, et tout phénomène doit être rapporté au sens et à l'interprétation de cesens. Cette nécessité apparaîtra tout à fait clairement lorsque, dans les lignes quisuivent, nous allons continuer à employer des exemples hors contexte, au lieu d'enprendre dans notre corpus Minitel, ce que nous ferons tout de suite après. Dans lecorpus en effet, et rien ne permet d'y assimiler la langue dans son ensemble, il setrouve que la catégorisation des questions à laquelle nous nous sommes attelécorrespond à une répartition des fonctions interactives :

a) L'interrogation partielle introduit généralement la fonction informative, dans lamesure où la réponse escomptée correspond effectivement à la question posée.

b) Avec la plupart des questions totales, il s'agit de la fonction communicative.Demander si Pierre mange quand on sait fort bien que c'est le cas a en général uneconnotation polémique : on suspecte alors quelque chose de répréhensible et ontente de remettre en cause l'existence du procès.

c) Avec l'interrogation indirecte (lorsque l'interrogation directe conviendraitparfaitement bien entendu), c'est la fonction existentielle qui est sollicitée. Dans jevoudrais savoir, consciemment ou inconsciemment, c'est le je qui est mis en valeur.

d) L'interrogation modalisée met en jeu à la fois la fonction existentielle et lafonction communicative. Ce qui est mis en avant, c'est en effet un doute sur le procès(peut-on, est-il possible). Le correspondant se met ainsi en avant (fonctionexistentielle) en manifestant son doute ; il sollicite d'autre part son interlocuteur(fonction communicative) en lui demandant de lever ce doute.

e) Il en va de même avec ce que nous avons appelé les questions décalées(croyez-vous ...), si ce n'est que cette fois la fonction communicative précède la

27

fonction existentielle : c'est le fait de solliciter dans un premier temps soninterlocuteur qui suppose, dans un second temps, l'existence d'un doute.

f) Pour les formulations interro-négatives, c'est évidemment la fonctioncommunicative qui est mise en avant, puisque celles-ci ont une connotationnettement polémique.

Dans la pratique, il n'est pas toujours aisé de démêler ces fonctions.Sensiblement pour la moitié des questions, cela ne fait pas de difficulté : ellessupportent la fonction informative (questions partielles où la réponse escomptéecorrespond à la réponse attendue). Les fonctions existentielles ou communicativesne sont toutefois pas forcément exclues : dans notre corpus Minitel par exemple, lademande d'information est rarement neutre. L'engagement du locuteur est en généralsoit un engagement polémique, soit un engagement qui manifeste son existence. Ungrand nombre de professionnels de l'emploi connaissent ainsi la réponse à laquestion qu'ils posent : parfois ils désapprouvent cette réponse, et leur question asurtout pour fonction de marquer cette désapprobation ; parfois ils pourraient plusefficacement trouver ailleurs une réponse. Pour les autres questions, il y amanifestement un hiatus entre la question posée et la réponse réellement attendue.On peut toutefois considérer alors que deux fonctions sont sollicitées : la fonctioncommunicative ou la fonction existentielle tout d'abord ; la fonction informativeensuite. Une sorte de vide interactif fait que celle de ces deux fonctions qui n'est pasmajeure reste sollicitée, pour cette simple raison sans doute que je et tu sontinséparables. Vis-à-vis du DHM, les fonctions interactives sont surtout intéressantesdès lors que la fonction informative n’est pas seule en cause, c’est-à-dire lorsqueintervient la dimension psychologique de la communication. Le problème peut alorsêtre autant d’ignorer tout ce qui ne relève pas strictement de la fonction informativeque d’être capable d’en tenir compte.

2.3. Les distorsions de la communication

En 1968, J. Peytard [Peytard 68] a dressé une typologie non pas des diversesformes de dialogue, mais des différents types de messages oraux. Cette typologie,qui lui permet de distinguer conversation, télécommunication, récit radiophonique,interview, message théâtral, message télé-théâtral et message enregistré est surtoutintéressante par un ensemble de 6 dichotomies, qualifiées par J. Peytardd’«invariants» . Ceux-ci caractérisent différentes formes de distorsions spatio-temporelles de la communication, et sont transposables, moyennant quelquesextrapolations, au DHM. Il s’agit en l’occurrence de considérer qu’un système esttoujours physiquement implanté quelque part, dans la mesure où il estnécessairement situé dans l’espace et dans le temps. A l’instar de toute forme decommunication, le DHM se trouve ainsi soumis à différentes formes de nonconcordance spatiale et/ou temporelle, dont l’identification permet d’induire deséléments de typologie.

La première de ces 6 dichotomies concerne la non concordance entre le tempsde l’émission et le temps de la réponse. L’interaction peut en effet réclamer plusou moins d’attente, et selon les cas un locuteur peut se trouver entraîné dans undialogue qui ne lui laisse aucun répit, ou bien être amené à attendre de longues

28

minutes devant son écran avant de disposer à nouveau de l’initiative. Bienévidemment, le type d’interaction différera, fût-ce dans une même application. Cettedistorsion temporelle peut résulter de la lourdeur d’un système comme celui de laSNCF où il peut y avoir plus de 10 000 connexions simultanées. La taille des basesde données peut également être en cause, tout comme il peut s’agir d’une intention,propre à induire un certain type d’interaction : toute distorsion temporelle estgénératrice de temps, dont l’interlocuteur dispose pour concevoir et compléter lesinterventions à venir, c’est-à-dire que cela ne peut que contribuer à réduire la part dudialogue incident (cf. infra, pp. 38-41).

La seconde dichotomie relève de la distorsion spatiale : il s’agit del’éloignement ou de la proximité du récepteur. Cette distorsion a moins deconséquence avec un interlocuteur machine que la précédente, dans la mesure oùl’écran, où qu’il se trouve, tient toujours lieu de système virtuel. Ce n’est cependantpas strictement la même chose que de s’adresser à un système de réservation tel quecelui de la SNCF par l’intermédiaire du Minitel, ou bien grâce à une borne installéedans une gare. La présence sur le site concerné par le propos des dialogues ne peutque modifier le modèle que le système va se construire de l’utilisateur.

J. Peytard oppose ensuite l’allocutaire actuel et l’allocutaire virtuel, lepremier correspondant à une personne connue (le destinataire d’une lettre parexemple), et le second à une personne dont on ne sait rien (les lecteurs d’unromancier par exemple). En matière de DHM, cette opposition n’est pas directementtransposable, dans la mesure où tous les allocutaires restent virtuels. Elle permetnéanmoins de dégager une opposition connexe : l’allocutaire personne etl’allocutaire générique. Selon les tâches en effet, une communication pourrait êtreconfiée à une tierce personne ou bien elle ne le pourrait pas. Selon les cas, ce qui estdemandé ne peut l’être que par l’intéressé, alors que parfois le renseignementrecherché est susceptible d’être sollicité par autrui.

Le dialogue suppose théoriquement une communication équivalente, c’est-à-direl’échange. Ce n’est cependant pas toujours le cas, et il peut se trouver des exemplesdans lesquels l’échange est impossible (à la radio par exemple). Dans le DHMégalement cette opposition entre communication avec ou sans échange peutpermettre certaines typologies, même s’il s’agit par définition d’une communicationnon équivalente. Selon les cas, un système doit ainsi maîtriser son acceptation ouson refus de l’incidence (cf. infra, pp. 38-41), dans la mesure où toute fixation del’incidence implique un refus de l’échange. De la même manière le modèle de latâche doit nécessairement déterminer si les changements de sujets dans le coursd’une communication sont acceptés ou s’ils ne le sont pas, tout comme il doitdéterminer si les rôles peuvent s’inverser. Accepter l’échange suppose en effet quele dialogue ne se limite pas strictement à un sujet prédéterminé et que, si nécessaire,le système puisse s’affranchir de son rôle d’esclave. Accepter l’échange, c’est enfinet surtout être capable de résoudre les phénomènes d’incompréhension par le biaisdu dialogue.

Cette opposition échange/non échange induit une opposition connexe : celleentre un contact immédiat et un contact différé. S’il n’y a pas échange en effet,c’est très souvent parce qu’au lieu d’un contact direct avec une personne à chaque

29

fois différente, on a affaire à un contact différé avec un interlocuteur virtuel qui resteinvariablement le même. Cette variation dans l’acceptation de l’interlocuteur en tantqu’individu est un des principaux axes d’évaluation des systèmes de DHM. Il esten effet totalement différent de concevoir un système qui s’adresse à uninterlocuteur type ou bien un système qui s’efforce de tenir compte des différencesentre les différents utilisateurs. Pour certaines tâches d’ailleurs, cette question del’adaptation à l’interlocuteur est absolument capitale : qui songerait par exemple àconcevoir un système d’EIAO qui ne s’adapte pas en permanence au niveau desapprenants.

J. Peytard oppose enfin les dialogues à stimulation directe aux dialogues àstimulation indirecte. Il s’agit en l’occurrence des dialogues totalementspontanés, par opposition avec les dialogues «à base écrite». La transposition auDHM est cette fois limpide : même si un système doit nécessairement avoir prévu lescénario des dialogues qu’il est susceptible de mener, il faudrait qu’il dispose d’unecertaine forme de spontanéité, en ce sens qu’il est toujours souhaitable de pouvoirtraiter différentes formes de non attendus. En théorie, les conditions de deuxdialogues étant toujours différentes, deux dialogues entre des interlocuteursdifférents qui se déroulent dans un contexte toujours spécifique ne devraient paspouvoir être identiques.

On aboutit ainsi à 6 critères de non spontanéité du DHM, selon que lesréponses sont immédiates ou différées, selon que le lieu où se déroulent lesdialogues dépend de ceux-ci ou bien qu’il est indifférent, selon que l’allocutaire estconsidéré comme une personne et non comme un allocutaire générique, selon que lesystème accepte ou refuse l’échange, selon son adaptation à l’interlocuteur, et selonla façon dont il intègre les différentes formes de non attendus. Ces critèrescaractérisent tout autant les applications que les systèmes, dans la mesure où lesdifférentes tâches susceptibles d’une automatisation ne requièrent pas toutesl’ensemble de ces capacités.

2.4. Les applications

Trois types d’applications nous paraissent en l’occurrence constituer desapplications de référence, auxquelles on pourrait éventuellement adjoindre desapplications connexes, relevant par exemple de l’EIAO ou de la robotique, c’est-à-dire des applications où le dialogue est davantage un faire-valoir qu’un but en soi. Ils’agit en l’occurrence de la consultation de bases de données telles que lesrenseignements horaires SNCF, de la manipulation d’un système qui saurait parexemple se substituer aux pages jaunes de l’annuaire, et enfin d’un systèmed’exploitation avec lequel on pourrait dialoguer, au point de parvenir à programmeren langage naturel. Bien entendu, ces trois applications constituent davantage desrepères que des applications effectives, dans la mesure où chacune peut se diversifierou se simplifier de façon à ne plus relever de la même classification. Passer d’unsystème de renseignements SNCF à la réservation de billets ou de la gestion d’untrajet à celle de voyages complexes requiert par exemple des capacités d’une touteautre nature, qui n’atteignent certes pas celles que réclamerait la programmation en

30

langage naturel, mais qui dépassent amplement la simple manipulation desprincipales commandes du DOS.

Ces applications relèvent d’une dialectique du maître et de l’esclave, dans larelation homme-machine, et c’est cette dialectique sous-jacente qui fait tout l’intérêtde la classification. Dans les renseignements SNCF, le système est esclave : il seborne à extraire une réponse de la base de données dont il dispose. Avec lesrenseignements pages jaunes, le système devient serviteur : pour répondre il doitpouvoir prendre des initiatives qui lui permettent de comprendre au delà du contenupropositionnel des questions qui lui sont destinées. Avec la programmation enlangage naturel, le système devient symboliquement le maître : il doit pouvoirprendre l’initiative du dialogue, et c’est lui qui bien souvent devra rechercher desinformations auprès de l’utilisateur, et non l’inverse. Chronologiquement, on peutconsidérer que cela fait dix ans que des systèmes type renseignements horairesSNCF existent, que les années 90 verront se développer des systèmes type pagesjaunes, et que la programmation en langage naturel ne pourra intervenir que bienplus tard, si tant est que l’on y parvienne un jour.

Une consultation de base de données comme les renseignements horairesSNCF a pour caractéristique d’être une tâche opérative [Falzon 89], confinée dansun domaine restreint. Les connaissances et le lexique manipulés restent limités. Lesutilisateurs sont tous peu ou prou des experts du domaine. L’allocutaire est trèsgénéralement un allocutaire générique, dans la mesure où l’information peut fortbien être recherchée par un tiers. Le système n’a pas outre mesure à accepter unéchange qui a pour unique fonction de compléter une information lacunaire.L’adaptation à l’interlocuteur n’est pas une nécessité, car l’information à fournirreste toujours la même, quels que soient les interlocuteurs.

Les tâches de type pages jaunes concernent un domaine beaucoup plus large,qui peut aller jusqu’à nécessiter une représentation du monde. Ce sont des tâchesinterprétatives dans lesquelles le système doit parvenir à maîtriser le contenuintentionnel. L’allocutaire est cette fois bien davantage considéré comme unepersonne, dans la mesure où l’information pourrait bien plus difficilement êtrerecherchée par un tiers. Le système doit ensuite accepter l’échange, car il ne s’agitpas simplement d’interpréter ce qui est dit, mais également de saisir les buts desinterlocuteurs. Comme il faut maîtriser le contenu intentionnel, l’adaptation àl’interlocuteur devient une nécessité.

Une tâche comme la programmation en langage naturel, qui relève peut-être dela fiction, est enfin une tâche réflexive, dans laquelle c’est le système qui devientl’acteur principal, celui qui guide la réflexion. Le système lui-même devient presqueune personne qui doit donner une image de son fonctionnement et de sesmécanismes de réflexion. L’échange est bien sûr totalement accepté : l’initiative dudialogue change de côté, les sujets abordés peuvent évoluer, les phénomènesd’incompréhension doivent pouvoir être pris en compte... Une tâche de ce typenécessiterait enfin que le système soit capable d’apprendre.

3. Modélisations et réalisations informatiques

31

Aussi bien pour les linguistes que pour les informaticiens, le dialogue verbalreste un domaine de recherche relativement marginal (3.1.). D'un côté comme del'autre, les différentes approches sont très récentes et en nombre limité (3.1.1.). Cesont en outre des approches qui ont du mal à collaborer, du fait des différences depréoccupations entre les disciplines (3.1.2.). Cela a néanmoins permis l'émergencede modélisations informatiques (3.2.). Après avoir présenté un modèle hiérarchique(3.2.1.), puis un modèle dynamique (3.2.2.), on examinera les composantesclassiques des systèmes actuels (3.3.), qui comportent un même ensemble deconnaissances, que l'on peut scinder en deux parties : les connaissances statiques(3.3.1.), et les connaissances dynamiques (3.3.2.).

32

3.1. L'étude du dialogue

3.1.1. Différentes approches

En linguistique, l'étude du dialogue est souvent ressentie comme une applicationde la pragmatique davantage que comme un domaine autonome. L'étude du dialogueen tant que tel est d'ailleurs récente et, en dépit de divers travaux très intéressants, ellese limite pour nous à deux courants majeurs :

- Les conversationnalistes américains [Sacks et al. 74] : il s'agit avant toutde sociologues, dont la caractéristique première est de s'être attachés à unedescription informelle de la conversation, sans se soucier de bâtir des systèmesexplicatifs. Ils ont ainsi mis en évidence le rôle déterminant des rapportspsychologiques entre les intervenants, et l'importance des gestes, silences,interruptions, reprises et autres «bruits» dans la conversation.

- L'école de Genève [Roulet et al. 85] : il s'agit, tout en parlant également deconversations réelles, de bâtir un système descriptif aussi structuré que possible. Ilen ressort un modèle de description fondé à la fois sur le courant conversationnaliste(le dialogue est conçu comme une négociation), sur la pragmatique anglo-saxonne,et sur la théorie de l'argumentation. L'intervention, qui ne s'identifie pas avec lestours de parole, comporte différents actes de langage hiérarchisés. Elle s'intègre dansun échange, car une intervention initiative appelle une intervention réactive. Deuxcontraintes, issues des maximes de Grice [Grice 75], déterminent dans une largemesure la structure des discours en situation interactive : la complétudeinteractionnelle (tendance à faire progresser le dialogue vers la satisfaction des deuxintervenants), et la complétude interactive (tendance, lorsqu'il y a désaccord, à larésolution des conflits pour pouvoir revenir au dialogue principal et envisager desatisfaire la complétude interactionnelle).

D'autres domaines, et notamment l'ergonomie, se sont également, en marge duDHM, intéressés à l'étude du dialogue [Falzon 89]. Il s'agit en l'occurrence d'étudierles conditions de réalisation et de pertinence de systèmes de DHM, ainsi que lecontexte des études linguistiques sur le sujet : dans quelle mesure dialogue homme-homme et DHM sont-ils similaires ? La méthode dite du «Magicien d'Oz» (avecmachine simulée) permet-elle d'obtenir des résultats fiables ? Celui qui simule lamachine peut-il éviter de conditionner en grande partie le comportement des usagers? Qu'en sera-t-il lorsque ces derniers se seront habitués à ce type de communication?

Dans ce domaine du dialogue, plus peut-être encore que dans d'autres, on peutconstater des divergences considérables entre l'Europe et les États-Unis : la seulethéorie descriptive qui soit à notre sens suffisamment rigoureuse pour pouvoirprétendre fonder la réalisation de programmes de DHM est européenne etfrancophone. Alors qu'elle sert de référence dans l'ensemble des équipes françaisestravaillant sur le sujet, elle est ainsi, depuis presque dix ans, à peu près totalementignorée dans l'ensemble des pays à tradition anglo-saxonne.

33

3.1.2. Linguistique et informatique

Le domaine du DHM offre un bon exemple des difficultés que peut rencontrerla collaboration entre informatique et linguistique, du fait du statut même de cesdeux disciplines : la linguistique vise à décrire la richesse de la langue, alors que lesréalisations informatiques tendent inéluctablement à une simplification réductrice.Deux exemples sont à cet égard éclairants : les modélisations de Cohen, Allen etPerrault [Allen et R. Perrault 80] à partir d'Austin et de Searle, qui font partie descontributions les plus marquantes des dix dernières années en DHM d'une part ; lesefforts de modélisation d’E. Roulet [Roulet et al. 85] et de J. Moeschler [Moeschler85 et 89], qui ont servi de base à la majorité des plus récents systèmes de DHM enFrance d'autre part.

Pour rendre compte de la signification intentionnelle, Allen et Perrault se sontefforcés d'utiliser la théorie des actes de langage pour traiter les demandes derenseignements reprises dans l'exemple 6, en partant du constat que, comme pour lesexemples sur le sel de Searle (avez-vous du sel ? pouvez-vous me passer le sel ?)une réponse coopérative devrait tenir compte non seulement de la fonction locutoire,mais également des fonctions illocutoires et perlocutoires.

Exemple 6 : différentes formulations de demandes de renseignements- Quand part le prochain train pour XXX- Prochain train pour XXX- Savez-vous quand part le prochain train pour XXX- Est-ce que le prochain train pour XXX part- Savez-vous si le prochain train pour XXX part- Sauriez-vous si le prochain train pour XXX part

Le linguiste constatera qu'un arsenal théorique complexe n'est pasindispensable, et qu'une analyse tout à fait pertinente est réalisable à partir de lasyntaxe de l'interrogation : l'ensemble de ces formulations est assimilable à uneinterrogation directe partielle (la réponse attendue comporte toujours l'horaire dutrain en question), c'est-à-dire au premier exemple, et les différentes formulationspeuvent simplement induire un éventuel «habillage» différent de la réponse (15hquai 2 / le prochain train pour XXX part à 15h du quai 2). Ce n'est en définitivequ'au cas où il n'y aurait aucun train que les réponses pourraient éventuellementdiverger. Cela dit, cette utilisation de la théorie des actes de langage a conduit audéveloppement de concepts aujourd'hui couramment utilisés, tels que les concepts debuts, ce que cherche un locuteur en posant une question (se rendre à XXX endemandant l'heure du train qui y va par exemple), de plans, ce que fait le locuteurpour réaliser son but (demander l'heure du train pour XXX quand on veut s'y rendrepar exemple) ou d'obstacles, ce qui ferait défaut pour réaliser un but (le quai d'oùpart le train recherché par exemple).

Développé pour aider à la description de conversations réelles, le modèlegenevois, quant à lui, vise à rendre compte de dialogues complexes, dans lesquelschaque tour de parole comporte souvent plusieurs actes de langage. En DHM, letype d'interaction diffère, et il est bien rare qu'un tour de parole excède un acte delangage. Tout au plus rencontre-t-on des rituels d'évaluation, souvent appeléséchanges confirmatifs [Sacks et al . 74], qui consistent à approuver ou à

34

désapprouver, à donner son accord ou à signaler son désaccord, à manifester sacompréhension ou son incompréhension, parfois par une reprise (je voudrais untrain Paris Lyon / Paris Lyon, à quelle heure), parfois par une marque linguistique(cf. H8 : tant pis, dans l'exemple sur la météo repris ci-dessous).

Ce modèle, qui permet de produire une représentation arborescente (cf.figure 2), est fondamentalement un modèle descriptif, qui permet de rendre compted'une conversation une fois celle-ci achevée. Le problème en DHM est à l'inverse derendre compte d'un dialogue au cours de son déroulement, de façon dynamique,afin de pouvoir autant que possible en garder le contrôle. Cela dit, un peu comme lesthéories d'Austin et de Searle, le modèle genevois a rendu des servicesconsidérables. A notre sens, il a notamment permis de dégager que tout dialogue nepouvait s'orienter que dans deux dilections complémentaires : on a affaire soit à undialogue régissant, soit à un dialogue incident (cf. figure 4.). Le premier vise àréaliser les buts successifs des locuteurs ; le second résout les difficultés ponctuellesqui gênent le déroulement du premier (incompréhension ; manque d'information...).Ainsi, dans l'exemple ci-dessous, les séquences M2-H5 et H7-M7 sont-elles desséquences incidentes, alors que tout le reste relève du dialogue régissant.

3.2. Modélisations du dialogue

Avant de décrire le fonctionnement global des systèmes de dialogue, nous allonsrapidement présenter certaines des modélisations qui en constituent le centre. Ils'agit en l'occurrence de diverses façons de représenter le dialogue en machine, pourles quelles nous reprendrons le dialogue présenté dans l'exemple 3.

3.2.1. Un modèle hiérarchique

Le modèle genevois a induit, dans les travaux sur le DHM, des représentationshiérarchiques comme dans la figure 2. Ce type de représentation, au départ fondéesur l'utilisation des concepts d'acte de langage, d'intervention et d'échange, peut êtrecomplété par l'étiquetage des branches à partir de la fonction illocutoire des tours deparole correspondants, mais elle est avant tout intéressante dans un système par lemécanisme de hiérarchisation qui est mis en oeuvre. Chaque ligne correspond,sinon à une intervention, du moins à un acte de langage : dans notre exemple, seulH8 comporte deux actes de langage, ce qui donne lieu à deux interventions quis'intègrent dans des échanges différents (H8 et H8'). Lorsque les couples dequestion-réponse sont contigus, cela donne lieu à des échanges simples (H1-M1,H3-M3, H4-M4, H8'-M8), parfois à trois composantes (H7-M7-H8) ; la réponse,comme c'est le cas à la suite de M6, peut inclure une séquence explicative. Lorsqueles couples de question-réponse sont discontinus, on a alors affaire à des échangescomplexes : M5 est la réponse à H2, et cette réponse inclut la séquence M2-H5 ; àl'intérieur de cette séquence, H5 est la réponse à M2, et cette réponse inclut laséquence H3-M4.

35

H1 : c'est la météo nationale ?M1 : ouiH2 : quel temps fera-t-il demain ?M2 : où cela ?H3 : connaissez-vous Martinville ?M3 : nonH4 : c'est à côté de TansonvilleM4 : ouiH5 : alors de ce côté-làM5 : il y fera un temps superbeH6 : est-ce que les aubépines seront en fleurs ?M6 : je ne sais pasH7 : pourquoi ?M7 : les problèmes de temps perdu ne me concernent pasH8 : tant pisH8' :il fera beau de toute façon, n'est-ce pas ?M8 : oui

Figure 2 : modèle hiérarchique de dialogue

Ce type de procédé est tout à fait comparable, en syntaxe, avec lareprésentation arborescente d'une phrase : c'est avant tout une méthode dereprésentation et beaucoup plus difficilement une méthode calculatoire ; cela nefonctionne efficacement que sur une séquence à la fois bien formée et achevée. Onpeut d'ailleurs recourir à d'autres représentations équivalentes, qui peuvent toutesprésenter un intérêt pour le développement de différents formalismes, que ce soitsous forme de formule parenthésée :

((H1 M1)(H2(M2(H3 M3)(H4 M4)H5)M5)(H6 M6(H7 M7 H8))(H8'M8)))

ou sous une forme comparable à une boîte de Hockett, comme dans la figure 3.Ces diverses représentation renvoient toutes à une même «syntaxe» du dialogue, àl’exclusion de toute autre composante, et notamment de la composante sémantique.

36

.

H1 M1 H2 M2 H3 M3 H4 M4 H5 M5 H6 M6 H7 M7 H8 H8' M8

H2 M2 H3 M3 H4 M4 H5 M5 H6 M6 H7 M7 H8 H2 M2 H3 M3 H4 M4 H5 M5 H6 M6 H7 M7 H8 H8' M8

M2 H3 M3 H4 M4 H5 H3 M3 H4 M4 H3 M3 H4 M4

H1 M1 H2 M2 H3 M3 H4 M4 H5 M5 H6 M6 H7 M7 H8 H8' M8

M6 H7 M7 H8H7 M7 H8

Figure 3 : représentation d'une «syntaxe du dialogue» sous forme de «boîte deHockett»

3.2.2. Un modèle dynamique

En s'inspirant du modèle hiérarchique, on peut construire un modèle dynamique[Luzzati 89], comme l'illustre la figure 4. Cela permet, par une représentationcalculatoire de la structure du dialogue, de gérer celui-ci dynamiquement, c'est-à-direde réagir en cours de communication.

Le dialogue peut s'orienter dans deux directions : soit demande d'information etdélivrance des renseignements s'enchaînent sans difficulté, et il s'agit d'un dialoguerégissant ; soit des demandes de précision, d'explication, de confirmation ou dereformulation doivent intervenir pour qu'une question ou une réponse soit acceptée,et il s'agit d'un dialogue incident. Ainsi, à la suite de H2, le système ne peut-il pasrépondre sans disposer de références spatiales, tout comme à la suite de M6, lecorrespondant souhaite voir justifiée la réponse qui vient de lui être fournie : onassiste alors à l'ouverture de deux axes incidents, le premier à l'initiative de lamachine, le second à l'initiative du correspondant. Le dialogue suit nécessairementsoit l'axe régissant, soit l'axe incident, VR et VI s'incrémentant de façon exclusive.Le troisième axe quant à lui n'intervient que dans le courant d'un axe incident, enindiquant la distance par rapport au retour potentiel sur l'axe régissant : VEs'incrémente lorsqu'il s'agit de questions incidentes (M2, H3, H4, H7), et sedésincrémente lorsqu'il s'agit des réponses correspondantes (M3, M4, H5, M7).

Ce qui est important, en matière de modèle de dialogue, c'est moins lareprésentation en elle-même que les décisions qu'elle permet de prendre dans lecourant de la communication. Ainsi, dans l'exemple proposé, pourrait-il êtrepréférable que H3 et H4 puissent être comprises comme des réponses, au lieu d'êtreinterprétées comme des questions, la réponse à H2, sur l'axe régissant, intervenantalors en M3 ou en M4. C'est précisément ce que permet le modèle présenté figure 4,à partir d’une fonction comme la suivante :

37

F = (a*VR)+(b*VI)+(c*VE)

1

2

3

4

5

6

7

8

1 2 3 4 5 6 7 8

12

3

H1 M1 H2M2

M3

H4

M4

H5 M5 H6M6

H7

M7 H8 M8

axe d'écartementVE

axerégissant

VR

axe d'incidence

VI

H3

Figure 4 : modèle dynamique de dialogue

Dans cette fonction, a, b et c sont des paramètres éventuellement dépendantsdes modèles de la tâche et de l'utilisateur par exemple. Pour ce qui concernel'interprétation de H3 et de H4, en attribuant respectivement les valeurs de 2, 5 et 20à x, y et z (ce qui confère un poids négligeable au dialogue régissant, qui ne poseaucun problème, et un poids d'autant plus considérable au dialogue incident qu'ils'écarte du niveau de retour sur l'axe régissant), on obtient les valeurs suivantes :

F(H3) = 56F(H4) = 76

alors que si ces mêmes interventions étaient interprétées comme des réponses, onaurait des valeurs différentes :

F(H3) = 16F(H4) = 26

38

Selon les cas, la valeur la plus faible de F peut être systématiquement privilégiée, cequi revient à refuser l'incidence et à figer l'interaction, ou bien on peut accepterl'incrémentation de VE dès lors que F ne dépasse pas un certain seuil.

3.3. L'approche dynamique

3.3.1. Le fonctionnement de l'incidence

L'aspect à la fois le plus important et le plus délicat d'une modélisationdynamique de ce type, c'est celui du fonctionnement de l'incidence. Tous lesproblèmes de dialogue surviennent en effet sur l'axe incident, qu'il s'agisse dusystème qui ne parvienne pas à répondre à une question (axe incident à l'initiative dela machine), ou de l'utilisateur qui ne se satisfasse pas d'une réponse du système(axe incident à l'initiative de l'utilisateur). Nous allons commenter ce fonctionnementde l'incidence à partir de l'exemple 7, qui reprend l'exemple 3 étudié ci-dessus ennotant hiérarchiquement les questions/réponses sur l'axe régissant QP/RP(Questions/Réponses principales) et QI/RI les Questions/ Réponses Incidentes.L'axe incident à l'initiative de la machine qui suit M2 illustre bien ce fonctionnementde l'incidence :

- M2 : Le système ouvre un axe incident en formulant une demande deprécision, dans la mesure où il est impossible de répondre à H2/QP2 sans savoir oùl'interlocuteur supposé souhaite connaître le temps à venir.

- H3-M3 : au lieu de répondre, l'interlocuteur supposé pose une nouvellequestion dont le statut dépend de l'interprétation de H3 : soit le système admettra H3comme une nouvelle question, et l’interprétera comme QI2 (comme c'est le cas dansl'exemple 7 et comme on le trouve représenté dans l'exemple 8a), soit H3 seraconsidérée comme une réponse à QI1, c'est-à-dire comme RI1. Dans ce cas, ou bienune réponse est possible, dans la mesure où Martinville est connu (cf. exemple 8b),ou bien c'est impossible, dans la mesure où Martinville est ignoré (cf. exemple 8c).

- H4-M4 : H4 est une affirmation que le système pourrait interpréter non pascomme QI3 mais comme RI1. Dans ce cas, M4 devrait pouvoir être une RP2 au lieud'être une RI3 (cf. exemple 9a). A la façon dont ce dialogue est présenté au traversde l'exemple 9, H4 est interprétée comme un question, tout comme H3, et le systèmerépond en toute logique que Tansonville lui est connu, même si ce n'est pas laquestion qui lui a été effectivement posée (cf. exemple 9b).

- H5 : comme on peut le voir dans l'exemple 9b, l'utilisateur supposé ne peut passe satisfaire de H4 et, s'il désire obtenir l'information qu'il recherche, il est tenu derelancer le dialogue en répondant à M2/QI1.

39

Exemple 7 : dialogue de référenceH1/QP1 : c'est la météo ?M1/RP1 : ouiH2/QP2 : quel temps fera-t-il demain ?M2/QI1 : où ?H3/QI2 : connaissez-vous Martinville ?M3/RI2 : nonH4/QI3 : c'est à côté de TansonvilleM4/RI3 : ouiH5/RI1 : alors de ce côté-làM5/RP2 : il y fera un temps superbeH6/QP3 : est-ce que les aubépines seront en fleurs ?M6/RP3 : je ne sais pasH7/QI1 : pourquoi ?M7/RI1 : les problèmes de temps perdu ne me concernent pasH8/QP4 : tant pis, il fera beau de toute façon n'est-ce pas ?M8/RP4 : oui

Exemple 8a: dialogue incident considérant QI2 comme une nouvellequestion.

QP2 : quel temps fera-t-il demain ?QI1 : où ?QI2 : connaissez-vous Martinville ?

RI2 : non

Exemple 8b : dialogue incident considérant QI2 comme RI1 et supposantque Martinville est connue du système.

QP2 : quel temps fera-t-il demain ?QI1 : où ?RI1 : connaissez-vous Martinville ?RP2 : le temps sera superbe

Exemple 8c : dialogue incident considérant QI2 comme RI1 et supposantque Martinville est inconnue du système.

QP2 : quel temps fera-t-il demain ?QI1 : où ?RI1 : connaissez-vous Martinville ?

QI2 : où désirez-vous connaître le temps ?

N'importe quel système de dialogue coopératif doit s'efforcer de gérerl'incidence de façon à être capable d'éviter autant que possible un dialoguemécanique. Cela suppose au moins :

- Que le système ne soit pas influençable par les modalités (formulationsassertives vs interrogatives). Souvent en effet, ce qui est formellement une questionest du point de vue dialogique une réponse, et inversement.

- Que le système soit capable d'assumer ses éventuelles erreurs : avec H3 et H4dans l'exemple 9, le système peut décider soit qu'il s'agit de QI, soit qu'il s'agit de RI.Le plus important n'est en l'occurrence pas la décision qui est prise, mais plutôt lafaçon avec laquelle le système va être capable d'assumer cette décision, et sonaptitude éventuelle à récupérer les erreurs qu'il a pu commettre.

40

- Que le système soit capable de gérer dynamiquement l'incidence. Il ne s'agit eneffet pas d'un concept destiné à effectuer des analyses a posteriori, mais d'unconcept opérationnel destiné à permettre des prises de décision.

Exemple 9a : dialogue incident considérant QI3 comme RI1.QP2 : quel temps fera-t-il demain ?QI1 : où ?QI1 : connaissez-vous Martinville ?

RI2 : nonRI1 : c'est à côté de Tansonville

RP2 : il y fera un temps superbe

Exemple 9b : dialogue incident considérant QI3 comme dans l'exemple 7.QP2 : quel temps fera-t-il demain ?QI1 : où ?QI2 : connaissez-vous Martinville ?

RI2 : nonQI3 : c'est à côté de TansonvilleRI3 : ouiRI1 : alors de ce côté-là RP2 : il y fera un temps superbe

Comme on l'a évoqué plus haut, la fonction F = (a*VR)+(b*VI)+(c*VE), danslaquelle a, b et c peuvent être prédéfinis ou bien varier dynamiquement, donne unevaleur à chaque intervention et permet de gérer l'incidence. En attribuant commeprécédemment les valeurs 2, 5 et 20 à a, b et c, on obtient une valeur de F quiautorise des prises de décision dans le courant du dialogue. Ainsi, en sachant queVR = 3 tout au long de l'axe incident étudié, que VI s'incrémente à chaquedéplacement vertical, et que VE fait de même à chaque déplacement vers la gauche,des interventions identiques (H3 dans les exemples 8 et H4 dans les exemples 9)correspondent-elles à des valeurs distinctes de F :

exemple 8a : F(QI12) = 56exemple 8b : F(RI1) = 16exemple 8c : F(RI1) = 16exemple 9a : F(RI1) = 26exemple 9b : F(QI3) = 66

- Dans l'exemple 8a, considérer H3 comme une question (QI2) revient àincrémenter VE et F, ce que le modèle tend normalement à éviter. Implicitement, celasuppose en outre un échange supplémentaire complet avant de pouvoir envisager unretour sur l'axe régissant.

- Dans l'exemple 8b, le fait de considérer H3 comme une réponse (RI1) permetde mettre VE à 0 et de réduire la valeur de F, en autorisant de ce fait un retourimmédiat sur l'axe régissant.

- Dans l'exemple 8c, la possibilité de retourner sur l'axe régissant n'est pasexploitée, parce que Martinville est ignorée. Le système est ainsi contraint à une QI2,

41

qui incrémente à nouveau et VE et F. Ce dernier, malgré l'incrémentation de VI,demeure à un niveau inférieur à celui de QI2 dans l'exemple 8a où, malgré unecertaine similarité (VE a la même valeur en RI2 qu'en QI2), on se trouve dans unesituation dialogique différente : c'est l'utilisateur qui pose une question dansl'exemple 8a, alors qu'ici c'est le système. L'initiative est alors entre les mains dusystème, alors qu'elle relève de l'utilisateur dans l'exemple 8a.

- Dans l'exemple 9a, H4 est interprété comme une RI, ce qui a pour effet dedésincrémenter VE, ce qui n'est bien entendu possible que si le système connaîtTansonville.

- Dans l'exemple 9b, H4 est supposée incomprise, ce qui réincrémente VE.L'intérêt dialogique de prendre parfois certains risques en matièred'incompréhension peut ainsi être chiffré.

3.3.2. Gestion du dialogue

La principale utilité du modèle est de permettre au système de gérer le dialogue.Si le niveau de compréhension est élevé, et le dialogue facile à conduire, le systèmeaura tendance à libérer l'incidence, et le naturel y gagnera. Si le niveau decompréhension est limité et le dialogue difficile à gérer, le système aura tendance àfixer l'incidence, ou même à opérer des retours forcés, et le dialogue deviendra deplus en plus rigide. L'intérêt du modèle est en définitive de se donner les moyens dedisposer d'une représentation calculatoire de ce genre de problème. Dans l'exemple7, il est tout à fait possible de supposer par exemple que H4 n'a pas été compris.Toute réaction à la suite d'un phénomène d'incompréhension de ce type dépend de lagestion de l'incidence, et en l'occurrence, trois réactions peuvent être prises enconsidération :

a) Le système peut avouer son incompréhension, par exemple en disant je necomprends pas (si le système disait simplement non, cela supposerait que le thèmedu propos a été compris, en l'occurrence que Tansonville est une ville). En faisant cetaveu, le système accepte l'incidence, dans la mesure où il accepte d'incrémenter VE,comme le montre l'exemple 10a, où la valeur de VE passe de 2 à 3 (de ce fait, F(QI4)= 91) lorsque le système pose une nouvelle question, c'est-à-dire lorsque se produitle phénomène de non compréhension.

b) Le système peut fixer l'incidence, en formulant une demande itérativecomme où voulez-vous connaître le temps ? C'est d'ailleurs la fonction desdemandes itératives que de fixer l'incidence, en réitérant la question antérieure. Enfixant ainsi l'incidence, le système n'a pas besoin de décider du statut del'intervention incomprise : la demande itérative va fixer les valeurs de F (enl'occurrence F(QI1') = 51) et de VE (cf. QI1 et QI1' dans l'exemple 10b)indépendamment de celle de la demande précédente, qui pourra en toute logiquevaloir soit VE+1, soit VE-1, c'est-à-dire être interprétée soit comme QI3, soit commeRI1. Entre QI1 et QI1', VI est néanmoins passé de 1 à 5, et le statut de ces deuxquestions est ainsi bien différent.

c) Si, compte tenu des valeurs de VE et de VI, le risque d'incompréhension estimportant (par exemple s'il était nécessaire de donner une valeur supérieure à 3 ou 4à VE alors que VI a déjà atteint un niveau conséquent), le système peut effectuer unretour forcé (RF), comme on peut le voir dans l'exemple 10c. Il s'agit d'une formeextrême de fixation d'incidence, puisque le système revient d'autorité au niveau

42

auquel VE = 0, en sollicitant une reformulation de la QP. F(RF) = 31, et le systèmese met en attente d'une QP'. Au lieu de poursuivre un axe incident qui n'a pascommencé dans des conditions satisfaisantes, il préfère tenter de résoudre leproblème en reprenant les choses à zéro, quitte à ouvrir un nouvel axe incident, enréinitialisant un certain nombre de variables.

Selon sa nature, M4 sera associée à une valeur d'autant plus forte que le risqued'incompréhension sera grand :

exemple 10a : F(QI4) = 91exemple 10b : F(QI1’) = 51exemple 10c : F(RF) = 31

Le système est dès lors en mesure d'opérer un choix entre diverses solutions. Il peutprendre des risques car il peut en calculer les conséquences et sait comment reveniren arrière. Tout le problème réside alors dans les critères de choix qui peuvent eux-mêmes être, selon les cas, statiques (ils restent identiques tout au long d'unecommunication) ou dynamiques (ils peuvent se déterminer en fonction de la tâche,de l'utilisateur, de l'état de la communication...).

Exemple 10a : dialogue acceptant l'incidence après une incompréhensionsupposée

QP2 : quel temps fera-t-il demain ?QI1 : où ?QI2 : connaissez-vous Martinville ?RI2 : nonQI3 : c'est à côté de TansonvilleQI4 : je ne comprends pas

Exemple 10b : dialogue fixant l'incidence après une incompréhensionsupposée de H4.

QI1 : où ?

RI2 : non

QP2 : quel temps fera-t-il demain ?

QI2 : connaissez-vous Martinville ?

QI3/RI3 : c'est à côté de TansonvilleQI1' : où désirez-vous connaître le temps ?

Exemple 10c : dialogue effectuant un retour forcé (RF) à la suite d'uneincompréhension de H4.

43

QI1 : où ?

RI2 : non

QP2 : quel temps fera-t-il demain ?

QI2 : connaissez-vous Martinville ?

QI3/RI3 : c'est à côté de Tansonville

RF : je suis perdu : pourriez-vous reprendre votre question initiale ?

Dans l'exemple 11 en tout cas, le modèle de dialogue permet de calculer quandune demande de reformulation telle que pouvez-vous répéter ? peut être posée etquand elle ne le peut pas : QI3 est acceptable, et F(QI3) = 64 ; QI7 ne l'est plus, etF(QI7 = 104). Le système peut ainsi introduire de la variation dans soncomportement dialogique, et se démarquer en partie de l'attitude qu'adopterait unautomate de dialogue. Il devient ainsi totalement impossible qu'il existe deux étatssimilaires, et même la fixation de l'incidence ne peut que fixer la valeur de VE, alorsque VI et VP continuent d'être incrémentées. Comme le modèle de dialogue permetd'éviter des comportements dialogiques semblables à QI7 dans l'exemple 9, il permetparadoxalement de les tenter. S'il est possible de calculer quand quelque chose estinacceptable, il devient possible de se risquer à adopter diverses attitudes dialogiquesqui seraient inenvisageables sans cette faculté. Les réponses totales par exemple(l'utilisation du couple oui/non) seraient extrêmement dangereuses sans un modèlede ce type, alors qu'elles deviennent concevables par son intermédiaire. Le modèle dedialogue explique enfin en quoi, dans l'exemple 11, le système provoque le rire etdevient ridicule : VE atteint 3 alors que VI = 12 ; la structure correspondante dedialogue (QIx(QIx+1 RIx+1) RIx) est uniquement possible lorsque la valeur de VIest faible, comme c'est le cas en QI3.

Dans la pratique, le modèle de dialogue introduit de la flexibilité dans la façonde guider l'interaction. Il augmente les chances de mener à bien un dialogue, sinécessaire avec un niveau de compréhension très limité. Il est fondamentalementorienté vers la gestion des phénomènes d'incommunicabilité : si un système necomprend rien, le modèle de dialogue ne pourra que retarder légèrement l'échec dudialogue ; si le niveau de compréhension est satisfaisant, le modèle permettra ausystème d'être un bien meilleur partenaire, en évitant autant que possible l'échec dudialogue et en optimisant le niveau de compréhension du système. Il n'augmente pasdirectement le niveau de compréhension, du moins si le niveau de compréhensiondont il s'agit concerne exclusivement les contenus propositionnels et intentionnels. Ilaugmente toutefois le niveau d'un certain type de compréhension. Le sens d'unephrase telle que y a-t-il un hôtel à Martinville ? ne se limite pas en effet au sens desmots associé aux intentions de l'utilisateur. Selon la situation de dialogue, il s'agitparfois d'une question, et parfois d'une réponse. C'est enfin un énoncé qui peutparfois être analysé comme une QP, et parfois comme une QI. Finalement, lemodèle de dialogue exploite cette instance particulière du sens, propre au dialogue,qui rend compte de l'existence d'un contenu interactionnel.

Exemple 11 : effet comique de la fixation d’incidence

44

RP : le train No ...

RI1 : premier train = ...

QP : un train pour Lyon demain matin svp

QI1 : ce train circule-t-il le premier

QI2 : non ce train circule-t-il le premier ?

RI3 : ce train circule-t-il le premier juin ?

QI3 : pouvez-vous répéter ?

RI2 : non

QI4 : ce train ne circule pas le premier juin ?RI4 : ouiQI5 : mais vous avez dit non RI5 : ouiQI6 : vous auriez dû dire oui QI7 : pouvez-vous répéter.?

3.4. Les systèmes de DHM

Un tel modèle ne constitue pas à lui seul un système de DHM, même si c'est àlui que revient la responsabilité de gérer le dialogue proprement dit. Il représenteseulement quelques-unes des connaissances que la machine doit posséder, dontcertaines sont statiques, c'est-à-dire qu'elles ne varient pas au cours du dialogue, etcertaines sont dynamiques, dans la mesure où elles se modifient dans le cours de lacommunication. Ces connaissances, telles qu'elles sont représentées dans le schémaci-dessous, ne constituent pas une architecture opérationnelle. Tout système deDHM doit les intégrer mais, d'une part, elles n'y ont pas toujours la mêmeimportance, et d'autre part elles sont trop interdépendantes pour pouvoir se répartiren modules distincts, comme pourrait le laisser supposer une présentationschématique telle que celle de la figure 5.

45

MODELE DE LANGAGE

MODELE DE DIALOGUE

MODELE DE LA TÂCHE

état de la tâche

modèle del'utilisateur

historiquedu dialogue

Figure 5 : représentation schématique des connaissances utilisées par un systèmede dialogue homme-machine

3.4.1. Connaissances statiques

On a coutume de dissocier en trois parties les connaissances initiales dont doitdisposer un système de DHM (cf. [Sabah 89] et [Pierrel 88]) :

- Le modèle de langage, qui comporte les connaissances linguistiquesnécessaires au fonctionnement de l'analyseur, est souvent considéré comme extérieurau fonctionnement du dialogue proprement dit. Les systèmes de DHM requièrenttoutefois fréquemment des connaissances lexicales, syntaxiques et sémantiquesadaptées à une tâche, c'est-à-dire par certains aspects très détaillées, et par d'autresextrêmement limitées. Dans un système de renseignements horaires SNCF parexemple, «train» est une métonymie qui a tout intérêt à être systématiquementcomprise comme «place assise» (je voudrais un train pour Paris demain matin), etnon comme «ensemble de wagons tirés par une locomotive», avec toutes les valeursd'emploi que cela peut comporter.

- Le modèle de la tâche a pour fonction de représenter et de structurer l'universde référence, dans lequel est censé évoluer le système. Ainsi, dans l'exempleproposé, est-il éminemment souhaitable, avant même qu'on lui ait parlé de«Martinville» ou de «Tansonville», que le système se soit attendu à se voir proposerdes toponymes, de la même façon qu'il n'a aucune chance d'interpréter correctement«aubépines» s'il n'est pas prévu que l'on évoque les fleurs à propos de

46

renseignements météo. Le modèle de la tâche a donc pour fonction essentielled'assurer la gestion thématique du dialogue. Il est également indispensable pourlever les ambiguïtés liées aux ellipses et aux anaphores, particulièrement fréquentesen dialogue : des interventions comme le suivant - celui d'avant - plus tôt - plus tardsont parfois omniprésentes. Cette représentation de l'univers de référence peutnotamment se faire par le biais de techniques de représentation évoquées dans leschapitres précédents telles que schémas, scénarios, plans ou Mops, et elle se gère parl'intermédiaire de l'historique du dialogue.

- Le modèle de dialogue, sur un exemple duquel nous nous sommes attardé,constitue la partie centrale d'un système de DHM. A la différence des deuxprécédentes parties, qui peuvent concerner toute forme de discours, celle-ci estexclusivement réservée au dialogue proprement dit. Sous une forme thématique(classification des échanges en échanges informatifs, confirmatifs, évaluatifs...), ousous une forme hiérarchique (on pourrait presque dire «syntaxique»), telle que nousl'avons décrite, le modèle doit présenter une «grammaire» du dialogue qui permetted'identifier et de classer les différentes séquences d'interventions.

3.4.2. Connaissances dynamiques

On distingue également en trois parties les connaissances qui évoluent au coursd'une communication :

- L'état de la tâche, associé au modèle de la tâche, a pour fonction d'accorder leniveau de compréhension du système avec l'état d'avancement de la tâche. «Direct»par exemple peut selon les cas signifier «sans arrêt» ou bien «sans changement» ;«le premier» s'interprétera comme une date si l'intervention qui précède est laquestion quel jour désirez-vous partir ?, comme une abréviation de «premier train»s'il suit la question à quelle heure désirez-vous partir ?, et comme «le premier trainque vous m'avez proposé» après la question lequel de ces trains vous convient-il ?.Dans un cas comme dans l'autre, ce sera l'état de la tâche qui permettra de leverl'ambiguïté.

- L'historique du dialogue, associé au modèle du dialogue, a pour fonction deconserver la structure et le contenu du dialogue en cours. Une demande dereformulation par exemple ne peut pas intervenir de la même manière au début d'undialogue ou à la suite de plusieurs échanges improductifs. De la même manière, ilest nécessaire de gérer les changements de thème car, comme dans l'exemple analyséci-dessus, on peut revenir à un thème antérieur (le temps qu'il fera à Martinville)après avoir fait une digression (l'épanouissement des aubépines). Pour ces questionsde contenu, on peut utiliser les modélisations de Cohen, Allen et Perrault, en termesde buts et de plans, alors que pour ce qui est de la structure du dialogue, c'est unedes fonctions du modèle hiérarchique présenté ci-dessus, auquel on peut associer unagenda des interventions.

- Le modèle de l'utilisateur, associé à la fois au modèle de dialogue et à celuide la tâche, doit permettre au système de s'adapter à son interlocuteur, ce qui estfondamental dans certaines applications, et relativement secondaire dans d'autres.L'utilisateur d'un système de renseignements horaires SNCF par exemple peut êtreconsidéré comme un interlocuteur générique, a priori expert dans le domaine (il saitce qu'est une gare, un train, une place, une réservation...), et ce n'est qu'avec dessituations exceptionnelles qu'une représentation de l'interlocuteur devient importante(problèmes de congés payés, transports d'animaux, renseignements pris pour un

47

tiers...). Dans les systèmes d'enseignement intelligemment assistés par ordinateur(EIAO) ou pour des tâches plus complexes, la représentation de l'interlocuteurdevient l'élément central du système. Ainsi, dans l'exemple «pages jaunes» proposéplus haut, a-t-on un correspondant qui cherche un garage et qui demande ensuite unhôtel : cela suppose une succession d'inférences complexes dans la représentationque le système possède de cet interlocuteur. Il doit faire réparer sa voiture ; laréparation peut être longue ; il va être à pied ; hôtel et garage doivent être proches ;peut-être souhaitera-t-il qu'on lui propose des occupations pendant son inactivitéforcée... Ici également, c'est une représentation en termes de buts et de plans qui estla plus souvent retenue.

48

49

CHAPITRE 2

Le corpus

1. Présentation

1.1. Principes

Ce travail a pour origine la constitution de corpus de dialogue homme-machineavec machine simulée, et pour aboutissement le développement, à partir du clavier,d'un système de dialogue simulé, DIALORS, système qui se substitue à l'opératricequi simulait la machine dans une tâche de renseignements horaires SNCF. Pourétudier le langage oral susceptible d'être concerné par un dialogue avec l'ordinateur,il convenait en premier lieu de le créer. Comme, pour des raisons techniques, ce typede dialogue n'existe pas encore, il nous a semblé nécessaire de placer des locuteursen situation réelle de communication homme-machine. Il s'agissait ainsi d'obtenirl'image d'un oral spontanément adopté par des locuteurs croyant s'adresser à unordinateur, oral qui ne s'identifie ni avec un oral spontané recueilli dans un cadredénué de contraintes particulières, ni avec une langue artificielle qui respecte unenorme presque systématiquement bafouée par l'usage. Cette méthode, qui a étéquelquefois utilisée outre Atlantique [Chin 84], est parfois baptisée, comme l'indique[Falzon 89], de méthode Wizzard of Oz, du nom du conte de Baum dans lequel unenfant est terrifié par l'aspect d'un monstre derrière lequel se cache un inoffensifvieillard. Outre le fait que les premières attestations d'expériences que nous ayonstrouvées datent, comme les nôtres, de 1984, et qu'il s'agisse d'expériences à partir duclavier, il faut souligner que l'expression ne concerne pas simplement le langage. Ils'agit en fait des manipulations qui conduisent à simuler un processus cognitif quel'on serait incapable de réaliser automatiquement.

En 1984, un premier corpus a été réalisé au LIMSI [Luzzati 89], sur un scénariode sondage téléphonique par ordinateur, à l'aide de deux questionnaires portant, l'un,sur les voitures, et l'autre, sur les transports en commun. En 1985, le propos s'esttrouvé repris, dans son fond comme dans sa forme par le GRECO n° 39,

50

Communication Parlée, avec le soutien financier du CNET. Avec des moyensinenvisageables au départ, le projet a pu être mené de façon autrement plusambitieuse. La réalisation des corpus a été confiée à des ergonomes, et lestranscriptions ainsi que les études linguistiques ont été effectuées à Paris III, sous laresponsabilité de M.A. Morel [Meunier et Morel 87]. Deux corpus ont ainsi étéréalisés, l'un sur une tâche de renseignements horaires SNCF (corpus SNCF),l'autre dans une tâche d'information et d'orientation universitaire (corpus CIO).

Les corpus une fois transcrits, nous avons pu nous consacrer, dans le cadre duCentre de Recherches en morphosyntaxe du français contemporain de Paris III, àleur analyse. De notre point de vue, celle-ci a tout d'abord mis en évidence l'intérêttout particulier du corpus SNCF. De même que le corpus CIO, il comportedifférentes phases, les unes enregistrées en situation de communication homme-homme, et les autres en situation de communication homme-machine, ce qui permetdes études contrastives. Le scénario des enregistrements effectués en situation decommunication homme-machine permet ensuite de disposer de doublets, c'est-à-direde requêtes identiques, formulées par la même personne, tout d'abord face àl'opératrice, puis face à la machine présumée. A la différence d'une tâche derenseignements de type CIO, les renseignements SNCF constituent enfin le typemême de tâche (consultation de base de données grand public dont on connaît apriori les règles de fonctionnement) que l'on souhaiterait tout d'abord automatiser.

L'analyse des corpus a ainsi pris deux directions essentielles. Elle est toutd'abord descriptive, pour le fonctionnement des requêtes comme pour le dialogue.Elle est ensuite contrastive, en opposant les productions recueillies dans les deuxsituations de communication, afin de faire déboucher l'analyse sur une étude ducomportement langagier induit par la machine. A ce propos comme à propos de lamodélisation ou de l'implantation d'ailleurs, nous avons distingué dans la pratiquel'organisation des énoncés, et notamment celle des requêtes, de ce qui concerne lefonctionnement du dialogue. En effet, le comportement langagier induit par lamachine ne se manifeste pas de la même manière dans l'organisation des requêtesque dans le déroulement de l'interaction ; la modélisation de celle-ci ne concerneguère celle de l'analyse d'énoncés oraux ; l'implantation d'un analyseur et celle d'undialogueur posent enfin des problèmes différents.

1.2. Les expérimentations

Les enregistrements du corpus SNCF ont été effectués dans le centre derenseignements de la gare Saint-Lazare en décembre 1984. Dans un premier temps(phase I), 117 communications normales ont été retenues pour servir de référence ;dans un second temps (phase II), 142 communications ont été réalisées avecmachine simulée. 13h d'enregistrement ont été nécessaires. Les communicationsdurent moins de 2 minutes en moyenne. La transcription quant à elle comporte77000 mots pour une moyenne de 290 mots par communication, et celles-cicomptent une moyenne de 18 interventions de 9 mots. Il convient enfin de noter que,compte tenu de l'élocution d'une machine simulée, l'opératrice occupe une moyennede 60% du temps de parole.

51

Les correspondants ne faisaient pas véritablement l'objet d'une sélection, si cen'est que ceux qui avaient un accent régional ou étranger trop prononcé étaientécartés. L'opératrice, qui avait suivi une brève formation au poste d'agent derenseignements SNCF, écartait en outre certaines communications en fonction deses compétences et de la question posée. L'expérience aidant, une forme de sélections'est opérée au cours de la phase II. Alors que dans la phase I, on trouve desquestions initiales très variées (horaires, tarifs, cartes vermeil, cartes couple, tarifsenfants, conditions de remboursement, bagages (non) accompagnés, livraisons àdomicile, congés payés, réservations, grèves, amendes, longueur des trajets, servicesde car, objets perdu, ...) même si 65% des communications (77 sur 118) portent surles horaires et 14,5% (17 sur 118) sur les tarifs, dans la phase II seules sontdemeurées les communications portant initialement sur les horaires (130 sur 142) etquelques unes (12) sur les tarifs. Il est clair toutefois que la première questionpassée, les correspondants peuvent poser les questions qu'ils veulent. Leur diversitéreste cependant limitée à des questions portant sur des tarifs spéciaux ou, à larigueur, sur le transport des bagages.

Le déroulement des communications de la phase II est resté toujours lemême : l'opératrice laissait les correspondants formuler une première fois leurquestion, avant de leur proposer de dialoguer avec une machine. Lorsque lescorrespondant acceptent, c'est-à-dire dans 97% des cas (5 d'entre eux refusent sur147 appels), on dispose donc de deux questions de même nature formulées par lemême correspondant, tout d'abord face à une opératrice, puis face à une machineprésumée. Une fois la communication terminée, les correspondants étaient repris parl'opératrice qui complétait si nécessaire les renseignements obtenus et qui se livrait àun questionnaire de satisfaction. Il ressort de ce dernier que 80% des locuteurs nesont pas gênés de parler avec une machine, que 75% ont confiance dans lesrenseignements fournis, et que pour 90% d'entre eux la machine est un moyend'avenir pour des dialogues de ce type. 60% des locuteurs préfèrent quand mêmedialoguer avec un opérateur humain et 50% ont le sentiment de modifier la façondont ils s'expriment.

2. Le dialogue SNCF

2.1. Représentation et modélisation

Dans le corpus SNCF, du moins dans la phase II, il est frappant de constatercombien il existe un modèle de dialogue sous-jacent, et combien les 142communications suivent, à quelques très rares exceptions près et avec des varianteslimitées, un scénario unique. Ce modèle de dialogue n'apparaît nullement lorsque latranscription est linéaire ( exemple 1). Il n'apparaît pas non plus lorsqu'on adopteune présentation par rôles qui se limite à distinguer les propos de la machineprésumée de ceux du correspondant, sans chercher à mettre en valeur les différentsniveaux de couples question-réponse ( exemple 2).

52

Exemple 1 : présentation linéaire d'un dialogue.M1: SNCF bonjour énoncez votre demande s'il vous plaîtC1: horaire des trains pour Poitiers e 28 décembre 84 à partir de 18 heures 30M2: pouvez-vous reformuler votre demande s'il vous plaîtC2: e pour horaire des trains pour le vendredi 28 décembre 84 à partir de 14 heuresM3: ne quittez pas ..........M4: un express de première et deuxième classe part de la gare d'Austerlitz à 15 heures54 minutes arrive à la gare de Poitiers à 18 heures 53 minutes ce train vous convient-ilC3: nonM5: que désirez-vousC4: à partir de 18 heuresM6: ne quittez pas ..........M7: un express première et deuxième classe part de la gare de Paris-Austerlitz à 19heures 20 minutes arrive à la gare de Poitiers à 21 heures 45 minutes ce train vousconvient-ilC6: il y a première et deuxième classeM10: oui il y a première et deuxième classeC7:et entre 18 heures 05 et 19 heures 20 il n'y en a pas y a pas un supplément un trainsupplémentaireM11: pouvez-vous reformulerC8: un train supplémentaire entre 18 heures 05 et 19 heures 20M12: ne quittez pas ..........M13: un corail première et deuxième classe part de la gare de Paris-Austerlitz à 18 heures45 minutes arrive à la gare de Poitiers à 21 heures 29 minutes ce train vous convient-ilC9: e première et deuxième classe il est première et deuxièmeM14: oui il est première et deuxième classeC10: oui ce train me convientM15: désire-vous d'autres renseignementsC11: il a bien lieu demainM16: oui ce circ ce train circule demainC12: bon d'accordM17: désirez-vous d'autres renseignementsC13: non non nonM18: ne quittez pas

53

Exemple 2 : présentation des dialogues par rôles.M1: SNCF bonjour énoncez votre demande s'il vous

plaîtC1: horaire des trains pour Poitiers e 28décembre 84 à partir de 18 heures 30

M2: pouvez-vous reformuler votre demande s'il vousplaîtC2: e pour horaire des trains pour le vendredi28 décembre 84 à partir de 14 heures

M3: ne quittez pas ..........M4: un express de première et deuxième classe part

de la gare d'Austerlitz à 15 heures 54 minutes arrive à la gare de

Poitiers à 18 heures 53 minutes ce train vous convient-ilC3: non

M5: que désirez-vousC4: à partir de 18 heures

M6: ne quittez pas ..........M7: un express première et deuxième classe part de la

gare de Paris-Austerlitz à 19 heures 20 minutes arrive àla gare de Poitiers à 21heures 45 minutes ce train vousconvient-ilC6: il y a première et deuxième classe

M10: oui il y a première et deuxième classeC7:et entre 18 heures 05 et 19 heures 20 il n'y en a pasy a pas un supplément un train supplémentaire

M11: pouvez-vous reformulerC8: un train supplémentaire entre 18 heures 05 et 19 heures 20

M12: ne quittez pas ..........M13: un corail première et deuxième classe part de la

gare de Paris-Austerlitz à 18 heures 45 minutes arrive àla gare de

Poitiers à 21 heures 29 minutes ce train vousconvient-ilC9: e première et deuxième classe il estpremière et deuxième

M14: oui il est première et deuxième classeC10: oui ce train me convient

M15: désire-vous d'autres renseignementsC11: il a bien lieu demain

M16: oui ce circ ce train circule demainC12: bon d'accord

M17: désirez-vous d'autres renseignementsC13: non non non

M18: ne quittez pas

54

Exemple 3 : modélisation du dialogue SNCF.M1: SNCF bonjour énoncez votre demande s'il vous plaîtC1: horaire des trains pour Poitiers e 28 décembre 84 à partir de 18 heures 30C1: horaire des trains pour Poitiers e 28 décembre 84 à partir de 18 heures 30

M2: pouvez-vous reformuler votre demande s'il vous plaît C2: e pour horaire des trains pour le vendredi 28 déc 84 à partir de 14 heures

M3: ne quittez pas ..........M4: un express de première et deuxième classe part de la gare d'Austerlitz àM4: un express de première et deuxième classe part de la gare d'Austerlitz à15 heures 54 minutes arrive à la gare de Poitiers à 18 heures 53 minutes 15 heures 54 minutes arrive à la gare de Poitiers à 18 heures 53 minutes c ec etrain vous convient-iltrain vous convient-ilC3: nonM5: que désirez-vous

C4: à partir de 18 heuresM6: ne quittez pas ..........

M7: un express première et deuxième classe part de la gare de Paris-Austerlitz à 19 heures 20 minutes arrive à la gare de Poitiers à 21heures 45 minutes ce train vous convient-il

C6: il y a première et deuxième classeM10: oui il y a première et deuxième classe

C7:et entre 18 heures 05 et 19 heures 20 il n'y en a pas y a pas un supplément un train supplémentaire

M11: pouvez-vous reformuler C8: un train supplémentaire entre 18 heures 05 et 19 heures 20

M12: ne quittez pas ..........M13: un corail première et deuxième classe part de la gare de Paris-Austerlitz à 18 heures 45 minutes arrive à la gare de Poitiers à 21heures 29 minutes ce train vous convient-il

C9: e première et deuxième classe il est première et deuxièmeM14: oui il est première et deuxième classe

C10: oui ce train me convientM15: désire-vous d'autres renseignements

C11: il a bien lieu demainM16: oui ce circ ce train circule demain

C12: bon d'accordM17: désirez-vous d'autres renseignementsC13: non non nonM18: ne quittez pas

question/réponse principale question/réponse principale question/réponse secondairequestion/réponse incidente

machine correspondant question réponse liaisons

55

Ce modèle de dialogue apparaît en revanche dans la présentation proposée dansl' exemple 3, qui nécessite une légende, et qui a pour principale caractéristique dedistinguer trois niveaux de questions, avec leurs réponses associées, les questionsprincipales (tabulation 0), les questions secondaires (tabutation 1), et les questionsincidentes (tabutation 2). Ces différents niveaux de question-réponse, associés à unsystème de liaisons, permettent de rendre compte de la totalité des dialogues à l'aidede formules qui se suffisent d'un nombre de symboles très limité :

QP/QS/QI = question principale/secondaire/incidenteRP/RS/RI = réponse principale/secondaire/incidente« »= domaine d'une QP< >= domaine d'une QS (y compris les QP)( ) = domaine d'une QI/ = temps d'attente (rech. de l'inform.)_ = procédure de liaison

En notant les propos de la machine présumée en italique, la communication quiprécède se traduit ainsi par la formule suivante :

_«<QP(QI RI)/RP>_<QS/RS(QI RI)><QS(QI RI)/RS(QI RI)_(QI 'RI)>»_Ce qui est particulièrement remarquable, c'est que cette représentation des dialoguess'applique à la totalité des 142 communications, et que l'exemple cité ci-dessus n'estnullement une exception. Ce genre de formule permet de bien intégrer l'interactionmachine présumée-correspondant dans le jeu des questions-réponses. On ne tientpas compte des éventuelles interruptions phatiques, et les liaisons sont notées defaçon distincte. L'interaction est ainsi régulière (droit-italique-droit-italique...), queles questions-réponses soient linéaires : ...<QS RS><QS/RS>..., qu'elles soientenchâssées de façon simple : ...<QS(QI RI)/RS>... ou de façon complexe :...<QP(QI RI)/RP(QI(QI RI)RI)>... Pour peu que les réponses soient elles-mêmesdes questions on peut ainsi avoir des enchaînements de questions sans que lescénario n'en soit perturbé. Il s'agit ici d'un modèle de dialogue formel, et non unmodèle sémantique, distinction très importante, qui permet de différencier ce type demodélisation de celle que propose E. Roulet et son équipe [Roulet et al. 85], etqui nous a beaucoup influencé. Il ne s'agit pas pour nous d'analyser le contenu dechaque tour de parole pour délimiter les interventions, mais d'accepter par définitionchaque tour de parole comme une intervention, c'est-à-dire comme l'unité de base dudialogue, quitte à hiérarchiser ces interventions à partir de critères non subjectifs. Ilest un fait que les liens entre forme et fond sont nombreux, et que les QP reflètentl'organisation thématique des communications. QP et RP ne doivent cependant pasêtre confondues avec les questions ou les réponses définitives. Souvent en effet, ellene sont que transitoires, la formulation finale pouvant intervenir, pour les questions,dans une RI, et pour les réponses, dans une RS ou dans une RI.

2.2. Les niveaux d'analyse

Les questions principales représentent l'organisation thématique descommunications. Celle-ci est parfois évidente, notamment lorsque l'on passe d'unedemande d'horaire à une demande de tarif ou à une requête diverse, lorsque l'onchange de trajet ou lorsqu'il s'agit de l'aller puis du retour. Elle est un peu moinsévidente lorsque l'on passe, pour un même trajet, d'une date à une autre. On pourrait

56

en effet être tenté de faire de ces requêtes des QS et non des QP. Cette simplicité del'organisation thématique de la phase II tient tout d'abord à la rigidité de la tâche elle-même, c'est-à-dire au petit nombre de thèmes susceptibles d'être abordés. Elle tientégalement à la simplicité des communications : sur 142 communications, 15seulement comportent 3 ou 4 QP, et 72 n'en ont qu'une, la moyenne étantsensiblement de 1,5 QP par communication. Par ailleurs, ces QP ne sont pas suiviesd'une infinité de QS puisqu'on rencontre au maximum 5 QS par QP et que lamoyenne est de 0,7 QS par QP.

Trois critères caractérisent les questions secondaires. Tout d'abord, elles sontdépendantes d'une QP, c'est-à-dire qu'elles se limitent à en modifier un élément ou,éventuellement, à en rajouter un. Elles ont ensuite une formulation elliptique, c'est-à-dire qu'elles n'ont de sens qu'en fonction de la QP (cf. les formulations telles que :plus tard ou le suivant). Les QS appellent enfin une réponse de même nature queles RP. Le cas de loin le plus fréquent est celui des demandes concernant un départou une arrivée antérieure ou postérieure : cela revient à faire évoluer un des élémentsde la QP (en général la plage horaire), et la RS qui suit est nécessairement le résultatpositif ou négatif de la recherche du renseignement, tout comme la RP qui précède.Les QS qui modifient ou qui font évoluer la plage horaire sont particulièrementfréquentes. Les locuteurs ont alors recours soit à des questions à repérage absolu,soit à des questions à repérage relatif. Ils utilisent alors un lexique précis et limité :plus tard, suivant, après ainsi que plus tôt ou avant (Pour «tôt» et «tard», il fauttoutefois remarquer qu'on trouve tout autant «trop tard» ou «trop tôt» que «plustard» ou «plus tôt», que les uns s'appliquent à l'horaire alors que les autresconcernent le train et que leurs interprétations sont contradictoires). On rencontreenfin quelques formulations plus excentriques, comme prochain, plus tardif, le trainqui précède ou plus bonne heure. Quelques QS sollicitent par ailleurs un train directou plus rapide : sans changement, direct, ou même turbo. Dans 18 communications,2, 3, 4 ou 5 QS se suivent. En général, elles traduisent alors deux types deprocédures : une procédure de balayage et une procédure d'encerclement : pour lapremière, le correspondant propose une plage horaire vague, puis il la balaye endemandant plusieurs fois le train suivant ou le train précédent; la seconde, plus rareque la précédente, consiste à solliciter un horaire précis, à s'en éloigner, puis à s'enrapprocher à nouveau.

Les questions incidentes sont en général soit des demandes de reformulation,soit des demandes de précision. Elles suivent soit une question, soit une réponse(quelques rares fois, elles peuvent suivre une précédente QI). Les QI qui suivent unequestion sont le fait de la machine présumée, alors que celles qui suivent uneréponse sont le fait du correspondant. Dans la pratique, l'essentiel des QI sont desprécisions demandées par la machine à la suite d'une QP. Dans la phase II, nous enavons ainsi trouvé 117, contre 2 seulement à la suite d'une QS. De la même manière,nous n'avons recensé qu'une vingtaine de QI de la part du correspondant (8demandes de reformulation et 14 demandes de précision). Les demandes deprécisions de la part de la machine constituent ainsi une procédure courante, qui setraduit par la formule «<QP(QI RI)/RP>... Pour les demandes d'horaire, cela revientà employer des formulations figées, et notamment vers quelle heure désirez-vouspartir et quel jour désirez-vous partir.

57

2.3. Les liaisons

Les liaisons les plus simples, car elles sont quasiment intangibles et ont valeurde rituel, sont l'introduction et la conclusion. Hormis celles-ci, le problème desliaisons ne se pose véritablement qu'au terme des réponses (RP, RS ou mêmeparfois RI), c'est-à-dire au moment où le dialogue peut s'orienter dans diversesdirections. Ces réponses se concluent d'ailleurs presque systématiquement parl'énoncé type : ce train vous convient-il ? La liaison se traduit alors le plus souventpar une procédure de chevauchement : la fin de la réponse se termine par un énoncéinterrogatif, auquel répond le début de la question qui suit. Ces procédures dechevauchement débouchent parfois sur des procédures de relance, procédures quiont généralement recours à une formulation type : désirez-vous d'autresrenseignements ? Ces procédures peuvent apparaître n'importe où, dès lors que ledialogue se ralentit. On les trouve toutefois prioritairement avant l'apparition d'unenouvelle QP. Le correspondant procède tout comme avec les liaisons parchevauchement, si ce n'est qu'il tarde à relancer le dialogue, à tel point que la machineprésumée s'en charge. La question de la relance est par ailleurs la même que laquestion conclusive, si ce n'est que le correspondant répond alors par la négative etnon par une nouvelle question.

Ce modèle de dialogue est un modèle formel qui ne rend pas directementcompte du fonctionnement sémantique du dialogue. Diverses procédures établissenttoutefois un lien entre la structure de surface et l'évolution du sens. La premièred'entre elles est une procédure de questionnement, qui concerne les QP dans leurtotalité : chaque QP est un espace entre une question plus ou moins bien formulée etune réponse définitive, qui correspond plus ou moins bien à l'attente ducorrespondant. Dans les cas les plus simples, la RP est à la fois la seule réponse etla réponse définitive, suivant une formule : ...«<QP/RP>»... Pour les cas plusdifficiles, différents niveaux de complexité peuvent être dégagés :

- Un premier niveau de complexité apparaît avec les QS, selon une formule :...«<QP/RP><QS/RS>...»... Selon le nombre et la nature des QS, ces formulestraduisent soit une procédure de balayage, soit une procédure d'encerclement. Dansle premier cas, la dernière RS est la réponse définitive. Dans le second, la réponseque va vraisemblablement retenir le correspondant se trouve dans une RSintermédiaire.

- Un second niveau de complexité apparaît avec l'introduction des QI qui,suivant une formule : ...<Q(QI RI)/R(QI RI)>..., traduisent une procédure généraled'approfondissement. Lorsque la QI suit R, s'il s'agit d'une demande dereformulation, la réponse définitive se trouvera dans la RI, alors que s'il s'agit d'unedemande de précision, la réponse définitive comprendra à la fois R et RI. Lorsque laQI suit Q et qu'il s'agit d'une demande de précision, on aura affaire à une procédured'ajustement, et seules les QP sont réellement concernées. Pour les demandes dereformulation, la procédure mise en oeuvre n'aura pas d'autre but que de faireénoncer à nouveau Q.

- A la fin de chaque réponse, RP, RS, ou reformulation en RI, intervient uneprocédure de liaison qui se traduit, comme on l'a vu, soit par un simplechevauchement, soit par une procédure de relance. Ces procédures de liaison, maiségalement toutes celles qui relèvent de la machine, usent en fait de phrases rituelles,

58

et l'essentiel du comportement de la machine tel qu'il est simulé se présente sousforme de phrases toutes faites qui, dans un système de dialogue, nécessiteraient unmodule de génération relativement simple.

2.4. Évaluation

On trouve bien sûr quelques cas particuliers, qu'ils relèvent de la machinesimulée ou du correspondant et qu'ils se soldent par des formulations atypiques oupar des séquences dont le modèle de dialogue rend difficilement compte. Lesrequêtes qui ne portent ni sur les tarifs ni sur les horaires, sont par nature desrequêtes atypiques, puisque on en a dénombré seulement 17 sur un total de 224 QP.Il faut toutefois rappeler qu'une sélection des appels a été effectuée et que toutes cesrequêtes diverses sont des requêtes internes aux communications et non desrequêtes initiales. On peut ensuite les classer, puisque 6 de ces QP concernent lesréservations, et 9 les différentes formes possibles de réduction. Seulement deuxd'entre elles sont donc réellement atypiques. Dans l'une, le correspondant s'enquiertde la station où il doit descendre. Dans l'autre, repris dans l' exemple 4, le problèmeconcerne un chien :

Exemple 4 : exemple de question atypique.M5 : désirez-vous d'autres renseignementsC4 : pas pour aujourd'hui ça va très bien est-ce qu'il fautC4 : pas pour aujourd'hui ça va très bien est-ce qu'il fautprendre un ticket pour un petit chien dans un sac e s'ilprendre un ticket pour un petit chien dans un sac e s'ilvous plaîtvous plaît

M6 : mettez-vous votre chien dans un sacC5 : ouiM7 : quel poids fait votre chienC6 : e trois kilos

M8 : jusqu'à six kilos maximum et transporté dans unM8 : jusqu'à six kilos maximum et transporté dans uncontenant le prix est de 15 F jusqu'à 99 km à partir de 100contenant le prix est de 15 F jusqu'à 99 km à partir de 100km le prix est de 21 Fkm le prix est de 21 F

_«<QP(QI RI)(QI RI)RI>»

Pour le reste, on trouve de temps en temps des énoncés atypiques qui, même s'ilsexcluent les formulations rituelles, s'intègrent dans le modèle de dialogue. Parfois,des questions ou des attitudes inhabituelles ont des répercussions sur la structure dudialogue. On trouve enfin quelques cas dans lesquels le modèle est inadéquat.Lorsque la responsabilité en incombe à la machine, c'est à mettre au compte del'opératrice qui la simule. Il s'agit parfois de réactions intempestives par lesquelles lamachine présumée rompt la rigidité du dialogue, comme lorsque la machine simuléeconclut la communication en prenant l'initiative de proposer un «billet séjour» , cequi modifie considérablement la nature du dialogue (cf. exemple 5).

En fait, l'inadéquation du modèle de dialogue n'est manifeste que lorsque laresponsabilité en incombe au correspondant. A cet égard, il est frappant deremarquer combien c'est rare, c'est-à-dire combien ce modèle de dialogue estrobuste. Outre une communication dans laquelle il ne fonctionne pas, on n'a guèrerelevé que 3 cas dans lesquels la structure du dialogue est réellement mise en cause,auxquels s'ajoutent 4 requêtes dont l'interprétation ne va pas de soi, et une

59

conclusion plus familière que de coutume : oh ben alors bon ben ma foi e tant pisquoi vous pouvez me repasser l'opératrice s'il vous plaît vous êtes bien je tiens àvous remercier hein vous êtes très gentil(le) est-ce que je dois dire monsieur oumadame allô.

Exemple 5 : exemple de «comportement intempestif» de la part del'opératrice simulant la machine.

M15 : combien de jours restez-vous à grenobleC11 : 4 joursM16 : y restez-vous un dimancheC12 : ouiM17 : savez-vous que vous pouvez bénéficier d'une réduction de 25%C13 : nonM18 : vous pouvez bénéficier d'une réduction de 25% au titre d'un billet de séjourC14 : d'accordM19 : je peux vous donner à présent le prix d'un billet deuxième classe aller retour avec25% de réductionC15 : oui s'il vous plaîtM19 : ne quittez pas..........

Il n'y a finalement qu'une communication atypique, reprise dans l' exemple6. Les problèmes apparaissent à partir de C3 : il s'agit d'une QP (on passe d'unedemande d'horaire à une demande de tarif) qui a la formulation elliptique des QS.En C4, le correspondant répond tout d'abord à la QI qui précède (en secondeclasse), puis il opère un décrochement puisque, dans la même réplique, apparaît unenouvelle question. Qui plus est, cette question est particulièrement délicate à classer.On peut d'une part la comprendre comme un complément décalé de C3, qui devientune question sur le prix au tarif couple. On peut d'autre part la comprendre commeune nouvelle QP, même si elle intervient avant que la machine n'ait répondu à laprécédente. On peut enfin, comme on l'a fait, l'interpréter comme une QI, c'est-à-direcomme une demande de précision anticipée qui s'applique à la demande de tarifénoncée en C3 ainsi qu'à l'horaire demandé en C1. On comprend qu'en M6 lamachine demande une reformulation. La réponse (C5) combine deux questions, cequi est relativement rare et généralement mal accepté par la machine simulée. Laréponse qui suit (M8) dénote d'ailleurs une incompréhension : l'opératrice répond àdeux questions distinctes alors que le correspondant souhaitait sans doute uneréponse jointe lui indiquant le tarif avec la réduction couple pour l'horaire indiqué enC1 (il est vrai que l'horaire en question excluait le tarif couple). En outre, cetteréponse est, du point du vue du sens, la réponse à la RI qui précède (C5) et, du pointde vue formel, la réponse à la QS antérieure (C3), ainsi qu'à ce qu'on a interprétécomme une QI (C4). En C6 intervient une question qui, du point de vue formel estune QS, mais une QS qui ferait partie du domaine de la QP initiale ! Du point devue du sens, cette QS enchaîne sur la réponse qui précède : la réduction couple nes'appliquant pas à l'horaire demandé, le correspondant en souhaite un après 15h.Nous n'insisterons pas sur la fin de la communication, où le correspondant a du malà s'y retrouver parce que la machine simulée s'est mise en contradiction avec elle-même.

60

Exemple 6 : exemple de communication globalement atypique.M1: SNCF bonjour quels renseignements désirez-vous obtenirC1: j'aimerais obtenir e le renseignement suivant j'aimerais avoir les horairesC1: j'aimerais obtenir e le renseignement suivant j'aimerais avoir les horairesdu des trains en date du dimanche 23 décembre à destination de Saint-Jean-du des trains en date du dimanche 23 décembre à destination de Saint-Jean-de-Luz au départ de Paris mercide-Luz au départ de Paris merci

M2: vers quelle heure désirez-vous partirC2: nous désirons partir vers 10h du matin si cela est possible

M3: ne quittez pas..........M4: le seul train possible en matinée est le rapide 14003 première etM4: le seul train possible en matinée est le rapide 14003 première etdeuxième classe qui part de Paris gare d'Austerlitz à 9h O3 minutes arrive à ladeuxième classe qui part de Paris gare d'Austerlitz à 9h O3 minutes arrive à lagare de Saint-jean-de-luz à 16h O8 minutes ce train vous convient-ilgare de Saint-jean-de-luz à 16h O8 minutes ce train vous convient-il

C3: e oui est-ce que je pourrais avoir les prix s'il vous plaîtM5: en quelle classe voyagez-vousC4: seconde classe et j'aimerais avoir e les renseignements sur les réductions

couple s'il vous plaîtM6: pouvez-vous répéter je n'ai pas comprisC5: j'aimerais aussi avoir les prix et les réductions tarif couple s'il vous plaît

M7: ne quittez pas..........M8: le billet deuxième classe aller retour Paris Saint-Jean-de -Luz Paris coûte 640 F pour bénéficier de la réduction carte couple famille vous devez partir après 15 H

C6: oui alors y a-t-il un train après 15HM9: ne quittez pas..........

M10: le corail 200 R 4007 part s de la gare de Paris Austerlitz à 14h 24minutes arrive à la gare de Saint-Jean-de-Luz à 21h 3 minutes ce train vous convient-il

C7: oui mais vous m'avez dit tout à l'heure qu'il fallait partir après 15h pour avoir laréduction couple est-ce que ce train peut avoir la réduction couple s'il vous plaîtM11: ce train peut avoir la réduction coupleC8: d'accord et oui et le le tarif est le même heinM12: pour la réduction couple vous bénéficiez de 50% de réduction pour l'une des

deux personnesC9: d'accord ben je vous remercieM13: désirez-vous d'autres renseignementsC10: e non merci cela sera toutM14: ne quittez pas

«<QP(QI RI)/RP>«<QP(QI RI+QI)(QI RI)/RP>»<QS/RS(QI RI)(QI RI)>»

Dans cette communication, on pourrait considérer que le correspondant n'arrivepas à guider la machine suivant un modèle très généralement accepté. Il eût d'ailleurssuffi pour cela qu'il eût précisément su ce qu'il voulait, c'est-à-dire avant tout voyageravec la réduction couple. Cependant, lorsque l'on adopte comme ici une perspectivedescriptive, mieux vaut éviter de porter des jugements sur des faits qui sont de toutesfaçon ce qu'ils sont, et considérer que le modèle de dialogue proposé est parfoisinadéquat. Dans cette communication, un modèle de la tâche différent pourraitd'ailleurs mieux correspondre, modèle où seraient fixés le trajet et l'horaire et oùdemandes de tarif et de réduction pourraient porter successivement, pour un mêmetrajet, sur deux horaire différents. Quoi qu'il en soit, il est patent qu'avec cettecommunication il faudrait à tout moment avoir accès à la totalité de ce qui a été ditalors qu'en général on peut en faire au moins partiellement l'économie. Il est clair entout cas que sur un corpus de près de 150 000 signes une description estdifficilement exhaustive et que de nombreux points ont dû nous échapper. Il apparaîtcependant que le modèle de dialogue proposé est remarquablement efficace et que,

61

proportionnellement, les formulations ou les séquences atypiques représentent peude chose.

Comme on l'a vu, ce modèle de dialogue est essentiellement formel. Il définitcependant des procédures étroitement liées au contenu des communications. Ilpermet en tout cas de constater a priori qu'une automatisation est possible, voirerelativement simple. Outre la possibilité de gérer une bonne partie du dialogue pardes énoncés types, cette automatisation ne nécessiterait vraisemblablement pas, àquelques exceptions près, la mise en oeuvre d'un lourd historique du dialogue. Dansl'immense majorité des cas, les communications se déroulent en effet de façonlinéaire, sans aucun retour en arrière. Cette simplicité est cependant liée à unecomplexité d'un autre niveau : ces dialogues sont oraux (par écrit, les correspondantsexigeraient peut être une plus grande flexibilité) et la machine devrait se fonder surle signal de parole et non sur une chaîne de caractère. Ce sont cependant là desproblèmes de traitement du signal ou d'analyse, et non des problèmes demodélisation du dialogue. Il faut toutefois souligner que ce modèle de dialogue estun modèle ad hoc. Tel quel, il n'a pas la prétention de rendre compte de dialoguesd'une autre nature que celui qui est ici en cause. La tâche en question estextrêmement contraignante, la finalité (pour les horaires et pour les tarifs en tout cas)est chiffrable, et l'interlocuteur est contraint. Cette contrainte, acceptée sansdiscussion par les correspondants, n'était nullement codifiée : l'opératrice qui simulela machine a fait ce qui lui semblait nécessaire pour que l'illusion de la communica-tion homme-machine soit acceptée. Ergonome qualifiée, on peut ainsi en conclurequ'elle a su exploiter un inconscient collectif auquel correspond un modèle dedialogue qu'il n'est pas obligatoirement nécessaire d'imposer pour en envisagerl'utilisation.

Son comportement dialogique a notamment pour caractéristique de fournir desréponses maximalistes, c'est-à-dire des réponses qui comprennentsystématiquement plus de renseignements qu'il n'en est demandé. Ainsi, à toutedemande d'horaire ou de tarif, l'opératrice qui simule la machine fournit, outre lerenseignement demandé, la gare de départ, la gare d'arrivée, la catégorie du train,etc... Elle suit en cela les habitudes des services de renseignements de la SNCF quivisent, par souci d'efficacité, à prévenir d'éventuelles questions supplémentaires. Ellefacilite ainsi la perspective d'un traitement automatique : une compréhensionparcellaire suffira à fournir une réponse qui a, par son caractère maximaliste, unegrande probabilité d'être adéquate, quitte à laisser au dialogue qui va s'engager lesoin de corriger quelques erreurs ou de compléter quelques lacunes. Nousterminerons en soulignant que cette constatation, même si elle est plutôt décevantesur le plan de l'intelligence artificielle pure, constitue un fait dont il convient de tenircompte.

62

3. Les questions SNCF

3.1. Le sous-corpus

Nous ne nous intéresserons ici qu'aux requêtes initiales d'horaire, c'est-à-dire à un sous corpus limité et tout à fait spécifique. La raison en est qu'il s'agit làd'un sous-corpus clairement défini, simple et cohérent (cf. [Meunier et Morel 87].Homogénéité et simplicité sont liées à la tâche : ce sont des énoncés qui comportentnécessairement les mêmes composantes et qui sont donc parfaitement comparables.La cohérence tient à la limitation du sous-corpus aux requêtes initiales, c'est-à-dire àl'exclusion des demandes internes aux communications. Cette limitation a semblés'imposer parce que seules les requêtes initiales ne risquent pas d'être conditionnéespar le contexte dialogique. Nous nous sommes enfin limité aux questions portantsur les horaires car ce sont les seules qui offrent un corpus suffisant, qui puissedonner lieu à des analyses suffisamment étayées. Le sous corpus est constitué de125 requêtes initiales d'horaire, extraites de la phases II. Il s'agit de requêtesproduites par 125 correspondants différents, tout à fait représentatifs des usagersd'un centre de renseignements téléphoniques de la SNCF. Compte tenu du protocoled'expérimentation, ces requêtes ont deux caractéristiques particulières :

- Ce sont des reformulations qui font suite à une première énonciation face àune opératrice et à une proposition de dialogue avec une machine.

- Elles constituent la première intervention face à ce que les correspondantscroient être une machine. Ils sont donc susceptibles d'être particulièrementimpressionnés et non d'avoir pu s'accoutumer à ce type d'interaction.

Ce sous-corpus constitue ensuite un précieux corpus d'évaluation (ouéventuellement d'apprentissage pour divers traitements automatiques du langage. Ilpermet en effet, d'une part, de définir a priori quelles doivent être les performancesd'un système pour fonctionner sur de la parole et non plus sur une langue abstraiteet théorique. Il permet, d'autre part, d'évaluer a posteriori les performances d'unsystème sur un corpus de cette nature. Les traitements automatiques concernés noussemblent pouvoir être essentiellement de deux ordres : systèmes de reconnaissancede la parole et systèmes d'analyse :

- Pour les systèmes de reconnaissance de la parole, il peut être intéressantd'évaluer les performances d'un système donné sur de la parole recueillie ensituation, et non pas simplement sur des mots isolés ou sur des énoncés avecsyntaxe figée. On peut alors envisager de prononcer à nouveau le corpus (le supportinitial est de trop mauvaise qualité pour permettre un traitement à partir du signal), enincluant ou en excluant les phénomènes d'hésitation ou de prosodie, et des élémentsde syntaxe peuvent être extraits de l'analyse des corpus. On peut également utiliserun programme de traduction graphèmes-phonèmes pour voir ce que peuvent donnerles analyses des suites phonétiques ainsi obtenues.

- Pour les systèmes d'analyse, il est toujours intéressant de voir dans quellemesure un analyseur parvient ou ne parvient pas à traiter un semblable corpus. Ilpeut alors s'agir d'extraire une représentation sémantique des différentes requêtes,comme de parvenir à réaliser une analyse syntaxique. Dans un cas comme dansl'autre, le problème est de ne pas être arrêté par la non normativité de ces requêtes,c'est-à-dire par les phénomènes de bruit, de dislocation et d'organisation qui lescaractérisent.

63

Nous utiliserons enfin ce sous-corpus dans le second chapitre qui suit, consacréau comportement langagier induit par la machine. Il permet en effet de réaliserdiverses comparaisons avec son frère jumeau, à savoir un sous-corpus constitué desmêmes requêtes, formulées par les mêmes correspondants, avant qu'on ne leurpropose de dialoguer avec une machine.

3.2. Structure sémantique

Dans un corpus aussi dépendant de la tâche, ce qui frappe au prime abord, c'estque la structure sémantique l'emporte sur la structure syntaxique. Larépartition des groupes de sens prend en somme le pas sur l'organisation desnoyaux verbaux ou non verbaux. Cette structure sémantique, représentée figure 1,comporte en première instance 3 éléments : un syntagme introducteur (SI), desréférences spatiales (RS), et des références temporelles (RT). En seconde instance,chacun de ces 3 éléments se scinde en 2 : syntagme verbal (SV) et syntagmenominal (SN) pour le SI ; première et seconde indication de lieu (L1 et L2) pour lesRS ; première et seconde indication de temps (T1 et T2) pour les RT. En troisièmeet dernière instance, chacun de ces éléments possède une fonction sémantique. LeSV indique que l'interrogation est le but de l'énoncé (j'aimerais savoir). Le SNindique précisément la tâche (les horaires de train). L1 et L2 correspondent à lagare de départ et à la gare d'arrivée (Paris Chartres). T1 et T2 renvoient au jour et àla plage horaire souhaités, ce qui correspond (On parlera donc de SVI -syntagmeverbal introducteur-, de SNT -syntagme nominal indiquant la tâche-, de GD -gare dedépart-, de GA -gare d'arrivée-, de J -jour- et de PH -plage horaire-).

e j'aimerais savoir les horaires de train pour Paris-Chartres e demain en fin de matinée

SVSN

L1L2

T1T2

SI

RS

RT

SVI j'aimerais savoir

SN les horaires de train

GD

GA

J

PH

Paris

Chartres

demain

en fin de matinée

Figure 1 : organisation sémantique d'une demande d'horaire

Des éléments excédentaires (EE) viennent parfois compliquer cettecomposition type. Il s'agit soit du syntagme s'il vous plaît (17 occurrences), quiponctue ou qui clôt les requêtes, soit d'un préambule métadiscursif (PM) (excusez-moi de vous déranger ou je voudrais obtenir un renseignement par exemple), quiintroduit les requêtes. Ces éléments excédentaires, totalement inutiles à une bonne

64

exécution de la tâche, amènent à poser le problème de l'indispensable et del'accessoire. Dans ces requêtes en effet, seuls deux éléments sont réellementindispensables : GA et PH. Pour le reste, c'est soit inutile, soit inductible. Toutcomme les EE, le SVI est ainsi inutile : il est clair que si l'on téléphone dans uncentre de renseignements de la SNCF, c'est que l'on voudrait savoir quelque chose.SNT, GD et J sont quant à eux parfaitement déductibles par défaut :

- La tâche est a priori la demande d'horaire, puisque lorsque ce n'est pas le cas(demande de tarif, de réservation ...), c'est toujours explicitement précisé. Leséléments présents dans la requête lèvent par ailleurs toute ambiguïté potentielle quantà la tâche concernée.

- La gare de départ est très souvent sous-entendue, dans la mesure simplementoù il s'agit de Paris (et qu'il n'y a aucune confusion possible au sujet des différentesgares parisiennes) et où Paris constitue le lieu d'appel, c'est-à-dire le lieu présumé dedépart.

- Quoi que ce soit plus rare, le jour peut également être omis, s'il s'agit du cas leplus banal, à savoir un jour de semaine. Dans ces cas-là, l'opératrice est néanmoinspresque systématiquement amenée à solliciter une reformulation, dans la mesure oùla complexité des horaires SNCF ne permet guère de semblables généralisations.

Comme on peut le voir dans l' exemple 7, on comprend ainsi que la structuretype SVI SNT GD GA J PH soit relativement rare (20 occurrences). En fait, lamoitié des requêtes omettent un, deux ou trois éléments (SVI, SNT et GDnotamment). Nombreuses sont ensuite les demandes d'horaire qui comportent desinversions, parfois simples (GD/GA, J/PH ou même RS/RT) et parfois complexes,notamment lorsque les références temporelles sont enchâssées dans les référencesspatiales (ou l'inverse), ce qui donne des formules du type : GD J PH GA, J GD GAPH, GD J PH GA, GA PH J GD ou GA PH GD J etc ...

Exemple 7 : exemples de structures sémantiques.horaire des trains paris montparnasse le mans le vendredi vingt-huit e décembre àpartir de dix-huit heures

SNT GD GA J PHje veux connaître l'heure d'un train pour le samedi vingt-neuf décembre pour allerde paris à angoulême charentes

SVI SNT J GD GAe voudrais un train partant de paris austerlitz e samedi matin en direction de royan

SVI SNT GD J PH GAoh j'ai pas écouté hé oui e pour partir e jeudi mercredi deux de la gare de lyon pourmontargis le matin

PM J GD GA PHj'aimerais obtenir e le renseignement suivant j'aimerais avoir les horaires du destrains en date du dimanche vingt-trois décembre à destination de saint-jean-de-luzau départ de paris merci

PM SVI SNT J GA GD

3.3. Structure syntaxique

Chacun des éléments de la requête a un fonctionnement syntaxique spécifique.Le syntagme verbal introducteur comporte tout d'abord, lorsqu'il est présent,différents degrés (de je veux à j'aurais voulu savoir). Ces différents degrésreposent sur l'utilisation ou non de 4 éléments : un semi-auxiliaire indiquant le désir,

65

le conditionnel, un temps composé et un infinitif indiquant l'acquisition. Dans lapratique, l'essentiel des requêtes comporte 2 ou 3 éléments, suivant la formule jevoudrais (savoir) et on ne rencontre pas de formulation particulière, par exempleavec une utilisation modale de l'imparfait (*je voulais savoir).

Le syntagme nominal indiquant la tâche ensuite est presque exclusivementcomposé (90 occurrences sur 127) de deux substantifs : S1 et S2 (les horaires destrains), parfois précédé ou suivi de premier, dernier ou direct. S1 est toujoursintroduit par un article défini. Si S1 est au singulier, S2 est généralement ausingulier, qu'il soit introduit par un article défini ou indéfini. Si S1 est au pluriel, S2est généralement introduit par un article défini pluriel. Deux cas cependantcombinent singulier et pluriel et confinent de ce fait à la non normativité : l'horairedes trains, qui se comprend, dans la mesure où chaque train n'a qu'un seul horaire, etles horaires du train, qui se justifie moins.

Pour les référence spatiales, le problème syntaxique le plus intéressant estcelui des marqueurs de départ et d'arrivée (sur 127 requêtes initiales, 53 nementionnent que la GA, toujours avec un marqueur, et sur les 72 requêtes quiévoquent à la fois GD et GA, 41 utilisent un marqueur avant la GD et avant la GA,15 n'emploient aucun marqueur, 12 n'en utilisent qu'avant la GD, et 4 seulementavant la GA. Un certain nombre de requêtes possèdent par ailleurs trois mentions degare, dans la mesure où GD ou GA sont reprises). Il faut toutefois mettre à part lapréposition pour (qui, avec 114 occurrences, est le mot le plus fréquent du corpus) :comme on peut le constater dans l' exemple 8, elle est en effet susceptible d'êtreutilisée quasiment dans tous les cas de figure (+GD/+GA ; seule/intégrée dans unmarqueur ; en tête de locution/en fin de locution ...). Il faut également mentionner lesmarqueurs doubles (de ... à/pour/vers ; entre ... et), relativement rares, ainsi qu'uneutilisation idiotique de sur : sur (la ligne) + GD GA. Les marqueurs de départ etd'arrivée sont quant à eux relativement nombreux (près de 25 au total) et peurécurrents : seul au départ de (14 occurrences) dépasse le seuil des 5 occurrences(Comme l'indique C. Leroy dans [Morel et al. 85], il s'agit à deux reprises d'uneformulation différente : «l'heure de départ de Paris» ne signifiant pas exactement lamême chose que «l'heure au départ de Paris»). Ce sont presque systématiquementdes locutions prépositives (en provenance de ; en direction de), des subordonnéesrelatives (qui partent de ; qui vont à), ou bien des locutions construites autour d'uninfinitif (pour revenir de ; pour arriver à) ou d'une forme en -ant (quittant ; enpartant pour). Entre autres difficultés, ces marqueurs ont la caractéristique d'êtrepresque tous formés sur le même moule, à partir des mêmes termes (partir et allernotamment), et marqueurs de départ et marqueurs d'arrivée s'opposent bien souventpar des différences minimes (qui partent à-de-pour).Ces marqueurs recèlent parailleurs deux polyptotes, dans lesquelles un traitement automatique aurait bien dumal à se retrouver : les départs de / au départ de ; pour aller de / pour aller pour.

Exemple 8 : ensemble des différents cas de figure de l'utilisation de«pour» devant RS (1).

pour GA (pour Caen)pour GD GA (pour Paris les Aubrets)de GD pour GA (de Paris pour Brive la Gaillarde)

66

au départ de GD pour GA (au départ de Paris pour Sablé)pour un aller pour GD GA (pour un aller pour Paris Lorient)en provenance de GD pour GA (en provenance de Château-Thierry pour Paris)pour aller de GD à GA (pour aller de Paris à Orléans)pour aller à GA (pour aller à Troyes)partant de GD pour arriver à GA (partant de Mulhouse pour arriver à Paris)qui part de GD pour GA (qui part de Paris pour Le Havre)en partance pour GA (en partance pour Tourcoing)

(1) «pour» et «vers» s'utilisent aussi bien en RS qu’en RT : «les heures de départ e destrains pour la Ferté-Gaucher en Seine-et-Marne pour samedi dimanche et lundi».

Les références temporelles, et notamment la PH, sont enfin les seuls élémentsdes requêtes qui aient a priori une structure syntaxique rigide (cf. figure 2). Toutcomme dans la requête suivante : une e Paris Tours e le dix-huit janvier départ e lematin pour arriver à Tours vers neuf heures et demie neuf heures quarante-cinq,on trouve des noyaux syntaxiques relativement longs et régulièrement construits.Dans la perspective d'une analyse automatique, les principales difficultés tiennentd'une part à l'importance des chiffres et à la nécessité de les différencier (parexemple dans *le 10 janvier à 10 h 10), et d'autre part aux phénomènes de nonnormativité (soit vers 16h soit 17h par exemple). Comme il s'agit de questions, lasyntaxe de l'interrogation (ou son absence) touche à l'organisation même desrequêtes. En pratique, on est confronté à 4 cas de figure :

- Les interrogations directes, peu nombreuses, qui induisent des phrases simples(à 1 SV).

- Les interrogations indirectes, presque systématiquement partielles et normées,un peu plus fréquentes (14 occurrences), qui induisent en revanche des phrasescomplexes. Compte non tenu des hésitations, des reprises, des relatives intercalées,etc ..., les interrogations indirectes supposent en effet un second SV (j'aimeraissavoir à quelle heure part ...). Seuls certains SVI tolèrent néanmoins uneconstruction avec interrogation indirecte : les constructions qui, outre le semi-auxiliaire, utilisent un infinitif de type savoir/connaître (il est impossible deconstruire une interrogation indirecte directement après un semi auxiliaire : *jevoudrais quelle est l'heure, tout comme après un infinitif comme avoir : *jevoudrais avoir quelle heure il est).

- Les requêtes avec SVI (de loin les plus fréquentes), dans lesquelles le SVIpeut être considéré comme un marqueur interrogatif, mais dans lesquelles laconstruction reste celle de l'affirmation.

- Les requêtes sans marqueur interrogatif, dont on relève 29 occurrences. Cesont généralement des énoncés non verbaux, qui pratiquent souvent un styletélégraphique, et qui présentent une structure sémantique complète (les heures destrains pour Reims demain entre 8 h et 9 h 30 par exemple).

JS lundi (mardi ...)JS + JM lundi premier (deux ...)JS + JM + M lundi premier janvier (février ...)JM + M premier janvierAT aujourd'hui (demain en-semaine)formulations synthétiques : ce(t) matin (soir après-midi)

67

lundi (mardi ...) prochainDifférentes formulations du jour (1)

IJP le matin(soir après-midi midi (2))IJV dans la matinée (journée soirée après-midi (3))RN+IJV en début (fin) de matinée ...(RP)+CH+h vers ...(à-partir-de aux-environ-de avant après entre)(RP)+CH+h+CM vers 10 h 10 (4)RP+CH+h(+CM)+CH+h(+CM)entre 10 h et 11 h (5)RP+CH(+CM)+CH+h(+CM) entre 10 et 11 hformulations synthétiques : premier (dernier) train - prochain train

Différentes formulations de la plage horaire (6) (7)

(1) JS = Jour Semaine ; JM = Jour Mois ; M = Mois, AT = Adverbe de Temps.(2) midi est par nature bivalent : il est soit une traduction de douze heures, soit une évocation de la mi-journée.(3) «après-midi» relève soit des IJP, soit des IJV : on peut dire cet après-midi (cf. ce matin, ce soir), toutcomme on peut dire dans l'après-midi/en début d'après-midi (cf. dans la soirée/en début de soirée ...).(4) midi, demie et quart ont un statut particulier : midi=CH(12)+h ; demie=CM(30) ; quart=CM(15).(5) entre n'est pas le seul RP à pouvoir précéder 2 indications d'horaire : on rencontre également vers (soitvers 16h soit 17h) ; même si on n'en rencontre pas d'autres attestations dans le corpus, on pourrait égalementtrouver les autres RP (*«avant 16(h) 17h» ou *«après 16(h) 17H».(6) IJP=Indicateur Journalier Précis ; IJV = Indicateur Journalier Vague ; RN = Repère Nominal ; CH =Chiffre Heures ; h = «heure» ; CM = Chiffre Minute ; RP = Repère Pépositionnel.(7) Il faut par ailleurs noter que l'on trouve parfois 2 plages horaires (vers 10h le matin), et que la plagehoraire correspond parfois à l'horaire d'arrivée. Il s'agit alors d'être à ou d'arriver à. Un cas est enfin à mettreà part : tôt le matin

Figure 2 : fonctionnement syntaxique des références temporelles.

3.4. Énonces non normés

Avant d'aborder les questions de lexique, il convient d'évoquer les problèmesde non normativité, même s'il est naturel qu'un corpus aussi limité et orienté par latâche soit moins concerné que d'autres par les phénomènes de bruit, de dislocationou d'organisation. Les énoncés sont en effet souvent très courts (e Paris Rouenpour ce soir), et même lorsque ce n'est pas le cas (e voudrais e au départ de Parissur Dunkerque les horaires des des trains le matin au départ le matin et e retourDunkerque Paris début après-midi merci), ils limitent le champ de la nonnormativité en pratiquant un «style» proche du style télégraphique : omission dupronom sujet (voudrais), du discordanciel (si c'est pas possible), ellipse (surDunkerque), absence de prépositions et de déterminants (début après-midi). Onrencontre également plusieurs occurrences d'anacoluthes (j'aimerais connaîtrel'horaire d'un train direct au pour le samedi 29 e dans la soirée pour Narbonne)ou de reprises elliptiques (les trains pour Bruxelles e les 2 prochains).

On rencontre enfin un phénomène particulier, lié au caractère opératif de latâche, et que nous avons qualifié de caractérisation linéaire. Les différentesoccurrences sont reprises dans l' exemple 9, le cas le mieux représentatif étantsamedi soir prochain. A la différence de l'apo koïnou, il ne s'agit pas d'un mêmemot ou d'un même syntagme en situation de dépendance par rapport à ce qui leprécède comme par rapport à ce qui le suit. Il s'agit néanmoins, tout comme l'apokoïnou, de deux mots ou de deux syntagmes en situation de dépendance par rapport

68

à un troisième. Comme pour l'apo koïnou également, c'est la linéarité de l'oral qui esten cause, dans la mesure où, à un moment donné de l'énonciation, un syntagme setrouve en situation de rection par rapport à plusieurs autres syntagmes (samedi parrapport à soir et à prochain). Plutôt que de remanier l'ensemble du propos (endisant *samedi prochain dans la soirée par exemple), les deux syntagmes enquestion sont énoncés linéairement, quitte à produire un résultat qui apparaîtraitcomme non normé à l'écrit (samedi soir prochain comme *samedi prochain soir).Soit en somme trois éléments A, B et C ; on s'autorise de la possibilité de construireAB et AC pour énoncer ABC sans effectuer éventuellement les modifications quipourraient apparaître comme nécessaires ; cela est souvent souligné par une reprisede pour : A pour B pour C.

Exemple 9 : requêtes comportant une caractérisation linéaire.je voudrais les horaires de train au départ de Mulhouse pour rejoindre Paris qui circule levendredi matin j'aimerais connaître l'horaire d'un train direct au pour le samedi 29 e dans la soirée pourNarbonne alors je voudrais l'horaire des trains Paris Lens pour le samedi après-midi 5 janvier et retourLens Paris pour le dimanche après-midi 6 janvier je voudrais savoir les horaires de trains pour Lorient pour samedi soir prochain à partir de 19 he j'aurais voulu les horaires de trains pour le dimanche en début d'après-midi pour Narbonne e pourrais-je avoir les horaires de trains pour e dimanche pour Deauville s'il vous plaîtje voudrais e des horaires de trains pour le dimanche e qui vient e pour Montereau ...

3.5. Lexique

La taille du lexique reste modeste : il comporte, avant toute analyse, 2245 motsreprésentant 332 items. Notre objectif étant, dans la perspective d'un traitementautomatique, d'extraire le lexique relatif à la tâche, on peut exclure les noms propres(95 items), les hésitations (13 items), les alternances sg/pl (16 items), de même quel'on peut reconstituer les mots composés (12 items). On peut également mettre à partles 20 items nécessaires aux indications chiffrées : les chiffres pouvant indiquer lejour (de 1 à 31), l'heure (de 0 à 23) et les minutes (de 0 à 59) notre lexique deschiffres se compose de 21 items (0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 20 30 4050) ; comme 1 existe sous trois formes -un, une et premier, et que ces trois formespeuvent être des déterminants, notre lexique des chiffres au sens strict représente 22items. On aboutit ainsi à un lexique de 172 items, correspondant à 1989 mots, danslequel seuls 25 items comptent plus de 20 occurrences, et 40 entre 4 et 20occurrences. Nous allons donc nous efforcer de relever et d'analyser, à partir de ces172 items, quels sont ceux qui sont nécessaires à l'exécution de la tâche, c'est-à-direceux qui constituent les différents éléments de la requête. Nous ne retiendrons parmiceux-ci que ceux qui possèdent plus de 2 occurrences, c'est-à-dire ceux dontl'emploi ne peut pas être considéré comme épisodique (cf. figure 3 ci-dessous).

La répartition de ce lexique suivant les différents éléments constitutifs d'unerequête est la suivante :

- Les EE sont bien entendu les éléments les moins intéressants, à une exceptionprès toutefois : s'il vous plaît. On en recense 17 occurrences, ce qui le classe autrente-deuxième rang par ordre de fréquence. Sa place n'est en outre jamais

69

anodine : il se trouve soit en fin d'énoncé (12 occurrences), soit entre deux groupesde sens (5 occurrences), comme on peut le constater dans l'exemple suivant. Ilfonctionne alors comme une sorte de ponctuation orale, à l'égal de quoi ou de hein :allô je voudrais avoir s'il vous plaît le retour à partir de 14 h e de Rouen versParis le 28 e e e le 28 e décembre s'il vous plaît

- Le lexique du SVI est particulièrement stable puisqu'il n'est composé que de 5verbes : 2 semi-auxiliaires marquant le désir (vouloir, aimer : 63+20 occurrences),et 3 infinitifs marquant un apprentissage (avoir, savoir, connaître : 22+24+24occurrences). Le phénomène est particulièrement frappant si l'on songe au nombredes formulations possibles (pouvez-vous m'indiquer, auriez-vous l'amabilité de medire, je cherche à trouver, je désire me procurer ...). En fait, on peut relever 12exceptions, même si, existe-t-il mis à part (qui correspond à une demande deconfirmation), ces exceptions constituent un micro système : on relève 5 occurrencesde désirer, et 2 de souhaiter, obtenir, pouvoir, et du présentatif il y a.

- Le lexique du SNT est en général extrêmement simple : S1 est presquesystématiquement représenté par heure(s) ou horaire(s) (65+67 occurrences), et S2par train (101 occurrences). Il faut cependant noter que TGV, qui ne fait pastoujours strictement partie du SNT (les heures de départ de Paris par le TGV) setrouve en S2 à 4 reprises, que départ se substitue à S1 à 2 reprises (je voudraissavoir les départs des trains) et à S2 à 6 reprises (je voudrais savoir lesheures/horaires de départ), et que l'on trouve 1 occurrence de retour et de direct àla place de S1.

- Pour les RS, le seul marqueur qui ait une réelle représentativité est au départde (14 occurrences). On peut également mentionner qui vont à et en direction de(5+5 occurrences), pour aller à (4 occurrences), partant de et à destination de (3+3occurrences). Le lexique des RT est celui qui a été décrit dans la figure 2. Il est danssa quasi-totalité utilisé à plus de 2 occurrences, et ce qui est surtout intéressant, c'estde constater des absences. L'indication de l'heure notamment pourrait êtrerelativement compliquée, en procédant par exemple de façon négative (dix heuresmoins dix) : dans le corpus, cela ne se rencontre jamais. Qui plus est, on nerencontre aucune occurrence de quart, systématiquement remplacé par quinze, et leseul exemple de demie, qui se substitue à trente, se situe dans un contexte dedésambiguïsation bien particulier : une e paris tours e le dix-huit janvier départ e lematin pour arriver à tours vers neuf heures et demie neuf heures quarante-cinq.

Sans tenir compte des noms propres et des chiffres, on peut donc dresser untableau, repris figure 3, reprenant l'ensemble du lexique utilisé pour l'exécution dela tâche. Comme on n'y mentionne que les termes qui possèdent plus de 2occurrences, ce tableau n'est pas exhaustif, mais il est très largement représentatif.Ce lexique comporte 46 items et couvre 568 mots, soit un peu plus du sixième ducorpus de référence. Il est par ailleurs extrêmement stable puisque, à quelques raresmodifications près, on peut l'obtenir à partir de l'une ou l'autre moitié du corpus.L'ordre des fréquences reste d'ailleurs sensiblement le même. Cette grande simplicitédu lexique tient à la pratique d'un véritable sous-langage : il est manifeste que, à uninstant donné de tout dialogue, le vocabulaire susceptible d'être utilisé est restreint etdélimité.

70

Ce lexique comporte enfin un certain nombre de confusions possibles, dans lamesure où un même mot (homophone+homographe) est susceptible d'être utilisé dediverses manières. L'importance de ces confusions dépend de celle des 2 emplois etde la fréquence d'utilisation du mot en question :

- heure(s) (65 occ.) peut faire partie du SNT (je voudrais savoir l'heure destrains) comme de la PH (vers 10 heures 10).

- départ (22 occ.) peut précéder GD (je voudrais l'horaire pour Dreux audépart de Paris) ou relever du SNT (je voudrais un départ pour Dreux). Parfoismême, il est difficile de déterminer laquelle de ces deux utilisations est en cause : lesheures de départ de Paris-Austerlitz ... .

- un/une (36 occ.) peuvent être soit des numéraux, soit des déterminantsindéfinis (*une place dans un train le trente-et-un janvier à midi trente-et-une).

- prochain (4 occ.) peut indiquer soit J (mercredi prochain), soit PH (les trainspour Bruxelles e les deux prochains)

- premier (2 occ.) indique deux fois le J ( premier janvier), mais il pourraitégalement indiquer la PH (premier train), alors que'on ne peut pas rencontrer deconfusion avec dernier (1 occ.) car, s'il peut indiquer PH (dernier train), il ne peutpas indiquer J (*lundi dernier), dans la mesure où on ne se renseigne guère sur untrain ou un horaire passé (cf. absence de hier).

- douze (4 occ.), compte tenu des dates de l'expérimentation se rencontre pourindiquer le mois (vendredi 28 e douze 84), l'heure à la place de midi (après 12h) et ilpeut comme d'autres chiffres indiquer indifféremment le jour, l'heure ou les minutes.

- retour (4 occ.) peut s'opposer à aller, comme il peut indiquer l'aller : jevoudrais svp le retour à partir de 14h e ce de Rouen vers Paris ... Il ne s'agit eneffet d'un trajet retour que dans l'esprit du locuteur qui a dû effectuer un trajet aller àune autre date, alors que pour la machine-opératrice, il ne peut y avoir de questionsur un trajet retour que s'il y a eu question, dans la même négociation, sur un trajetaller.

Trois remarques, sur lesquelles nous nous fonderons pour développer notreanalyseur, se distinguent en définitive de l'analyse linguistique des questions SNCF:

1 - La syntaxe est celle de l'oral, avec tous les phénomènes de non normativitérencontrés précédemment.

2 - L'organisation sémantique des requêtes est extrêmement figée etremarquablement fiable.

3 - Le lexique réellement utile à la compréhension est particulièrementlimité.

EE : s'il-vous-plaît(17)SVI : aimer(20) vouloir(63) avoir(22) connaître(24) savoir(24) désirer(5)SNT : horaire(67) heure(65) train(101) tgv(4) départ(8)GD : au-départ-de(14) partant-de(3)GA : en-direction-de(5) à-destination-de(3) qui-vont-à(5) pour-aller-à(4)J : demain(12) aujourd'hui(6) en-semaine(3)

lundi mardi mercredi jeudi vendredi samedi dimanche(71)décembre janvier février(34)

PH : matin(32) midi(4) après-midi(25) soir(6) journée(3) matinée(4) soirée(3) (après-midi)fin(10) début(3)

71

à-partir-de(4) aux-environs-de(4) après(4) avant(3) entre(8)(heure)

Figure 3 : représentation du lexique utile à la tâche

Le but de ce chapitre, consacré à l'étude descriptive de corpus de dialogueshomme-machine n’est pas d'aboutir à une conception générale de l'oral ou dudialogue, même si un certain nombre de constatations (dialogue à structurehiérarchique, dialogue à déroulement linéaire ou caractérisation linéaire par exemple)peuvent avoir une portée générale. Il ne s’agit pas non plus d'extraire directementdes règles qui serviraient de base à une informatisation. Le but est plutôt de passerde données brutes à des données observables par une description aussi soignée quepossible des corpus dont on dispose. Il s'agit en somme d'extraire unemodélisation linguistique de l'analyse des corpus, afin de respecter, autant quefaire se peut, toutes leurs spécificités. Nous nous efforçons par là de mettre notreproblématique en pratique, à savoir que la modélisation ne doit en aucun casdénaturer les données à partir desquelles on prétend effectuer un traitementautomatique. Bien plus, nous nous sommes appliqué à montrer que de l'analyse descorpus pouvait se dégager une modélisation autrement mieux fondée que par uneapproche théorique.

Pour le dialogue, il apparaît qu'il existe un «modèle» sous-jacent qu'utilisentspontanément tous les locuteurs et auquel se réfère tout aussi spontanémentl'opératrice qui simulait la machine. Il est clair cependant que ce modèle estétroitement lié au respect des tours de parole propres à la situation decommunication homme-machine. Pour les requêtes, il apparaît que, à partir d'unestructure sémantique extrêmement nette, la simplicité du lexique compense lacomplexité d'une syntaxe aussi peu normée que dans n'importe quel autre corpus defrançais parlé.

72

73

CHAPITRE 3

Comportement langagierinduit par la machine

Le comportement langagier induit par la machine recouvre un problèmeessentiel : il s'agit de savoir si nous nous exprimons spontanément de façondifférente face à une machine et face à un interlocuteur humain et, dans l'affirmative,de connaître précisément la nature de ces différences. Comme précédemment, leproblème concerne d'une part la conduite du dialogue, et d'autre part la constructiondes énoncés, c'est-à-dire, en l'occurrence, des requêtes.

Exemple 1 : scénario précédant l’introduction de la machine présumée- SNCF bonjour- bonjour je voudrais avoir un petit renseignement j'aimeraisconnaître les horaires des trains le mardi 25 décembre maispartant de province de ruffec en enfin pour arriver à austerlitz- pardon est-ce que vous accepteriez de dialoguer avec unemachine- avec une machine- oui- ben e pourquoi pas- alors vous parlez normalement vous demandez tout ce quevous voulez et de toute façon je vous reprendrai après d'accord- d'accord- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - -- SNCF renseignements téléphoniques quels renseignementsdésirez-vous obtenir- voilà j'aimerais connaître le les horaires pour e revenir de ruffecet arriver donc à paris austerlitz le mardi 25 décembre...

Pour le dialogue, il s'agira de comparer les deux phases du corpus SNCF. Pourles requêtes, nous nous intéresserons comme précédemment aux requêtes initialesd'horaire, en comparant, outre les deux phases du corpus, les Demande Antérieure(DA) et les Demande Initiale (DI), ce qui correspond aux requêtes initiales d'horaire

74

(DI), par comparaison aux mêmes requêtes formulées par les mêmescorrespondants, avant qu'on ne leur propose de dialoguer avec une machine (DA).C'est cette dernière comparaison surtout qui, comme on le verra, est intéressante. Ellen'a été rendue possible que par l'existence du scénario qui précédait l'entrée en scènede la machine, et qui est repris dans l'exemple 1.

75

1. Le dialogue

Ce qui apparaît tout d'abord, c'est la longueur des communications de lapremière phase ainsi que la bien plus grande brièveté des répliques : lescommunications comportent un bien plus grand nombre d'interventions (au sens deprise de parole), puisque la moyenne est de 33 interventions par communication(contre 18) ; ces dernières sont en moyenne bien plus courtes, puisqu'ellescomportent 5,5 mots (contre 9). Ces différences, d'ordre statistique, cachent toutefoisdes oppositions plus intéressantes, que nous nous efforcerons de mettre en lumièreen nous référant tout d'abord au modèle extrait de l'analyse de la phases II (1.1.),puis en utilisant le modèle genevois (1.2.).

1.1. Le modèle SNCF

Exemple 2 : communication dont le modèle de dialogue pourraitdifficilement rendre compte

O1 : SNCF bonjourC1 : allô

O2 : ouiC2 : oui bonjour

O3 : bonjourC3 : vous pouvez me donner un train pour Châlon Paris Châlon Châlon vous allez

p'têtre me dire quel Châlon04 : Châlon sur Saône

C4 : je ne sais pasO5 : ah

C5 : que je me demande c'est Châlon sur Saô Saône ou Châlon sur Marne heinO6 : e oui e normalement oui

C6 : oui vous permettezO7 : oui

C7 : une seconde merciC8 (à un tiers) : tu m'aides à trouver

C9 : allôO8 : oui

C10 : c'est Châlon sur MarneO9 : Châlon sur Marne

C11 : oui excusez-moiO10 : bon alors vous voulez un train vers quelle heure ...

Point n'est besoin d'une longue analyse pour constater que le modèle dedialogue est ici inadéquat. Le comportement de l'opératrice n'est plus figé, lesquestions sont presque systématiquement moins précises et plus complexes qu'ensituation de communication homme-machine, et les références contextuellesindispensables à une bonne compréhension du dialogue abondent, comme le montrel'exemple 2. Les diverses caractéristiques suivantes vont également dans le mêmesens :

- L'opératrice n'hésite pas à intervenir dans le courant d'une négociation. Alorsqu'un correspondant lui a demandé un train pour Bruxelles et avant de lui proposerune quelconque réponse, elle suppose par exemple : e vous voulez un train direct oubien un train e enfin j'pense que vous préférez un train direct, pour poursuivre en

76

disant : mais e le problème c'est que vers cette heure-là je n'ai pas de train directj'ai un train à à 18h 40. Tout comme dans l'exemple 3 elle a ainsi souvent tendanceà procéder de façon directive, presque par QCM, c'est-à-dire à guider l'interaction, aulieu de laisser les correspondants poser leurs questions à leur guise.

- Il est très fréquent de rencontrer des questions floues ou incomplètes. Ontrouve notamment des questions initiales d'horaire seulement constituées d'un SVI,d'un SNT, et de GA : oui bonjour madame pour un pouvez-vous me dire est-cequelle heure il y a un train qui part de Montparnasse le dimanche.

- Dans certaines communications, GA reste floue : un correspondant demandepar exemple un train pour Dreux, et une fois J et PH spécifiés, il ajoute : pourDreux ou Nonancourt hein mais pour Nonancourt il me faut j'en voudrais undirect sans changement donc.

- Les questions multiples, c'est-à-dire les questions avec 2 QP : oui bonjourpourrais-je avoir les horaires de train de Paris à Reims et de Paris à Châlon pourdemain matin voulant partir de 8h alors Paris e sont assez fréquentes.

- Dans quelques communications enfin une QP se modifie ou s'amplifie dans lecourant d'une négociation, comme dans l'exemple 3, où non seulement J se modifiemais également la tâche qui se met à englober les tarifs.

Exemple 3 : communication où le modèle de dialogue serait totalementinadéquat.

O1 : SNCF bonjourC1 : bonjour madame j'aimerais avoir des renseignements sur les trains en

partance pour CannesO2 : oui qu'est-ce que vous vous voulez des trains pour quel jour

C2 : e pour jeudi matinO3 : pour le jeudi matin vous ne quittez pas s'il vous plaît

C3 : commentO4 : vous ne quittez pas

C4 : ouiO5 : merci

C5 : jeudi ou vendrediO6 : jeudi ou vendredi matin

C6 : et les prix aussi ...

Pas plus qu'un traitement automatique, le modèle ne pourrait enfin prendre encompte les incessantes allusions contextuelles. Dans une séquence telle que cellequi est reprise dans l'exemple 4 il est ainsi difficile d'interpréter premier qui faitréférence à O3, et qui signifie *est-ce que le train que vous me proposez est lepremier par rapport à la borne horaire que je vous ai indiquée (19h 30). Un grandnombre de passage ne sont interprétables ensuite qu'à partir de connaissances quidépassent amplement le domaine de la tâche. Cela est parfois vrai à propos d'unerequête : allô bonjour madame je voudrais avoir des horaires e je sais pas on m'adonné des horaires e suivants pour Paris Le Creusot le 14 décembre à 16h 59 etmoi je les trouve pas où il faut interpréter le on tout comme le moi je les trouve pas.Cela peut être vrai également à propos d'une séquence, comme dans l'exemple 5, oùil faut être à même de reconstruire les professions du correspondant et du futurusager pour identifier correctement les différentes références de il(s) : quelqu'un(une secrétaire ?) se renseigne pour un tiers (son patron ?) en utilisant il(s) pour letrain (C5), pour son patron en personne (C10) et pour l'ensemble des participants àla réunion à laquelle ce dernier assiste (C11), ce que dénotent les formes verbales.

77

C'est certes là un cas extrême, mais, d'une part, ce cas existe, et d'autre part c'est unphénomène constant en situation de communication homme-homme que d'utiliser laconnaissance du monde dont dispose son interlocuteur.

Exemple 4 : allusion contextuelle non perçue par l'opératriceO1 : SNCF bonjour

C1 : ou bonjour madame est-ce-que je pourrais avoir e les numéros de de Parisles heures de trains directs Montargis à partir de 7h 30 jeudi oui de 19h 30 jeudiO2 : et pour quel jour

C2 : ben pour aujourd'huiO3 : pour aujourd'hui à partir de 19h 30 oui vous ne quittez pas

C3 : merci ..........O4 : allô

C4 : ouiO5 : oui alors vous avez un train e départ Paris gare de Lyon à 20h 09

C5 : c'est le premierO6 : pardonC6 : c'est le premier07 : c'est le premier que je puisse vous donner oui ben vous m'avez dit après 19h 30

Exemple 5 : jeu de référence complexe sur «il(s)»O5 : bon non alors j'ai un train mais le enfin le problème c'est que c'est un train àsupplément

C5 : oui et il part à quelle heureO6 : alors j'en ai un qui part à 19 18H 33

C6 : ouiO7 : et il arrive à Angers à 20h 46

C7 : 20h 46O8 : c'est bien pour aujourd'hui hein

C8 : oui ouiO9 : bon alors sinon e

C9 : aprèsO10 : sinon j'ai des problèmes plus tard

C10 : ben il me il m'a dit entre 18h et 19hO11 : 18 et 19h et j'en ai un à 19h mais il est pas pour e il marche que le vendredi

C11 : parce que comme ils savent pas quelle heure qu'ils vont sortir de la réunion

Il apparaît qu'une telle connaissance du monde est beaucoup moins nécessaireen situation de communication homme-machine qu'en situation de communicationhomme-homme. Les correspondants adaptent le contenu de leurs propos de tellesorte que face à une machine celui-ci soit d'emblée modélisable de façonrelativement rigide. Il est certain que le comportement de l'opératrice qui simulait lamachine les conditionnait en ce sens. Il est manifeste néanmoins qu'ils n'attribuentpas la même fonction à la communication dans ces deux cas. Face à une machine, ilsn'ont ainsi pas de «face» [Goffman 81] [[Kerbrat 86] à défendre : si, dans l'exemple5, la correspondante utilise toutes ces références, c'est vraisemblablement pourfournir une justification à un comportement qu'elle suppose considéré commetatillon par l'opératrice. De la même manière, dans l'exemple 4, le correspondantressent le besoin de se justifier d'avoir à demander une confirmation, c'est-à-dire unrenseignement qu'il connaît déjà.

78

On peut enfin s'interroger sur l'utilité de ces processus psychologiques dansle déroulement des communications. Il est certain qu'ils sont ressentis commenécessaires dans la communication homme-homme, mais il est non moins certainque, pour une tâche de ce type, leur absence ne nuit pas à l'efficacité de lacommunication homme-machine. Face à la machine, les correspondants nes'embarrassent pas de justifications et les communications sont plus courtes, maiscela n'empêche pas de parvenir à ses fins. Ce type de considération ne peutcependant s'appliquer qu'à une tâche aussi simple que les renseignements horaires.Face à un correspondant qui demanderait : bonjour madame je vais vous demanderun renseignement s'il vous plaît ... e en ce qui concerne les billets de congés payés... pour l'année alors voilà alors moi je travaille mais je travaille je ne travaille quepar intermittence ... donc je n'ai pas toute l'année e je suis jamais au même endroitet je n'ai pas toute l'année des fiches de paye bon d'un autre côté je suis mariée est-ce que ça peut marcher sur le sur parce que moi je suis sur la sécurité sociale demon mari est-ce que ça peut ma comment ça se passe est-ce que vous il n'en iraitpas de même ! ( Au bout de huit échanges, l'opératrice occasionnée crie d'ailleursgrâce : je vais vous repasser je vais vous passer un autre poste hein).

1.2. Le modèle genevois

Le modèle genevois [Roulet et al. 85] [Moeschler 85], que nous avons déjàévoqué précédemment est à notre connaissance le modèle fonctionnel de dialoguele plus achevé dont on puise disposer. En ce qui concerne le comportementlangagier induit par la machine, il est intéressant de voir comment il s'applique (oune s'applique pas) dans les deux situations de communication. A cet effet, nousallons nous fonder sur deux extraits représentatifs des deux types de dialogue quisont en cause (exemples 6). Suivant notre modèle, ils sont constitués chacun d'unenégociation, composée d'une QP et d'une QS, avec les réponses associées. En phaseII, on trouve par ailleurs une QI, alors qu'il y en a 2 du même type (demande deprécision) en phase I. Cette dernière communication s'allongeant, on l'a enfinabrégée (...), afin d'inclure l'échange confirmatif de clôture.

Dans le modèle genevois, l'intervention n'est pas systématiquement liée au tourde parole. Le modèle a un caractère beaucoup plus sémantique que formel.L'intervention est avant tout un certain type d'acte de langage qui s'inscrit dans uncadre argumentatif. Il est clair que cette dissociation intervention/tour de parole estégalement nécessaire en phase I (exemple 6a). Près du tiers des prises de parole onten effet un statut phatique. Ce sont notamment les oui et les phénomènes d'écho (àla suite de [Bunt et al. 84], nous préférons ce qualificatif à celui de «diaphonie»,pour éviter une confusion avec le sens usuel d'«interférence»). Pour les analyser, ilest en fait nécessaire de distinguer deux utilisations :

- Il s'agit d'une part (cf. C9 et C13 pour oui ; C8, C10, C12 et C18 pour lesphénomènes d'écho) d'une simple ponctuation approbative, sorte de prise de paroleentre parenthèses, qui ne fait que suspendre le déroulement d'un seul et même tourde parole de la part de l'opératrice. Ainsi, de O7 à O10 a-t-on une seule et mêmeintervention, répartie sur 7 tours de paroles (4 pour l'opératrice, 3 pour le corres-pondant) : oui alors vous avez un train à 7h 11 (7h 11) Paris gare de Lyon (oui)arrivée Nevers à 10h 19 (10h 19) c'est un corail 1ère et 2ème classe.

79

- Il s'agit d'autre part (cf. C3 et C5 pour oui ; O3 et C4 pour les phénomènesd'écho) d'une réelle participation à l'interaction, d'un signe approbatif effectif, reçu etsignalé comme tel par l'interlocuteur. Alors qu'en tant que phatiques, les oui et lesphénomènes d'écho sont presque exclusivement le fait des correspondants (leurimportance dépend donc du comportement langagier de chacun d'eux), ils émanentici de l'un ou de l'autre des interlocuteurs. Dans ces cas, le modèle genevois estd'ailleurs parfaitement opératoire (cf. C2-O5), puisque ce qui pourrait n'êtreconsidéré que comme une ponctuation approbative est ressenti comme uneintervention réactive d'approbation, incluse dans un échange réparateur subordonné,et qui donne lieu à un oui qui a également valeur d'intervention réactive. L'échangeest ainsi clos, et la complétude interactionnelle réalisée.

Exemple 6a : interaction homme-hommeO1 : SNCF bonjour

C1 : bonjour mademoiselle les heures de train de Nevers pour Nevers s'il pour Nevers s'il vous plaît

O2 : oui pour quandC2 : e pour le 26 décembre

03 : pour le 26 décembreC3 : oui

O4 : dans la matinée dans l'aprèsC4 : dans le matin la matinée

O5 : dans la matinée oui vous ne quittez pas s'il vous plaîtC5 : ouiC6 : merci ..........

O6 : allôC7 : allô oui

O7 : oui alors vous avez un train à 7h 11C8 : 7h 11

O8 : Paris gare de LyonC9 : oui

O9 : arrivée Nevers à 10h 19C10 : 10h 19

O10 : c'est un corail première et deuxième classeC11 : oui

O11 : sinon vous en avez un à 8h 45C12 : 8h 45

O12 : également corail première et deuxième classeC13 : oui

O13 : arrivée 10h 52C14 : 10h 52

O14 : alors je sais pas vous voulez plus tôt plus tardC15 : plus tard si vous avez oui

O15 : plus tardC16 : plus tard jusqu'au début de l'après de l'après-midi quoi

O16 : ouiC17 : hein

O17 : alors j'en ai un à 10h 53C18 : 10h 53

O18 : arrivée 13h 38C19 : 13h 38 ... très bien bon ben ça ira comme ça allez c'est parfait bon ben je vous remercie mademoiselle

80

Exemple 6b : interaction homme-machineM1 : SNCF bonjour quels renseignements désirez-vous obtenir

C1 : je voudrais connaître les trains vendredi 28 décembre Paris Clermont-Ferrand le matin.

M2 : vers quelle heure désirez-vous partirC2 : ben le matin

M3 : ne quittez pas ..........M4 : un corail première et deuxième classe part de Paris gare de Lyon à 7h 02mn arrive àla gare de Clermont-Ferrand à 10h 47mn ce train vous convient-il

C3 : non plus tardM5 : un corail première et deuxième classe part de Paris gare de Lyon à 8h 45mn arrive àla gare de Clermont-Ferrand à 12h 40mn ce train vous convient-il

C4 : parfait merciM6 : désirez-vous d'autres renseignements

C5 : non merci

Comme on peut le constater dans l'exemple 6b, qui est parfaitement représentatifde l'ensemble des dialogues de la phases II, cette dissociation interventions/tours deparole disparaît totalement. Les interventions de type M3 (ne quittez pas) mises àpart, l'ensemble de la communication (de l'«incursion» pourrait-on dire) est chevillédans un système d'échanges extrêmement rigide. Il n'y a tout d'abord pasd'échange confirmatif d'ouverture à deux interventions. Les échanges réparateurssont ensuite principaux ou subordonnés, mais ils comportent tous deuxinterventions, la première à caractère initiatif, et la seconde à caractère réactif. Depuisla première intervention (C1) jusqu'à la réalisation de la complétude interactionnelle(C4), chaque intervention non incidente (M2 C2 : vers quelle heure désirez-vouspartir / ben le matin) comporte à la fois soit une réponse et une demanded'évaluation (M4 : un corail ... ce train vous convient-il), soit une évaluation et unenouvelle question (C3 : non plus tard). On trouve enfin systématiquement un beléchange confirmatif de clôture (M6 C5).

Le problème de la recherche d'information (M3 : ne quittez pas) est toutaussi révélateur. Cette intervention reste formellement en suspens, et nous l'avonsspontanément classée dans les phénomènes de liaison dont notre modèle n'avait pasà rendre compte. Cela fait en effet partie du rituel de la tâche de renseignementhoraire SNCF que de prendre le temps de rechercher l'information. En phase I enrevanche (cf. exemple 6a), cela donne lieu à un échange subordonné à troisinterventions, selon le schéma classique : une intervention initiative, suivie de deuxinterventions réactives, ce qui permet d'atteindre la complétude interactionnelle. Paropposition à la situation de communication homme-homme, on peut égalementconstater qu'il n'y a pas d'acte subordonné et que, sauf très rare exception, lesinterventions se réduisent aux seuls actes directeur. C'est bien entendu laconséquence de l'absence volontaire de psychologie dans ce type decommunication : les correspondants ne se soucient plus d'argumenter leurs requêtesou de prévenir un éventuel contre argument de leur interlocuteur. En d'autre termes,ils ne font aucune observation causale, consécutive ou adversative.

La même analyse pourrait d'ailleurs être faite à partir de la théorie des faces[Goffman 59] que nous avons déjà évoquée. Celle-ci stipule que nous sommesguidés, dans notre comportement dialogique, par la volonté de ne pas perdre la face,qu'il s'agisse de notre face positive (image que l'on donne de soi), ou de notre face

81

négative (intégrité de notre territoire). En situation de communication homme-machine, la machine n'a, par définition, pas de face à défendre et de ce fait nous neressentons pas le besoin de défendre les nôtres. On comprend ainsi que lesinterventions des correspondants ne s'entourent pas des mêmes précautionscirconstancielles que face à un opérateur humain. De la même manière, les oui ou lesphénomènes d'écho, qu'ils soient de simples ponctuations approbatives ou qu'ilsparticipent à l'interaction disparaissent presque totalement. C'est d'ailleurs ce quiexplique que, pour une négociation d'importance équivalente, il y ait besoin de troisou quatre fois plus d'échanges dans un cas que dans l'autre. On ne rencontred’aileurs que 7 occurrences de phénomènes d'écho dans la phase II.

On constate ainsi que le modèle genevois, avec tout ce qu'il met en oeuvre, estnécessaire si l'on veut prétendre rendre compte de communications homme-homme,avec toute la complexité psychologique et interactionnelle que cela suppose. Ildevient ainsi inutilement complexe avec des communications homme-machine danslesquelles le cadre sémantique correspond au cadre formel. C'est d'ailleurs la raisonpour laquelle un modèle sémantico-formel simple comme le nôtre est inadéquat dansun cas et plus efficace dans l'autre. Dans un cas, l'échange et l'intervention sont desunités sémantiques (et plus précisément argumentatives) qui ne recoupent qu'enpartie les unités formelles que sont les tours de parole. Dans l'autre, ce sont desunités sémantico-formelles qui recoupent presque systématiquement les tours deparole. Dans un cas, les actes de langage sont nécessaires pour démêler lacomplexité de l'argumentation et recomposer le fonctionnement d'interventionscomplexes. Dans l'autre, l'analyse n'a plus besoin d'être aussi sophistiquée, et lanotion même d'actes de langage devient, sinon caduque, du moins largement inutile.

2. Les requêtes

Pour tenter d'évaluer l'incidence de la présence de la machine dans lecomportement langagier du locuteur, on va maintenant s'intéresser aufonctionnement des énoncés, et en l'occurrence des requêtes. On va ainsicomparer des énoncés ou des structures linguistiques comparables, produits d'unepart en situation de communication homme/homme et, d'autre part, en situation decommunication homme/machine. Il convient bien entendu de souligner auparavantque, dans ces dialogues téléphoniques, l'opératrice est une ergonome, et non uneprofessionnelle expérimentée de la SNCF, et que, en fait de machine, les témoinsn'ont affaire qu'à une voix mécanisée. Rappelons également que nous ne ferons iciporter l'analyse que sur les demandes initiales. Deux raisons justifient l'importanceaccordée à celles-ci. D'une part ce sont ces demandes qui constituent la base de cegenre de communication. D'autre part, c'est le seul élément que l'on puisseintégralement prendre en compte, car, dans le corps des communications, le dialogueest mené par un compère, ce qui conduirait à faire autant porter les analyses sur samanière de conduire le dialogue que sur l'incidence de la présence de la machine surle comportement langagier des témoins.

82

Il s'agira pour l'essentiel de s'appliquer à relever et à caractériser les écarts quipeuvent exister par rapport à la structure de base (SVI SNT GD GA J PH), que l'ontrouve par exemple dans : je voudrais savoir / les horaires de train / pour e Paris /Amiens / les e vendredis / à partir de 12h (cf. infra, pp. 61-70). Le problème estdonc, à partir d'une structure considérée comme stable de relever et de classer lesdifférentes formes d'instabilités :

- Celles-ci peuvent tout d'abord toucher à la structure : si la successionESPACE/TEMPS est de loin la plus fréquente, on trouve des structuresTEMPS/ESPACE, ou bien des enchevêtrements divers, notamment lorsque lescorrespondant disjoignent GD de GA ou J de PH.

- Les instabilités peuvent également prendre la forme d'omissions, les plusfréquentes concernant GA ou J.

- Il peut s'agir de rajouts qui, de taille variable, peuvent être considérés commedes éléments inutiles, qu'ils ne soient porteurs d'aucun élément référentiel, ou qu'ilsvéhiculent des informations purement accessoires, pour l'exécution de la tâche toutau moins.

- On peut enfin aborder les problèmes d'instabilité à travers l'étude desredondances, des périphrases ou des phénomènes de non normativité et s'intéresser,à l'intérieur d'une même demande, aux différentes formulations d'une informationdonnée.

On examinera les questions d'instabilité sous six rubriques au traversdesquelles se posent les problèmes suivants :

- L'étude du SVI (2.1.) et du SNT (2.2.) pose, de manière générale, le problèmede l'accessoire. Ce sont deux éléments en définitive superflus. Dire Je voudraissavoir lorsque l'on s'adresse à un service de renseignements quelconque est pardéfinition inutile. Ajouter l'horaire des trains auprès d'une opératrice de la SNCFl'est presque autant. Ce sont des propos de nature plutôt phatique que référentielle.La meilleure preuve en est qu'ils peuvent être parfaitement ignorés, comme c'est lecas dans bon nombre de requêtes (alors le direct e pour demain c'est-à-dire le le28 le 29 le 29 décembre pour Auxerre en direct).

- Les références aux notions d'espace et de temps, RS (2.3.) et RT (2.4.) posentplutôt le problème des omissions. Dans de nombreux cas en effet, gare de départ,gare d'arrivée, jour de départ ou plage horaire sont omis. Cela tient au fait que ladécision par défaut est souvent possible. Ce ne sont cependant pas des élémentsinutiles, car l'opératrice est très souvent encline à formuler des demandes deprécision, et on peut considérer que les demandes les plus stables sont celles quiévitent ces décisions par défaut, et qui n'hésitent pas à lever toute ambiguïté virtuelle.

- Les éléments excédentaires (EE), c'est-à-dire totalement inutiles à l'exécutionde la tâche, posent le problème des rajouts (2.5.). Nous avons choisi l'exemple des'il vous plaît, et il est intéressant, d'une part, de voir quelle est sa fréquence danstelle ou telle partie du corpus et, d'autre part, de constater combien, à l'instar desappuis du discours comme bon ben hein ou quoi, sa place est manifestement régiepar certaines règles.

- L'ordre ESPACE/TEMPS ou TEMPS/ESPACE pose enfin le problème de lastructure des énoncés (2.6.), les références spatio-temporelles constituant l'ossatured'une demande d'horaire, et il convient d'examiner si une même structure prédominedans la totalité du corpus, que la voix soit naturelle ou mécanisée.

83

2.1. Syntagme verbal introducteur (SVI)

Le SVI peut se constituer de trois éléments : un verbe de demande ou de souhait(aimer / vouloir / désirer / pouvoir), un participe passé (lorsque ce verbe est à untemps composé) et un infinitif (savoir / connaître / dire / donner). Le témoin peutpar ailleurs recourir au conditionnel et, éventuellement, à l'inversion du sujet ou aumorphème interrogatif est-ce que. On a alors des SVI qui se présentent ainsi que lerappelle l'exemple 7

Exemple 7 : diverses formulations du SVI.j'aurais vouluje voudraisj'aurais voulu avoirest-ce que vous pourriez me donnerpouvez-vous me direje voudrais savoir

Nous nous sommes surtout intéressé aux cas où le SVI était présent, en nousdemandant s'il était possible de conclure qu'il était plus ou moins étoffé en phase Iqu'en phase II. A cet effet nous avons dénombré dans la figure 1 les conditionnels,les participes passés (recours à un verbe composé), et les infinitifs. On peut yconstater que la différence est minime bien que constante. On peut donc en conclureque le SVI est systématiquement plus fourni dans la première phase que dans lasuivante. La présence de la voix mécanisée pousse en somme les témoins à réduirece qui ne relève pas directement de la fonction référentielle.

Conditionnels I 56 = 87,5I I 91 = 75%

Part. Passé I 11 = 17,2I I 7 = 5,8%

Infinitif I 52 = 81,2% I I76 = 63,3%

Figure 1 : composition proportionnelle du SVI

2.2. Syntagme nominal indiquant la tâche (SNT)

Le SNT peut posséder de 1 à 4 mots-clés, qui font en général partie des champssémantiques de heure/horaire, départ, train ou TGV, comme on peut le voir dansl'exemple 8. A l’instar du SVI, le SNT n'a pas de fonction référentielle effective.Comme ce n'est pas le premier élément de la structure de base de nos demandesd'horaire, on peut cette fois accorder quelque crédit aux cas d'omission, même dansla seconde phrase. Nous nous sommes par ailleurs intéressé à l'étendue de ce SN, etnous avons dénombré, dans la figure 2, les demandes qui ne possèdent pas de SNTet celles dont le SNT possède 1, 2 ou 3 éléments.

Exemple 8 : diverses formulations du SNT.l'horaire du trains'il y a un trainl'heure du premier train

84

les horaires des trainsl'heure d'un trainà quelle heure il y a un trainhoraireles heures de départ(le renseignement suivant) à quelle heure part un train

Omission du SNT I 5 = 7,8%I I 13 = 10,8%

SNT à 1 élément I 15 = 23,5%I I 27 = 22,5%

SNT à 2 éléments I 40 = 62,5%II 75 = 62,5%

SNT à 3 éléments I 4 = 6,2I I 5 = 4,2%

Figure 2 : composition proportionnelle du SNT

On ne peut relever dans ces données aucune différence notable entre la phase Iet la phase II. Cela tient peut-être au fait que le SNT est moins accessoire que leSVI. Même si la majorité des appels concernent les demandes d'horaire, il n'est pastotalement inutile de préciser d'emblée si la demande que l'on va formuler va traiterdes horaires, des prix ou du fonctionnement du service autos-couchettes. Toutcomme un éventuel interlocuteur machine, l'interlocuteur humain a immédiatementbesoin de saisir quelle est la nature de la tâche dont on débat. C'est sans doute laraison pour laquelle les témoins procèdent inconsciemment de la même manièredans les différentes phases.

2.3. Références spatiales

Les références spatiales (GD/GA) peuvent être données partiellement, c'est-à-dire que la gare de départ n'est pas toujours mentionnée (il s'agit alors de la gared'appel : Paris). Elles peuvent être fournies soit de manière directe soit parl'entremise de locutions ou de termes introducteurs, ceux-ci constituant un micro-système qui ne laisse guère de confusion possible qu'avec pour (un train pourDijon pour 10h) . Envisagées seules, ces indications spatiales ne posent guère deproblème de structure. Sauf rares exceptions (2 en phase I, 5 en phase II), l'ordre estGD / GA. Les locutions ou les termes introducteurs sont par ailleurs les mêmes enphase I qu'en phase II, et leur fréquence est similaire. Dans la figure 3, il nous adonc semblé plus particulièrement intéressant de dénombrer, d'une part, les mentionsde GD, c'est-à-dire les cas où la décision par défaut n'est pas nécessaire et, d'autrepart, les omissions de GA, c'est-à-dire les cas où une demande de précision s'avèreindispensable.

De façon globale, on peut conclure de ces données que les demandes sont pluscomplètes en phase II qu'en phase I, c'est-à-dire que leur structure est plus stable carles données spatiales sont plus précises. GD étant plus fréquemment mentionné, lesdécisions par défaut sont plus rarement nécessaires et surtout les omissions de GAétant quasiment inexistantes, les demandes se suffisent à elles-mêmes. Si ladifférence est aussi nette, c'est vraisemblablement parce que la voix mécanisée incite

85

les locuteurs à ne pas attendre de confirmations transitoires à caractère phatique (oui/ je vois / phénomènes d'écho ...).

mention de GD I 35 = 54,7I I 68 = 65,7%

omission de GA I 12 = 18,8I I 2 = 1,7%

Figure 3 : représentation proportionnelle des RS.

2.4. Références temporelles

Les références temporelles se présentent de façon plus complexe que lesréférences spatiales. Elles peuvent être introduites de manière analytique (demain enfin de soirée) ou de manière synthétique (ce soir). Elles sont ensuite souvent floues :si à partir de 16h est très clair, dans la soirée ou vers les 16h laissent libre cours àdes interprétations diverses. Il reste enfin les sources de confusion que peutconstituer l'utilisation de prochain ou de partance dans des formulations comme leprochain train, dimanche prochain, en partance ou en partance de.

Exemple 9 : différentes formulations des RT.vers les 12h45samedi matinle dimanche soir vers e 18hen partancece soir vers 21hpour ce soirdemain matin voulant partir de 8h à peu prèspour e cet après-midi

Comme précédemment à propos des références spatiales, le micro système desmarqueurs de référence temporelle est sensiblement le même dans la totalité ducorpus. Nous nous appliquerons plutôt, dans la figure 4, à relever les cas d'omissionou d'incomplétude de J et de PH.

présence de J I 39 = 60,2II 83 = 69,2%

présence de PH I 36 = 56,2%II80 = 66,7%

omission des RT I 19 = 29,7%II15 = 12,5%

Figure 4 : représentation proportionnelle des RT.

Ici aussi, on peut constater que les demandes de la phase II sont plus précisesque celles de la phase I. Il est notamment beaucoup plus rare qu'il n'y ait aucuneréférence temporelle, ce qui suppose nécessairement une demande de précision. Demanière plus fine, on peut par ailleurs remarquer que, alors que J est présent dansune proportion relativement similaire dans la totalité du corpus, PH l'est de façonbeaucoup plus nette lorsque la voix est mécanisée. Les locuteurs se sententmanifestement enclins à ajouter un élément supplémentaire, qui évitera une demande

86

de précision. Ils s'efforcent donc, dès l'énonciation de la requête liminaire, de réduireles phénomènes d'interaction et abréger autant que possible le dialogue à venir.

2.5. Éléments excédentaires

La structure d'une demande d'horaire sera d'autant plus stable que des élémentsextérieurs à cette structure interviendront peu. Comme on l'a constaté, on n'en relèveguère, ce qui rend la problématique dite des «noyaux informatifs» peu productivesur un semblable corpus. Il en existe cependant quelques uns, de nature trèsvariable. Comme ils n'ont guère de sens hors contexte, on a schématiquementrestitué, dans l'exemple 10, la structure de la demande d'horaire.

Exemple 10 : insertions d'EE dans les requêtes initiales d'horaireSVI SNT GA avec un m comme Martine J PHSVI SNT GA s'il vous plaîtGN SVI s'il vous plaît SNT GD J PH s'il vous plaîtSVI SNT GD GA hein SVI SNT PH Jj'aimerais obt le renst svt SVI SNT J GA GD merci

SVI SNT GD GA hein SVI SNT PH JPH SVI SNT GA PH s'il vous plaîtPH SVI s'il vous plaît SNT GD GA J PH

Comme on peut le constater, l'introduction d'un élément extérieur à la tâche vasouvent de pair avec un bouleversement structurel. Évidemment ou hein parexemple servent même d'appuis pour une sorte de rétablissement structurel : l'unindique, a posteriori, qu'une décision par défaut était possible et l'autre, a priori,qu'il y a reprise. Comme on l'a déjà constaté, une exception s'impose toutefois : s'ilvous plaît. C'est un véritable idiotisme fonctionnel qui assume un rôle structurel deponctuation orale, qu'il se trouve en position médiane (il se situe alors toujours entredeux groupes de sens) ou en situation finale. Dans la figure 5, nous nous sommesdonc appliqué à dénombrer ses occurrences et à relever sa place dans les énoncés.

Fréquence I 21 = 32,8%II15 = 12,5%

Sit. médiane I 8II 2

Sit. finale I 13II 13

Figure 5 : représentation de la situation d'un EE comme «s'il vous plaît».

On constate que s'il vous plaît est beaucoup plus fréquent en phase I qu'enphase II (sa valeur phatique intrinsèque y est certainement pour quelque chose : ondit moins volontiers s'il vous plaît à une machine qu'à une standardiste). En situationde communication homme-machine, sa fonction structurelle est d'autant plusmanifeste : 13 occurrences sur 15 sont en situation conclusive, comme une sorte deponctuation orale. Dans la première phase en revanche, on le trouve souvent àl'intérieur des demandes, même si, il est vrai, c'est toujours pour conclure le groupeintroducteur, les RS ou les RT.

2.6. Structure espace/temps

87

Comme on a pu le constater, le problème central réside dans la structure desdemandes d'horaire, c'est-à-dire, pour l'essentiel, dans l'organisation des référencesspatiales et temporelles. Cette organisation est extrêmement diverse et, même s'ilexiste une structure fondamentale, aucun cas de figure ne peut être exclu, comme lerappelle l'exemple 11, qui reprend 4 requêtes initiales.

Exemple 11 : structures sémantiques.j'aimerais connaître l'horaire d'un train direct au pour le samedi 29 e dans la soirée pournanterre (SVI SNT J PH GA)j'aimerais avoir les horaires des trains en en partance de paris-austerlitz e jusqu'à poitiers(SVI SNT GD GA)voilà j'aimerais connaître les horaires pour e revenir de ruffec et arriver donc à paris-austerlitz le mardi 25 décembre (SVI SNT GD GA J)les heures de départ de paris-austerlitz le lundi 24 décembre à destination de blois e audépart entre 10h et 15h (SNT GD J GA PH)

Dans la figure 6, nous nous efforçons de regrouper les diverses solutions sousquatre rubriques. Tout d'abord la structure ESPACE/TEMPS (RS/RT), puis unestructure sans références temporelles (RS), ensuite une structure dans laquelle lesréférences spatio-temporelles sont inversées (RT/RS), et enfin les structuresenchâssées. Ces dernières peuvent être très diverses, tout comme leur degréd'enchâssement. Ce dernier cas de figure est révélateur d'une difficulté dansl'énonciation de la requête : le témoin est presque toujours amené à se reprendre, àrépéter un ou plusieurs des éléments de sa demande. On constate, à partir de cesdonnées, que la structure fondamentale n'est réellement majoritaire que dans la phaseII .

A cet égard, il faut cependant remarquer que c'est dû en grande partie àl'abondance, en phase I, des demandes sans références temporelles, c'est-à-dire àcette tendance à laisser au dialogue le soin de compléter la requête. On comprend dela même manière que les structures RT/RS soient beaucoup plus rares avec voixmécanisée qu'avec voix naturelle : le souci d'éviter que les demandes de précision nesoient nécessaires incite à adapter spontanément la structure fondamentale. Onpourrait en revanche s'étonner que les structures enchâssées soient plus fréquentesdans la deuxième phase que dans la première. La seule explication qui nous sembleplausible réside dans l'effet «déstabilisant» du dialogue avec la machine. Quand lelocuteur conserve une bonne maîtrise de soi, la structure de sa requête a tendance àêtre particulièrement stable. Quand ce n'est pas le cas, l'embarras aidant, le locuteurne sait plus comment s'exprimer et on relève des structures enchâssées.

RS/RT I 29 = 45,3% I I79 = 65%

RS I 1 = 29,5% I I15 = 13,3%

RT/RS I 13 = 20,3% I I14 = 11,7%

Struct. enchâss. I 3 = 4,7% I I12 = 10%

Figure 6 : représentation proportionnelle des structures RS/RT.

88

3. Demandes antérieures et demandes initiales

Avant d'être confrontés à une voix mécanisée, les témoins ont eu affaire à uneopératrice et ils avaient formulé leur demande avant même qu'on puisse leurproposer de dialoguer avec une machine. L'ensemble de la communication ayant étéenregistré, on dispose donc de deux versions d'une même demande, la première enréponse à une voix naturelle, la seconde en réponse à une voix mécanisée. Nouscontinuerons d'appeler la seconde Demande Initiale (DI), et la première DemandeAntérieure (DA).

Au préalable il convient de rappeler (et cela s'applique également à ce quiprécède) que la DI est en fait, en phase II, une reformulation. Les remarques que l'onpourra faire procéderont donc, pour une part qu'il serait très délicat d'évaluer,presque autant d'un contexte de reprise que de l'introduction d'une machine simuléedans le dialogue. Il a été difficile d'obtenir la totalité des transcriptions des DA. Cettecomparaison portera donc sur un échantillon de 120 communications, au lieu des127 prises en compte précédemment. Elle comportera cinq rubriques quireprendront systématiquement les différents éléments de la requête : similitudes(3.1.), enrichissements (3.2.), appauvrissement (3.3.), modifications (3.4.), structure(3.5.).

3.1. Similitudes

Des demandes d'horaire formulées dans des conditions différentes (celapourrait être également le cas pour des reformulations dans des conditionssimilaires) comportent fatalement des divergences, et le problème ne se pose pas enterme d'identité, ne serait-ce qu'à cause de l'intonation. Nous considéreronscependant que la similitude existe lorsque les composants sont identiques et que lastructure des deux demandes est la même. Pour la structure, le problème est simple :SVI SNT GD/GA J/PH doivent être présents ou absents dans le même ordre. Par«nature des composants», nous entendons bien sûr les références spatio-temporelles, mais nous entendons surtout les différents mots-clés. La similitude estforte lorsque l'ensemble des mots-clés reste identique. Elle s'estompe au fur et àmesure qu'ils se modifient. Des énoncés qui commencent par je voudrais savoir ouje voudrais connaître peuvent ainsi demeurer, jusqu'à un certain point, des énoncéssimilaires.

On constate en tout premier lieu que les énoncés concernés dans leur totalité,comme dans l'exemple 12a, sont rares : outre la disparition de la PH, on peutconstater que l'hésitation sur vendredi est remplacée par une hésitation sur belfort etque ces hésitations se matérialisent de façon différente dans les deux énoncés. Lasimilitude est donc loin d'être parfaite, même si elle est plus marquée que dans lescinq autres énoncés qui, sur notre échantillon de 120 requêtes, sont concernés. Celase présente alors comme dans l'exemple 12b.

Exemple 12a : énoncés similaires

89

DA : (bonjour) je voudrais avoir les horaires des trains e belfort paris le vendredi e e e jevendredi 11 janvierDI : je voudrais savoir les horaires de train e ba e bai pardon belfort paris vendredi 11janvier

Exemple 12b : énoncés divergentsDA : je voudrais les horaires de train pour bordeaux samedi alors samedi e demain donc29 et dimancheDI : oui je voudrais les horaires des trains pour bordeaux pour le samedi 29 et le dimanche30

Cette tendance à ne pas conserver intacte la formulation de la DA dans la DItendrait à prouver que l'introduction de la voix mécanisée a une incidenceconsidérable sur le comportement langagier du locuteur. Elle exerce en somme unconditionnement, même si, sur le plan linguistique, les manifestations sont sidiverses qu'il est difficile de les codifier. A ceci s'ajoute enfin que l'introduction de lamachine a une influence immédiate sur la longueur des énoncés et que plus unénoncé est concis plus il est facile de le reprendre sans y apporter de modification.

Le SNT est l'élément le plus constant entre DA et DI (84 demandes sur 120).Cela tient certainement au nombre très restreint de mots-clés qu'il peut comporter.C'est donc l'élément le plus stable de la demande d'horaire. C'est d'ailleurs celui quipermet de sélectionner la tâche. On peut enfin remarquer que, comme dans l'exemple13, lorsque le témoin utilise une formulation particulière dans la DA, on la retrouvedans la DI.

Exemple 13 : permanence d'une formulation originale du SNTDA : (oui bonjour madame) je voudrais divers renseignementsd'abord je voudrais savoir quel est le train le plus commode queje peux e avoir pour être au mans vers 5 heures et demieDI : je voudrais savoir quel est le train le plus commode pour être au mans à 17h30

Pour les SVI, seule la moitié d'entre eux (62 sur 120) restent inchangés, alorsque le nombre des mots-clés qu'ils peuvent comporter n'est guère plus grand quepour le SNT. Cela tient vraisemblablement au fait que, dans la quasi-totalité des cas,la DI débute sur le SVI (alors que la DA débute sur le phatique introducteur) ; larelative fréquence de leurs transformations est sans doute liée à leur rôled'embrayeur.

Moins de la moitié des énoncés (54 sur 120) n'apportent aucune différencesensible aux références spatio-temporelles. Ce qui est surtout remarquable, c'est queles éventuelles modifications structurelles interviennent peu et que cela se manifestegénéralement comme dans l'exemple 14.

Exemple 14 : modifications des références spatio-temporellesDA : (bonjour madame) j'aimerais avoir les horaires des des TGVcet après-midi pour montpellier s'il vous plaîtDI : j'aimerais avoir les horaires du TGV sur montpellier eaujourd'hui cet après-midi

90

On remarque par ailleurs que le jeu des locutions prépositives et desprépositions qui indiquent gare de départ et gare d'arrivée reste le même dans lagrande majorité des cas. On a même le sentiment que cela relève de l'idiotisme, c'est-à-dire que chacun possède, dans sa pratique linguistique, ses locutions usuelles etqu'il tient à les conserver. Il est surtout intéressant, comme précédemment, deconstater cette permanence, même au travers de modifications structurelles. En fait,ce sont surtout les locutions verbales (participes présents et subordonnées relatives)qui ont tendance à disparaître dans la DI, car ce sont les éléments les moinsconcernés. Ils abondent toujours dans les énoncés spontanés comme la DA. Ilss'estompent dès lors que, comme dans l'exemple 15, apparaît une contrainte.

Exemple 15 : disparition d'un SVI inutileDA : (oui bonjour) excusez-moi de vous déranger surtout versmidi est-ce que vous pourriez me donner les horaires de train s'ilvous plaît pour le week-end du 5 janvier au 6 janvier pour lensDI : (alors) je voudrais l'horaire des trains paris-lens pour lesamedi après-midi 5 janvier et retour lens-paris pour le dimancheaprès-midi 6 janvier

En somme, les similitudes entre DA et DI concernent surtout les élémentsporteurs d'information : SNT GD/GA J/PH. Tout ce qui ne fait pas directementpartie de la structure de la demande d'horaire (excepté peut-être s'il vous plaît) prêtedonc aisément à appauvrissement, à modification ou à enrichissement.

3.2. Enrichissements

Étant donné la structure relativement figée d'une demande d'horaire, il existedeux catégories d'ajouts. Il s'agit d'une part de l'apparition, dans la DI, d'un élémentqui manquait dans la DA. Cet élément peut être un des constituants majeurs del'énoncé dans sa totalité, ou simplement GD ou PH. Il s'agit d'autre part del'enrichissement de l'un de ces constituants, c'est-à-dire de la présence d'uneprécision supplémentaire. Chacun des éléments de la demande d'horaire estconcerné, mais celle-ci peut également s'enrichir globalement d'une précisionsupplémentaire comme direct ou par le TGV. Sur notre échantillon de 120 énoncés,il n'y a qu'un cas de DA sans SVI, et celui-ci apparaît dans la DI. Outre cet exemple,seuls quatre SVI s'enrichissent dans la DI, parfois avec les mêmes mots-clés, etparfois avec des mots-clés différents. Le SNT étant le second élément d'un groupeintroducteur, on comprend que les problèmes d'ajouts le concernent aussi peu que leSVI. On ne relève qu'un seul cas de DA sans SNT, et celui-ci apparaît dans la DI.

Le principal enrichissement que la voix mécanisée pourrait inciter à introduireserait certainement GD. On comprendrait en effet que les témoins sous-entendentplus facilement que la gare de départ est Paris dans la DA que dans la DI. Il n'en vacependant pas ainsi, et sur 24 cas d'omission de GD dans la DA, on ne peut releverque 4 exemples où il soit mentionné par la suite. Les références spatiales peuventégalement s'enrichir de marqueurs renforcés d'origine ou de destination. Un trainParis Orléans ou un train de Paris à Orléans peuvent devenir un train au départde Paris à destination d'Orléans. On s'attendrait d'ailleurs à ce que ce typed'exemples soit fréquent. Tel n'est cependant pas le cas, et on ne relève que six

91

exemples d'enrichissement de ce type, et encore certains d'entre eux ne concernent-ils que GD ou GA, alors que GA ou GD peuvent parallèlement s'appauvrir. Lesréférences spatiales peuvent enfin s'enrichir de simples précisions, et notamment dunom de la gare parisienne de départ ou d'arrivée à côté de Paris.

Les références temporelles sont indéniablement plus complètes dans la DI quedans la DA, et les ajouts y sont bien plus considérables qu'à propos des référencesspatiales. Cela s'explique sans doute par le fait qu'une demande d'horaire quin'indique pas la gare d'arrivée et la gare de départ est inconcevable, alors qu'elle estenvisageable sans référence temporelle : chacun sait qu'on doit toujours accéder à laligne de chemin de fer avant de pouvoir chercher l'heure d'un train. Dans la DA, letémoin livre donc immédiatement les références spatiales et laisse au dialogue quis'engage le soin de donner les références temporelles. Dans la DI de la phase II enrevanche, un dialogue réel avec une machine n'étant guère concevable, le témoins'efforce de fournir immédiatement l'ensemble des données nécessaires à l'exécutionde la tâche. On comprend ainsi qu'il y ait, dans notre échantillon, 9 cas d'apparitionde références temporelles et 10 où celles-ci s'enrichissent. L'apparition de référencestemporelles peut concerner J, PH, ou les deux à la fois, comme dans l'exemple 16.

Exemple 16 : apparitions des références temporellesDA : (bonjour) je voudrais avoir les horaires de train pour bernayDI : je voudrais les horaires de train pour bernay samedi en fin d'après-midi

Il peut également s'agir d'une information redondante, telle que l'apparition de ladate à côté du jour de la semaine, alors qu'il était question de la semaine suivante etqu'aucune confusion n'était à craindre. Ce type d'enrichissement, illustré parl'exemple 17, est à mettre en parallèle avec l'apparition de GD : pour le témoin, ils'agit de précisions dont un interlocuteur humain, grâce à ses facultés déductivessans doute, peut se passer, mais dont la machine, vraisemblablement privée de cesmêmes facultés, risque d'avoir besoin.

Exemple 17 : objectivation des références spatio-temporellesDA : (oui bonjour) je voudrais savoir les trains pour nantes le samedi matin s'ilvous plaîtDI : je voudrais savoir les horaires de train pour nantes le samedi 5 janvier aumatin

Les EE sont de loin les éléments les moins concernés par les ajouts et si, commeon l'a vu, ils restent parfois identiques de la DA à la DI, ils n'apparaissent quasimentjamais pour la première fois dans cette dernière. C'est d'ordinaire le contraire qui sepasse et, finalement, les ajouts ne concernent guère que les références temporelles.Force est cependant de constater que, même dans ce cas-là, ils restent très modiques,et que, par rapport aux DA, les DI s'enrichissent bien peu. Les ajouts sont en sommede nature moins quantitative que qualitative et ils confinent bien souvent à de simplesmodifications.

3.3. Appauvrissements

92

A comparer demandes antérieures (DA) et demandes initiales (DI), la premièrechose qui frappe est la concision des secondes par rapport aux premières, que cesoit par la réduction ou par la disparition de divers éléments des demandes. Celaprend parfois des proportions considérables, comme dans l'exemple 18, même s'ilfaut souligner que c'est loin d'être une loi générale et que, de précision ajoutée enprécision supplémentaire, on trouve assez souvent des contre-exemples. Tous leséléments constitutifs de la demande d'horaire sont concernés, mais on comprend quece soient les éléments excédentaires qui soient les plus touchés.

Exemple 18 : concision caricaturale de la DI par rapport à la DADA : (allô bonjour madame) est-ce que vous pourriez me dire les deux prochainstrains e partant pour bruxelles de gare de la gare du nord s'il vous plaîtDI : e les trains pour bruxelles e les deux prochains

Sur 26 DA qui comportent des éléments excédentaires, 16 les perdent dans laDI : e voudrais des renseignements s'il vous plaît les trains les horaires des trainsdevient par exemple bon les horaires des trains. Le préambule métadiscursif,présent dans la DA, disparaît dans la DI. On constate en outre que les reprisess'estompent, voire disparaissent. De ce point de vue, il faut toutefois tenir compte dufait que la DI est une reformulation et que les hésitations interviennent toujours plusfacilement dans une première mouture que dans les suivantes.

Quant il ne s'estompe pas par rapport à la DA, le SVI tend à disparaître de laDI : j'aurais voulu e avoir devient par exemple je voudrais . La réduction du SVI seconcrétise en général par la disparition de l'infinitif et, éventuellement, du tempscomposé. Sa disparition est sans doute liée à son rôle d'embrayeur dans la DI. A ladifférence du SVI, le SNT est rarement concerné par les appauvrissements. Surnotre échantillon de 120 demandes, il ne disparaît que trois fois et ne se réduit quesix fois. Les références spatiales quant à elles s'appauvrissent peu et ne disparaissentjamais. Les réductions concernent seulement les locutions prépositives qui précèdentla gare de départ ou la gare d'arrivée. Tout comme les références spatiales, lesréférences temporelles s'appauvrissent peu. Elles disparaissent toutefois dans troisdemandes, parallèlement aux références temporelles.

3.4. Modifications

Les modifications concernent en fait l'ensemble des transformations qui peuventaffecter les demandes initiales (DI) par rapport aux demandes antérieures (DA).Enrichissements et appauvrissements sont donc concernés, et nous serons amené àreprendre des remarques faites précédemment. Nous considérerons cependant par«modification» les transformations sans ajout ni retrait.

Il s'agit parfois d'un phénomène évident, parfois de quelque chose de plus ténu,comme l'illustrent les deux versions de l'exemple 19. Dans le premier exemple,même si la DI est manifestement plus concise que la DA, il n'y a pas à proprementparler de retrait, mais plutôt la transformation de je voudrais vous demander en jevoudrais savoir et de c'est à quelle heure il y a des trains en l'heure des trains.Dans le second exemple, nous ne nous intéressons pas à la disparition du SVI, maisà la transformation de d'un en du. Cette modification semble plus modeste que la

93

précédente, mais elle est susceptible d'induire des implications tout aussiimportantes. La modification doit simplement être effective, et non pas procéderd'une interprétation discutable de l'enregistrement. Les modifications dont il sera iciquestion ont donc été vérifiées à partir des cassettes. Les énoncés non concernés parles modifications sont rares (une quinzaine au total) et aucun des différents élémentsde la demande d'horaire n'est épargné. Deux problèmes toutefois sont plusparticulièrement intéressants : le lexique des SVI d'une part et, d'autre part, uneévolution du repérage spatio-temporel.

Exemple 19 : modifications de la DI par rapport à la DADA : (allô bonjour madame) je voudrais vous demander c'est à quelle heure ily a des trains le 7 janvier pour rouenDI : je voudrais savoir l'heure des trains pour le 7 janvier pour rouen

DA : (oui bonjour madame) je voudrais connaître le l'heure de départ d'untrain pour troyes demain après-midiDI : le départ du train paris troyes demain après-midi

Les SVI peuvent se transformer par des changements de lexique ou par desvariations modales. Le lexique est en fait restreint : il se limite à quelques verbesutilisés soit comme semi-auxiliaires marquant le désir (vouloir/aimer), soit commeinfinitifs traduisant un apprentissage (avoir/savoir/connaître). Dans les DI de laphase II, le SVI est absent ou bien composé de ces mêmes verbes. On constate ainsique les modifications qui interviennent concourent à la stabilité du SVI, enintroduisant les mots-clés usuels, ou à son instabilité, en retirant ces mots-clés, eneffectuant ce que nous appelons des variations modales. Cela se matérialise souventpar un changement de mode (du présent vers le conditionnel) et par un passage dutemps simple au temps composé. Cette évolution va par ailleurs de pair avec ladisparition de vous c'est-à-dire avec celle de la représentation de l'opératrice dans lesénoncés du témoin, dont on ne trouve pas moins de 6 occurrences dans les DA.

On constate également une évolution parallèle des préambules métadiscursifs.Dans les DA comme dans les DI, ils introduisent une seconde structure SVI/GN(j'aimerais avoir un renseignement... avoir l'heure exacte...), ou un doublement duSN, toujours avec renseignement (je voudrais les renseignements pour le train ...pour les heures de train...). Seules six demandes, sur les 120 de la phase II sontconcernées, alors qu'il y en a douze dans les DA. Dans deux demandes seulement lepréambule métadiscursif demeure. Il est alors sensiblement identiques dans la DA etdans la DI. On peut ensuite relever quatre cas où le préambule métadiscursifapparaît dans la DI et dix cas où il disparaît. Ici encore c'est la tendance à la stabilité,par l'élimination d'un élément redondant, qui l'emporte.

Comme nous avons déjà eu l'occasion de le remarquer précédemment, on peutenfin constater, entre la DA et la DI, une évolution du repérage spatio-temporel.Lorsqu'ils s'adressent à une voix mécanisée, les témoins font moins référence à leur«ici-maintenant», c'est-à-dire au moment où ils parlent et au lieu où ils se trouvent.Cela peut se manifester par des ajouts : celui de la date à côté du jour ou de Paris àcôté de la gare parisienne par exemple. Cela peut également se manifester par desmodifications, ce qui est particulièrement évident dans l'exemple 20.

94

Exemple 20 : modification du repérage spatio-temporelDA : (oui bonjour madame) je voudrais connaître les trains e paris e le mans ece soir à partir de 6 heures DI : horaire des trains paris-montparnasse le mans le vendredi 28 e décembre à partir de 18 heures

Trois indices dénotent ici cette modification du repérage spatio-temporel. Lepremier, qui procède d'un ajout, consiste à indiquer le nom de la gare à côté deParis. Le second réside dans la transformation de ce soir en vendredi 28 décembre,ce qui revient à passer d'un repérage temporel subjectif par le déterminantdémonstratif ce à un repérage objectif à l'aide de la date. Le troisième se trouve dansle passage de 6 heures à 18 heures. Les heures sont ainsi désignées de façonabsolue et non plus de manière relative, en faisant implicitement référence aumoment où on est en train de parler. De façon générale, il faut tout d'abord noter queles modifications vont presque toujours dans le même sens et que les exemples danslesquels on quitte un repérage spatio-temporel objectif pour quelque chose de plussubjectif sont très rares. Les deux phénomènes les plus courants sont ensuite :

- DA : gare parisienne / DI : gare parisienne + Paris . C'est en somme lephénomène inverse de celui qui est présenté dans l'exemple 20.

- DA : jour de la semaine / DI : jour de la semaine + date . Ce phénomène estbeaucoup plus courant que le remplacement du jour par la date.

Il reste enfin, comme dans l'exemple 21, des modifications beaucoup plusdiffuses, qui peuvent avoir une incidence sur le repérage spatio-temporel. Le témoinn'ajoute aucune date, mais en précisant qui vient ou du matin, il rend le repéragespatio-temporel plus objectif. On retrouve cela dans les exemples où les locuteursajoutent aujourd'hui à cet après-midi ou prochain à samedi soir.

Exemple 21 : modification diffuse du repérage spatio-temporelDA : (bonjour) j'aurais voulu savoir les horaires de train pour montereau enseine et marne le dimanche matin j'aurais voulu un train vers 11 heures ouicomme çaDI : je voudrais les horaires de train pour le dimanche e qui vient e pourmontereau en seine et marne j'aurais voulu un une un horaire de train vers11 heures du matin

Ajoutons pour terminer que ce même phénomène se rencontre de façondialogique. C'est par exemple un des seuls cas, en situation de communicationhomme-machine, où le correspondant s'autorise à interrompre la machine présumée,comme on le constate dans l'exemple 22.

Exemple 22 : interruption de la machine présumée pour effectuer unrecentrage spatio-temporel

C7 : ... je voudrais l'horaire de Chartres Paris pour arriver à Paris vers 6hM11 : ne quittez pasC8 : vers 18h hein

En définitive, les transformations apportées aux demandes d'horaire entre DA etDI semblent plus négligeables que les enrichissements ou que les appauvrissements,

95

alors que ce qu'elles contribuent à dénoter, notamment la modification du repéragespatio-temporel, porte peut-être plus à conséquence. Les modifications qui affectentle lexique du SVI vont quant à elles dans le même sens, c'est-à-dire que ce qui serapporte à l'individu, les formules un tant soit peu personnelles, s'estompent, auprofit d'un lexique standard.

3.5. Structure

Sur notre échantillon de 120 demandes d'horaire, on peut relever 61 exemplesdans lesquels la structure de la demande antérieure (DA) n'est pas la même que cellede la demande initiale (DI). Cette structure peut être totalement bouleversée, ou bienà peine modifiée, comme le montrent les deux cas de l'exemple 23, dans lequel, outreles symboles usuels, PM traduit les préambules métadiscursifs.

Exemple 23 : modifications de structureDA : (allô bonjour madame) c'est pour avoir un renseignement pour le vendredi 28pour savoir s'il y a des trains dans l'après-midi pour la direction paris-montparnasselorient

PM J SVI SNT PH GD GADI : j'aimerais avoir un renseignement pour un pour un aller pour paris lorient heinsavoir l'heure exacte dans l'après-midi de vendredi 28 e

PM GD GA SVI SNT PHDA : (bonjour madame) j'aimerais avoir les horaires des TGV cet après-midi pourmontpellier s'il vous plaît

SVI SNT PH J GDDI : j'aimerais avoir les horaires du TGV aujourd'hui cet après-midi

SVI SNT GD GA J

Tant par la description du corpus que par la simple logique, on peut considérer,comme on l'a vu, qu'il existe une structure de base et que chaque demande en estplus ou moins proche. Il est ainsi à la fois fréquent et naturel de commencer par leSVI, suivi du SNT. En général, et il est logique qu'il en soit ainsi, viennent ensuiteles références spatiales, puis les références temporelles. Dans celles-ci, la gare dedépart vient d'ordinaire avant la gare d'arrivée, et le jour avant la plage horaire. Onaboutit ainsi à une formule de six éléments reliés deux à deux :

SVI SNT / GD GA / J PHChaque demande d'horaire se rapproche plus ou moins de cette structure, et ce

qui est intéressant, c'est d'examiner quelle est la structure de la DI par rapport à cellede la DA. Le problème se pose bien entendu lorsque la structure est totalementbouleversée, mais il se pose également lorsque ce sont de simples variations. Il nes'agit pas en l'occurrence des éléments qui, absents dans la DA, apparaissent dans laDI car, même s'ils perturbent la structure de la demande, ils la rapprochent d'unestructure complète. Il s'agit surtout des inversions, qui ne contribuent pas toujours àla stabilité des énoncés. Ainsi, pour les deux cas de l'exemple 24, le premier restituel'ordre J PH, alors que le second scinde le SNT en deux éléments, et transforme unestructure SVI SNT GD GA en SVI SNT GD SNT GD J :

96

Exemple 24 : inversions de structureDA : (bonjour) je voudrais les horaires de train qui bruxelles en fin d'après-midi le

samedi DI : e les horaires de trains qui vont à bruxelles samedi en fin d'après-midi

DA : (oui bonjour) je voudrais les horaires des TGV au départ de paris pour valence s'ilvous plaît

DI : je voudrais les heures de départ de paris par le TGV pour valence en semaine hein le26 ou le 27 décembre

Des trois cas de l'exemple 25 on peut avoir l'impression qu'il ne s'agit pasexactement de la même personne dans la DA et dans la DI. La structure n'est passeule en cause : le lexique est souvent différent et on peut relever à la fois desenrichissements et des appauvrissements. Il y a cependant un bouleversementstructurel, et la structure des DI n'a plus rien à voir avec celle des DA. Dans lepremier cas, le bouleversement structurel va de pair avec un léger appauvrissementde la demande (compte non tenu de la formule de politesse), alors que dans les deuxautres exemples c'est plutôt le contraire. On peut parler d'inversion, car il ne s'agitplus de simples permutations d'éléments identiques, mais à la fois de permutation,d'apparition et de disparition d'éléments souvent différents.

Exemple 25 : bouleversements structurelsDA : (bonjour mademoiselle mademoiselle) je désirerais partir dimanche oulundi à verdun vous pourriez m'indiquer les horaires s'il vous plaît (SVI J GASVI SNT)

DI : je désire partir à verdun e de paris e le dimanche 23 ou le lundi 24 selonles possibilités (SVI GA J)

DA : (bonjour mademoiselle) e pour vendredi départ paris qu'est-ce quevous avez sur dunkerque (J GD GA)

DI : je voudrais au départ de paris sur dunkerque les horaires des trains audépart le matin e e retour dunkerque paris début après-midi (SVI GD GASNT PH SNT GD GA PH)

DA : (oui bonjour) je voudrais renseignement pour les trains qui vont àclermont-ferrand(SVI SNT GA)

DI : je voudrais connaître les trains vendredi 28 décembre paris clermont-ferrand le matin(SVI SNT J GD GA PH)

En définitive, on constate que les modifications structurelles sont très fréquenteset qu'elles peuvent être extrêmement conséquentes. Elles sont en outre loin d'allersystématiquement dans le sens de la stabilité, c'est-à-dire que la structure de la DIn'est pas toujours plus proche de la structure de base indiquée plus haut que celle dela DA. Le problème est cependant complexe et il faut l'envisager, sous forme debilan, avec l'ensemble des remarques concernant la comparaison DA/DI.

97

3.6. Bilan

Si on récapitule l'ensemble des remarques qui ont été faites précédemment etqu'on les rapporte à chacun des éléments de la demande d'horaire, on aboutit auxconstatations suivantes :

- Éléments excédentaires : quant ils ne disparaissent pas, ils s'estompent. C'estpresque une règle absolue. Une exception demeure : s'il vous plaît.

- Syntagme Verbal Introducteur : ils sont souvent omis dans la DI. Quandils ne disparais-sent pas, leur lexique a tendance à recourir exclusivement aux cinqmots-clés indiqués plus haut.

- Syntagme Nominal indiquant la Tâche : il est très rarement concerné.C'est certainement l'élément le plus stable de la demande d'horaire.

- Gare de Départ/Gare d'Arrivée : les références spatiales évoluent peu. Toutau plus peut-on remarquer une tendance à l'introduction de GD dans la DI, lorsqu'ilest absent dans la DA.

-  Jour/Plage Horaire : les références temporelles s'enrichissentconsidérablement. Cela se manifeste autant par l'introduction de J ou de PH que parl'apport de diverses précisions.

Des remarques générales, qui portent peut-être plus à conséquence, s'imposentégalement :

- Les DI sont, dans l'ensemble, beaucoup plus concises que les DA, que ce soitpar le biais de retraits ou de modifications. On relève même de nombreux exemplesdans lesquels la DI est plus concise que la DA, alors que sa structure estconsidérablement plus fournie.

- Tout ce qui fait référence aux personnes du discours, qu'il s'agisse dutémoin ou de la machine, s'estompe ou disparaît. Cela se manifeste par le disparitiondes préambules métadiscursifs, par des variations modales du SVI et par de trèsfréquentes omissions de ce même SVI, ce qui élimine tout «je» de l'énoncé dutémoin.

- Dans le même sens, on remarque une évolution du repérage spatio-temporel. Dans la DA, les témoins se fondent souvent sur leur «ici-maintenant»,c'est-à-dire qu'ils font implicitement référence au lieu où ils se trouvent et au momentoù ils parlent. Dans la DI, cela évolue presque systématiquement, non plus vers unrepérage spatio-temporel relatif, mais vers un repérage spatio-temporel absolu. Onpeut essentiellement le constater par des enrichissements et par des modificationsportant sur GD/GA ou J/PH. Il peut s'agir par exemple de la création du coupleparis/gare parisienne, de la substitution du jour de la semaine par la date, de latransformation de prochain ou de ce en plage horaire, ou du remplacement de 6h par18h.

- On remarque enfin que, bien plus que les DA, les DI tendent à se rapprocherd'une formulation type fondée sur une structure de base : SVI SNT GD GA JPH. Rares cependant sont les demandes qui suivent presque systématiquement lesremarques qui ont été faites et passent d'une formulation originale à une formulationextrêmement stable, comme le met en valeur l'exemple 26 :

Exemple 26 : représentation schématique de l'évolution DA/DI

98

DA : (bonjour) je voudrais avoir un petit renseignement j'aimerais connaître les horaires des trainsle mardi 25 décembre mais partant de province de ruffec en enfin pour arriver austerlitzDI : voilà j'aimerais connaître le les horaires pour revenir e de ruffec et arriver donc à paris-austerlitz le mardi 25 décembreDemande antérieure Demande initialeE E je voudrais avoir un petit renseignement E E ...S V I j'aimerais connaître S V I j'aimerais connaîtreSNT les horaires des trains SNT le les horairesJ le mardi 25 décembre G D pour revenir de ruffecG D partant de province de ruffec G A et arriver à paris aussi.G A pour arriver à austerlitz J le mardi 25 décembreP H P H

Cet exemple pose bien le problème de la stabilité. Avec voilà ... le les ... e...donc ... on pourrait le trouver peu fiable et lui préférer des formulations comme lasuivante, sans prendre garde qu'il est plus complet et que notre propos est decomparer DA et DI : e voudrais avoir les horaires au départ de paris pour vichy lematin. Quoi qu'il en soit, les DI présentent rarement une stabilisation générale parrapport à la DA. Si on peut remarquer que c'est une tendance permanente, c'est parceque s'applique souvent un ensemble de «règles» de stabilisation qui demeurent bienentendu implicites :

- Disparition des éléments excédentaires (s'il vous plaît est à considérerséparément).

- Disparition du SVI, ou limitation du lexique aux cinq mots-clés.- Présence de SNT.- Présence de GD et de GA (GD par défaut doit être Paris).- Présence aussi précise que possible de J et de PH (jour + date/ plage horaire

définie).- Rapprochement de la structure de base.- Tendance à la concision.

A l'aide des trois cas de l'exemple 27, on va voir comment, de manière concrète,ces règles peuvent s'infirmer ou se confirmer :

- Dans le premier, il est impossible de conclure à une différence de stabilitéentre DA et DI. On note la disparition du SVI, de en partance et de s'il vous plaît.Seule en fait la plus grande concision de la DI, pour un apport d'informationidentique, pencherait pour une stabilité supérieure de la DI.

- Dans le second en revanche, la plus grande stabilité de la DI est indiscutable :le SVI limite son lexique aux seuls mots-clés, et surtout la structure se modifie : SVISNT J GD GA PH devient SVI SNT GD GA PH J. On constate certes l'ordre PH Jmais il reste préférable à l'ordre de la DA, qui insère les références spatiales àl'intérieur des références temporelles.

- Dans le troisième, le problème est différent. La disparition du préambulemétadiscursif va dans le sens de la stabilisation. L'absence du SNT tendrait enrevanche à prouver le contraire, alors que la présence d'une PH très détaillée iraitaussi dans le sens de la stabilisation. La structure, de PM SVI SNT GD GA J,devient GD GA J PH, c'est-à-dire qu'elle est tronquée au début et qu'elle se complètevers la fin.

99

Exemple 27 : illustrations de l'évolution générale DA/DIDA : (oui bonjour) je voudrais savoir les e les horaires de train en partant pourchartres à partir de 18h s'il vous plaîtDI : horaire des trains pour chartres après 18hDA : (bonjour) puis-je avoir les horaires pour ce soir de paris lorient vers 19h àpeu prèsDI : j'aimerais avoir les horaires pour paris lorient à partir de 18h30 ce soitDA : (oui bonjour madame) est-ce que je peux avoir un renseignement surles horaires paris tours oui 18 janvierDI : une e paris tours le 18 janvier départ le matin pour arriver à tours vers 9het demie 9h45 e

Les exemples comme celui-ci ne sont pas rares, mais ils ne doivent pas cacher,par rapport à la DA, la tendance générale à la stabilisation des demandes d'horairedans la DI. Il est fréquent qu'elle soit inutile, puisque la DA est parfois très prochede la formulation type. Il arrive alors que la DI s'éloigne de cette formulation, ce quiconduit à se demander si, lorsque la DI est moins stable que la DA, cela tient àl'introduction d'une voix mécanisée, à un contexte de reformulation ou à la syntaxeutilisée par le compère qui simule la machine.

* * *

On peut en définitive considérer que l'introduction de la voix mécanisée a uneinfluence manifeste sur le comportement langagier des locuteurs. Si l'on entend parstabilité la tendance à se rapprocher d'une formulation qui aurait pour structure SVISNT GD GA J PH, l'introduction de la voix mécanisée a une nette influencestabilisatrice. Cela se constate dans la comparaison phase I / phase II, comme dansla comparaison DA / DI. Il apparaît tout d'abord que, si l'introduction de la voixmécanisée a une influence stabilisatrice, nombre de demandes d'horaire n'en ontnullement besoin pour être extrêmement stables. Autrement dit, ce type de questionest tellement orienté par la tâche qu'il paraît relativement modélisable, sans l'influencede quelque contrainte que ce soit. Il n'en demeure pas moins que la phase II est, dece point de vue, en nette amélioration par rapport à la phase I. Il apparaît ensuite qu'ilpeut être dangereux de se fier à des considérations générales qui porteraient à croireque chaque demande d'horaire est concernée, alors qu'un certain nombre d'entre ellesne le sont pour ainsi dire jamais. Comme on a pu le constater à travers les exemplesproposés tout au long de cette étude, quelques-uns d'entre eux reviennent beaucoupplus souvent que d'autres. Cela permet de souligner que les conclusions auxquellesnous avons pu aboutir ne sont en aucun cas des règles. Il s'agit tout au plus detendances, dont les manifestations demeurent souvent sous-jacentes.

Il faut toutefois éviter de minimiser à l'excès l'influence de l'introduction de lavoix mécanisée sur le comportement langagier du locuteur. Les analyses quiprécèdent portent en effet sur le fonctionnement des énoncés, c'est-à-dire là oùl'influence de l'introduction de la machine est le plus difficile à mettre en lumière. Iln'en va pas de même si l'on prend en considération la prosodie ou le dialogue. C'estpourtant dans l'intonation des témoins et dans le déroulement du dialogue que

100

l'influence de l'introduction de la machine dans le comportement langagier deslocuteurs est sans doute la plus manifeste ou, tout au moins, la plus aisémentperceptible. L'intonation tout d'abord obéit à un mimétisme certain, et les locuteurss'efforcent d'adopter le ton monocorde d'une voix dont on a fixé la hauteur ainsi quele rythme lent et régulier qu'adopte le compère. A cet égard, il est certainementregrettable que la médiocre qualité des enregistrements exclue la possibilité del'analyse des phénomènes intonatifs.

Le dialogue est ensuite beaucoup moins interactif. Le compère ne se comportepas comme une opératrice et il renonce à intervenir à tout propos par des phatiquesapprobatifs ou par des phénomènes d'écho. Les témoins lui emboîtent d'ailleurs lepas, et s'efforcent manifestement de fournir des énoncés plus complets, c'est-à-diremoins susceptibles d'entraîner des demandes de précision ou de reformulation, quiactivent l'axe incident, avec tous les risques de quiproquo et d'incommunicabilité quecela comporte. On aboutit ainsi à deux dialogues totalement différents, dont on nepeut prétendre rendre compte à l'aide des mêmes «modèles», si tant est d'ailleurs quece terme ait la même signification dans les deux cas. D'un côté le modèlehiérarchique de l'école de Genève est indispensable pour rendre compte de lacomplexité psychologique et sémantique des échanges. De l'autre se dégage, commeon l'a vu, un modèle beaucoup plus formel, fondé sur une interaction simplifiée parune absence de psychologie spontanément adoptée par l'ensemble des locuteursainsi placés en situation de communication homme-machine.

En matière de comportement langagier induit par la machine, la présente étudereste cependant bien limitée. Il conviendrait en effet d'une part de poursuivre d'autresanalyses à partir d'autres corpus, dont les protocoles d'expérimentation pourraientêtre conçus exclusivement dans cette perspective. Il conviendrait d'autre partd'étendre le champ des investigations, en s'intéressant par exemple aux phénomènesd'intonation ou de mimétisme, et en incluant dans les recherches les dialogues avecentrée au clavier. Il s'agit en tout état de cause d'un domaine nouveau, en pleindéveloppement, à vocation pluridisciplinaire, qui peut déboucher sur nombred'applications concrètes, et qui a certainement vocation à se développer dans lesannées à venir.

101

CHAPITRE 4

L'analyse

Les chapitres 4 et 5 seront consacrés à la présentation de Dialors, système deDIALogue ORal Simulé, qui a pour vocation de se substituer autant que possible àl'opératrice qui simulait la machine dans la phase II du corpus SNCF. Ce systèmede dialogue automatique est simulé dans la mesure où il simule au clavier undialogue qui s'est déroulé au téléphone, c'est-à-dire à l'oral. Il est néanmoinsopérationnel car il fonctionne avec une entrée au clavier. Dialors peut ainsi être testéet apprécié de deux manières fort différentes :

- Dans son contexte, c'est-à-dire par rapport au corpus à partir duquel il a étéconçu.

- Hors contexte, c'est-à-dire indépendamment du corpus SNCF, parcomparaison plutôt avec les divers systèmes de même nature qui ont pu êtredéveloppés.

Dans les pages qui suivent, nous allons donc décrire le fonctionnement ainsique les tenants et les aboutissants d'un programme développé pour l'essentiel en1987. Il serait cependant faux de prétendre que l'essentiel réside dans laprogrammation. Cette dernière en effet a pour finalité de tester une hypothèse, c'est-à-dire de s'inscrire dans un débat. L'hypothèse en question relève bien entendu de laproblématique générale : il s'agit de se fonder non sur des données intuitives etgénérales, mais sur des données attestées, c'est-à-dire sur un corpus. S'il se trouveen somme des phénomènes (termes, formulations ...) qui nous paraissent plausiblesmais que Dialors ne sait pas traiter parce qu'ils ne font pas partie du corpus, nousconsidérerons que la pertinence de ces phénomènes est bien plus en cause que lesperformances du système, d'autant plus que nous ne nous serons pas efforcé de lesintégrer dans Dialors et que, bien souvent, leur intégration ne poserait guère deproblème particulier.

Développer ainsi un système automatique de dialogue à partir d'un corpussuppose une méthodologie extrêmement stricte. Il convient en effet de scinder lecorpus en deux parties, la première constituant le corpus d'apprentissage, et laseconde le corpus d'évaluation. Quel que soit le module de Dialors sur lequel

102

nous travaillons, nous en définirons ainsi les fonctionnalités à partir du corpusd'apprentissage, et nous examinerons les résultats auxquels on aboutit à l'aide ducorpus d'évaluation. A partir du premier, on peut en somme dresser un bilan de cequi a pu être pris en compte et de ce qui a dû être laissé de côté. A partir du second,on peut évaluer la validité des résultats qui auront pu être obtenus, c'est-à-dire voir sile corpus d'apprentissage était suffisamment représentatif de la tâche pour que lesrésultats aient une quelconque valeur générale.

UTILISATEUR

ALORS

DIALOG BD

GENERATION

Figure 1 : schéma général de Dialors

Comme on peut le constater dans la figure 1, Dialors comporte deux modules:

- Un analyseur, Alors, qui a pour fonction de transformer les énoncés proposéspar les interlocuteurs en une représentation interne manipulable par le système.

- Un dialogueur, Dialog, qui décide, en fonction de cette représentation, del'action à mener (recherche dans la base de données suivie d'une réponse, demandede précision ou de reformulation ...).

Outre ces deux modules, qui constituent les deux chapitres qui suivent, Dialorscomporte une base de données et un système de «génération». L'un commel'autre, qui n'entrent pas directement dans le champ de nos préoccupations (notrepropos concerne le dialogue et l'analyse automatiques, et non la consultation«intelligente» des BD ou la génération de phrases), sont en fait extrêmementsimplifiés. Notre objectif en la matière a été d'être simple et efficace, et non d'innover:

- La base de données en question se limite en fait aux seuls horaires Paris-Dreux et Dreux-Paris et, notre travail ne consistant pas à développer une base dedonnées pour la SNCF, nous avons systématiquement transformé pour les tests GDet GA en Paris ou Dreux, de façon simplement à prendre en compte les notionsd'«aller» et de «retour». Il est clair qu'une base de données plus étendue poserait unensemble de problèmes difficiles à résoudre que nous ne nous sommes pas posés, etnotamment celui des trajets complexes avec changements de train et gares de transit.

103

- La «génération» se limite quant à elle à de la restitution de phrases, quiincluent simplement des variables instanciées par le dialogueur.

Un analyseur a pour fonction de transformer des énoncés, en l'occurrence ceuxdes interlocuteurs, en une représentation interne manipulable par le système. Il s'agiten somme d'extraire (et également de coder) les informations nécessaires àl'exécution de la tâche. Cela est vrai de tous les énoncés, mais cela l'est toutparticulièrement des requêtes initiales, c'est-à-dire des énoncés qu'aurait effecti-vement à reconnaître une machine, avant qu'un quelconque dialogue puissecommencer, et modifier à nouveau le comportement langagier des locuteurs. Ce sontd'ailleurs par définition les requêtes les plus complètes et, partant, les pluscomplexes à analyser. C'est donc sur les demandes initiales d'horaire de la phase IIdu corpus SNCF que nous nous sommes fondé pour réaliser notre analyseur. Notrecorpus est ainsi constitué des 125 requêtes initiales d'horaire étudiéesprécédemment. Nous l'avons ensuite subdivisé en deux parties qui constituent lecorpus d'apprentissage (69 requêtes) et le corpus d'évaluation (56 requêtes). Pourune évaluation d'une autre nature (situation de communication homme-machine /situation de communication homme-homme), nous utiliserons par ailleurs le corpusde 120 DA (demandes antérieures) étudié précédemment à propos du comportementlangagier induit par la machine (cf. infra, pp.87-99).

Nous allons maintenant nous intéresser aux principes (1.) linguistiques etinformatiques qui nous ont conduit à sélectionner un type particulier d'analyseautomatique : l'analyse sélective. Nous nous pencherons ensuite sur lefonctionnement (2.) de Alors, mis au point à partir du corpus d'apprentissage. Nousnous étendrons enfin sur son évaluation (3.), en opposant d'une part corpusd'apprentissage et corpus d'évaluation, et d'autre part situation de communicationhomme-machine (DI) et situation de communication homme-homme (DA).

1. PrincipesLes principes de notre analyseur, qui nous ont conduit à pratiquer ce que nous

avons appelé l'analyse sélective (traduction de l'anglais skimming : «écrémage»),sont de deux ordres, et nous les examinerons séparément :

- Les principes linguistiques (1.1.) d'une part, qui définissent les données quidoivent être prises en compte et celles qui peuvent être ignorées. Il s'agit en sommede tirer les conséquences de l'étude des questions SNCF et de la nécessité dedemeurer compatible avec une entrée vocale, même si cette compatibilité reste bienthéorique, fût-ce en tenant compte de l'évolution prévisible des technologies en lamatière.

- Les principes informatiques (1.2.) d'autre part, qui recouvrent l'examen desdifférents types d'analyse automatique susceptibles de convenir, compte tenu ducadre linguistique préalablement défini. Il existe en effet différents typesd'analyseurs, selon leurs finalités respectives et la «philosophie» qui a présidé à leurélaboration.

104

Pour les uns comme pour les autres, l'objectif est de permettre le déroulement dela tâche. La représentation interne d'une requête initiale d'horaire doit ainsi permettresoit une recherche efficace dans une base de données, soit l'énonciation dedemandes de reformulation ou de précision effectivement nécessaires, c'est-à-diresusceptibles d'être acceptées par les interlocuteurs. Tant en ce qui concerne lesdonnées linguistiques que pour ce qui touche les outils informatiques, notre proposest donc d'aller à l'essentiel, de distinguer le nécessaire de l'accessoire, ce qui estrendu possible par la nature constamment explicite de la tâche.

1.1. Cadre linguistique

1.1.1. Structure sémantique

Ce n'est pas la première fois qu'en matière de traitement automatique du langagedes travaux portent sur des tâches qui s'apparentent directement à une consultationde base de données du même type, c'est-à-dire sur des renseignements horaires oudes services de réservation (pour n'en citer que quelques-uns dont le contexte et lafinalité sont souvent différents : traitement automatique de la parole [Levinson etSchipley 80] [Nakatsu et Kohda 80] [Proctor et Young 86] ; dialogue [Bobrow etal. 77] [Bunt 89] [Waterworth 86] ; analyse automatique [Saitta 80] [Allen etPerrault 80] ; ou même ergonomie [Chapanis 80]). Comme nous l'avons vu àpropos de la typologie des dialogues, cela se comprend fort bien, dans la mesure oùles énoncés pris en compte (et également les dialogues qui en découlent), ont pourfonction de compléter une grille qui sous-tend la structure sémantique des requêtes.Cette grille, reprise dans l'exemple 1, est en effet fondée sur les références spatio-temporelles (RS=GD+GA ; RT=J+PH). Le syntagme introducteur (SVI+SNT)joue quant à lui un rôle plus secondaire, puisqu'il se limite à indiquer des élémentsqui peuvent être déduits des références spatio-temporelles, à savoir qu'il s'agit d'unequestion et quel est leur objet (la nature exacte de la tâche). Le dialogue, qu'il soitautomatisé ou non, consiste ensuite à entériner cette grille, à la modifier ou à enconstruire une nouvelle.

En ce qui concerne Alors, le but essentiel a été, comme on peut le voir dansl'exemple 1, d'instancier correctement les variables de l'analyseur, en opérant lecas échéant les transformations nécessaires (des indications chiffréesalphabétiquement à des indications chiffrées numériquement, pour donner unexemple simple). Ces variables sont au nombre de 5 : tâche (T) - gare de départ(GD) - gare d'arrivée (GA) - jour (J) - plage horaire (PH), ce qui signifie que pourl'essentiel le SVI sera considéré comme accessoire et laissé de côté. Le problème esten somme d'accéder le plus commodément possible au sens, en exploitant lescaractéristiques du corpus. Dans l'exemple cité ci-dessus, l'analyseur devrait en outreéviter d'être gêné par les redondances (... les horaires des trains ... les horaires detrain ...) et par les phénomènes de bruit (de ven e vendredi).

Ce genre de tâche est cependant loin d'être une tâche simpliste, car un ensembled'éléments divers doit également être pris en compte, même si ces éléments n'ont pasbesoin de l'être à un même degré que les références spatio-temporelles. L'analyseurdoit ainsi intégrer en permanence des distinctions qui peuvent être relativementcomplexes et qui, par leurs diverses combinaisons, rendent possible l'existence de

105

plus de 300 versions de la même grille (i.e. à partir des mêmes références spatio-temporelles) :

- aller / retour- direct / non direct- train ordinaire / TGV- 1ère classe / 2ème classe- premier train / dernier train- heure de départ / heure d'arrivée- demande directe / demande de confirmation

Exemple 1 : grille d'analysee voudrais les horaires des trains en provenance de château-thierry pour paris et les horaires de train de ven e vendredi soir

T = HORAIREGD = chateau-thierryGA = parisJ = vendredi svtPH = soir

Si Alors s'intègre dans un système qui a pour fonction d'être à même d'effectuerréellement une recherche dans une base de données et de fournir une réponseeffective, il doit impérativement intégrer ces éléments dans sa représentation interne.Ceux-ci, qui posent souvent de délicats problèmes d'interprétation, le seront par unsystème d'attributs, fréquemment instanciés, comme on le verra, par desprocédures de décision par défaut. Il faudra enfin qu'ils soient visualisés dans lagrille d'analyse proposée ci-dessus. Il apparaît en tout cas que, dans une tâche de cetype, la structure sémantique est suffisamment solide pour offrir d'emblée un cadre àl'analyse. Elle ne dispense pas pour autant d'intégrer les aspects syntaxiques etlexicaux. Elle ne peut pas non plus être considérée comme exhaustive, et l'existencede la tâche, son caractère vivant dont attestent les corpus, nécessite l'intégration d'unensemble de points particuliers, dont la nature et la quantité dépendent de la finalitéde l'ensemble du système.

1.1.2. Contraintes syntaxiques

La syntaxe énonciative, c'est-à-dire l'organisation des groupes de sensl'emporte en tout cas sur la syntaxe verbale. Il n'en demeure pas moins que larépartition de ces groupes de sens n'obéit à aucune règle et que tout élément estsusceptible d'être suivi par tous les autres, d'être repris, ou même disloqué (samediaprès-midi 5 janvier). Si la syntaxe au sens de l'organisation des noyaux verbauxou non verbaux a une place secondaire, elle n'est pas pour autant inexistante. Elle estnotamment indispensable pour le traitement de J et surtout de PH. On peut certesdire samedi matin, formulation qui ne nécessite aucune analyse syntaxique, mais iln'en va pas de même lorsque dans la même requête on trouve : entre disons à partirde 10 h le matin.

En fait, une analyse syntaxique est absolument nécessaire dans deux cas :- Pour lever certaines des ambiguïtés, et notamment pour analyser les chiffres.

106

- Pour prendre en compte les noyaux syntaxiques. Si un correspondantdemande ainsi un train entre 8 h et 9 h 30, la représentation interne de ce noyausyntaxique doit permettre une recherche dans la base de données qui considère lesdeux heures proposées comme deux bornes à l'intérieur desquelles le renseignementdoit être trouvé, faute de quoi aucune réponse ne pourra être considérée commesatisfaisante. Dans soit vers 16 h soit 17 h en revanche, les deux heures proposéesne doivent pas être considérées comme des bornes, et la recherche dans la base dedonnées ne doit pas s'effectuer de la même façon, tout comme la réponse proposéen'aura pas à prendre en compte de la même manière un critère d’auto-évaluation(comme il s'agit d'une approximation, l'horaire le plus proche sera par définition labonne réponse, alors que dans l'exemple précédent une réponse non conforme devraêtre considérée comme mauvaise).

Une analyse syntaxique est en revanche accessoire voire inutile dans deuxtypes de cas, et Alors pourra se dispenser de les intégrer dans son fonctionnement :

- En dehors des repères prépositionnels qui peuvent être considérées comme untout (à partir de et aux environs de notamment), prépositions et déterminantspeuvent être ignorés. Ainsi, s'il faut distinguer les indicateurs journaliers précis (IJP)des indicateurs journaliers vagues (IJV), c'est que ces derniers peuvent être précédésdes repères nominaux (RN) début et fin (début/fin de matinée), et non pourdistinguer matin de dans la matinée ce qui, en terme de recherche dans la base dedonnées, revient strictement au même (cf. infra, p. 68).

- Tous les phénomènes syntaxiques complexes, qui ont été relevés dansl'étude des requêtes SNCF peuvent quant à eux être ignorés car ils n'ont aucuneincidence sur l'exécution de la tâche au sens strict. Cela est vrai des oppositionssg/pl dans les SNT (l'/les horaire(s) de/des train(s)), de la syntaxe de départ dansl'heure de départ de Paris / l'heure au départ de Paris, de celle de pour (qui peutindifféremment précéder GD, GA, J ou PH : * pour demain pour 18 h pourChartres/pour Paris Chartres), du jeu des pronoms dans les préambulesmétadiscursifs (PM), ou encore des formulations interrogatives, qui relèvent toutesdu SVI.

L'analyse syntaxique est enfin confrontée aux phénomènes de n o nnormativité qui, compte tenu de la tâche et de la situation de communication, sontmoins fréquents que dans d'autres corpus, mais qui sont suffisamment constantspour poser des problèmes extrêmement délicats, dans la perspective d'une analyseautomatique en tout cas :

- Les phénomènes de bruit, qu'il s'agisse des bruits phonétiques ousyntaxiques posent théoriquement moins de problèmes que les phénomènes dedislocation. Pour les bruits phonétiques en effet il serait simplement nécessaire deprévoir que tout mot est susceptible d'être suivi par un e, y compris lui-même. Pourles phénomènes de grille, leur configuration même, fondée sur la redondance seraitsusceptible de se prêter à une automatisation.

- Pour les phénomènes de dislocation, et notamment pour tout ce qui touche àl'anacoluthe, le problème serait quasiment insoluble. Un énoncé tel que : j'aimeraisconnaître l'horaire d'un train direct au pour le samedi 29 e dans la soirée pourNarbonne serait ainsi extrêmement difficile à analyser automatiquement, ne fût-ceque pour en représenter la syntaxe. De la même manière, même en utilisant lestravaux les plus évolués sur la question, on ne parviendrait vraisemblablement pas à

107

surmonter des problèmes de référence aussi complexes que dans : les trains pourBruxelles e les deux prochains. La caractérisation linéaire enfin ne poserait guère deproblème lorsqu'elle ne conduit pas à disloquer un noyau syntaxique : les horairesde train au départ de Mulhouse pour rejoindre Paris qui circule le vendredi matin.Elle en pose en revanche lorsque le noyau syntaxique est éclaté, comme dans samedisoir prochain .

- Les phénomènes d'organisation, quant à eux sont trop peu formalisablespour être d'un quelconque secours pour un traitement automatique.

1.2.3. Contraintes lexicales

Le lexique susceptible d'être retenu est le vocabulaire relatif à la tâche quipossède au moins deux occurrences :

- Pour les EE, nous avions seulement retenu s'il vous plaît, et il est clair qu'il esttotalement inutile au déroulement de la tâche au sens strict, à moins que l'on nesouhaite doter la machine d'une amabilité à géométrie variable (par exemple enjouant sur la tonalité de la voix de synthèse), ce qui n'est pas notre cas.

- Dans le SI, le SVI peut donc être totalement ignoré alors que, compte tenu dela clarté du champ lexical, un traitement automatique est envisageable. Pour le SNT,seuls heure(s) et horaire(s), peuvent être d'une réelle utilité, dans la mesure où ilsconfirment qu'il s'agit bien d'une demande d'horaire et non, par exemple, d'unequestion portant sur les tarifs : pour heure(s), il faut y associer des contraintessyntaxiques, afin de distinguer l'heure du train de 10 heures 10. Train en revanchen'apporte rien, tout comme départ (à distinguer de au départ de). TGV pose enfindes problèmes particuliers liés au trafic sur certaines lignes. Paris-Dreux n'étant pasconcerné (pas plus que par les voyages en couchettes !), nous pourrons doncl'ignorer. Nous devrons en revanche tenir compte de l'existence de trains «corail»,par opposition aux trains de banlieue, parallèlement à une opposition direct/nondirect (ce qui ne signifie pas omnibus d'ailleurs), qui la recoupe presque totalement.

- En ce qui concerne les marqueurs de GD et de GA, seul au départ de nesuscite aucune réserve : il est suffisamment fréquent pour avoir une réelle utilité (14occurrences), et il est sans ambiguïté susceptible d'indiquer GD dans le cas oùl'ordre GD/GA ne serait pas respecté. En direction de et à destination de peuventjouer un rôle similaire pour GA, mais ils sont nettement moins fréquents (5+3occurrences). Partant de, qui vont à et pour aller à ne peuvent quant à eux êtreconservés que si on est certain de pouvoir faire la différence entre des monosyllabescomme de et à, faute de quoi on risquerait d'induire gravement le système en erreur.

- Pour J et PH, c'est-à-dire pour l'ensemble des RT, tout le vocabulaire concernéest utile, sinon indispensable, à l'exécution de la tâche. Il entre d'ailleurs dans lacomposition des noyaux syntaxiques, quand il ne les constitue pas à lui seul.

Parmi les contraintes d'ordre général qu'il convient de prendre en compte setrouvent les contraintes liées à la compatibilité théorique du système avec une entréevocale. Même si notre propos n'est pas d'intégrer le traitement du signal de parole, ilnous a semblé indispensable, compte tenu de la nature du corpus, d'envisager quellespouvaient être les contraintes qui pouvaient induire une certaine compatibilité :

- Il faut notamment confondre les homophones sous une même référencelexicale, ce qui ne touche guère que l'opposition de/deux. Cela concernera également

108

l'opposition «prix»/«prie», dans l'expression je vous prie, dans la mesure où Alorsdevra reconnaître la nature de la tâche dans les demandes de tarif, même s'il ne saurapas les traiter. Il faut enfin éviter d'utiliser des oppositions qui tiennent seulement àl'accentuation (a/à, ou/où ...) qui, outre le fait qu'elles n'apparaissent pas dans le codeoral, font souvent l'objet d'omission à l'écrit (les accents sont en outre absents desclaviers actuels des Minitel).

- Il convient par ailleurs de ne pas attribuer trop d'importance aux monosyllabesqui, bien souvent, sont impossibles à reconnaître dans de la parole continue. En fait,il faut surtout éviter d'utiliser des monosyllabes en dehors des noyaux syntaxiques,c'est-à-dire dans des situations où la syntaxe ne peut pas aider à la reconnaissance(les possibilités des systèmes de reconnaissance de la parole, et notamment ceux dedétection de mots dans la parole continue, sont très différentes s'ils peuventfonctionner avec ou sans syntaxe : si je voudrais voyager le 2 est plus difficile àsaisir que je voudrais voyager le 2 janvier, c'est que dans un cas la présence dejanvier lève toute ambiguïté). Dans la pratique, cela nous confirme dans la nonintégration des marqueurs de GD/GA complexes tels que partant de, qui vont à oupour aller de, et cela nous interdit surtout de distinguer ce et le lorsqu'ils précèdentdes IJP et que, de ce fait, ils indiquent J (ce/le soir). En fait de monosyllabes, nousne conserverons, outre les chiffres bien entendu, que heure, fin, entre et soir, cedernier seulement pouvant être utilisé seul, c'est-à-dire sans syntaxe.

1.1.4. Bilan

En définitive, ce qui ressort du cadre linguistique du corpus c'est la primautéde la structure sémantique, la simplicité du lexique et, par opposition, lacomplexité de la syntaxe (cette dernière est déjà complexe en elle-même, et lesphénomènes de non normativité n'arrangent pas les choses) :

- Pour la structure sémantique, sa solidité (on connaît par avance quasiment tousles éléments que peut comporter une requête d'horaire SNCF), permet d'envisagerune utilisation extrêmement poussée du contexte (ce que l'on appelle couramment lapragmatique).

- Pour le lexique, on s'aperçoit que sur les 44 items du lexique utile à la tâche,seuls 30 restent en lice, que les 14 autres ne puissent être pris en compte ou qu'il nesoient pas absolument nécessaires à l'exécution de la tâche.

- Pour la syntaxe, il ressort de l'examen qui précède qu'elle n'est nécessaire quede façon locale, et que tout ce qui introduit une excessive complexité peut être laisséde côté.

Lorsque l'on se débarrasse ainsi de tout ce qui, dans l'analyse syntaxique, n'estpas directement nécessaire à l'exécution de la tâche, on a tendance à se retrouver avecune succession de mots pleins qui renvoie au style télégraphique, par ailleurs utilisépar certains locuteurs, et qui, en matière de traitement automatique, évoque ce quel'on appelle un peu sommairement l'analyse par mots-clés [Weizenbaum 66] (cf.infra, p. 12). En fait, cette dernière exclut l'analyse syntaxique et repose sur unprincipe : une reconnaissance implique une action, ce qui élimine la possibilité d'untraitement intermédiaire. En ce qui nous concerne en revanche, nous sommes tenud'effectuer des analyses syntaxiques parfois complexes (* entre 18 h 45 et 19 h 45comporte au minimum 11 items consécutifs à analyser), même si l'exécution de latâche ne nécessite pas l'analyse de toutes les structures de détail. Il apparaît ainsi

109

que, si une analyse par mots-clés serait nettement insuffisante, une analyseexhaustive, qui prendrait la totalité de chaque requête en compte serait tout d'abordpour une grande part inutile, et ensuite quasiment impossible à mener à bien. Ilfaudrait en effet pouvoir intégrer dans l'analyse l'ensemble des phénomènes de bruitet de dislocation, alors même que certains de ces phénomènes (les e notamment) neseraient vraisemblablement pas reconnus par un système de reconnaissance de laparole, quel qu'il soit.

L'analyse qui conviendrait le mieux serait donc une analyse partielle, qui netienne compte que d'une partie des énoncés, et qui n'hésite pas à en ignorer unebonne part. Ce type d'analyse, qui ne fait intervenir la syntaxe que localement, seraiten outre a priori compatible avec un certain type de reconnaissance de la parole, enl'occurrence la détection de mots dans la parole continue [Mariani 85]. Quels quesoient les outils informatiques utilisés, notre analyseur pourra donc se fonder surl'existence d'un lexique très limité reposant sur une structure sémantique sans faille.Il devra en revanche se défier de la syntaxe, qui reste extrêmement complexe et«orale», même dans des énoncés de ce type. Il conviendra donc de privilégier lesstratégies guidées par la sémantique par rapport à celles où c'est la syntaxe quiprime. Ces stratégies ont en outre l'avantage de permettre d'intégrer la limitation de latâche et la structure sémantique qui en découle dans le fonctionnement du système.

1.2. Cadre informatique

1.2.1. Problématique

Un des principaux problèmes de l'analyse automatique du langage, c'est-à-direde systèmes qui ont pour fonction de comprendre du langage, c'est la définitionmême de la compréhension en question (Kayser, dans [Pierrel et al. 84])[Winograd 87]. Selon les systèmes, comprendre c'est ainsi produire un arbre,étiqueter un lexique, effectuer diverses transformations, et afficher un résultat sur unécran. Si ce résultat répond à l'attente des programmeurs, on peut estimer que lesystème a «compris» quelque chose, quelle que soit la nature de la compréhensionen question, qui n'est nullement destinée à des utilisateurs effectifs. Afficher unrésultat, c'est certes effectuer une action, mais une action qui demeure en circuitfermé, qu'il est exclu d'ouvrir sur le réel. S'il est ainsi rare qu'un analyseur aitréellement à effectuer une action, c'est que ce dernier n'est plus alors que l'un deséléments d'un système plus vaste, et notamment d'un système de dialogue. Il devienten effet une interface entre l'utilisateur et le module chargé d'effectuer la tâche, et lacompréhension du système se juge alors à sa capacité à fournir un renseignement, àaccéder à une base de données, ...

Si les facultés de compréhension d'un système se jaugent ainsi auxperformances de sa sortie, elles peuvent également se juger à l'entrée, c'est-à-dire auxénoncés que le système est censé traiter. Les systèmes qui ont pour vocation detraiter la langue dans son ensemble, sont actuellement fatalement destinés à sefocaliser sur un aspect seulement des traitements automatiques du langage, et àproduire du même coup une sortie qui demeure par définition à usage interne. Lessystèmes qui sélectionnent une application ont la plupart du temps moins pour

110

vocation d'effectuer une tâche que de s'en servir pour illustrer un problème de naturebeaucoup plus générale. En ce qui nous concerne, notre propos est d'être à même defournir un renseignement effectif, quels que soient les moyens informatiques utiliséset les problèmes cognitifs que cela peut poser. Alors a ainsi pour vocation de traiteren entrée un sous-corpus précis et limité qui n'est pas simplement l'applicationd'un problème d'analyse plus général : l'ensemble du système a été réaliséexclusivement dans la perspective de traiter ce corpus.

Alors doit par ailleurs s'intégrer dans un système de dialogue, c'est-à-dire êtreà même d'effectuer un certain nombre d'actions, en l'occurrence soit effectuer unerecherche dans la BD, soit se trouver en situation de solliciter une précision ou unereformulation, afin de pouvoir effectuer ultérieurement cette recherche. La grille quenous avons évoquée précédemment n'est ainsi qu'une visualisation transitoire, quidemeurera à usage interne, surtout destinée à mettre au point et à évaluer notreanalyseur. En extrayant cette grille de chaque requête, Alors a moins la prétention decomprendre la totalité de la requête que de reconnaître certains des éléments qui lacomposent. Une compréhension tout à fait partielle suffit donc, qui se satisfait duseul contenu référentiel. Notre but n'est pas d'obtenir un analyseur qui dispose depuissantes facultés virtuelles, susceptible par exemple de traiter une grande variétéd'énoncés. Comme nous disposons d'un corpus représentatif, l'analyseur a pourseule fonction de traiter ce corpus. Il peut certes se trouver des formulations quiviennent à l'esprit et que l'analyseur soit incapable de traiter efficacement, mais nousconsidérons dans ce cas que c'est la pertinence de ces formulations qui est en cause,et non les performances de l'analyseur, d'autant plus que ce dernier est en faitcapable de traiter une grande variété de formulations possibles. La distinction entrecorpus d'apprentissage et corpus d'évaluation a pour fonction de tester la couverturedu corpus par rapport à la tâche.

En définitive, aucun préjugé ne guide l'implantation de l'analyseur. Il ne s'agitpas d'utiliser telle ou telle technique d'analyse, de développer tel ou tel aspect del'analyse automatique du langage, mais plutôt d'être aussi efficace que possible, c'est-à-dire de privilégier les procédés les plus simples et les plus rapides.

1.2.2.. L'analyse sélective

Une seule approche de l'analyse automatique pratique effectivement ce qui, àl'analyse des corpus, apparaît comme une quasi nécessité, à savoir l'analysepartielle. Il s'agit du système Frump, développé par G. De Jong à Yale, dansl'équipe de R. Schank, qui a pour objectif de fournir un résumé de dépêchesd'agences de presse en plusieurs langues, autour des thèmes du terrorisme et descatastrophes naturelles notamment. Ce système ne lit pas les dépêches : il les«écrème» (to skim). La forme d'analyse partielle que nous proposons, l'analysesélective, est directement issue de cette approche [De Jong 79 et 82].

Sur le plan linguistique tout d'abord, l'analyse partielle apparaît d'une partcomme une nécessité, et d'autre part comme un facteur d'économie. L'abondance etla présence virtuellement constante des phénomènes de bruit et de dislocationrendent en effet nécessaires d'ignorer une bonne part des requêtes, et par là-même defocaliser l'analyse sur une partie seulement de celles-ci. Parallèlement, ignorer une

111

bonne part de l'énoncé est un facteur d'économie considérable, à condition bienentendu que cette sélection se fasse avec discernement. Ces observations dépendentévidemment des caractéristiques du corpus, qui relève, comme on l'a vu, de la langueparlée. L'analyse partielle nous paraît toutefois présenter un intérêt même à l'écrit,notamment parce que c'est un facteur d'économie de traitement, et parce qu'ellecomporte un certain fondement psychologique : une telle approche correspond trèsvraisemblablement à notre façon de lire et de comprendre dans un bon nombre decas. Dans une situation contextuelle explicite en effet, il est fréquent qu'on ignoredélibérément la majeure partie d'un texte pour ne rechercher et ne retenir quel'information qu'on y recherche, indiquée en majuscules dans l'exemple 2.

Exemple 2 : texte de la vie courante dans lequel on se satisfait d'unelecture partielle.AVIS IMPORTANT

Les voyageurs sont avertis qu'en raison de problèmestechniques indépendants de notre volonté les trains àdestination de DREUX auront du RETARD jusqu'à DEMAINMATIN

Sur le plan informatique, l'analyse partielle nous paraît devoir être située commeune prolongation des méthodes utilisées dans les premiers systèmes de traitementautomatique du langage, tels qu'Eliza [Weizenbaum 66] ou que Parry [Colby et al.71] notamment, qui simulent soit un psychothérapeuthe non directif, soit un sujetparanoïaque et qui ont pour caractéristique de donner l'illusion de comprendreremarquablement bien alors qu'il n'en est rien et qui datent des années soixante. Cesméthodes utilisent la technique dite du pattern-matching, c'est-à-dire qu'ellesprocèdent à une reconnaissance des formes, pattern signifiant littéralement«modèle», «échantillon», «patron», et to match «apparier», «assortir». Cesméthodes, souvent improprement qualifiées de méthodes par mots-clés , ont pourprincipe de déclencher non une véritable analyse, mais une action à la simplereconnaissance d'un mot ou d'une séquence de mots dans l'énoncé à traiter. L'actionest en l'occurrence généralement une réponse, et le même principe peut être utilisépour la génération, par l'insertion de «patrons», en tant que variables dans unechaîne de caractères stockée dans le système. Winograd [Winograd 83] classed'ailleurs Frump parmi les systèmes utilisant la technique du pattern matching, à lasuite d'Eliza ou de Parry. Il souligne simplement que De Jong utilise desconnaissances sémantiques, et pratique une certaine forme d'analyse syntaxique.L'analyse partielle ne se limite donc pas nécessairement à une détection de mots-clésou à la reconnaissance de séquences qui peuvent à la rigueur inclure des variables,car entre détection et action peuvent intervenir toutes sortes d'analyses, qui peuventrequérir des connaissances syntaxiques, morphologiques, sémantiques oupragmatiques.

Le système Frump (Fast Reading Understanding and Memory Program) [DeJong 79], tout comme son successeur IPP (Integrated Partial Parser) [Schank etal. 79], est directement issu des théories de R. Schank, et notamment de la définitionet de l'utilisation de la notion de scénario, traduction de l'anglais script, de celle debut et de plan, exposées notamment dans [Schank et al. 77] (voir également [Sabah

112

88], pp. 272-287), ainsi que de celle de MOPs (Memory Organization Packets)[Dyer 1983]. Un scénario se présente comme un schéma dynamique, propre àreprésenter des situations et des actions aussi bien que des connaissances. Il estfondé sur l'idée que comprendre c'est en somme saisir une différence par rapport àun état antérieur. Il apparaît ainsi comme impératif de donner à un système auquelon souhaite conférer la possibilité de comprendre une représentation du mondepropre à lui permettre de saisir quand émerge une différence par rapport à un étatantérieur ou par rapport à l'état initial. Un scénario permet de prévoir quels sont leséléments et les actions qui sont susceptibles d'apparaître dans un univers donné, demême qu'il permet éventuellement de procéder à des décisions par défaut. Il nepourra toutefois être utilisé que lorsqu'il aura été identifié et activé.

Frump s'inspire en partie des systèmes SAM et PAM, précédemmentdéveloppés dans la même équipe, et repris dans [Schank et Abelson 77]. Cesystème, tout comme l'ensemble de ces recherches, est fondé sur le sentiment qu'ilconvient de privilégier les approches descendantes, par rapport aux approchesmontantes, c'est-à-dire de restituer, pour la compréhension automatique du langage,le caractère prédictif de la compréhension humaine. C'est en effet ce caractère quinous permet entre autres de lever les ambiguïtés ou d'identifier les référents, en nousmettant en situation de connaître a priori les structures syntaxiques, les catégoriessémantiques, les types de discours ... à venir. Le gros problème qui demeure estalors celui de l'identification du «bon» scénario. En ce qui concerne lacompréhension humaine, elle ne se trouve jamais, sauf situation réellement anormale,totalement dépourvue de contexte, et nous sommes en outre capables de nousadapter instantanément à un nouveau contexte. Un système de compréhensionautomatique a en revanche bien du mal à activer le «bon» scénario au «bon»moment. Il doit donc, avant de pouvoir fonctionner de façon descendante, procéderde façon ascendante, c'est-à-dire qu'il ne peut faire d'emblée jouer son efficacité.

Ce défaut intrinsèque de l'analyse prédictive nous incite à considérer avec uncertain scepticisme les systèmes qui, à l'instar de Frump, se déclarent «domainindependent», c'est-à-dire non dépendant de la tâche. Il apparaît en effet que, comptetenu de l'extrême difficulté que rencontrent les systèmes à choisir le «bon» scénario,les approches prédictives de la compréhension automatique du langage ne sontréellement susceptibles d'être efficaces que dans le contexte d'une tâche simple etclairement définie, telle qu'une consultation de BD horaire.

Frump nous intéresse particulièrement parce que c'est à son propos que G. DeJong a avancé l'idée d'analyse partielle, en utilisant le verbe to skim. Frump, qui«comprend» des dépêches d'agences de presse, ne prétend pas les lireexhaustivement, mais simplement les parcourir à la recherche des élémentsimportants, comme le montre l'exemple 3 [De Jong 79]. Selon son auteur, au lieu defonctionner à partir des deux modules classiques, à savoir un analyseur qui produitune représentation syntaxique, et un résolveur d'inférence qui permet d'accéder ausens, il fonctionne à partir de deux modules originaux, respectivement appelés«predicator» et «substanciator». Le premier prévoit itérativement une suite enfonction du contexte, et le second vérifie si les prédictions se réalisent, les entérine etles ajoute à sa représentation dudit contexte. Comme le dit G. Sabah dans [Sabah89], Frump ne se demande pas quel est le sens correct de ce mot ? mais est-ce que

113

ce mot peut remplir le rôle que je veux lui voir jouer ? Frump, tout comme IPP, estdonc un système qui effectue une analyse qui n'est guidée ni par la syntaxe, ni par lasémantique, au sens strict du terme, mais par les prédictions. Dans l'application qui aété développée, les données sont représentées sous forme de 48 sketchy-scripts, ou«scénarios rudimentaires». Les résultats, qui sont présentés comme relativementsatisfaisants, sont en fait plutôt décevants :

- Sur les 368 dépêches arrivées au terminal, 121 comportent des histoires quiconcernent l'actualité, et qui sont donc susceptibles d'être traitées par Frump.

- Sur ces 121 dépêches, Frump ne possède de script que pour 29 d'entre elles. Iln'est donc pas susceptible de traiter les 92 autres.

- Sur ces 29 histoires, 11 sont correctement comprises, et 2 le sont partiellement.

De notre point de vue, Frump reste un système classique, dans la mesure où ilse fonde sur une problématique informatique traditionnelle et non sur uneproblématique linguistique issue de l'analyse de corpus. Il se propose ainsi derésoudre des problèmes classiques, tels que l'ambiguïté lexicale ou la recherche desréférents, et il se donne pour contrainte initiale de séparer les connaissanceslinguistiques générales de celles qui relèvent de la tâche. Cette dernière est ainsi unesimple application. Aucune analyse de corpus n'est effectuée au préalable, le systèmeayant à charge d'analyser des choses qu'il n'a jamais vues, alors qu'il y a fort à parierqu'une telle analyse eût permis, si tel en avait été le but, d'améliorer considérablementles résultats évoqués ci-dessus. En ce qui concerne l'analyse , il est clair qu'il s'agitmoins d'un but que d'un résultat. Une représentation plus fine des scénarios, et unerecherche plus détaillée dans les dépêches, qui aurait pour effet de réduire l'aspectpartiel de l'analyse, apparaîtraient ainsi comme des améliorations. En définitive,l'ambiguïté fondamentale de Frump tient à notre sens dans une contradictionintrinsèque entre le corpus visé et la stratégie utilisée. Suivant les termes mêmes deG. De Jong, Frump prétend 'écrémer' des histoires, alors que, d'une part, lesdépêches d'agence de presse sont rarement des histoires, et que, d'autre part, lorsquec'est le cas, un simple 'écrémage' apparaît comme insuffisant, le style étant déjà bienconcis. Inversement, il s'agit d'une stratégie bien mieux adaptée pour uneconsultation de BD horaire : il y a très peu d'imprévu ; il s'agit moins d'histoires quede flux d'information ; on peut sans difficulté y distinguer l'essentiel de l'accessoire ;l'évaluation de l'analyse est donnée par la satisfaction d'une requête et ne provientpas d'un jugement, fatalement subjectif.

114

Exemple 3 : fonctionnement de Frump, qui utilise en l'occurrence le«scénario rudimentaire» break-relations.

Entrée :WHASHINGTON MARCH - THE STATE DEPARTMENT ANNOUNCED TODAY THE SUSPENSION OFDIPLOMATIC RELATIONS WITH EQUATORIAL GUINEA. THE ANNOUNCEMENT CAME FIVEDAYS AFTER THE DEPARTMENT RECEIVED A MESSAGE FROM THE FOREIGN MINISTER OFTHE WEST AFRICAN COUNTRY SAYING THAT HIS GOVERNMENT HAD DECLARED TWO UNITEDSTATES DIPLOMATS PERSONA NON GRATA.THE TWO AMBASSADORS HERBERT J. SPIRO AND CONSUL WILLIA C. MITHOEFER JR, BOTHSTATIONED IN NEIGHBORING CAMEROON BUT ALSO ACCREDITED TO EQUATORIAL GUINEA.ROBERT L. FUNSETH, STATE DEPARTMENT SPOKESMAN, SAID MR. SPIRO AND MR.MITHOEFER SPENT FIVE DAYS IN EQUATORIAL GUINEA EARLIER THIS MONTH AND WEREGIVEN «A WARM RECEPTION».BUT AT THE CONCLUSION OF THEIR VISIT, MR. FUNSETH SAID, EQUATORIAL GUINEA'SACTING CHIEF OF PROTOCOL HANDED THEM A FIVE-PAGE LETTER THAT CAST«UNWARRANTED ANDINSULTING SLURS» ON BOTH DIPLOMATS.

Sortie :résumé anglais : THE US STATE DEPARTMENT AND GUINEA HAVE BROKEN DIPLOMATICRELATIONS.résumé français : LE DEPARTEMENT D'ETAT DES ETATS-UNIS ET DE LA GUINEE ONTCOUPE LEURS RELATIONS DIPLOMATIQUES.résumé chinois : MEEIGKWO GWOWUHYUANN GEN JIINAYAH DUANNJYUELE WAYJIAUGUANSHIH.résumé espagnol : EL DEPARTAMENTO DE RELATIONES ESTERIORES DE LOS EE UU YGUINEA CORTARON SUS RELACIONES DIPLOMATICAS

La stratégie sélective qui est la nôtre ne correspond pas exactement à l'analysepartielle telle qu'elle est pratiquée dans Frump ou dans IPP, ce que l'on peutconstater à partir de différents points de vue :

- Pour nous, il s'agit avant tout de parvenir au sens à moindre frais, c'est-à-dired'éviter de tenir compte de tout ce qui est termes grammaticaux, flexions et motsoutils, alors que tel n'est pas le cas de Frump.

- Nous nous satisfaisons, sinon d'être dépendant de la tâche, du moins defonctionner dans un univers restreint ce qui réduit, voire élimine, la question duchoix du «bon» scénario.

- Nous ne nous posons pas au préalable le problème de la portabilité, ce qui nenous conduit pas à dissocier par principe les connaissances linguistiques généralesde celles qui relèvent de la tâche.

- Nous nous posons en revanche au premier chef le problème de la flexibilité del'analyse face à des énoncés non normés, alors que la question n'est pas abordée parDe Jong et qu'elle est simplement effleurée par les auteurs d'IPP [Schank et al. 79].

«Sélective» doit en fait être pris dans deux sens, dans la mesure où le typed'analyse que nous nous sommes efforcé de développer effectue deux types desélection, deux types de choix :

- Le premier concerne le lexique, c'est-à-dire qu'il renvoie à la nature partielle del'analyse.

- Le second concerne le type d'analyse qui diffère au cours du traitement :parfois, il s'agit simplement d'apparier un patron (pattern-matching) ; parfois il s'agitd'une analyse syntaxique utilisant de petits ATN ; parfois enfin il s'agit directementde l'utilisation du schéma. La prédiction concerne en somme la nature et laprofondeur de l'analyse.

115

Pour terminer avec l'analyse sélective, nous voudrions, indépendamment denotre application, évoquer quels peuvent être les éléments qui permettent de fairel'évaluation d'une stratégie de ce type, en définissant les concepts repris dans lafigure 2 :

- De manière statique, il faut tout d'abord distinguer, lors d'une évaluation, lelexique de la tâche (LexT) et le lexique du système (LexS). Une analyse sélectiveperd en effet son caractère si le système s'alourdit d'un lexique qui n'est pas aumoins de moitié inférieur à celui du corpus d'évaluation. Cette proportion permet enoutre d'opposer deux approches : l'analyse sélective d'une part, qui se propose den'utiliser qu'une partie des données ; l'analyse à trous (gaps) d'autre part, quis'efforce surtout d'accepter des vides dans son analyse.

- De façon dynamique, il faut ensuite comparer le lexique d'entrée, c'est-à-dire lelexique du corpus (LexC) (ce qui revient à totaliser le nombre d'occurrences deLexT), et le lexique reconnu (LexR). Ici également une analyse sélective perdrait deson intérêt si LexR était supérieur à LexC/2.

- LexR se compare enfin au lexique qui déclenche effectivement une analyse(LexA) (ce dernier peut d'ailleurs également se comparer à LexC). La différenceentre LexA et LexR dénote pour sa part la présence d'une analyse syntaxique,puisqu'un choix est opéré dans le lexique que reconnaît le système, entre celui quiest utile à l'analyse et celui qui peut ou doit être écarté (la fonction de l'analysesyntaxique ne se limite pas pour autant à cette simple discrimination).

A titre indicatif, la figure 2 reprend ces données par rapport à notre corpusd'apprentissage. Différents critères devraient par ailleurs être introduits, afind'évaluer les autres aspects d'une analyse sélective. La complexité syntaxique descorpus notamment, ainsi que celle de l'analyse, nécessiterait une évaluation dont lamise au point constituerait un sujet de recherches à part entière. Il faudrait enfinjuger des types d'analyse susceptibles d'être activés, et plus particulièrement du typed'étiquetage retenu (sémantique ou syntaxique), ainsi que du nombre et de la naturedes représentations conceptuelles (schémas, scénarios ou MOPs par exemple) quiguident l'analyse. Quoi qu'il en soit, on aboutit aux trois remarques suivante :

LexT = 188LexS = 69 -> 36 %

LexC = 2245LexR = 832 -> 37 %

LexA = 537 -> 24 % / LexC->64 % / LexR

Figure 2 : évaluation lexicale de l'analyse sélective dans Alors à partirdu corpus d'apprentissage :

- Le système parvient à accéder au sens avec seulement 36 % du lexique de latâche.

- Ce lexique représente 37 % des mots du corpus : pour l'essentiel, ce sont lesitems les plus fréquents qui sont utilisés par le système.

116

- 64 % de ce dernier lexique, soit 24 % de l'ensemble du corpus, est réellementutilisé dans l'analyse, ce qui suppose l'élimination de près de 20 % du lexiquereconnu par l'analyseur.

2. Fonctionnement

Comme nous l'avons vu dans l'exemple 1, Alors a pour fonction d'extraire unereprésentation interne des requêtes qui lui sont fournies à partir du clavier. Cettereprésentation interne peut être visualisée sous une forme de grille qui s'apparenteaux schémas. Après avoir présenté le fonctionnement global du système, nousdétaillerons ses trois principaux aspects : le lexique (et la sémantique), la syntaxe etla pragmatique. Cette dernière constitue certainement la composante la plus efficacedu système, dans le sens qui est le sien en traitement automatique du langage : ils'agit de la représentation du contexte et de son utilisation dans l'analyse.

2.1. Présentation

Le traitement effectué par Alors comporte six niveaux essentiels, quiinterviennent simultanément à propos de chaque item et qui sont illustrés parl'exemple 4 :- 1 : détection des mots appartenant au lexique de l'analyseur.- 2 : sélection des items pertinents pour l'analyseur.- 3 : filtrage des étiquettes à partir de l'environnement.- 4 : traitement des noyaux syntaxiques.- 5 : transformation en une représentation interne.- 6 : affectation, éventuellement par défaut, des variables de sortie de l'analyseur.

Le premier niveau consiste simplement à déterminer LexR, c'est-à-dire les motsqui, dans la requête analysée, appartiennent au lexique de l'analyseur. Laconséquence majeure de cette opération, c'est d'ignorer d'emblée 77 % duvocabulaire des requêtes. Avant même que ne commence l'analyse, les itemsreconnus sont en outre caractérisés par un étiquetage syntaxique, un étiquetagesémantique et un numéro d'ordre dans la requête.

A un deuxième niveau, Alors détermine LexA, c'est-à-dire les seuls itemspertinents pour l'analyseur. Dans après tout je voudrais un train après 10 h parexemple, seul le second après demeure. Cette sélection, qui est nécessaire pourcertains mots seulement, réduit encore la part du lexique qui va effectivement fairel'objet de l'analyse, soit 26 % de LexT, ou 81 % de LexR.

A un troisième niveau, les étiquettes de certains termes nécessitent un filtrage.Dans je voudrais l'heure d'un train le 10 janvier à partir de 10 heures 10 parexemple, les différentes occurrences de heures et de 10 doivent être discriminées. Ils'agit en somme, en fonction du contexte d'affiner l'étiquetage afin d'être en mesurede procéder correctement à l'analyse.

117

Exemple 4 : représentation des six niveaux d'analyseune e paris tours e le dix huit janvier départ e le matin pour arriver à tours vers neuf heureset demie neuf heures quarante cinq e1 une paris tours dix huit janvier départ matin arriver tours neuf heures demie neuf heures

quarante cinq2 - paris tours dix huit janvier - matin arriver tours neuf heures demie neuf heures quarante cinq3 paris tours dix huit janvier matin arriver tours neuf heures demie neuf heures quarante

cinq (1)4 paris tours ( dix huit janvier) - matin arriver tours (neuf heures demie neuf heures quarante cinq) 5 paris tours (18 jv) matin « » (2) tours (9h30-9h45) (3)

6 ($horaire départ/arrivée$)(T) (paris)(GD) (tours)(GA) (18 jv)(J) (matin)(PH1) « » (4) ($><$ 9h30-9h45)(PH2) (5)

T = $HORAIRE$ départ/arrivée

GD = parisGA = toursJ = 18 jvPH = matin «» $<>$

9h30-9h45

Il s'agit ensuite de traiter les noyaux syntaxiques locaux. De longueurvariables (de 2 à 8 items), ils doivent pouvoir être disloqués, par l'insertion de bruit(le 10 e voyons janvier), ou parfois même d'éléments signifiants (demain après-midi10 janvier). Ils doivent également, d'autant plus qu'ils caractérisent surtout J et PH,être traduit en une représentation interne qui permette la consultation effective d'uneBD. Pour reprendre l'exemple proposé dans l'exemple 4, pour arriver à Tours versneuf heures et demie neuf heures quarante-cinq doit ainsi être représenté de tellemanière que le renseignement fourni corresponde à une demande portant sur leshoraires d'arrivée et que la recherche s'effectue sans exclusive à partir d'une heuremédiane, comprise entre 9h30 et 9h45.

L'avant dernier niveau est ainsi consacré à cette transformation en unereprésentation interne manipulable par le système. Cette représentation estsimplement visualisée dans notre grille. Arriver (représenté « ») est par exempleinterprété comme un marqueur qui signifie que la PH qui précède doit être consi-dérée comme PH de départ, et celle qui suit comme PH d'arrivée. Les chiffres, entrésalphabétiquement, sont également transformés, non pas simplement sous formechiffrée, comme dans la grille de sortie, mais également de façon à permettre l'accèsà la BD. Huit heures vingt le soir, visualisé 8h20 / soir doit ainsi être représenté enopérant les distinctions matin/soir et heure/minute. (1) L'étiquette des chiffres doit être différente selon qu'il s'agit de la date, des heures ou des minutes. «heure» peutégalement indiquer l'heure ou la tâche de demande d'horaire.(2) « » signifie que les indications de Plage Horaire qui précèdent doivent être considérées comme PH de départ, etcelles qui suivent comme PH d'arrivée.(3) (9h30-9h45) est considéré comme une approximation et non comme une fourchette.(4) Pour l'affectation de GD/GA, une règle de contiguïté joue lorsqu'il y a plus de deux noms de gare. Cette secondeoccurrence de «tours « est donc ignorée.

118

Pour finir, le système doit procéder à l'affectation, éventuellement par défaut, desvariables du schéma. Dans l'exemple précédent, le monosyllabe vers est ainsi sys-tématiquement réintroduit, alors qu'il ne fait pas partie du lexique de l'analyseur, demême qu'une règle de contiguïté permet d'écarter le second Tours de la sélection deGD et de GA. Les différentes variables sont en somme instanciées, et lorsque cen'est pas le cas, le système propose des hypothèses ou active des procédures dedécision par défaut.

Alors devrait également, ce qui a été partiellement réalisé lors de la connexionavec Dialog, disposer de procédures de vérification, de façon à contrôler lacohérence de sa représentation. Il devrait pouvoir ainsi vérifier que lorsqu'uncorrespondant demande un train pour Sainte-Goburge l'Aigle ou pour Tours Saint-Pierre-des-Corps il ne s'agit pas du couple GD/GA. Il pourrait également simplifierla représentation de PH lorsque, comme c'est très souvent le cas, le correspondantfournit une double indication : vague (le matin) et précise (vers 10h). Lorsque Alorsa été développé et évalué, toutes ces procédures n'avaient toutefois pas été mises enplace, et on n'en tiendra pas nécessairement compte dans les pages qui leurs sontconsacrées.

Comme toutes les stratégies qui utilisent des formalismes contextuels, c'est-à-dire qui se fondent sur une représentation du domaine sémantique abordé, lastratégie employée est fondamentalement une stratégie descendante. Au lieu departir des données (en l'occurrence des requêtes), le système recherche dans celles-cice qu'il a prédit d'y trouver. Concrètement, ce sont les deux premiers niveaux, ceuxqui réduisent LexT et LexA, qui ont au premier chef la charge d'appliquer cettestratégie. Tout repose en somme sur un postulat : un quart du lexique suffit pouraccéder au sens. Alors utilise ensuite une grammaire sémantique, ce qui revient àpostuler que le système sait par avance quel va être le «sens» des mots reconnus. Ilprédit ainsi non seulement le lexique qu'il va utiliser, mais également quelle va êtreson utilisation. Cela permet de savoir systématiquement auquel des cinq principauxtypes de traitement vont devoir être affectés chacun des différents items :

- Parfois (e.g. matin, soir, demain, aujourd'hui), aucun traitement n'estnécessaire, aucune syntaxe n'intervient, et les items reconnus peuvent être affectésd'emblée à certaines variables de la grille de sortie.

- Certains items doivent faire l'objet d'une sélection (e.g. départ, avant, après,entre) car ils ne sont pas toujours pertinents pour l'analyseur. Dans un train entreParis et Dreux entre 10 et 11 h par exemple, seul le second entre présente un intérêtpour la compréhension de la requête.

- L'étiquette de certains items (e.g. heure, chiffres), doit être précisée dansl'analyse, car ils peuvent intervenir de diverses manière (premier train / premierjanvier).

- Certains items (e.g. après-midi, matinée, soirée) sont susceptibles d'entrerdans la composition des noyaux syntaxiques, tout comme ils peuvent avoir à êtrepris en considération isolément (en fin d'après-midi / l'après-midi).

(5) «vers», qui ne fait pas partie du lexique, est réintroduit par défaut ($...$) car l'indication de l'heure n'est précédéed'aucun marqueur ( «à partir de, après ... »).

119

- D'autres enfin s'intègrent nécessairement dans les noyaux syntaxiques (e.g.chiffres, début, fin).

L'analyse s'effectue ensuite de gauche à droite, par ordre d'apparition des mots.Le problème du choix entre différentes stratégies d'analyse, qui ne peut se poserqu'à propos des noyaux syntaxiques, se résout alors de façon extrêmement simple :

- Lorsque les noyaux syntaxiques escomptés sont brefs (e.g. en début dematinée), le premier item est laissé en attente pour n'être traité qu'à l'apparition dusecond.

- Lorsque les noyaux syntaxiques escomptés sont longs (supérieurs à troisitems) ou lorsqu'ils sont susceptibles d'être éclatés (lundi après-midi trois janvier),le système procède à un regard en avant, c'est-à-dire qu'il observe le contextedroite avant d'activer l'arbre d'analyse correspondant.

L'analyse est également une analyse prédictive dans la mesure où leformalisme contextuel renvoie à celui des schémas et qu'il permet des décisions pardéfaut. L'analyse de la requête une fois achevée, un grand nombre d'interprétationssont effectuées à partir de l'instanciation ou de la non instanciation de la grille desortie, ainsi que d'un ensemble limité d'attributs qui indiquent par exemple qu'il a étéquestion d'un horaire d'arrivée ou qu'il est fait mention d'un horaire retour (Alorsinduit par exemple de la nature de PH s'il s'agit éventuellement d'une demandesimple ou demande de confirmation).

2.2. Lexique

Les items retenus sont bien entendu directement issus du vocabulaire relatif à latâche. Des critères pragmatiques ont cependant permis d'opérer quelquessimplifications, alors que le fait d'introduire des contraintes vocales imposaitquelques obligations. Quatre règles ont en fait présidé à leur sélection :

a - Se limiter à un vocabulaire minimum, quitte à accroître la part des procéduresde décision par défaut. L'ensemble du GV, pourtant aisément identifiable, a ainsi étéignoré, car il était inutile à l'établissement de la grille.

b - Écarter tous les items dont la pertinence est discutable. Cette règle conduittoutefois pour l'essentiel à écarter les termes dont on ne relève qu'une occurrencedans la totalité du corpus. Pour diverses raisons, les six exceptions suivantes ont étéfaites :

- arrivant : lorsqu'il obéit à quelques contraintes syntaxiques, il traduitl'heure d'arrivée, comme arrivée, arriver ou qui arrivent. La racine /arriv/pourrait donc être discriminante avec un système de détection de mots dansla parole continue.

- avant : il est employé comme à-partir-de, aux-environs-de, après,entre. L'existence d'un système nous a semblé justifier son maintien.

- demie : on songerait moins à le supprimer qu'à introduire quart, tanteux aussi constituent un système.

- dernier : la même notion de système s'applique à dernier, dont lemaintien se justifie par la présence de premier, même si celui-ci est parfoisambigu (premier train / premier janvier).

120

- février : l'expérimentation ayant eu lieu en décembre, janvier etdécembre ont été les mois les plus sollicités. Il paraît logique de conserverun minimum de trois mois dans le calendrier de l'analyseur.

- journée : toujours la même notion de système incite à garder journée,qui n'a qu'une occurrence dans le corpus d'apprentissage, par rapport àmatinée, soirée et après-midi, d'autant plus que c'est un mot qui entre dans lacomposition de certains noyaux syntaxiques (en fin de journée).

c - Eviter le recours à des monosyllabes, souvent difficiles à identifier. Pour ouvers, pourtant extrêmement fréquents ont ainsi été laissés de côté, tout commel'ensemble des prépositions. Cela nous a notamment conduit à ignorer aller, allant,partir et partant : il aurait fallu distinguer à et de, ou bien ajouter 8 items au lexique(aller-à, aller-de...).

d - Confondre les homophones, en leur donnant la même référence lexicale. Surun corpus restreint, il sont en fait peu nombreux :

- prie (je vous prie) / prix (tarif).- de (préposition) / deux (chiffre).- en fin / enfin- six / si

Sur un lexique total de 273 mots, nous en avons finalement retenu 154. Lesnoms de gare (85 items) et les chiffres (23 items) font partie du lexique minimal.Sur les 165 termes restants, 43 ont été retenus, ce qui constitue le vocabulairerelatif à la tâche proprement dit. L'ensemble de ce lexique recouvre 743occurrences, soit sensiblement le tiers des 2245 mots que contient le corpus. Levocabulaire relatif à la tâche se répartit en quinze classes, que l'on peut représentersous forme de grammaire sémantique, par une arborescence (cf. figure 2) qui reflètenotamment l'organisation des noyaux syntaxiques locaux (avant 22 H 30 = PH3 +PH32 + PH321 + PH311), mais qui ne prétend nullement représenter la structureréelle des requêtes. Ces arbres sont à l'origine de l'étiquetage du lexique, c'est-à-direde l'aspect sémantique de l'analyseur.

Cet étiquetage est en définitive à la fois sémantique et syntaxique : les classesen questions regroupent des mots syntaxiquement de même nature. Ce que l'on aappelé les indicateurs journaliers vagues (IJV) par exemple (étiquetés PH21 dans lafigure 3) ne regroupe que des substantifs (matinée, après-midi, soirée, journée),alors que les repères prépositionnels sont tous des prépositions ou des groupesprépositionnels (à partir de, aux environs de, avant, après, entre). Il apparaîtsimplement que nos classes ne sont jamais dégagées sur des critères exclusivementsyntaxiques. On relève même, dans un petit nombre de cas, des classes hétéro-syntaxiques : J3 comporte les nombres cardinaux de 1 à 31 ainsi que l'ordinalpremier, qui peuvent être des pronoms (je voudrais un train le trois) ou desdéterminants (... le trois janvier) ; PH311 comporte également des nombrescardinaux, associés cette fois avec l'adjectif demie. Comme en atteste soninvariabilité, ce n'est toutefois un adjectif qu'en apparence, puisqu'en l'occurrence ilsignifie nécessairement 30.

Un des intérêts de l'analyse syntaxique apparaît par ailleurs dans la présence decertains items dans plusieurs classes, ce qui crée des ambiguïtés potentielles :

- chiffres (J3, PH311, PH32).

121

- heure (T, PH321).- après-midi (PH1, PH21)- premier (J3, divers).

La rubrique «divers» illustre enfin l'utilisation des attributs qui pourrontremettre en question la grille de sortie, une fois ses variables instanciées. Etre etarriv- activent un même attribut (qui signale, sous certaines conditions, qu'il s'agitd'un horaire d'arrivée), alors que les autres items de cette rubrique activent desattributs distincts.

G G1 G2

J1

J2

J3 J31

J3

PH1

PH2

PH3

PH21PH31 PH311

PH311PH32 PH321

J

PH

T

T = heure horaire (prix) (tarif)G1 = au-départ-deG2 = gares (85)J1 = aujourd’hui demain en semaineJ 2 = lundi mardi mercredi jeudi vendredi samedi dimancheJ3 = premier 1...31J 3 1 = décembre janvier févrierP H 1 = matin soirP H 2 = début finP H 2 1 = soirée après-midi journée matinéeP H 3 = à-partir-de avant après entreP H 3 1 = midiP H 3 1 1 = demie 1...59P H 3 2 = 1...24P H 3 2 1 = heuredivers = être arriv- TGV dernier premier retour direct prochain

Figure 3 : grammaire sémantique du lexique relatif à la tâche.

2.3. Syntaxe

Ce qui caractérise la construction des énoncés oraux un tant soit peu spontanés,qui explique les phénomènes de dislocation et qui rendrait très difficile une analyseguidée par la syntaxe, c'est leur linéarité. A la différence de l'écrit, ils ne sont pasconstruits en phrases, c'est-à-dire que leur syntaxe ne doit pas nécessairement être«cohérente» et «correcte». Ils sont conçus dans le fil de leur énonciation, comme

122

une chaîne dont chaque maillon représente une fenêtre, plus ou moins large selon lacompétence du locuteur et la nature du discours. Ces maillons sont reliés deux àdeux, mais chaque lien est indépendant des liens précédents comme des lienssuivants. Certains maillons peuvent enfin rester en suspens, sans «utilité» apparentedans la construction de l'énoncé. Il est clair toutefois que s'il s'agissait réellementd'écrit la composante syntaxique pourrait être avantageusement développée.

Que l'analyse ne puisse pas être guidée par la syntaxe ne signifie pas que celle-ci soit inutile. Un certain nombre de règles reposent en effet sur une composantesyntaxique. Comme on l'a vu, la syntaxe a tout d'abord pour rôle de contrôlerl'accès à l'analyseur en refusant certains mots, en fonction de leur environnement.Départ par exemple n'est retenu que lorsqu'il précède un nom de gare, et entreseulement lorsqu'il est suivi par deux indications d'heure : (les horaires de train(entre) Béthunes (entre) Paris et Béthunes en direct vs les heures des trains pourReims demain entre huit heures et neuf heures trente). La syntaxe sert ensuite àmodifier l'étiquette de certains mots-clés. Heure notamment peut traduire la tâche(heure des trains) comme l'heure proprement dite (douze heures). Certains chiffresquant à eux peuvent indiquer aussi bien les heures ou les minutes (dix heures dix)que la date (dix janvier), d'où leur présence, avec des fourchettes différentes, danstrois classes de la grammaire sémantique (J3, PH311, PH32).

Exemple 5 : existence de noyaux syntaxiques1. : une e paris tours e le dix-huit janvier départ e le matin pourarriver à tours vers neuf heures et demie neuf heures quarante- cinq 2. : alors je voudrais savoir les les horaires pour aller àgrandville alors e en fin d'après-midi soit vers seize heures soitdix-sept heures 3. : alors je voudrais l'horaire des trains paris lens pour lesamedi après-midi cinq janvier et retour lens paris pour ledimanche après-midi six janvier

La tâche essentielle de la syntaxe est cependant d'exploiter l'existence denoyaux syntaxiques locaux. Les indications de J ou de PH notamment sontsouvent constituées par plusieurs termes conjoints, que l'on peut représenter par unarbre. Entre dix-sept heures et dix-sept heures quarante-cinq suppose par exemplel'enchaînement de dix items consécutifs. Le nombre et l'ordre des noyauxsyntaxiques est indifférent. Ainsi, dans l'exemple 5 a-t-on tout d'abord deux noyauxsyntaxiques disjoints : l'un, de trois éléments, pour J, et l'autre, de sept éléments,pour PH. Celui-ci comporte par ailleurs une autre occurrence, mais qui se limite à unitem isolé, matin. On voit ensuite qu'il faut introduire dans la succession des motsun seuil de tolérance, une flexibilité, qui permette d'intégrer hésitations et «ratés».Cette tolérance doit enfin pouvoir s'étendre à certains items, car les noyauxsyntaxiques sont parfois éclatés. Ce phénomène concerne tout particulièrement lesséquences JS+JM+M (JS = jour semaine, JM = jour mois et M = mois), danslesquelles vient s'interposer l'indication de J (samedi après-midi 5 janvier).

2.4. Pragmatique

123

2.4.1. Lexique et pragmatique

Il en va de la pragmatique comme de la syntaxe dans certaines approchesanalytiques utilisées pour la reconnaissance de la parole : il s'agit d'une part duniveau le plus élevé, et d'autre part de celui qui est le plus contraint. La limitation dela tâche fait en somme fonction de rigidité syntaxique. L'existence d'un corpusenregistré et transcrit permet à tout instant d'aborder la formalisation d'un concept àpartir de la façon dont il se manifeste réellement dans le discours. Cela explique quela composante pragmatique soit très concrète et constamment présente.

Ainsi, le choix du lexique et la détermination des règles syntaxiques dépendentsouvent de considérations pragmatiques. Pourtant relativement fréquents (9occurrences), les indicateurs de GA (en direction de, à destination de) deviennentpar exemple redondants dès lors que l'on a constaté que l'infraction à l'ordre GD/GAétait (à une exception près) soulignée par au-départ-de. Le système peut ainsi sesatisfaire de la seule connaissance de ce dernier. Ici comme ailleurs, des raisonspragmatiques justifient donc les différences entre le vocabulaire relatif à la tâche et lelexique retenu.

Assez fréquemment, les correspondants évoquent un horaire d'arrivée. Ilserait bien entendu exclu de ne pas en tenir compte, faute de quoi la consultation dela base de donnée se ferait sur de mauvais repères. Comme les locuteurs n'évoquentun tel horaire qu'à l'aide de la racine /arriv-/ (arrivée, arriver et arrivant notamment)ou de l'expression être-à, les mots correspondants ont été intégrés dans le lexique.Ils ne font pas directement partie de la grammaire sémantique, car leurreconnaissance a simplement pour effet d'activer un attribut qui permettra demodifier la grille en conséquence. A deux reprises, on trouve par ailleurs mention dedeux PH, l'une correspondant à l'horaire de départ, et l'autre à l'horaire d'arrivée. Ilfaut alors que les deux soient distinguées, afin qu'on ne tienne pas systématiquementcompte de le plus précise des deux, indépendamment de l'opposition départ / arrivée.Le critère utilisé, totalement pragmatique, est alors le suivant : les marqueurs enquestion activent l'attribut correspondant uniquement si, lorsqu'ils interviennent, lesystème a déjà rencontré des indications de PH. Ces dernières sont alorsconsidérées comme PH de départ, et les suivantes comme PH d'arrivée.

L'émergence de direct, qu'il s'agisse de trains directs ou d'horaires ... en directactive également un attribut. Ici, il s'agit véritablement d'un mot-clé, puisque sonémergence traduit systématiquement le désir d'un train qui s'arrête le moins possible,quelles que soient sa localisation et sa situation syntaxique. Le seul problème quipuisse se poser concerner la base de données SNCF. Il se rencontre donc lors de lagestion du dialogue, et non au cours de l'analyse. Il s'agit du fait que le terme directrecouvre des réalités fort différentes selon les types de trajets concernés : pour Paris/ Mantes-la-Jolie, cela signifie selon toute vraisemblance «qui ne s'arrête jamais»,alors que pour Paris / Narbonne ou Paris / Béthunes cela signifie plutôt «sanschangement». Pour Paris / Marseille, le sens serait encore légèrement différent, toutcomme lorsqu'un correspondant demande le direct ... pour Auxerre en direct .

2.4.2. Pragmatique et interprétation

124

On en vient ainsi à se livrer à des interprétations qui pourraient paraîtrearbitraires, dans la mesure où on dépasse la stricte reconnaissance de ce qui est dit.Parfois en effet, on effectue un tri dans les informations fournies par la requête, etparfois on pratique des décisions par défaut, en ce sens qu'on entérine pardéduction des éléments que les énoncés ne mentionnent pas expressément. L'ajoutd'une information sous-entendue est moins délicat que l'omission d'une prétendueredondance. La quasi-totalité de la grille est d'ailleurs concernée. Le cas le plusintéressant est cependant celui de J :

- Si PH est vide, aucune décision par défaut ne peut être prise. Il s'agit derequêtes sans référence temporelle, et le dialogue devra compléter la grille.

- Si PH n'est pas vide, le système laisse deux solutions : aujourd'hui ou ensemaine. On ne peut les discriminer d'une part parce que les locuteurs ne précisentpas toujours s'il s'agit bien du jour d'appel et, d'autre part, parce que cela supposeraitune distinction entre ce et le, ce qui, compte tenu des problèmes d'entrée vocale estexclu. Il faut bien reconnaître par ailleurs que même pour nous cette distinction estparfois bien ténue : c'est parfois la connotation fréquentative du pluriel qui permetd'induire qu'il s'agit vraisemblablement d'un jour de semaine (alors les horaires detrain pour Paris Les Aubrets le matin s'il vous plaît), alors que le singulier inciteparfois à conclure que J doit être considérée comme le jour d'appel (e je voudraissavoir s'il y a un train pour Amiens vers dix-huit heures départ de Paris).

- Si J est un jour de semaine, comme lundi, le système hésite également entre lelundi qui suit ou le lundi en général.

- Si le jour de semaine est précisé par le jour du mois sans que ce dernier soitindiqué, le système décide qu'il s'agit soit du mois d'appel, soit du mois suivant, si lejour en question précède le jour d'appel. Cette distinction n'est toutefois effectivequ'avec l'ensemble du système, dans la mesure où elle nécessite l'installation d'uncalendrier dans l'analyseur.

- Il en va de même si J est un jour de semaine suivi de prochain car il faut être àmême de calculer la date en question.

L'identification GD/GA devient délicate, d'une part, dès lors que l'ordreGD/GA se trouve inversé, et d'autre part, dès lors que la requête en contient trois ouplus ( le corpus ne comportant aucune allusion à une gare de transit, le problème n'apas été envisagé, alors qu'il serait incontournable et redoutablement complexe dansle cadre d'une application effective). Pour ce qui est de l'ordre GA/GD, il suffit,comme on l'a évoqué plus haut, de se fonder sur le marqueur au départ de. Pour cequi est des requêtes avec plus de deux noms de gare, le problème nous est apparucomme beaucoup plus difficile à résoudre, sa solution requérant la création de règlespragmatiques, étroitement liées au contexte. Dans : je voudrais savoir les horairesde Paris à Cherbourg et de Cherbourg à Paris e alors on va commencer par eParis Cherbourg un départ en fin d'après-midi, le système se trouve confronté à3+3 occurrences de deux gares. L'affectation de GD et de GA devient du coup bienproblématique, compte tenu que, du fait des contraintes vocales, de et à ne font paspartie du lexique. L'observation du corpus nous a toutefois permis de faire jouer unprincipe de contiguïté. Un couple de gares prime ainsi sur la présence d'un nom degare disjoint, et peut être interprété comme GD/GA, ainsi qu'on peut le constaterdans l'exemple 6.

125

Exemple 6 : principe de contiguïté pour la détection de GD/GA.horaires paris bourges en partant le matin de paris les horaires de train de paris à toulouse arrivant à toulouse en fin d'après-midi

La grande majorité des requêtes ne fournit d'indications de J et de PH que pourun trajet. Quelques-unes en donnent également pour le retour, item qui suffit à leuridentification. Il faut toutefois le retenir seulement lorsqu'il est précédé d'indicationsde J et de PH, c'est-à-dire lorsqu'il existe deux séries de références spatio-temporelles, l'une pour l'aller, l'autre pour le retour. Dans le cas contraire en effet,retour est utilisé dans le SNT, à l'égal de heure ou horaire : allô je voudrais savoirle retour à partir de quatorze heures e ce de Rouen vers Paris le vingt-huit e e e levingt-huit e décembre s'il vous plaît. Il n'a alors de valeur que dans l'esprit ducorrespondant, pour lequel il s'agit d'un voyage retour par rapport à un voyage allerprécédemment effectué, et son utilisation n'apporte strictement rien quant aurenseignement qui sera fourni. Pour des requêtes qui comportent une série deréférences temporelles aller et une série de références temporelles retour, le systèmepourrait engendrer une seconde grille, qui inverserait GD et GA, et qui retiendrait Jet PH à partir de retour. Encore une fois l'observation du corpus montre que ce n'estpas nécessaire, dans la mesure où, dans le dialogue qui suit, la question est presquesystématiquement reformulée dans sa totalité, parfois d'ailleurs avec desmodifications. Il suffit en somme au système de savoir qu'un retour est souhaité,sans qu'il soit indispensable qu'il s'encombre des références correspondantes.

Lorsqu'une indication d'horaire chiffrée n'est pas précédée d'un repère(après (+), avant (-), entre (<>), à-partir-de (<), aux-environs-de (><)) celanécessite la prise de diverses décisions par défaut. Il est en effet impératif que lareprésentation interne issue de l'analyse permette la consultation de la BD horaire. Sile système reconnaît ainsi que l'heure en question est une approximation, unefourchette, une borne avant ou une borne arrière, il est des cas où il n'a d'autresolution que de le supputer. Une indication horaire chiffrée simple non précédéed'un RP (repère prépositionnel) est tout d'abord considérée comme une demande deconfirmation, comme une approximation, ou bien comme une borne avant :

- Il s'agit d'une demande de confirmation lorsque l'indication d'horaire comportedes minutes (autre que 30, qui est considéré comme une approximation). Même s'ilest vrai que cela exclut la possibilité de comprendre qu'il s'agit d'une demande deconfirmation lorsque les trains partent ou arrivent à une heure juste ou à la demie, onpeut constater que l'on restitue par défaut, dans l'exemple 7-2, la présence del'interrogation indirecte totale, c'est-à-dire que l'on parvient à passer outre l'analysed'un des phénomènes syntaxiques les plus compliqués qui soient. Dans l'exemple 7-1, le système va jusqu'à la rétablir, passant outre cette fois des phénomènesinteractionnels complexes.

- Il s'agit d'une approximation lorsque, à l'inverse, l'indication chiffrée indiquel'heure juste ou la demie, comme l'illustre l'exemple 7-3. A cet égard, ce qui estsurtout remarquable, c'est que le système qui, du fait des contraintes vocales, ne s'estpas autorisé à reconnaître vers, parvient ainsi à le restituer systématiquement, dansl'ensemble du corpus.

- Il s'agit d'une borne avant lorsque l'horaire en question est un horaire d'arrivée,comme l'illustre l'exemple 7-4. Ce phénomène, que l'on ne retrouve que dans une

126

autre requête du corpus d'apprentissage doit donc à peu de chose d'avoir étéimplanté. Même si cela ne pose aucun problème particulier de programmation, etqu'il est logique de considérer que lorsque l'on souhaite être à un endroit à X heures,X est une borne avant, nous nous serions interdit de prendre ce phénomène enconsidération s'il n'avait eu au moins deux attestations dans le corpusd'apprentissage. On peut d'ailleurs remarquer qu'on ne le rencontre pas dans lecorpus d'évaluation, et qu'on atteint là les limites de ce que l'on peut faire en utilisantdes procédures de décision par défaut : si d'aventure un correspondant utilisaitarriver au lieu de être à, la règle qui stipule que dans ce cas l'horaire chiffré est uneborne avant serait fausse (*je voudrais arriver vers/à 18h, et non pour 18h).

Exemple 7 : gestion de la PH par défaut.1 : je voudrais e les horaires des trains pour mantes-la-jolie le samedi e je crois qu'y en aun vers seize h eures cinquante-cinq 2 : je voudrais connaître c'est enfin je voudrais savoir si le train de d ouze heures vingtparis clermont-ferrand circule le mardi vingt-cinq décembre mille neuf cent quatre-vingtquatre3 : e je voudrais savoir s'il y a un pour amiens un train vers dix-huit heures départ de paris4: je voudrais savoir s'il vous plaît quel est le train le plus commode pour être au mans àdix-sept heures trente

Les indications horaires chiffrées doubles font également difficulté. Ellespeuvent être considérées soit comme une fourchette, soit comme une approximation:

- Il ne peut s'agir d'une fourchette que si les deux indications horaire chiffréessont immédiatement précédées du RP entre, comme on peut le voir dans l'exemple8-1.

- Lorsque tel n'est pas le cas en revanche, le système considère qu'il s'agit d'uneapproximation. Que les deux heures en questions soient visualisées (cf. exemple 8-2) ou non, la représentation interne devient : horaire 1 + ((horaire 2 - horaire 1) / 2).

Exemple 8 : double indication chiffrée de PH1 : les heures de train pour reims demain entre huit heures et neuf heures trente 2 : oui bonjour j'aimerais e connaître l'horaire du train pour aller en direction de caen versseize heures trente dix-sept heures s'il vous plaît

Le problème qui se pose ensuite est celui de l'existence de plusieurs PH.Comme on s'en doute, il s'agit plus d'un problème de représentation interne que devisualisation. Il est aisé, dans l'exemple suivant par exemple : je voudrais avoir leshoraires des TGV e Paris Grenoble e le matin et le soir, de représenter PH (matin/soir), mais le fond du problème est de déterminer quels vont être les choix qui vontpermettre la première consultation de la BD. Trois cas sont plus particulièrementconcernés :

- Le premier est celui des requêtes dans lesquelles, comme dans l'exemplementionné ci-dessus, les deux indications de PH sont de même nature. Le choix estalors simple : c'est PH1 qui doit être pris en considération. Parfois, comme dansl'exemple 9-1, à PH1 et PH2 correspondent J1 et J2, le correspondant hésitant entredeux séries de RT : J1+PH1 ou J2+PH2. La priorité accordée à la première de cesdeux séries (ce qui n'interdit pas de conserver la seconde en mémoire) correspond àla réalité du dialogue oral : on ne répond qu'à une seule question à la fois, et on peut

127

laisser à des reformulations ultérieures le soin de prendre en charge tout ce qui, pourla première consultation de la BD, était superflu (avec un clavier, on afficherasystématiquement plusieurs «réponses» à la fois).

- Le deuxième est celui de la présence, outre PH, d'une formulation synthétiquede la plage horaire par l'intermédiaire de premier / dernier train. C'est bien sûr cettedernière formulation qui doit être seule retenue, comme on peut le voir dansl'exemple 9-2.

- Le troisième est celui, très fréquent, des PH mixtes. On y rencontreconjointement une indication floue et une indication chiffrée (cf. exemple 9-3). Bienentendu, c'est cette dernière qui est seule utilisée pour la consultation de la BD. Dansce dernier cas enfin, l'existence d'une PH double permet parfois de lever uneambiguïté quant à la représentation interne de l'heure. Lorsqu'une PH chiffréeconcerne des heures inférieures à 12, le système peut en effet se demander s'il doitconsidérer qu'il s'agit du matin ou d'un horaire postérieur à midi. En fait, le douten'existe guère, dans la mesure où, le comportement langagier induit par la machineaidant, les correspondants évitent de créer une confusion et ils précisent presquesystématiquement l'horaire en question par une PH double.

Exemple 9 : PH doubles hétérogènes1 : je voudrais savoir à quelle heure il y a un train pour soissons dimanche dans la soiréeou l undi matin ou mardi ou lundi matin oui2 : je désirerais connaître l'heure du premier train pour lille demain matin samedi vingt-deux décembre3 : oui je souhaite connaître les horaires de train samedi matin en direction de lille entredisons à partir de dix heures le matin

Ainsi se pose un problème de dialogue, puisque ou bien une demande dereformulation sera énoncée, ou bien le système produira une réponse qui comporteraun risque d'inadéquation par rapport à la requête. Ce même problème se posed'ailleurs dans le cours du dialogue car, phénomène d'ellipse, ce genre deformulation y est beaucoup plus fréquent que dans les requêtes initiales. Avant depasser à l'évaluation de Alors, nous voudrions ainsi souligner que, dans Dialors, unmodule comme celui qui est ici présenté est connecté à un module de dialogue qui apour tâche de permettre à la grille d'évoluer au gré de l'utilisateur. Dans ce contexte,la connaissance d'informations générales facilite le dialogue, même si, dans unpremier temps, c'est l'information la plus précise qui est seule prise en compte.L'évaluation qui suit, n'est donc qu'une des formes d'évaluation possibles. Il s'agit enl'occurrence d'une évaluation statique, ou interprétative, fondée sur des comparaisonsentre des grilles optimales et des grilles effectives. Le chapitre 2, qui concerneDialog, constituera ensuite une évaluation dynamique, ou dialogique, de l'analyseur,puisqu'il se trouve mis à l'épreuve du dialogue. Cette dernière forme d'évaluation estau moins aussi importante que la première, car en matière de dialogue, le problèmeest moins de ne pas faire de faute que d'être à même de les rectifier efficacement.

3. Évaluation

128

Nous allons maintenant procéder à l'évaluation de Alors. Cette évaluation va sefonder sur les grilles optimales qui pourraient être extraites des requêtes, si letraitement automatique pouvait être parfait. Il s'agira d'examiner quelles sont lesdivergences qui demeurent entre ces grilles et celles qu'obtient Alors. Ainsi, certainesquestions, comme le problème des PH doubles, qui vient d'être évoqué, ne sont pasprises ici en considération : la grille de sortie est en l'occurrence parfaitementsatisfaisante, et ce n'est que la consultation de la BD qui est susceptible de fairedifficulté. Cette évaluation comportera deux volets :

- En situation de communication homme / machine, en distinguant lesproblèmes rencontrés dans la formalisation du corpus d'apprentissage et les erreursqui demeurent dans le traitement du corpus d'évaluation.

- En situation de communication homme / homme, en observant d'une part lesDA correspondant aux DI qui font problème, et en comparant d'autre part lesrésultats obtenus sur l'ensemble des 120 DA étudiées précédemment avec ceux quirésultent du traitement des 120 DI correspondantes.

3.1. Communication homme-machine

3.1.1. Critères d'évaluation

L'évaluation des performances d'Alors, que ce soit vis-à-vis du corpusd'apprentissage ou du corpus d'évaluation, pose des problèmes qu'il convient dedégager aussi clairement que possible. Dans la pratique en effet, deux typesd'évaluation sont possibles :

- Une évaluation interprétative, qui compare, de façon statique, la grille desortie avec une grille théorique optimale. Il s'agit alors de faire clairement la partentre les erreurs à la fois objectives et les erreurs plus subjectives.

- Une évaluation dialogique, qui établisse, de façon dynamique, unclassement des erreurs en fonction du coût de leur éventuelle rectification dans ledialogue qui suit.

Ces deux types d'évaluation peuvent être, comme on le voit dans les exemples10, 11 et 12, concordantes, discordantes ou divergentes :

- Dans l'exemple 10 tout d'abord, on constate par l'évaluation interprétative uneerreur importante : une inversion GD/GA. L'évaluation dialogique est concordante,puisque cette erreur coûtera cher à rectifier : ce n'est qu'à la suite d'une réponse,éventuellement comprise comme fausse, que le correspondant aura une chance de serendre compte de l'erreur et d'envisager sa rectification.

- Dans l'exemple 11, on constate par l'évaluation interprétative une erreurvirtuelle. Il semblerait en effet que le correspondant recherche un train qui soit enpartance, c'est-à-dire le premier train qui suive l'heure d'appel, mais la requête nepermet aucune certitude en la matière. L'évaluation dialogique est ici discordantepuisque, l'incertitude aidant, le système aura intérêt à formuler une demande deprécision.

- Dans l'exemple 12, on ne constate par l'évaluation interprétative qu'une erreurminime, quant à la nature de la tâche. L'évaluation dialogique est cette fois totalementdivergente, puisque cette erreur induira inévitablement des questions qui neporteront ni sur J, ni sur PH, c'est-à-dire qui ne permettront pas de compléter la

129

bonne grille. Selon toute vraisemblance, il faudra d'ailleurs reprendre la négociationà zéro pour espérer la rectifier.

Exemple 10 : évaluation interprétative et dialogique concordantes.je désire partir e à verdun e de de paris e le dimanche vingt-trois ou le lundi vingt-quatreselon les possibilités

T = $HORAIRE$GD = verdunGA = parisJ = dim 23 lun 24

$mois crt svt$PH = $??$

Exemple 11 : évaluation interprétative et dialogique discordantes.e j'aimerais avoir les horaires des trains en en partance de paris austerlitz e jusqu'à poitiers

T = HORAIREGD = parisGA = poitiersJ = $??$PH = $??$

Exemple 12 : évaluation interprétative et dialogique divergentes.je voudrais avoir je vous prie les départs des trains de paris vers melun s'il vous plaît

T = TARIFGD = parisGA = melunJ = PH =

Notre propos étant d'intégrer Alors dans un système de dialogue, c'est bienentendu l'évaluation dialogique que nous allons privilégier. De ce point de vue, nousutiliserons le classement évoqué dans le chapitre 1 pour classer les erreurspotentielles en quatre catégories :

Exemple 13 : erreur négligeable pour une évaluation dialogique.oui bonjour e j'aimerais aller me rendre à lorient demain matin je voudrais arriver à loriententre six heures et sept heures et je voulais savoir de quelle gare je devais partir e et àquelle heure

T = HORAIRE (départ/arrivée)

GD = $paris$GA = lorientJ = demainPH = matin/<> 6h-7h

Exemple 14 : erreur justifiant d'une simple demande de précisionoui alors l’heure du train e pour reims ce soir dernier train

T = HORAIRE (dernier train)

130

GD = parisGA = reimsJ = $auj/en sem$PH = soir

Exemple 15 : erreur justifiant d'un échange de clarificationles horaires du train e paris pour bruxelles le tôt le matin

T = HORAIREGD = parisGA = bruxellesJ = $auj/en sem$PH = matin

(a) Les erreurs négligeables, en l'occurrence celles qui n'influencent pas ledéroulement du dialogue. Ainsi, dans l'exemple 13, la partie de la requête portant surla nature de la gare parisienne n'est nullement prise en compte, alors que n'importequelle réponse inclura cette information.

(b) Les erreurs à rectification immédiate, qui ne nécessitent qu'une demandede précision ou de rectification, de la part de la machine, c'est-à-dire qui se manifes-tent par la non compréhension de J ou de PH. Ainsi, dans l'exemple 14, l'indicationsynthétique de J (ce soir) n'est pas prise en compte, ce qui suppose la formulationd'une question incidente (Quel jour désirez-vous partir ?).

(c) Les erreurs à rectification différée, qui supposent que la demande deprécision ou de rectification émane du correspondant, à la suite d'une réponsepartiellement fausse de la machine présumée. Ainsi, dans l'exemple 15, la noncompréhension de tôt conduira Alors à proposer une réponse qui considéreraseulement matinée comme PH, ce qui induira une inadéquation entre la réponseproposée et l'information attendue.

(d) Les erreurs non rectifiables, qui, comme dans l'exemple 10, nécessitentune reprise de toute la négociation. Il s'agit en fait des erreurs qui supposent uneréelle incompréhension de la requête.

En définitive, les erreurs qui concernent T ou le couple GD/GA portent bienplus à conséquence que les autres, qui ne concernent pas la requête dans sa totalité,et qui permettent au dialogue de commencer. Le dialogue en effet débute sur demauvaises bases, et plusieurs échanges seront nécessaires pour pouvoir revenir surles erreurs commises. Pour évaluer Alors en terme de taux d'erreur, nous nemettrons donc pas ces différentes erreurs sur le même plan, et nous reprendrons laclassification décrite ci-dessus en lui appliquant le barème suivant :

(a) Il n'y a pas lieu de considérer qu'il y a effectivement une erreur, puisquecelle-ci demeurera totalement transparente pour l'utilisateur.

(b) Les requêtes concernées seront considérées comme fausses à 25 %.(c) Les requêtes concernées seront considérées comme fausses à 50 %.(d) Les requêtes concernées seront considérées comme fausses à 100 %.

3.1.2. Corpus d'apprentissage

Comme il s'agit du corpus d'apprentissage, c'est-à-dire des 69 requêtes à partirdesquelles le système a été constitué, les erreurs qui demeurent ne peuvent avoir quetrois origines possibles :

131

- Elles peuvent relever d'un phénomène dont on trouve moins de deuxoccurrences, et n'avoir pas été implantées, faute d'une représentativité suffisante.

- Elles peuvent dépendre des contraintes vocales, et ne pas avoir été implantéesparce qu'elles supposent des traitements qu'une détection de mots dans la parolecontinue ne pourrait réaliser que très aléatoirement.

- Elles peuvent tenir à une difficulté de programmation : nous ne somme pasparvenu à implanter le phénomène dont elles relèvent.

Sur les 69 requêtes du corpus d'apprentissage, on en trouve huit qui fontdifficulté. Suivant la classification utilisée ci-dessus, elles se répartissent de la façonsuivante :

(a) Pour les erreurs négligeables :- le correspondant demande un train turbo pour caen e vers midi, ce qui n'a pas

été pris en considération, faute d'une représentativité suffisante de l'item turbo. Lasignification technique de turbo est toutefois loin d'être claire, et il est assezvraisemblable qu'une réponse peut se fier simplement à PH.

- le correspondant demande s'il y a des trains supplémentaires pour sablé.Supplémentaire dont on ne rencontre qu'une occurrence dans le corpusd'apprentissage, fait cependant partie du lexique du dialogueur, tant il est utilisé dansle déroulement des communications. S'il fait donc problème pour Alors, prisisolément, il n'en fait aucun dans Dialors.

- J reste ambigu, dans une expression telle que : vendredi 5 14 décembre, et lesystème, tout comme une opératrice de la SNCF d'ailleurs, pourrait hésiter entre unedemande de précision ou le choix d'une des deux dates indiquées.

(b) Pour les erreurs à rectification immédiate, :- les démonstratifs ce ou cet ne sont pas pris en considération du fait des

contraintes vocales, et J n'est pas instancié, même si une présupposition existe ($auj/ en sem$), comme dans l'exemple 14.

(c) Pour les erreurs à rectification différée, :- dans tôt le matin (cf. exemple 15), tôt n'est pas pris en considération car c'est

sa seule occurrence dans le corpus d'apprentissage. Comme, même s'il fait partie dulexique de Dialors, ce n'est pas dans ce contexte, l'erreur est ici comptabilisée.

(d) Pour les erreurs non rectifiables :- (cf. exemple 10) inversion GD/GA, du fait de l'ordre GA GD en l'absence du

marqueur départ devant GD. Cette erreur tient à une difficulté d'implantation,compte tenu des contraintes vocales qui nous interdisent d'utiliser des monosyllabescomme à ou de.

- (cf. exemple 12) dans une application réelle, prie (je vous prie) seraitconfondu avec prix, et induirait une confusion de tâche.

Si on veut se représenter ceci en terme de taux d'erreur, on aboutit, suivant lesproportions dégagées plus haut, à un taux d'erreur de l'ordre de 4,3 %. Il convienttoutefois de relativiser ce genre d'évaluation, dans la mesure où elle dépendamplement de la façon, somme toute largement subjective, selon laquelle on procède.Il n'en demeure pas moins que, sur les 69 requêtes du corpus d'apprentissage etcompte tenu des contraintes qui sont les nôtres, seules 8 résistent à l'analyse, dont 5de manière préjudiciable, à des degrés divers, pour le dialogue qui s'engage.

132

3.1.3. Corpus d'évaluation

Le corpus d'évaluation, constitué de 56 requêtes initiales, n'a pas été pris enconsidération pour l'élaboration de Alors. Tandis qu'avec le corpus d'apprentissage,nous nous sommes efforcé, requête après requête, de définir les règles quipermettraient d'analyser au mieux le corpus, le corpus d'évaluation n'induit pardéfinition aucune modification du système. Il a au contraire pour fonction de testerla représentativité de ce qui a été fait à partir du corpus d'apprentissage. Cettedémarche est indissociable de l'ensemble de la problématique, et notamment de lavolonté de travailler à partir de données attestées, c'est-à-dire à partir d'un corpus. Eneffet, l’utilisation de telles données pose toujours des problèmes de généralisation,dans la mesure où l'on est systématiquement en droit de s'interroger sur la validité dece qui a été fait dès lors que l'on quitte le corpus d'apprentissage.

Pour examiner les requêtes dont l'analyse fait difficulté, nous allons reprendre lemême plan que précédemment, même si le problème est surtout ici de s'interrogersur la stabilité du système. Il s'agit en effet moins de voir si ces erreurs tiennent auxcontraintes vocales ou aux difficultés de programmation, que de constater ce quilaisse à désirer et qui aurait pu être pris en compte si le corpus d'évaluation avait étéinclus dans le corpus d'apprentissage :

(a) Trois erreurs peuvent être considérées comme négligeables :- sur trois indications de J (les heures de départ ... pour samedi dimanche et

lundi), seules les deux premières sont retenues. Cette difficulté, qui n'apparaît pasdans le corpus d'apprentissage, n'a aucune incidence sur le dialogue qui s'engage, carles réponses ne sont en pratique jamais multiples.

- à deux reprises, des erreurs sur l'affectation de GD/GA sont liées à l'absenced'une représentation du réseau SNCF, dont la constitution permettrait de lever uncertain nombre d'ambiguïtés.

(b) Cinq erreurs seraient immédiatement rectifiables :- par 4 fois, comme cela se présente également dans le corpus d'apprentissage, la

non reconnaissance des démonstratifs induit une non instanciation de J.- une utilisation de prochain, dont c'est la seule occurrence dans cette acception,

qui n'aurait donc pas été considérée comme suffisamment représentative, n'est pascorrectement analysée par Alors : les trains pour Bruxelles e les deux prochains. Jet PH restes vides alors qu'ils devraient être constitués de «aujourd'hui» et de «+maintenant». De façon dynamique, cette erreur a de fortes chances d'induire deuxdemandes de précision, et on en tiendra compte pour l'établissement des tauxd'erreur.

(c) A deux reprises, une même erreur à rectification différée est commise, quine tient pas compte d'un renseignement fourni dans la requête, ce qui pourraitconduire le correspondant à rectifier sa question à la suite de la réponse proposée :

- un correspondant demande en l'occurrence à voyager en seconde classe, ceque le système ne sait pas reconnaître. Cela fait partie d'un ensemble de questions(avec la notion de gare de transit par exemple), qu'une bonne connaissance de latâche inclinerait à ajouter à tout système opérationnel. Il n'en demeure pas moins quecette question, au demeurant aisément implantable, n'est pas présente dans le corpus

133

d'apprentissage et que savoir qu'elle existe ne renseigne nullement sur les façonsdont elle se manifeste.

En termes de taux d'erreur, c'est-à-dire pour une appréciation quantitative, lesdeux corpus sont parfaitement équivalents. Pour un taux moyen strictement égal à4,4 %, on aboutit à un taux légèrement inférieur (de l'ordre de 4,34 %) pour lecorpus d'apprentissage, et à un taux légèrement supérieur (de l'ordre de 4,46 %)pour le corpus d'évaluation (compte tenu des poids des différents types d'erreur, lesdonnées précises sont les suivantes : 8 requêtes à problème, qui se réduisent à 3erreurs pleines, sur les 69 requêtes du corpus d'apprentissage ; 10 requêtes àproblème, qui se réduisent à 2,5 erreurs pleines, sur les 56 requêtes du corpusd'évaluation). En termes qualitatifs également l'équivalence prédomine. On trouve eneffet les mêmes phénomènes de bruit (alors le direct e pour demain c'est-à-dire lele vingt-huit le vingt-neuf le vingt-neuf décembre pour Auxerre en direct e) ou dedislocation (je voudrais connaître les horaires de train Paris Cherbourg pourmercredi prochain dans la mati mercredi prochain trois janvier dans la matinées'il vous plaît). L'immense majorité du corpus d'évaluation est d'ailleursintégralement prise en compte à l'aide des règles définies à partir du corpusd'apprentissage. En définitive, seuls deux problèmes demeurent, qui représententtrois requêtes : la référence aux «classes» et une utilisation non programmée deprochain (le prochain train par opposition à dimanche prochain). Ni l'un ni l'autrene présentent de difficulté particulière d'implantation et c'est leur absence dans lecorpus d'apprentissage qui justifie seule leur ignorance par Alors.

Le système ne peut donc pas être considéré comme parfaitement stable, dans lamesure où il est manifeste que peuvent surgir des problèmes pertinents qui neseraient pas apparus dans le corpus d'apprentissage. On peut souligner cependantque les problèmes en question sont liés à la modélisation de la tâche et non à desquestions d'usage, et que, si nous ne les avons pas programmés, c'est pour respecterles règles que nous nous étions fixées. A cela s'ajoute d'ailleurs que le principe del'utilisation de corpus pour définir les potentialités d'un système va de pair avec ladéfinition de processus d'apprentissage, qui permettent d'accentuer en permanencel'adéquation entre le traitement automatique et l'usage. Le point le plus négatifapparaît en fait dans la non réversibilité des deux corpus. En effet, si on y trouve lesmêmes phénomènes d'interprétation (en partance par exemple traduit parfois «lejour même», et parfois «le lendemain»), dans l'ensemble, la complexité est moindre.On ne rencontre notamment aucune occurrence de demande de confirmation oud'horaire d'arrivée, questions qui nous ont posé certains des plus délicats problèmesd'implantation.

3.2. Communication homme-homme

Pour achever ce chapitre sur Alors, nous allons profiter de la présence ducorpus des DA (Demandes Antérieures), évoqué chapitre 3, pour effectuer uneévaluation d'un type particulier. Il s'agira de proposer le corpus des requêtesformulées face à un opérateur humain à l'analyse automatique, afin de voir si lecomportement langagier induit par la machine, étudié précédemment, a uneréelle influence sur un traitement automatique. Dans un premier temps, nous allons

134

recenser les erreurs qui apparaissent dans les grilles de sortie issues du traitementautomatique des DA. Dans un second temps, nous nous efforcerons de comparerces résultats avec ceux issus du traitement automatique des DI correspondantes, etnous tenterons d'en tirer les conclusions qui s'imposent.

Sur 120 requêtes que comprend le corpus des DA, 27 présentent quelquesdifficultés à l'analyse, dont 2 à double titre. On peut les classer selon les quatrerubriques de l'évaluation dialogique que nous avons utilisées précédemment :

(a) 4 erreurs peuvent être considérées comme négligeables, dans la mesure oùelles n'auraient aucune incidence sur le dialogue qui s'engage :

- comme dans les DI correspondantes, turbo et supplémentaire posent desproblèmes qui n'ont guère d'incidence possible sur la suite du dialogue.

- comme précédemment, une question de réseau SNCF, dont la représentationinformatique échappe à nos préoccupations, reste ignorée.

- une répétition (samedi samedi demain et dimanche) ne peut être totalementprise en compte.

(b) On recense 16 erreurs à rectification immédiate, réparties dans 14requêtes :

- à 10 reprises, J est indiqué par les démonstratifs ce ou cet (ce soir ou cetaprès-midi).

- à trois reprises, des heures postérieures à midi sont indiquées par des chiffresinférieurs à 12 (ce soir avant 6 h ; en fin d'après-midi vers 7h). Le dialogueur, quipréfère systématiquement les indications précises aux indications floues (6 h à cesoir) devra alors vérifier ces dernières à la lumière des premières, ce qui peutl'induire à formuler une demande de confirmation. L'indication chiffrée peuttoutefois être seule (quel est le train le plus commode que je peux e avoir pour êtreau mans vers cinq heures et demie), mais même dans ce cas (toute PH chiffréeinférieure à 7), le dialogueur prendra la précaution de demander une confirmation (5h 30 du matin ou 5 h 30 du soir ?), ce qui nous permet de classer cette erreur dansles erreurs à rectification immédiate et non dans celles à rectification différée.

- comme précédemment, on retrouve une formulation particulièrementsynthétique de J et PH qui n'a pas pu être programmée, faute d'une représentativitésuffisante (les deux prochains trains partant pour Bruxelles).

- un locuteur oublie enfin dans sa requête d'indiquer sa destination, ce qui luivaudrait immanquablement une question à ce sujet.

(c) 5 erreurs peuvent ensuite être considérées comme des erreurs àrectification différée :

- à trois reprises, des phénomènes de bruit ou de dislocation induisent desreprésentations internes erronées, qui conduisent à des réponses inadéquates.Lorsque le correspondant demande à partir de après midi, la représentation internede PH devient après-midi, et non + 12h. Il en va de même pour J, lorsque lecorrespondant demande un train le 7 janvier 6 janvier pardon, puisque la premièredate sera tout d'abord retenue, et non la seconde, comme le suggère pardon en fin ensoirée est compris comme en fin de soirée, ce qui conduirait le système à effectuerune recherche dans la BD qui serait vraisemblablement considérée commeinadéquate par le correspondant.

- comme on peut le constater dans l'exemple 16, un préambule métadiscursifexcusez-moi de vous déranger surtout vers midi influence la représentation interne,dans la mesure où midi est interprété comme une PH.

135

Exemple 16 : erreur à rectification différée avec phénomène de bruit.oui bonjour excusez-moi de vous déranger surtout vers midi est-ce que vous pourriez medonner les horaires de train s'il vous plaît pour le week-end du cinq janvier six janvier pourlens.

T = HORAIREGD = $paris$GA = lensJ = 5-6 janvierPH = midi

- pour bien interpréter en tout début d'après-midi, le système fait une omissiondans la mesure où il ne dispose pas de l'item tout. Même si cette erreur peutapparaître comme minime par rapport à la précédente, elle aurait presquesystématiquement pour conséquence un échange réparateur, sous forme de questionsecondaire (QS), le locuteur étant amené à solliciter un train plus tôt que celui qui luiest tout d'abord proposé. Cette erreur aurait simplement pour caractéristique dedemeurer transparente pour un certain nombre d'utilisateurs qui se lanceraient danscette QS sans avoir le sentiment qu'une erreur ait pu avoir été commise.

(d) Il reste enfin quatre erreurs non rectifiables, qui supposeraient, parfois auterme de plusieurs échanges, une reprise de l'ensemble de la négociation. Toutes lesquatre ont pour caractéristique de ne pas identifier correctement GD et GA :

- à deux reprises, trois gares sont énoncées consécutivement, ce qui induit uneerreur dans la distinction GD/GA. La règle de la plus forte contiguïté ne peut eneffet pas jouer, et dans Lille Paris Lille, Lille est interprété comme GD, et Pariscomme GA. Il est certain que si le phénomène avait été suffisamment représentédans le corpus d'apprentissage une règle appropriée aurait pu résoudre la question,et il n'est pas sans intérêt de remarquer qu'il se produit en situation decommunication homme-homme (ces exemples, et le phénomène qu'ils véhiculent,soulignent l'intérêt d'une analyse prosodique de la parole spontanée. A l'oral en effetaucune confusion n'est possible, et l'existence d'une légère pause entre G1 etG2+G3, associée à une accélération du débit, retire toute ambiguïté).

- GD et GA sont inversées parce que le système ne reconnaît pas les garesparisiennes et n'identifie pas le syntagme pour arriver à gare d'Austerlitz. Encoreune fois, il suffirait, pour qu'une semblable requête soit correctement traitée,d'intégrer ces gares dans le lexique de l'analyseur, mais cela serait contraire auxrègles que nous nous sommes fixées. Il est d'ailleurs intéressant de constater que lephénomène ne se pose qu'en situation de communication homme-homme.

- l'excessive dislocation d'un noyau syntaxique (au départ le lundi vingt-quatredécembre entre dix heures et quinze heures de Paris Austerlitz) interditl'identification de GD, dans la mesure où GD/GA sont inversées.

Même s'il est toujours intéressant de relever et d'analyser ainsi des erreurs, celan'a guère de sens que dans la perspective d'une comparaison entre l'analyseautomatique effectuée sur les DA et l'analyse automatique effectuée sur les DI :

- Sur 125 DI, 17 grilles de sortie sont entachées d'erreur, soit 13,6 % ; sur les120 DA, 27 grilles sont entachées d'erreur, soit 22,5 %.

136

- En terme de taux d'erreur, en utilisant les poids définis ci-dessus dans le cadrede l'évaluation dialogique, on aboutit à un taux d'erreur de 4,4 % pour les DI, contreun taux d'erreur de 8,75 % pour les DA.

Il apparaît donc, d'une part, que les difficultés d'analyse sont plus grandes avecles DA qu'avec les DI, et d'autre part que l'importance des erreurs commises croîtégalement lorsqu'il s'agit d'énoncés recueillis en situation de communicationhomme-homme. Le taux d'erreur passe en définitive du simple au double selon lasituation de communication. En observant ces résultats, on constate ensuite que lamoitié des erreurs d'analyse en DI se retrouvent avec les DA (9 sur 17). Celasignifie bien entendu que 18 de ces erreurs disparaissent et qu'il en apparaît 8. Cetteévolution est également vraie sur le plan qualitatif : à deux reprises notamment, onpasse d'une erreur non rectifiable en DA à une erreur à rectification différée en DI,comme le montre l'exemple 17.

Cet exemple est ainsi parfaitement révélateur de l'incidence du comportementlangagier induit par la machine sur l'analyse automatique. Certaines erreursapparaissent en DI : ce sont souvent des erreurs liées à un souci de complétude.Certaines erreurs disparaissent en DI : ce sont souvent des erreurs liées auxphénomènes de bruit et de dislocation, ou bien des erreurs issues d'un repéragespatio-temporel plus subjectif. Les indications synthétiques de J par exemple (parl'utilisation des démonstratifs) sont ainsi beaucoup plus fréquentes en DA qu'en DI ;les indications ambiguës de l'heure (par des indications chiffrées inférieures à 12)n'existent qu'en DA ; les hésitations, les dislocation de noyaux syntaxiques ou lespréambules métadiscursifs sont enfin beaucoup plus nombreux en DA qu'en DI. Enaboutissant à des taux d'erreur de 4,4 % en situation de communication homme-machine, et de 8,75 % en situation de communication homme-homme, on démontreplus l'incidence du comportement langagier induit par la machine que lesperformances du système. Des chiffres comme ceux-là dépendent en effet descritères qui ont présidé à leur élaboration c'est-à-dire, en l'occurrence, de l'évaluationdialogique. Cette dernière a pour caractéristique de dépendre du coût desrectifications à effectuer en termes d'interventions et d'échanges réparateurs. Cestaux d'erreur montrent ainsi que les bases d'un dialogue existent, qu'Alors permetd'envisager la modélisation de l'interaction sans que les problèmes d'analyse rendentpar avance caduque toute tentative d'automatisation.

Exemple 17 : erreur apparaissant en DI du fait d'un soucis de complétudeDA : bonjour mademoiselle pourriez-vous s'il vous plaît me dire sur le trafic e nantes parisnantes

T = $HORAIRE$GD = nantesGA = parisJ = $??$PH = $??$

DI : trains au départ de paris en direction de nantes le lundi trente et un décembre à partirde midi deuxième classe

T = $HORAIRE$GD = parisGA = nantes

137

J = lundi 31 décPH = < 12h

Ces résultats ont été obtenus à partir d'un corpus relativement stable, mêmes'il est manifeste que le corpus d'apprentissage serait trop réduit pour définir toutesles potentialités d'un système opérationnel. Ne serait-ce que pour tenir parfaitementcompte du corpus d'évaluation il faudrait en effet ajouter quelques mots au lexique etquelques règles dans la syntaxe. Un tel système devrait en fait disposer de facultésd'apprentissage, afin de s'adapter en permanence à l'usage qu'il est censé traiter. Lanature de la problématique et les principes d'analyse limitent toutefois la portabilitéde semblables analyseurs, et c'est là le reproche majeur qui peut être fait à Alors.Deux objections, bien différentes, s'imposent toutefois :

- A notre connaissance, aucun système théoriquement portable, c'est-à-diresusceptible de s'adapter à des tâches très différentes, ne serait capable de pendre encompte notre corpus, essentiellement du fait de l'abondance des phénomènes de nonnormativité.

- On peut observer ensuite que la portabilité du système ne se trouve pas dansune quelconque modularité, mais plutôt dans une technique qui repose sur laréalisation d'un corpus, et dans le type d'analyseur employé. Pour aborder letraitement automatique d'une autre tâche il faudrait ainsi réaliser un autre corpus,sans qu'il soit pour autant nécessaire de définir à nouveau des principes d'analyse.

Ces derniers, qui concourent à définir l'analyse sélective, consistent à ne traiterque les parties porteuses d'information d'un énoncé, en utilisant conjointement desinformations sémantiques, syntaxiques et pragmatiques. Alors n'utilise ainsi que26 % du contenu des énoncés qu'il traite pour en obtenir une représentationinterne. Ce type d'analyse est à mettre en rapport avec le caractère non normé desénoncés à traiter et il n'est rendu possible que par une stratégie fortementdescendante, liée à la limitation de la tâche, et fondée sur l'utilisation d'un schéma,c'est-à-dire sur une représentation a priori de la tâche à effectuer. L'ensemble de cetravail doit enfin être mis en rapport avec les objectifs qui ont guidé ces recherches.Il ne s'agissait pas d'aboutir à un système directement opérationnel, suffisammentportable pour permettre le traitement de tâches diverses. Il s'agissait d'aborder lesproblèmes d'analyse automatique du langage et de reconnaissance de la parole àpartir d'énoncés réellement produits en situation de communication homme/machine,dans le cadre d'une tâche réellement automatisable. Il s'agissait en somme, pourréaliser notre analyseur de nous fonder exclusivement sur la parole, et non sur lalangue, approche qui eût abouti à un échec, avec des données comme les nôtres.

Notre démarche a donc été essentiellement pragmatique. Elle est fondée surdeux constatations pratiques : d'une part, un système d'analyse ou de reconnaissancede la parole est appelé à reconnaître des énoncés effectifs, et non des énoncésartificiels et, d'autre part, l'automatisation d'un processus de communication n'estpour le moment envisageable que dans le cadre d'une tâche bien définie. Notredémarche consiste finalement à utiliser la rigidité de l'application pour tenter depallier la complexité de la langue spontanée, qu'elle soit orale, ou, éventuellement,produite au clavier.

138

139

CHAPITRE 5

Le dialogue

Notre propos était de substituer autant que possible notre système à l'opératricequi simulait la machine dans le corpus SNCF, et non d'aborder tel ou tel des grandsproblèmes que pose la réalisation de systèmes de DHM. Nous nous sommes donclimité au dialogue à deux, et nous avons procédé comme pour Alors, en distinguantun corpus d'apprentissage et un corpus d'évaluation :

- A partir du corpus d'apprentissage, en l'occurrence 69 communications, nousnous sommes efforcé de définir les potentialités de notre dialogueur, afin d'enassurer la réalisation informatique.

- A l'aide du corpus d'évaluation, en l'occurrence 56 communications, nousavons ensuite testé l'état du système, afin de voir s'il demeurait des problèmes qui nese seraient pas dégagés du corpus d'apprentissage.

Tout comme à propos de l’analyseur, nous allons dans un premier tempsexaminer les principes linguistiques et informatiques qui ont conduit à définir ladémarche (1.). Dans un second temps, nous nous intéresserons au fonctionnementde Dialog, mis au point à partir du corpus d'apprentissage, et à l'aide du modèle (2.).Nous nous étendrons enfin sur son évaluation, en opposant d'une part le corpusd'apprentissage et le corpus d'évaluation, et en nous efforçant d'autre part de juger lesystème indépendamment de tout corpus, c'est-à-dire non plus comme un systèmede dialogue oral simulé, mais comme un système de dialogue avec entrée au clavier,comme il pourrait déjà en exister dans des organismes comme la SNCF (3.).

1. Principes

1.1. Le modèle dynamique

Il existe peu de systèmes de DHM, fût-ce avec entrée au clavier, ce qui suffit àillustrer les problèmes que cela pose. A notre connaissance, aucun n'a été développé

140

suivant la problématique qui est la nôtre, c'est-à-dire à partir de données attestées,recueillies sous forme de corpus, qui permettent d'envisager un apprentissage et uneévaluation. Ces systèmes ont plutôt été conçus pour développer tel ou tel aspectthéorique du problème, ou éventuellement pour mettre en valeur le fonctionnementd'un système pour lequel le dialogue n'est pas forcément la question fondamentale.Nous allons donc, à partir du modèle de dialogue descriptif évoqué ci-dessus (cf.infra, pp. 51-62), tenter de montrer comment a émergé le modèle dynamique évoquéChapitre 1 (cf. infra, pp. 36-44), qui a servi de base à l'implantation informatique deDialog.

Ce modèle est étroitement lié à une certaine conception du DHM, qui metl'accent sur ce que l'on appelle souvent la gestion du canal de communication[Pierrel 87]. Dans le DHM, le problème majeur nous paraît en effet être celui de lanon compréhension, de l'incommunicabilité. Que l'entrée soit vocale ou qu'elles'effectue au clavier, et que la sortie s'affiche sur un écran ou qu'elle soit produiteautomatiquement, le système ne comprend pas tout ce que lui dit le correspondant,tout comme ce dernier ne saisit pas tout ce qui est présenté par la machine. Quellesque soient en somme les performances du système, le problème va donc être depermettre à l'interaction d'augmenter les chances de succès de la communication. Lerôle du dialogue sera d'autant plus limité que l'analyse sera bonne. Il s'agira alors deguider un correspondant, de lui demander des précisions ou des renseignementscomplémentaires. Cette approche n'exclut donc pas les problèmes de modélisationde la tâche ou de l'utilisateur. Elle met simplement l'accent sur le bon fonctionnementde l'interaction plutôt que sur son raffinement. Même si elle est nécessaire en toutesituation de DHM, elle n'est suffisante que pour un certain nombre de tâches,relativement simples, dans lesquelles les correspondants souhaitent obtenir uneréponse déterminée de la part de la machine.

Le problème nous est en fait apparu sous l'angle de la nécessité de gérer lesphénomènes d'incommunicabilité de façon calculatoire. Tout phénomèned'incommunicabilité suppose en effet un approfondissement, et toutapprofondissement induit le risque d'une rupture de la communication, par exemplelorsqu'un approfondissement en nécessite un deuxième, qui en suppose untroisième, et qu'il n'est plus possible de s'y retrouver. Il faut en somme permettre ausystème de savoir constamment où il en est, et notamment de savoir précisémentquand apparaît un risque d'interruption, c'est-à-dire quand l'interaction s'est dégradéeà un point tel que le correspondant sera enclin à renoncer. Notre modèle doit doncavoir pour vertu première d'être dynamique, c'est-à-dire de permettre de prendre desdécisions dans le cours des communications, et non pas simplement d'autoriser laproduction d'un graphe une fois le dialogue achevé.

1.2. Sources

La première origine du modèle, même si c'est une source indirecte, touche auxproblèmes d'entrée vocale. Même si Dialors est un système de dialogue oralsimulé, nous nous sommes en effet posé les problèmes d'entrée vocale, et nousavons été confronté à ceux de l'oral, c'est-à-dire aux phénomènes de non normativité.Une entrée vocale est en tout premier lieu inéluctablement associée à un tauxd'erreur. Qu'il s'agisse de reconnaissance analytique, de détection de mots dans la

141

parole continue, ou éventuellement de l'utilisation de modèles markoviens, unsystème de reconnaissance de la parole est et sera toujours associé à un taux d'erreur(cf. [Mariani 85]), à partir duquel le système devra inférer la signification de qui aété dit. Avec l'écrit en revanche, le problème est d'emblée qualitatif, puisque la totalitéde ce qui a été produit est immédiatement disponible. Alors qu'avec une entrée auclavier les problèmes de compréhension semblent immédiatement essentiels, ce sontles problèmes de reconnaissance qui priment avec une entrée vocale. Le dialogueaura alors inévitablement pour fonction première de permettre la récupération de cequi n'a pas été pris en compte à la reconnaissance. Notre modèle a ainsi pourconséquence de doter le système d'une forme de «conscience» de l'état del'interaction. Le système saura de façon calculatoire s'il peut manifester sonincompréhension ou sa perplexité, ou bien si l'état de l'interaction est tel que celan'est pas souhaitable, voire que cela comporte un danger. De la même manière, lesystème saura moduler son attitude selon qu'il se trouve en début de communicationou bien que celle-ci a déjà comporté un certain nombre d'échanges.

Les travaux de l'école de Genève [Roulet et al. 85] [Moeschler 85] que l'on adéjà largement évoqués, nous ont incité à envisager la modélisation du dialogue àl'aide de deux axes. Compte tenu des différences de corpus et de perspective, leursanalyses recoupent très exactement les nôtres, et ce non pas parce que nous lesaurions reprises, mais bien plutôt parce que les formalismes issus de donnéesattestées sont ce qu'ils sont, et ne peuvent vraisemblablement être différents. Sansreprendre ici le détail de leurs analyses qui concernent l'écrit comme l'oral et lemonologue comme le dialogue ou les conversations à 2+n intervenants, nousretiendrons seulement le cadre général de leurs analyses, et notamment les deuxprincipes qu'ils ont mis en avant, à savoir la «complétude interactive» et la«complétude interactionnelle» :

- La complétude interactionnelle dépend de la satisfaction d'une «contraintede double accord qui autorise la clôture d'une négociation». En d'autres termes, lepremier axe du dialogue est l'axe horizontal qui symbolise la recherche d'un accord,c'est-à-dire la satisfaction des différents intervenants. Dans le corpus SNCF, on peutainsi considérer que chaque QP ouvre une «négociation» et que, à l'aide d'autant deQS qu'il le souhaite, le locuteur poursuivra le dialogue jusqu'à ce qu'il soit satisfaitou, éventuellement, jusqu'à ce qu'il puisse conclure quant aux limites de cettesatisfaction.

- La complétude interactive dépend de la satisfaction d'une contrainte declarté et de cohérence «pour permettre à l'interlocuteur de prendre position etautoriser ainsi la poursuite linéaire de la négociation». Le second axe du dialogue,l'axe vertical, traduit, à l'initiative de n'importe lequel des interlocuteurs, une volontéde clarification ou d'approfondissement jugée nécessaire pour pouvoir poursuivre lanégociation dans des conditions satisfaisantes.

Des différences importantes existent entre l'approche de l'équipe d'E. Roulet etla nôtre, dans la mesure notamment où leur démarche est essentiellement descriptive,alors que la nôtre doit déboucher sur des implantations. Leur «modèle», si tant estque ce terme ait la même signification, est ainsi un modèle statique et fonctionnel : ilpermet de rendre compte du fonctionnement d'un dialogue une fois celui-ci achevé.Il ne s'agit pas d'un modèle dynamique susceptible de permettre à un système

142

automatique de prendre les bonnes décisions dans le cours du dialogue. Lesnotions qu'ils utilisent (échanges, interventions, ... ) chevauchent en outre les toursde parole, alors que pour l'implantation de dialogues homme/machine il n'est pasconcevable de les remettre en cause. Il n'en demeure pas moins que l'on a conservéle principe des deux axes du dialogue, l'axe horizontal, qui correspond à l'évolutionde la négociation, et l'axe vertical, qui traduit l'approfondissement.

La principale source de notre modèle de dialogue se trouve toutefois dans lescorpus dont nous nous sommes efforcé d'extraire une modélisation linguistique, parnature descriptive et statique. Cette dernière se traduit soit par une visualisationparticulière des transcriptions, soit par des formules parenthésées. Cettemodélisation linguistique est directement à l'origine de notre modèle de dialogue, quise veut cette fois réellement dynamique. Ces formules rendent compte d'un certaintype de dialogue, qualifié de dialogue à structure hiérarchique par opposition avec ledialogue à déroulement linéaire, où notamment on ne rencontre pas de problème detour de parole. La machine adopte ainsi un comportement volontairement assez figéqui ne laisse guère de place à la composante psychologique, dont le rôle est capitaldans le dialogue homme-homme.

1.3. Des corpus au modèle

Il s'agit, comme on l'a vu, de distinguer en premier lieu trois types de couplesquestion/réponse, les Q/R principales, secondaires et incidentes. Pour mémoire,rappelons que :

- Les questions/réponses principales (QP/RP) constituent le cadre de ladescription, puisqu'elles définissent un espace de référence. On change d'espace deréférence lorsqu'on change de QP, c'est-à-dire de trajet ou de tâche (réservations,tarifs... ). La RP quant à elle est simplement la réponse à la QP.

- Les questions/réponses secondaires (QS/RS) se limitent à modifier un deséléments de la QP (en général les références temporelles), et elles appellent toujoursune réponse (RS) de même nature que la RP.

- Les questions/réponses incidentes (QI/RI) sont, dans le corpus SNCF, soitdes demandes de précision, soit des demandes de reformulation. Elles peuvent êtrele fait de la machine (+QP/QS) ou bien des correspondants (+RP/RS). Les QI/RIpeuvent enfin être enchâssées, ce qui permet de rendre compte de configurationsrelativement complexes.

A ces trois niveaux de Q/R est associé un système de liaisons qui gère deuxtypes de procédures, les procédures de chevauchement et les procédures de relance,qui concourent toutes deux à assurer la continuité de la communication, en comblantpar avance un «vide» potentiel dans le dialogue :

- Les procédures de chevauchement consistent à solliciter explicitement lescorrespondants à la fin de chaque RP/RS, à l'aide de la formule ce renseignementvous convient-il ? Il y a en effet chevauchement dans la mesure où se constitue ainsiun échange métadialogique enchâssé dans l'échange finalisé.

- Les procédures de relance consistent, lorsque la situation se présente, àvérifier si la communication est close en relançant l'interlocuteur à l'aide d'énoncéscomme désirez-vous un autre renseignement ? ou quel renseignement désirez-vousobtenir ?

143

Ce qui est en définitive particulièrement remarquable, c'est que ce jeu de troisniveaux de Q/R, associé à un tel système de liaison, s'applique exhaustivement àl'ensemble du corpus SNCF. Il apparaît ainsi qu'un ensemble limité de symboles,organisés de façon logique, suffit à couvrir la totalité d'un échantillon largementreprésentatif d'un usage effectivement attesté. Notre modèle est ainsi plutôtempirique que théorique.

1.4. Les axes

Comme on l'a vu dans le premier chapitre, le modèle est fondé sur l'utilisation dedifférents axes, associés à un ensemble de variables, de façon à ce que chaquedialogue puisse être représenté par un graphe. L'axe horizontal est appelé axerégissant, et l'axe vertical axe incident : quelle que soit la situation dans laquelle lesystème se trouve, il a ainsi la possibilité d'avoir des repères paramétrables,susceptibles de lui permettre de s'en sortir :

- L'axe régissant concerne les questions effectives qui sont posées au système(dans une tâche opérative type SGBD telle que les renseignements horaires SNCF,l'information circule toujours dans le même sens), et les réponses correspondantes(i.e. les couples QP/RP).

- L'axe incident concerne les demandes itératives, les demandes dereformulation, d'explication, de confirmation ou de précision qui sont nécessaire àune bonne compréhension des QP/RP (i.e. les couples QI/RI).

L'exemple 1 illustre cette structuration, ainsi que les représentations qui peuventen découler. M2 par exemple y est une QI, et le système a besoin de comprendreH2 pour être à même de répondre à la QP formulée en H1. H3, H4 et H5 sontégalement des demandes de précision, et l'interlocuteur a besoin des informationsfournies en M4, M5 et M6 pour pouvoir s'estimer satisfait, comme il le manifeste enH6. On peut en fait distinguer dans cet exemple deux sortes d'axes incidents :

- L'axe incident à l'initiative de la machine, qui intervient à la suite d'uneQP et qui est le fait du système. Les réponses correspondantes sont donc fourniespar l'utilisateur (M2/H2) .

- L'axe incident à l'initiative de l'utilisateur, qui intervient à la suite d'uneRP, selon la volonté de l'utilisateur. Les réponses correspondantes sont doncdonnées par le système (H3 à M6).

Les demandes de précision sont formulées par la machine dans les axesincidents à l'initiative de la machine, et par l'utilisateur dans les axes incidents à soninitiative. Le statut de semblables questions est donc assez différent : dans le premiercas, elles ont pour fonction de tenter de rendre une RP possible ; dans le second,elles sont censées rendre possible le double accord entre les l’interlocuteur et lamachine.

144

Exemple 1 : communication gérée par le modèleM1 : SNCF bonjours quels renseignements désirez-vous obtenir ?H1 : je voudrais être à Dreux demain matin j'aimerais être à Dreux entre six et sept etj'aurais voulu savoir l'heure de départ et de quelle stationM2 : six heures du matin ou de l'après-midi ?H2 : du matinM3 : premier train : No 3055 première et deuxième classe départ Paris-Montparnasse à7h12 arrivée à Dreux à 8h01 sans supplément : ce train vous convient-il ?H3 : pourriez-vous répéter l'heure de départ ?M4 : départ Paris-Montparnasse à 7h12 arrivée à Dreux 8h01 : ce train vous convient-il ?H4 : est-ce un train à supplément ?M5 : c'est un train sans supplément : ce train vous convient-il ?H5 : y a-t-il des couchettes ?M6 : il n'y a pas de couchettes entre Paris et Dreux : la SNCF se penchera sur la questionH6 : ok pouvez-vous me passer l'opératrice

axe régissant

axeincident

H1

M2

H2M3

H3

M4

H4

M5

H5

M6H6

Figure 1 : graphe du modèle de dialogue à deux dimensions.

Pour chaque dialogue, le système construit un graphe qui peut, selon lesreprésentations, comporter 2 ou 3 axes :

- Dans une représentation à deux dimensions (cf. figure 1), un mouvementhorizontal s'effectue lorsque intervient une QP ou une RP, et un mouvement verticallorsqu'intervient une QI ou une RI. A ce premier type de mouvement s'associe unsecond : pour chaque QI le graphe s'oriente à gauche, alors qu'il s'oriente à droitepour chaque RI.

- Dans une représentation à trois dimensions (cf. figure 2 ci-dessous), untroisième axe, dit axe d'écartement, correspond à ces mouvements propres auxcouples QI/RI.

145

1

2

3

4

5

6

7

8

1 2 3 4 5 6 7 8

12

3

axe d'écartementVE

axerégissant

VR

axe d'incidence

VI

H1

M2

H2M3

H3

M4

H4

M5

H5

M6H6

Figure 2 : graphe du modèle de dialogue à trois dimensions. à partir de l'exemple1

- Ces deux représentations correspondent à une troisième, parenthétique, danslaquelle on utilise <> pour les couples QP/RP, et () pour les couples QI/RI :

<M1<H1 (M2 H2)M3(H3 M4)(H4 M5)(H5 M6)>H6

Parfois enfin, le système se trouve contraint de recourir à des ruptures dans ledialogue, à pratiquer des sortes d'anacoluthes. Il peut alors s'agir soit d'un retourforcé, soit d'un changement d'attitude dialogique : pour éviter une rupture dansle dialogue, le système peut tenter de revenir «de force» sur l'axe régissant, même s'ilne se trouve pas dans une situation qui le permet (par exemple en utilisant unedemande de réinitialisation), ou bien il peut aller jusqu'à changer de comportementdialogique, en optant pour un comportement totalement directif.

1.5. L'axe régissant

Sur l'axe régissant, les deux intervenants ont des rôles figés : il y en a un quipose des questions, et l'autre qui y répond. Même si dans la pratique un systèmeautomatique est difficilement le demandeur, questions ou réponses peuvent

146

théoriquement être le fait de l'un ou l'autre des intervenants. Il faut simplement quechacun conserve son rôle, c'est-à-dire que le modèle ne prévoie pas que, dans lecourant d'un même dialogue, celui qui interroge devienne celui qui est interrogé.Cela est toutefois parfaitement concevable, dans la mesure où le modèle de la tâchel'intégrerait. On peut imaginer par exemple qu'un système de renseignement ou deconsultation de base de données se charge en fin de communication d'effectuer unsondage auprès des correspondants.

Le premier problème que pose l'axe régissant est qu'il existe différentescatégories de questions. Dans une consultation de base de données comme lesrenseignements SNCF, la première question définit en général un espace deréférence, et les questions qui suivent visent à poursuivre la consultation de la basede données, en général parce que les correspondants souhaitent obtenir plusieursrenseignements, en conservant le même espace de référence, auquel on fait allusionen pratiquant abondamment l'ellipse. Nous avons ainsi été amené à définir des QP etdes QS. Il est clair toutefois que des types de questions spécifiques peuvent existerdans certaines tâches, types de questions que le modèle peut avoir des difficultés àintégrer.

Le second problème que pose l'axe régissant est celui de la succession des QP.Toute communication doit en effet pouvoir comporter plusieurs phases de dialogueet, même si, dans le corpus SNCF, c'est loin d'être toujours le cas, le modèle proposédoit pouvoir en tenir compte. Le système doit en fait commencer par être capable dedistinguer les QP des QS, ce qui dépend de la tâche et relève de la manipulation dela représentation interne fournie par l'analyseur. Il doit ensuite gérer la successiondes QP, c'est-à-dire maîtriser la liaison QP-1/QP qui, par le biais des liaisonsprécédentes peut éventuellement concerner des informations fournies dans QP-5,c'est-à-dire amplement antérieures. En pratique cela suppose une interaction étroiteentre modèle de la tâche, historique du dialogue et modèle de dialogue, ce qui devraitconduire à la sélection de l'une des trois solutions qui peuvent théoriquement êtreenvisagées :

- Fusion, totale ou partielle QP-1/QP, ce qui suppose une gestion sélective del'ellipse.

- Destruction de QP-1, auquel QP ou QP+1 ne pourront plus se référer, ce quirevient à tourner la page.

- Inhibition de QP-1, ce qui revient à considérer virtuellement une phase dedialogue comme une parenthèse.

1.6. L'axe incident

L'axe incident peut commencer à l'initiative de l'un ou l'autre des intervenants,que ce soit la machine ou le correspondant. Il peut prendre racine à n'importe quelnoeud de l'axe régissant, qu'il s'agisse d'une question ou d'une réponse. Il permet derendre compte de réalisations complexes telles que les inextricables suites dequestions dans lesquelles bon nombre de réponses sont formulées à la modalitéinterrogative. Dans le principe, chaque question incidente (QI) appelle une réponseincidente (RI) correspondante, et chaque intervention de A doit être suivie d'uneintervention de B. Dans la pratique, cela se traduit parfois par une configuration

147

simple, et parfois par des configurations plus complexes, comme dans l'exemple 2,avec des enchâssements et des démultiplications de l'axe incident. En tout état decause, le modèle propose, à chaque noeud de l'axe incident, deux possibilités,auxquelles s'ajoute l'éventualité d'un retour arbitraire ou d'un retour forcé. On peutsoit s'orienter vers une RI, soit vers une nouvelle QI. Si tel est le cas, il faut procéder,avant de pouvoir revenir à l'axe régissant, à un «désemboîtage» des différentes RI, defaçon à ce qu'aucune QI ne reste en suspens. On peut ensuite revenir à l'axerégissant ou poser une nouvelle QI, ce qui allonge l'axe incident. Pour faire le lienentre le modèle de dialogue et le sens, il convient de distinguer, à la suite d'E. Roulet,l'échange, unité formelle composée de deux interventions, la seconde étant la réponseà la première, de la négociation, unité sémantique qui peut comporter plusieurséchanges. On peut ainsi manipuler des mécanismes sémantiques relativementcomplexes pour le DHM, à savoir par exemple qu'un échange explicatif composé dedeux interventions non consécutives peut inclure deux échanges enchâssés : unéchange reformulatif et un échange confirmatif, composés chacun de deuxinterventions consécutives (cf. exemple 3).

Exemple 2 : configuration d'axe incident complexe :...M1><H1(M2 H2)(M3(H3 M4)(H4 M5)H5)M6>

M1 : ...ce renseignement vous convient-il ?

M2 : pouvez-vous reformuler votre phrase svp ?

M3 : suivant quoi svp ?

H1 : e oui e le train suivant svp ?

H2 : oui pourrais-je connaître l'heure de départ du train suivant ?

H3 : comment ?M4 : je répète suivant quoi svp?

H4 : e je ne comprends pas qu'avez-vous dit ?M5 : je répète suivant quoi svp ?H5 : le train suivant e celui qui part vers 17h ?M6 : train No ... au départ de la gare de ...

Tout cela est en outre contrôlé par une fixation de l'incidence à VE=1 (M1, M2et M3). Sur l'axe incident en effet, tout le problème est de contrôler l'incidence, dansla mesure où plus VE s'incrémente, plus nombreuses seront les interventionsnécessaires pour pouvoir envisager un retour sur l'axe régissant, que ce soit pourfournir une réponse, pour solliciter une nouvelle question, ou pour conclure. Tout leproblème est en définitive celui du retour forcé qui doit rester la dernière extrémitéd'un système de dialogue. Cela ne revient pas au même en effet de préférer l'axerégissant à l'axe incident, par exemple en pratiquant le maximalisme des réponsesou en fournissant des réponses qui ont de fortes probabilités d'être imparfaites, qued'avouer son impuissance et de se trouver acculé à réinitialiser la totalité d'unenégociation, voire d'une communication.

148

Exemple 3 : enchâssement d'échanges incidents contrôlés par une fixationde l'incidence : <H1(M1(H2 M2)(H3 M3)H4)M4>

M1 : que signifie taxidermiste ?

H1 : je voudrais l'adresse d'un taxidermiste ?

H2 : pardon ?M2 : que signifie taxidermiste ?

H3 : vous voulez savoir ce que signifie taxidermiste ?M3 : ouiH4 : c'est quelqu'un qui empaille les animauxM4 : voici l'adresse ...

Nous n'entrerons pas ici dans le détail de considérations sémantiques, et nousnous limiterons à souligner deux points essentiels du fonctionnement del'incidence. En premier lieu, il est clair que la fonction d'un axe incident n'est pas lamême selon qu'il prend racine sur une question ou sur une réponse de l'axerégissant et selon qu'il est originellement le fait de la machine ou du correspondant.La fixation de l'incidence ne peut d'ailleurs s'effectuer dans le second cas quelorsque VE est pair (c'est-à-dire au mieux lorsque VE=2), alors que dans le premiercas elle se fait lorsque VE est impair (c'est-à-dire qu'elle peut intervenir dès queVE=1). On voudrait souligner en second lieu que les QI peuvent être en gros dequatre types (demande de précision, de reformulation, d'explication et deconfirmation), et que l'importance à accorder à chaque échange incident dépend de lanature de la QI ainsi que de sa profondeur dans l'axe incident.

1.7. Utilisation du modèle

Le modèle décrit ci-dessus est surtout intéressant au travers de sa fonction decontrôle, ce qui permet au système de savoir où il en est, de même qu'il lui donneles moyens de prendre des décisions. Il convient toutefois de souligner que, selonles tâches, les types d'arbres susceptibles de se constituer ne sont pas identiques etque le modèle permet de rigidifier ou de fixer la structure d'un dialogue àautomatiser. Dans un dialogue de contrôle avec entrée vocale par exemple, lesystème interprète des mots-clés et demande presque systématiquement uneconfirmation, ce qui revient à fixer le parcours possible dans le graphe proposée parle modèle. Celui-ci permet ensuite de contrôler le niveau de complexité du dialogue.Selon le type de dialogue concerné et les performances que l'on donne au système,le modèle permet de définir un cadre, sur l'axe régissant comme sur l'axe incident.Le degré de complexité du dialogue peut ainsi être évalué de façon dynamique, en lepondérant éventuellement par la nature du parcours effectué. Dans la pratique, lesystème doit surtout contrôler son parcours dans l'axe incident. Grâce au modèle, ilpeut décider, en fonction de sa profondeur dans le graphe s'il peut effectuer une QIou s'il est préférable de pouvoir revenir à tout moment à l'axe régissant.

Le modèle permet ainsi, non pas de mieux comprendre, mais d'optimiser lagestion de l'incommunicabilité. Il permet simplement de gérer au mieux cettenon-compréhension, afin de pouvoir éventuellement la surmonter. Le modèle permet

149

notamment de jouer sur les deux axes, c'est-à-dire de décider qu'à partir d'un niveaude profondeur donné par exemple, il vaut mieux procéder à un retour arbitraire, endonnant une réponse imparfaite, de façon à revenir sur l'axe régissant, quitte àrelancer rapidement un nouvel axe incident. Un «modèle de dialogue» tel que nousl'avons défini et présenté ici est dans notre esprit une modélisation qui doit faciliterl'implantation de systèmes automatiques de dialogue. Il est certain que différentssystèmes ont pu être conçus sans recourir explicitement à un «modèle» similaire. Lefait que depuis près de dix ans les systèmes de dialogues qui ont été développés nedépassent pas les capacités d'un système comme GUS, montre cependant que celadevient une nécessité dès lors que, comme dans Dialors, on veut obtenir desdialogues relativement longs et complexes.

Il est enfin susceptible d'être utilisé pour l'évaluation de dialogues, que ceux-ciaient été recueillis dans un corpus ou qu'ils aient été produits par un système, ce quipeut conduire à l'évaluation des systèmes de DHM eux-mêmes (ce genred'évaluation fait actuellement défaut, ce qui rend quasiment impossible lacomparaison entre des systèmes qui concernent des applications différentes). Pourl'axe régissant, cette évaluation concernerait essentiellement la longueur de l'axe,c'est-à-dire le nombre de négociations que le système accepte d'enchaîner. Pour l'axeincident, le problème est à la fois plus intéressant et plus complexe, et c'est unensemble de critères qui doivent être mis en jeu :

- Le fait d'accepter le principe de l'incidence ou de le refuser. Le principe del'incidence peut d'ailleurs n'être accepté qu'à l'initiative de la machine, et refusélorsque cela suit une réponse du système, c'est-à-dire à l'initiative du correspondant.

- Le fait de libérer l'incidence ou de la figer. Lorsque l'on accepte l'incidence,mais qu'on la gère sous forme de scénarios, on définit par avance la nature et laforme de l'incidence que va tolérer le système.

- Le fait de fixer l'incidence ou de ne pas la fixer et, dans le premier cas, leniveau auquel on la fixe. Il est ainsi clair qu'un système qui n'accepte pas, sur un axeincident initialisé par la machine, que VE descende en dessous de 2 sera moinspuissant qu'un autre qui descendra jusqu'à 4.

- Le fait de gérer l'incidence de façon uniforme, quels que soient lescorrespondants, la tâche ou l'état de la communication, ou bien de la gérer de façonmodulable, en fonction notamment de ces mêmes paramètres. C'est là quelque chosequi n'a pas encore été réalisé et une des principales fonctions de ce modèledynamique de dialogue est d'en créer la possibilité.

150

2. Fonctionnement

2.1. Présentation

Tout comme le module d'analyse, celui de dialogue est directement tributaire descorpus. Il ne s'agit pas d'un système élaboré pour mettre en valeur tel ou tel aspectdu DHM, mais d'un système dont les fonctionnalités ont toutes été définies à partird'un corpus d'apprentissage. Il sera en outre ultérieurement évalué, tout d'abord àpartir de ce même corpus d'apprentissage, puis à partir du corpus d'évaluation. Parailleurs, comme nous l'avons déjà dit, il n'a pas été conçu pour valider le modèle dedialogue que nous venons d'exposer, et ce dernier s'est bien plutôt dégagé dans lecourant de l'implantation qu'il n'en est à l'origine.

Les fonctionnalités de Dialog ont été définies dans les pages consacrées audialogue SNCF, dans lesquelles nous nous sommes efforcé de décrire ce dernier parun modèle de dialogue descriptif. Tout comme l'opératrice qui simulait la machine, lesystème va s'efforcer de parvenir à une RP, en réduisant l'importance des QI, c'est-à-dire de l'axe incident. Il va fournir des RS de même nature que les RP, en les plaçantainsi sur l'axe régissant. Il va abondamment pratiquer le maximalisme des réponses,de façon à éviter autant que possible des axes incidents à l'initiative ducorrespondant, dans lesquels il rencontre quelques difficultés à maîtriser l'incidence.Il va enfin utiliser la totalité du système de liaisons, constitué comme on l'a vu d'unensemble de formules toutes faites. En fait, deux types de modifications ont étéapportées par rapport au corpus de référence, modifications qui tiennent au fait quenotre propos concerne essentiellement le dialogue et accessoirement seulement desquestions comme la consultation de BD : d'une part, la BD se limite aux seulshoraires, sur la ligne Paris-Dreux et Dreux-Paris ; d'autre part, le système ne traiteque les demandes d'horaire, et il se limite à reconnaître les autres types de requêtes(tarif et réservation notamment).

Dans la pratique, la fonction de Dialog est de parvenir, après chaque énoncé ducorrespondant, à activer la bonne réponse, c'est-à-dire à instancier correctement unevariable REP qui sélectionnera le chemin à parcourir dans le répondeur (termepréférable à celui de «générateur» qui convient surtout aux systèmes qui conçoiventvéritablement des énoncés à partir de concepts alors que pour notre part il s'agitsimplement de restitution de phrases, même si ces dernières incluent des variables etdes segments facultatifs). La communication doit en outre être supervisée par lemodèle de dialogue, afin d'aboutir à une interaction cohérente. Cette activations'effectue à partir du même schéma, de la même grille, que pour Alors. Celle-ci,rappelons-le, comporte cinq champs (T, GD, GA, J et PH). Tout dépend en sommede leur instanciation, et le but du système est de les compléter au mieux, afin d'êtresusceptible d'effectuer une recherche dans la BD. Cela implique qu'il dispose d'uncertain nombre de facultés, dont les principales sont les suivantes :

- Il doit pouvoir réagir si ce n'est pas ce schéma qui est sollicité, c'est-à-dire sila tâche n'est pas celle des renseignements horaires. Cette réaction pourra être activeou passive, la réaction active supposant que le système a compris ce dont il s'agit,même s'il n'est pas forcément à même de répondre, et la réaction passive supposant

151

qu'il a compris qu'il ne s'agissait pas des horaires, mais sans parvenir à identifier cedont il est question.

- Il doit pouvoir instancier à tout moment les différents éléments de la grille.On parlera d'instanciation attendue dans le premier cas, et d'instanciationimpromptue dans le second.

- Il doit pouvoir utiliser la représentation interne, de façon à consulter laBD. J et PH notamment doivent être transformés en une représentationindépendante de leur formulation (demain, samedi prochain, le premier, samedipremier, samedi premier décembre, le premier décembre pour J).

- Il doit pouvoir gérer la non compréhension de façon à optimiserl'interaction, c'est-à-dire permettre au dialogue d'aboutir, même s'il ne «comprend»strictement rien, éventuellement pendant plusieurs échanges.

- Il doit enfin pouvoir détecter les absurdités qui pourraient se trouver dansles énoncés qui lui sont proposés (samedi premier décembre si le premier décembreest un dimanche, ou bien des question portant sur le 47 du mois !), c'est-à-diredisposer des quelques facultés élémentaires de raisonnement qui permettent dedétecter les incohérences les plus prévisibles.

2.2. Analyse et dialogue

Dialog utilise au premier chef les représentations internes extraites parl'analyseur. Toutefois, ces dernières sont parfois vides ou bien ne suffisent pas, et ila fallu intégrer dans l'analyse un ensemble de 18 attributs qui permettent ausystème d'adapter son comportement. Ces attributs ont pour rôle d'assurerl'implantation d'un ensemble de fonctions. Ces dernières, regroupées dans l'exemple4, peuvent être réunies sous 4 rubriques :

- Les QS à repérage relatif qui, à la suite d'une réponse de la machine, jouentdirectement sur l'accès à la BD, en sollicitant les trains antérieurs ou postérieurs pardes procédures d'encerclement ou de balayage.

- Les QI à l'initiative du correspondant, qui suivent une RP ou une RS. Cesdemandes de précision portant sur la réponse qui vient d'intervenir peuvent aussibien donner lieu à une reformulation de la totalité de la RP ou de la RS que fairel'objet d'une reformulation partielle.

- Les questions portant sur la tâche, qui peuvent intervenir en tant que RP àn'importe quel moment du dialogue.

- Les énoncés qui relèvent des procédures de liaison, procédures qui font ainsil'objet d'un traitement spécifique.

La liste de ces attributs, tout comme le lexique qui y est associé, a été définie enfonction du corpus d'apprentissage. Il ne s'agit donc pas d'une liste close, et onpourrait fort bien en imaginer d'autres : une QS qui solliciterait le premier trainproposé dans une procédure de balayage ou d'encerclement ; une QI concernant lesdifférentes classes ; une extension des tâches prises en compte (bagagesaccompagnés, train autos-couchettes ...). Certains de ces attributs sont d'ailleurs liésà l'époque à laquelle ces corpus ont été réalisés, à savoir à l'approche des fêtes de find'année : c'est en effet surtout à ce type de période que des correspondants peuventêtre conduits à s'enquérir de l'existence de trains supplémentaires. Ces attributs onten définitive à charge d'assurer l'implantation de l'ensemble des fonctions qui

152

découlent de l'exemple 4. Ils sont ainsi destinés à être intégrés par le dialogueurdans les règles de gestion du dialogue, à l'égal de l'état du dialogue ou de celui de lagrille d'analyse. Ce qui les différencie fondamentalement des différents champs decelle-ci, c'est que les informations véhiculées par la grille demeurent disponiblespendant plusieurs échanges, alors que les attributs n'ont d'utilité qu'à la suite del'énoncé qui vient d'être analysé.

Exemple 4 : liste classée des 18 attributs utilisés par Dialog. QS QI T liaisons(a) train suivant (c) entre les deux (i) tarif (o) demande de renst(b) train précédent (d) durée du trajet (j) réservation (p) réponse affirmative

(e) heure de départ (k) train supplémentaire (q) réponse négative(f) heure d'arrivée (l) couchette (r) clôture(g) train à supplément (m) changement(h) train direct (n) retour

Exemple 5 : lexique de l’analyseur et lexique spécifique du dialoguelexique commun lexique du dialogue lexique commun lexique du dialogue(a) après suivant plus-tard trop-tôt (i) prix tarif montant(b) avant précédent plus-tôt trop-tard (j) réservation place

(k) supplémentaire(c) entre (les deux) (l) couchette(d) combien-de-temps (m) changement

(n) retour(e) départ(f) être-à /arriv/ (o) renseignement(g) supplément (p) oui(h) direct (q) non merci

(r) au-revoir

Il en va bien entendu du lexique qui permet d'activer les attributs comme desattributs eux-mêmes, c'est-à-dire que c'est uniquement leur degré d'attestation dans lecorpus d'apprentissage qui justifie la sélection. Il convient toutefois de distinguerdeux catégories de termes (cf. exemple 5) :

- Ceux qui étaient déjà utilisés par l'analyseur, c'est-à-dire le lexique communentre Alors et Dialog.

- Ceux qui ont dû être introduits dans le système , c'est-à-dire le lexiquespécifique au dialogue.

Le lexique commun est relativement peu important. Trois cas sont à prendretout particulièrement en considération : celui de la racine /arriv/, celui de retour etcelui de direct, que l'on retrouve conjointement dans l'exemple 6. Dans Alors eneffet, ils activaient déjà un attribut. Ce dernier n'avait toutefois guère de rapport aveccelui de Dialog, dans la mesure où sa fonction se limitait à un simple problèmed'affichage. Avec le dialogue, c'est la recherche dans la BD et la conduite del'interaction qui sont concernées :

- En ce qui concerne l'horaire d'arrivée, il s'agissait de repérer les cas, sommestoutes relativement rares, dans lesquels PH indique un horaire d'arrivée et non unhoraire de départ. Avec Dialog, que ce soit à propos des requêtes initiales ou dans lecourant des dialogues, il s'agit de déterminer si la recherche dans la base de donnéesdoit s'effectuer à partir de l'horaire de départ ou bien de l'horaire d'arrivée. Il fautégalement, lorsque le concept se trouve dans un axe incident à l'initiative ducorrespondant, pouvoir l'interpréter comme une demande de confirmation del'horaire d'arrivée.

153

- Le concept de retour n'avait été pris en considération dans Alors que dans lecas de questions multiples, c'est-à-dire lorsque, à la suite d'une demande d'horairealler, les correspondants sollicitent, dans la même requête, un horaire retour. AvecDialog cette faculté est totalement laissée de côté, dans la mesure où le système n'apas à tenir compte des divers volets d'une question multiple. Dans le courant desdialogues, retour doit en revanche être pris en considération comme une nouvelleQP dès lors qu'une négociation est avérée comme complète (une RP a enl'occurrence été fournie). GD et GA sont alors inversés, et J et PH sont considéréscomme nuls.

- Pour la notion de direct, le problème est un peu plus complexe car il s'agitd'opérer une sélection dans la BD, c'est-à-dire ne retenir que les trains qui sontqualifiés d'«express» ou de «corail», dans la mesure où, sur un trajet comme Paris-Dreux, «direct» s'oppose à «omnibus», alors que sur Paris-Lyon, cela signifierait«sans arrêt», et sur Paris-Aix-en-Provence «sans changement». Quand le concept dedirect ne se trouve pas dans une QI (demande de précision ou de reformulation), ilse trouve dans une QS, à la suite d'une RP ou d'une RS dans laquelle le trainproposé n'était pas direct.

Exemple 6 : exemple forgé de cumul d'attributs.M1 : SNCF bonjour quel renseignement désirez-vous obtenir?H1 : dreux demain matinM2 : train omnibus No 3267 1e et 2e classe départ Paris-Montparnasse à 9h43 arrivée Dreux à 10h 41 sans supplément : ce train vous convient-il?H2 : un retour dimanche mais pour arriver avant midi en directM3 : train express No 3054 1e et 2e classe départ Dreux à 9h 25 arrivée Parisà 10 H 12 sans supplément : ce train vous convient-il?

Le lexique spécifique du dialogue est quant à lui relativement limité : celaconcerne 13 concepts, qui représentent, compte tenu des flexions, 32 entrées dans undictionnaire de formes. Comme pour Alors, ce qui est en définitive remarquable,c'est l'étroitesse du lexique effectivement utilisé, ainsi que son extrême spécialisation:

- Pour (d) par exemple, on trouve plusieurs occurrences de combien de temps etaucune de durée du trajet ou de longueur du voyage.

- Parallèlement, un mot comme place(s) est exclusivement utilisé pour solliciterune réservation, alors qu'il pourrait s'intégrer dans une demande de tarif (*le prixd'une place de première) ou même dans une demande d'horaire (*j'ai une placedans le train de midi et je ne sais pas à quelle heure il arrive).

2.3. Le dialogueur

Si l'on reprend les quatre éléments d'un système de dialogue, on peut considérerque, de manière implicite ou explicite, le dialogueur est une «boîte noire» qui les meten jeu :

- Le modèle de la tâche tout d'abord est inclus dans la grille de dialogueextraite par Alors et constamment mise à jour par le système.

- Le modèle de l'utilisateur est quant à lui laissé de côté, le corpus nenécessitant nullement son utilisation. Si cela avait été le cas, nous aurions utilisé l'étatdu dialogue pour l'implanter.

154

- Le modèle de dialogue qui, répétons-le, s'est dégagé de l'implantation deDialog plutôt qu'il n'en a été à l'origine, se trouve inclus dans l'utilisation de l'état dudialogue.

- L'historique du dialogue enfin se trouve intégré à la fois dans le jeu demanipulation des grilles qui permet de disposer d'informations fournies dans ninterventions précédentes et dans l'état du dialogue qui se trouve stocké par lesystème et consulté à la demande.

La partie centrale de Dialog est en fait constituée de règles de dialogue quiutilisent trois types d'information, représentées chacune par des variables spécifiques(cf. exemple 7) :

- L'état de la grille d'analyse, qui utilise les variables évoquées précédemment,à savoir T, GD, GA, J et PH.

- L'état des attributs, repris dans l'exemple 4- L'état du dialogue essentiellement matérialisé dans une variable DIALSIT,

explicitée ci-dessous.

L'état de la grille est le plus important de ces critères. Comme on peut le voirdans l'exemple 8, il gère à lui seul une bonne part du dialogue, et notammentl'ensemble des cas simples, qu'il s'agisse de QP/RP, de RS/RS ou de QI/RI :

- En H1, J et PH restent vides. Quel que soit l'état du dialogue, le système vachercher à les compléter. C'est une QP qui ouvre une négociation.

- En H2, il s'agit d'une RI : J et PH sont activés et pris en compte, même si M2ne portait que sur J. Comme GD et GA étaient fournis en H1 (GD est trouvé pardéfaut, ce qui revient au même), le système accède à la BD et propose un train.Notons à cet égard que si H2 n'avait comporté que des indications de PH, cesdernières auraient été prises en compte, et M3 aurait été une réitération de M2.Inversement, si H2 avait concerné seulement J, M3 aurait porté sur PH et, dans cesdeux cas, M3 aurait fort bien pu rectifier la première version de J ou de PH.

- En H3 et en H6, on a affaire à des QS à repérage absolu, même si J et PH sontconjointement activés. Ils remplacent simplement les indications fournies en H2. Lesystème accède à nouveau à la BD, et propose un nouveau train.

- En H4 et en H5, qui sont également des QS à repérage absolu, seuls J ou PHsont détectés et pris en compte pour la recherche dans la BD, même si en M6 le trainproposé est le même qu'en M5.

- En H7 enfin, GD et GA sont implicitement activés. Ils sont alors inversés parrapport aux grilles précédentes. J et PH sont effacés, et le système, comme en H1, seretrouve avec une nouvelle QP ouvrant une deuxième négociation.

Exemple 7 : règle de dialogue portant à droite sur une QP non pourvue deréférences de PH (Paris-Dreux demain svp)

SI état de la grille = EG SI EG = (PH=0)état des attributs =EA EA = /état du dialogue = ED ED = QP/QS

Alors réponse = REP Alors REP = QI PH

155

Exemple 8 : gestion de dialogue à partir de l'état de la grille.H1 : je voudrais un train pour dreux

GD=$Paris$ GA=Dreux J = 0 PH=0M2 : quel jour désirez-vous partir?H2 : jeudi soir

GD=0 GA=0 J=jeudi PH=soirM3 : train express No 3269 1e et 2e classe départ Paris-Montparnasse à 19h 28arrivée Dreux à 20h 22 sans supplément : ce train vous convient-il?H3 : vendredi matin

GD=0 GA=0 J=vendredi PH=matinM4 : train omnibus No 3267 1e et 2e classe départ Paris-Montparnasse à 9h 43arrivée Dreux à 10h 41 sans supplément : ce train vous convient-il?H4 : vers midi

GD=0 GA=0 J = 0 PH=$vers$ midiM5 : train omnibus No 6413 1e et 2e classe départ Paris-Montparnasse à 10h 28arrivée Dreux à 13h 33 sans supplément : ce train vous convient-il?H5 : samedi

GD=0 GA=0 J = 0 PH=$vers$ midiM6 : je répète : train omnibus No 6413 1e et 2e classe départ Paris-Montparnasse à12h 28 arrivée Dreux à 13h 33 sans supplément : ce train vous convient-il?H6 : vendredi soir

GD=0 GA=0 J=vendredi PH=soirM7 : train omnibus No 6427 1e et 2e classe départ Paris-Montparnasse à 18h 44arrivée Dreux à 19h 48 sans supplément : ce train vous convient-il?H7 : et un retour

GD=Dreux GA=Paris J = 0 PH=0M8 : quel jour désirez-vous partir?...

A la différence de l'état de la grille, l'état des attributs est rarement à lui seuldiscriminant. Selon la nature de l'attribut, EG et ED ont un poids plus ou moinsimportant :

- Pour les QS à repérage relatif, EG et ED sont essentiels, et le suivant ne peutêtre interprété comme tel qu'à condition que EG = 0, et notamment que PH ne soitpas instancié, et que ED permette une QS (il faut en particulier qu'une RP ait étéproduite). Ainsi le système ne risque pas d'effectuer une mauvaise interprétationd'une séquence comme le train suivant, lorsqu'elle est suivie de ce serait un Dreux-Paris le premier décembre en fin de matinée.

- Il en va de même pour les QI à l'initiative du correspondant. Pour EG, seul Tpeut être instancié (non GD GA J et PH), et pour ED, on doit impérativement setrouver à la suite d'une RP ou d'une RS. L'heure de départ svp est ainsi interprétécomme une demande de reformulation partielle d'un horaire fourni précédemment,ce qui ne serait pas le cas d'une séquence telle que l'heure de départ plutôt vers midisvp, qui serait une QS à repérage absolu.

C'est bien entendu à propos de l'état du dialogue que le modèle de dialogueest directement sollicité. Il s'est toutefois dégagé de la réalisation de Dialog, danslequel il se trouve implanté dans les règles et non sous forme d'un module distinct.Dans la pratique, il s'agit pour le système, lorsque c'est utile ou nécessaire, dedécider ce qu'il va faire non pas seulement en fonction de l'état de la grille ou decelui des attributs, mais également en fonction de ce qui a été fait. Il dispose pourcela de la nature des réponses fournies au préalable, c'est-à-dire des états successifsde la variable REP, stockés comme une forme d'historique du dialogue, tout au long

156

de la communication. Afin de simplifier l'écriture des règles, le système réduit lenombre de ces états, et il se fonde en fait sur 8 états de dialogue, identifiés et stockésdans une variable Dialsit. Le modèle de dialogue est donc utilisé de façon statique,c'est-à-dire figée. Même si, selon l'état de la communication, le système peut réagirdifféremment, ses réactions sont inscrites dans les règles de dialogue, au lieu d'êtrecommandées par des paramètres dialogiques indépendants, possibilité qui constituel'élément majeur du modèle, et ce tout simplement parce qu'une telle facultén'apparaissait jamais comme une nécessité dans nos corpus. Le comportement del'opératrice qui simulait la machine est d'ailleurs directement en cause, et il aurait étésouhaitable de pouvoir réaliser d'autres corpus en demandant aux compères de semontrer plus souples.

Comme on peut le constater dans l'exemple 8, où l'instanciation de ces états dedialogue est indiquée entre parenthèses, de (a) à (h), à la fin de chaque interventionde la machine, bon nombre de ces états peuvent suivre différentes interventions dusystème, tout comme ils peuvent précéder divers types d'intervention ducorrespondant. Un même état de Dialsit peut en effet correspondre à plusieursinterventions du système, tout comme chaque état de Dialsit peut précéder plusieurstypes d'intervention du correspondant. Dans la pratique, cela signifie que le système,lorsqu'il propose une intervention, se situe automatiquement dans un état de dialoguequi n'admet, sauf retour forcé bien entendu, le passage que dans certains états.Lorsqu'il se trouve à proposer l'intervention suivante, c'est-à-dire après avoir analysél'intervention du correspondant, le système peut donc, pour décider de l'instanciationde REP, se servir des prédictions liées à l'état antérieur de Dialsit. L'exemple le plusfréquemment mis en oeuvre est à ce propos celui de la fixation de l'incidence quicorrespond tout simplement au cas où un état de Dialsit se réitère tant que l'étatescompté n'est pas en mesure d'intervenir. Dans les règles, l'état du dialogue setrouve donc lié aux 8 états de la variable Dialsit :

(a) Une réponse a été fournie, que ce soit une RP ou une RS, et qu'il s'agissed'horaires ou d'une autre tâche. On se trouve donc sur l'axe régissant. Troissituations sont alors possibles :

- Une continuation de l'axe régissant par une QS, par une nouvelle QP, ouéventuellement par une clôture.- Un passage sur l'axe incident à l'initiative du correspondant par une QIportant sur la réponse proposée.- Un passage sur l'axe incident par une procédure de liaison. La formule cetrain vous convient-il ? devra alors être considérée comme une QI, qu'elle aitou non été comprise (H3).

(b) Une QI portant sur J ou sur PH a été fournie. On se trouve donc sur l'axeincident. Le système attend nécessairement une RI et il est disposé à bloquerl'incidence jusqu'à temps qu'il l'obtienne.

(c) Une RI très particulière a été fournie (quel trajet désirez-vous effectuer :Dreux-Paris ou Paris-Dreux ?). On se trouve donc sur un axe incident liminaire, àl'initiative du correspondant : au début d'une communication, aucune QP n'est encoreintervenue, et l'incidence restera bloquée jusque là (H2).

(d) Une RI portant sur l'heure de départ, l'heure d'arrivée, la nature du train(direct ...) ou sa catégorie (à supplément ...) a été fournie. On se trouve donc sur unaxe incident à l'initiative du correspondant. Trois situations sont alors possibles :

157

- Une QS, sur l'axe régissant, qui supposerait l'utilisation de l'état de la grilleainsi que la grille de dialogue active.- Une nouvelle QP, toujours sur l'axe régissant, qui définirait une nouvellegrille de dialogue.- Une autre QI, qui poursuivrait le même axe incident et qui supposerait lerecours à l'état des attributs.

(e) Une QI a été fournie à la suite d'une QP ou d'une RI portant sur PH (Xh dumatin ou de l'après-midi ?). On se trouve donc sur l'axe incident où, comme pour(b), le système attend une RI correspondante (H3).

(f) Une QI (désirez-vous un autre renseignement ?) a été fournie dans le cadredes procédures de liaison. On se trouve donc sur un axe incident à l'initiative de lamachine, mais à la suite d'une RP ou d'une RS. La formule ce train vous convient-il? aura été considérée comme une QI, et l'intervention du correspondant comme laRI. Deux situations sont alors possibles :

- Une réponse explicite sur le même axe incident (H6).- Une QP ou une QS sur l'axe régissant qui, du point de vue du modèle dedialogue supposerait une réponse implicite sur l'axe incident, positive s'ils'agit d'une QP, négative s'il s'agit d'une QS (H4).

(g) Toujours dans le cadre des procédures de liaison, le système vient deproduire un énoncé de relance (quel renseignement désirez-vous obtenir ?). On setrouve donc sur l'axe régissant. C'est d'ailleurs l'état initial du système, lorsqu'il aénoncé sa question liminaire. Trois solutions sont alors possibles :

- Une QP, une QS ou une clôture.- Une demande de reformulation si rien n'arrive (H7).

Exemple 8 : dialogue illustrant les différents états de dialogue et leurincidence face à une intervention vide

M1 : SNCF bonjour quel renseignement désirez-vous obtenir? (g)

H1 : totoM2 : quel trajet désirez-vous effectuer (dreux-paris ou paris-dreux)? (c)

H2 : dreux demain matinM3 : train omnibus No 3267 1e et 2e classe départ Paris-Montparnasse à 9h

H3 : totoM4 : désirez-vous un autre renseignement? (f)H4 : soir

M5 : train express No 3269 1e et 2e classe départ Paris-Montparnasse à 19h

43 arrivée Dreux à 10h 41 sans supplé�ment : ce train vous convient-il? (a)

28 arrivée Dreux à 20h 22 sans supplément : ce train vous convient-il? (a)H5 : nonM6 : désirez-vous un autre renseignement? (f)

H6 : oui

M7 : quel renseignement désirez-vous obtenir? (g)H7 : totoM8 : pourriez-vous reformuler svp? (f)

H8 : midi

M9 : train omnibus No 6413 1e et 2e classe départ Paris-Montparnasse à 12h 28 arrivée Dreux à 13h 33 sans supplément : ce train vous convient-il? (a)

158

2.4. Génération

En matière de génération, nous nous sommes limité à de la restitution dephrases : à partir du corpus d'apprentissage, nous avons défini l'ensemble desphrases susceptibles d'être produites par la machine, et le système s'emploie àinstancier correctement REP, ce qui aura pour effet de déterminer comment serasollicité le répondeur. Bon nombre de réponses sont toutefois composées desegments fixes, de segments modulables et de variables instanciées. Les phrasesrestituées sont constituées de segments terminaux, qui instancient Dialsit, et desegments non terminaux, qui instancient à nouveau REP, c'est-à-dire un autresegment non terminal ou un segment terminal. Tous les cas de figure peuvent bienentendu exister : segment terminal (quel jour désirez-vous partir ?) ; segment nonterminal et segment terminal (le trajet dure environ une heure / désirez-vous unautre renseignement ?) ; n segments non terminaux et segment terminal (je répète /il n'y a pas de couchettes entre Paris et Dreux / la SNCF se penchera sur laquestion / désirez-vous un autre renseignement ?).

REP et Dialsit correspondent ainsi aux différentes entrées/sorties durépondeur. Ni l'un ni l'autre ne correspondent toutefois au nombre de réponsespossibles. REP, qui comporte 22 états, peut ainsi être réinstancié plusieurs fois aucours de la constitution d'une réponse. La valeur de Dialsit traduit différents états dudialogue, et un même état peut fort bien correspondre à plusieurs segmentsterminaux (quel jour désirez-vous partir ? et à quelle heure désirez-vous partir ?par exemple). Il devient donc difficile de donner une liste de l'ensemble desréponses possibles, et on ne peut guère que proposer, comme dans l'exemple 9,l'ensemble des 20 segments non terminaux et des 13 segments terminaux, lesystème pouvant produire sensiblement 70 énoncés, soit ce que réclament lescombinaisons réalisées dans le corpus d'apprentissage.

Exemple 9 : segments utilisés pour les réponses du système Segments non terminaux Segments terminauxsuivis de la réinstanciation courante de REP a quel jour désirez-vous partir ?1 je répète b a quelle heure désirez-vous partir ?2 je ne parviens pas à répondre à cette question (d) c quel trajet désirez-vous effectuer ?3 dernier train = (i) d désirez-vous un autre renseignement ?4 premier train = (i) e au revoir5 il n'existe pas de couchettes entre Paris et Dreux (7) f quel renseignement désirez-vous obtenir ?6 il n'y a pas de changement entre Paris et Dreux (7) g pouvez-vous reformuler svp ?7 la SNCF se penchera sur la question h Xh du matin ou de l'après-midi ?8 il n'y a pas de train supplémentaire entre Paris et Dreux (9) i RÉPONSE9 il existe un (i) j heure d'arrivée = ...10 il n'y a pas de train avant Xh (4) k heure départ = ...11 il n'y a pas de train après Xh (3) l ce train est sans supplément12 il n'y a pas de train entre Xh et Yh (14) m ce train est un (direct/corail/omnibus)13 il n'y a pas de train à Xh (14)14 train le plus proche = (i)15 malheureusement les jours n'ont pas 48h (b)16 les trains ne circulent pas les 36 du mois (a)17 le (joursem) est un (joursem) et non un (joursem) (a)18 les questions relatives à ... ne font pas partie de mon domaine (d)19 le trajet dure environ 1h (d)20 question trop longue (g)

159

2.5. Consultation de la BD

La base de données est, pour ce qui nous concerne, un simple support dedialogue, même si sa nature, sa constitution et sa consultation sont loin d'être desproblèmes anodins, et c'est d'ailleurs à ces problèmes que les auteurs de GUSconsacrent près de la moitié de leur publication la plus connue [Bobrow et al. 77],tout comme c'est à leur propos qu'ont été développées des procédures à base de«servants» et de «demons» [Charniak 78]. Il est clair en effet qu'avec les horairesSNCF, la consultation de la base de donnée consiste simplement à lire la bonneinformation dans un fichier conçu à cet effet. Dans un tel cas, un opérateur humaincomprend instantanément les questions qui lui sont posées, mais tarde à trouver laréponse, alors qu'un système trouve instantanément l'information mais peine àinterpréter de façon sûre les propos des correspondants. Dans d'autres cas(problèmes de couchettes, voiture-lit, grill express, restauration à la place, bar, venteambulante, tgv ou trajets modulables par exemple), le problème est moins évident,dans la mesure où le système doit inférer sa réponse d'une compulsation«intelligente» de la BD. On rencontre enfin dans le corpus quelques exemplescomme le suivant : bonjour madame je vais vous demander un renseignement svp(- oui) e en ce qui concerne les billets de congés payés (- oui) pour l'année alorsvoilà moi je travaille mais je travaille je ne travaille que par intermittence (- oui)donc je n'ai pas toute l'année e je suis jamais au même endroit et je n'ai pas toutel'année des fiches de paye bon d'un autre côté je suis mariée est-ce que ça peutmarcher sur le sur parce que moi je suis sur la sécurité sociale de mon mari est-ceque ça peut ma comment ça se passe est-ce que vous.

La consultation de la base de données se fait en fonction d'une variableTyperech qui est activée dans le courant de l'analyse et qui indique si l'horairerecherché antérieur et/ou postérieur à des bornes déterminées, s'il s'agit d'une QS oud'une demande de confirmation. L'activation de Typerech se fait avant tout à partir demarqueurs spécifiques (entre, avant, après, aux environs de, aux alentours de, àpartir de, premier/dernier train). Il se fait également en fonction de décisions pardéfaut (demande de confirmation, absence de marqueur) ou de l'état du dialogue(QP/QS). La prise en compte de l'horaire d'arrivée (7 occurrences dans le corpusd'apprentissage) ne pose guère de problème, et le lexique associé est sans ambiguïté(arrive, arrivée, arriver, arrivant, être à).

2.6. Le modèle de dialogue

Le modèle descriptif, dégagé à l'analyse des corpus constitue le cahier descharges qui a servi de base à l'implantation de Dialors, et dont les QuestionsPrincipales restent le noyau de base, dans la mesure où elles reflètent l'organisationthématique des communications. Même si, pour l'essentiel, celles-ci ne comportentqu'une QP, le système doit accepter autant de changements de QP (ou de thèmes)que le souhaitent les correspondants. Un dialogue étant par définition linéaire, on nes'intéressera pas directement à QP-4 ou à QP-3, mais plutôt à la liaison QP-1/QPqui, par le biais des liaisons précédentes, peut éventuellement véhiculer desinformations fournies dans QP-5. Selon qu'il s'agit de passer d'un trajet aller à un

160

trajet retour, de changer de trajet, ou de modifier la nature de la tâche, trois solutionspeuvent être envisagées lors des changements de QP :

(a) Fusion de l'historique (totale ou partielle) de QP-1 avec celui qui est encours d'élaboration de QP (ce qui revient à effectuer une gestion sélective del'ellipse). Cela devrait par exemple être le cas pour le traitement effectif desdemandes de tarif, qui supposent que le système conserve un certain nombre desinformations dont il a disposé pour répondre aux demandes d'horaire.

(b) Destruction de l'historique de QP-1 dont aucun élément ne sera repristout au long du traitement de QP (ce qui revient à tourner la page).

(c) Inhibition de l'historique de QP-1, de façon à pouvoir le récupérertotalement ou partiellement dans une éventuelle QP+1 (ce qui revient à considérerQP comme une éventuelle parenthèse).

Les Questions Secondaires, qui du point de vue structurel sont de mêmenature que les QP, puisqu'elles appellent des réponses de même nature, se présententde deux manières dans le corpus, même si la différence qui les oppose est unedifférence de pure forme :

(a) Les QP à repérage relatif, qui, à l'aide d'un lexique précis et limité (aprèsavant suivant précédent plus/trop+tôt/tard) supposent que le système agissedirectement sur le type de recherche dans la BD.

(b) Les QP à repérage absolu qui agissent sur l'espace actif en modifiant defaçon absolue J ou PH : je voudrais un autre horaire à partir de dix neuf heures.Beaucoup plus rares que les précédentes, ces QP supposent la modification de lagrille d'analyse.

Les Questions Incidentes qui proviennent du système sont de loin les plusfréquentes. Il s'agit tout simplement des demandes de précision qui suivent une QPincomplète, et leur implantation ne pose guère de problème. Les QI qui relèvent descorrespondants posent en revanche des problèmes bien plus délicats. Il s'agit dequestions qui portent sur la réponse préalable, soit globalement (demande dereformulation), soit partiellement (demande de précision). Ces dernières notamment,qui reviennent sur une partie de la réponse préalable, supposent une décision destratégie entre deux options, dont la seconde constitue une facilité nécessairementcondamnable :

(a) Le système peut se montrer souple, en cherchant à comprendre la natureexacte de la question et il peut s'efforcer d'y répondre très précisément. Ilconsidérerait ainsi un énoncé comme : oui c'est bien c'est pour dimanche ? commeune question totale, et il y répondrait par l'affirmative ou la négative, en reprenant lespropos antérieurs (dans la mesure où la réponse est affirmative), ou en y apportantune éventuelle modification (pour une réponse négative : * ce train est pour unsamedi).

(b) Le système peut être rigide, concevoir des réponses complètes, considérerque toutes les informations qu'il peut avoir à fournir y sont contenues et se borner,dès lors qu'il détecte ce type de QI, à répéter la totalité de la réponse préalablementénoncée, c'est-à-dire pratiquer un maximalisme des réponses.

161

2.7. Quelques exemples

Exemple 10 : problème du traitement de la QI «entre les deux».M1 : SNCF bonjour quel renseignement désirez-vous obtenir?H1 : dreux demain matinM2 : train omnibus No 3267 1ère et 2ème classe départ Paris-Montparnasse à 9h 43arrivée Dreux à 10h 41 sans supplément : ce train vous convient-il?H2 : entre les deuxM3 : désirez-vous un autre renseignementH3 : suivantM4 : train express No 3061 1ère et 2ème classe départ Paris-Montparnasse à 11h 22arrivée Dreux à 12h 9 sans supplément : ce train vous convient-il?H5 : entre les deuxM6 : il n'y a pas de train entre 9h 43 et 11h 22H6 : midiM7 : train omnibus No 6413 1ère et 2ème classe départ Paris-Montparnasse à 12, 28arrivée Dreux à 13h 33 sans supplément : ce train vous convient-il?H7 : soirM8 : train express No 3269 1ère et 2ème classe départ Paris-Montparnasse à 19h 28arrivée Dreux à 20h 22 sans supplément : ce train vous convient-il?H8 : entre les deuxM9 : à quelle heure désirez-vous partir?H9 : entre midi et dix neuf heuresM10 : train omnibus No 6415 1ère et 2ème classe départ Paris-Montparnasse à 14h 28arrivée Dreux à 15h 32 sans supplément : ce train vous convient-il?H10 : au revoir

Certaines interventions des correspondants, et notamment la QI à l'initiative ducorrespondant entre les deux, peuvent faire difficulté, dans la mesure où, comme onpeut le voir dans l'exemple 10, il existe en fait trois situations dans lesquelles unequestion comme celle-là est susceptible d'être posée, et dans lesquelles c'est l'état dudialogue qui permet d'effectuer des distinctions.

Dans un certain nombre de cas, il est utile de mettre en place des heuristiques,sous forme de décisions par défaut. Ainsi, dans l'exemple 11, se déroule jusqu'à H9une longue procédure, qui aboutit à une rupture provisoire de la communication.Cette procédure, commandée par une heuristique dont le but est de permettre audialogue de repartir, se déroule sur un axe incident initial. De M10 à la fin ensuite sedéroule une brève heuristique, en forme de procédures de liaison.

L'analyse des corpus fait enfin apparaître certains problèmes qu'aucun de ceuxqui ont testé le système n'a jamais songé à évoquer, et notamment celui desphénomènes d'écho (exemple 12). Il s'agit, phénomène caractéristique de l'oral, dereprendre une intervention par son élément conclusif ou par l'un de ses éléments.Dans la pratique, le problème est de savoir comment réagir lorsqu'un correspondant,à la suite d'une RP ou d'une RS, reprend l'horaire de départ ou d'arrivée qui vient delui être proposé, car on peut avoir affaire à un simple phénomène d'acquiescementque le système doit ignorer (cf. H2, H4 et H8), tout comme on peut avoir affaire àune QI de reformulation, le correspondant n'ayant pas bien compris l'horaire quivient de lui être proposé (cf. H3 et H7). On aboutit ainsi à cette situation curieusemais amplement attestée dans le corpus qui consiste à

162

Exemple 11 : dialogue guidé par des heuristiques de choix.M1 : SNCF bonjour quel renseignement désirez-vous obtenir?H1 : totoM2 : quel trajet désirez-vous effectuer (dreux-paris ou paris-dreux)?H2 : totoM3 : je répète : quel trajet désirez-vous effectuer (dreux-paris ou paris-dreux)?H3 : totoM4 : je répète : quel trajet désirez-vous effectuer (dreux-paris ou paris-dreux)?H4 : totoM5 : pouvez-vous reformuler svpH5 : totoM6 : je répète : pouvez-vous reformuler svpH6 : totoM7 : je répète : pouvez-vous reformuler svpH7 : totoM8 : je ne parviens pas à répondre à cette question : désirez-vous un autrerenseignement ?H8 : totoM9 : au revoirH9 : dreux demain matinM10 : train omnibus No 3267 1ère et 2ème classe départ Paris-Montparnasse à 9h 43arrivée Dreux à 10h 41 sans supplément : ce train vous convient-il?H10 : totoM11 : désirez-vous un autre renseignement?H11 : totoM12 : au revoirH12 : au revoir

Exemple 12 : traitement de phénomènes d'écho.M1 : SNCF bonjour quel renseignement désirez-vous obtenir?H1 : dreux demain matinM2 : train omnibus No 3267 1ère et 2ème classe départ Paris-Montparnasse à 9h 43arrivée Dreux à 10h 41 sans supplément : ce train vous convient-il?H2 : neuf heures quarante troisM3 : désirez-vous un autre renseignement?H3 : neuf heures quarante troisM4 : train omnibus No 3267 1ère et 2ème classe départ Paris-Montparnasse à 9h 43arrivée Dreux à 10h 41 sans supplément : ce train vous convient-il?H4 : dix heures quarante et uneM5 : désirez-vous un autre renseignement?H5 : suivantM6 : train omnibus No 6413 1ère et 2ème classe départ Paris-Montparnasse à 12h 28arrivée Dreux à 13h 33 sans supplément : ce train vous convient-il?H6 : midi et demieM7 : je répète : train omnibus No 6413 1ère et 2ème classe départ Paris-Montparnasse à12h 28 arrivée Dreux à 13h 33 sans supplément : ce train vous convient-il?H7 : oui douze heures vingt huitM8 : je répète : train omnibus No 6413 1ère et 2ème classe départ Paris-Montparnasse à12h 28 arrivée Dreux à 13h 33 sans supplément : ce train vous convient-il?H8 : midi vingt huit ouiM9 : désirez-vous un autre renseignement?H9 : au revoir

163

interpréter de façon différente Xh oui et oui Xh. Dans le premier cas en effet, il s'agitd'une simple réponse affirmative à la question ce train vous convient-il ? Dans lesecond en revanche, il s'agit d'une demande de confirmation, c'est-à-dire d'une miseen question de la réponse affirmative qui vient d'être énoncée.

3. Évaluation

L'appréciation du système est totalement différente selon qu'il s'agit du corpusd'apprentissage, qui sert à déterminer les limites du système (les erreurs quidemeurent supposent des incapacités), ou du corpus d'évaluation, qui permet detester la portée du système (les erreurs qui demeurent révèlent tantôt les incapacitésdu système, tantôt les lacunes de l'apprentissage). Dans un cas comme dans l'autre,les données ont dû subir quelques transformations : simplification des trajets,disparition des temps de recherche dans la BD et réduction des tâches effectuéesnotamment.

3.1. Corpus d'apprentissage

3.1.1. Modifications du corpus

Certaines des différences que l'on peut constater entre les dialogues réalisésavec Dialors et leurs modèles issus du corpus sont dues au corpus lui-même, et ilserait absurde de les présenter comme l'illustration de diverses carences du système,d'autant plus que cela n'a qu'une importance très relative, à l'instar de l'exemple 13.L'opératrice notamment se départit parfois de son comportement d'automate simulé,que ce soit par une quelconque distraction ou bien en sortant de son rôle d'esclave. Ila ainsi été nécessaire d'exclure les deux premières communication de l'évaluation,dans la mesure où elles comportent divers phénomènes particuliers liés aucomportement d'une opératrice non encore rodée à la simulation qu'elle va effectuer.

Quelques correspondants adoptent ensuite un comportement langagier qu'iln'y a pas lieu de simuler avec Dialors par exemple en s'adressant à un tiers (attendsje veux lui poser d'autres questions), ou bien en prenant la parole de façonimpromptue. Un correspondant s'efforce ainsi de briser par des oui itératifsl'interaction alternative.

La réduction de la tâche induit également quelques modifications du corpusd'apprentissage, et un certain nombre de questions dépassent les capacités d'unsystème qui se limite à fournir des renseignements horaires sur la ligue Paris-Dreux. Cela se produit notamment lorsque l'on a affaire soit à une confusion destâches, soit à la consultation d'une BD trop différente. A deux reprises par exemplel'opératrice est amenée à se demander s'il s'agit de Calais-Ville ou de Calais-Maritime. Parfois, les correspondants s'enquièrent de l'existence de couchettes, detrains supplémentaires, de problèmes de changement ...

Exemple 13 : communication comportant quelques modifications

164

CORPUSV1 : SNCF bonjour quel renseignement désirez-vous obtenir?C1 : e les horaires de train pour deauville s'il vous plaîtV2 : quel jour désirez-vous partir?C2 : alloV3 : quel jour désirez-vous partir?C3 : alloV4 : quel jour désirez-vous partir?C4 : e aujourd'huiV5 : vers quelle heure désirez-vous partir?C5 : vers vers les trois heures et demie quatre heures

V6 : le train turbo 137 part de Paris gare Saint-Lazare à 16h44 arrive à Lisieux à 18h14 part un autorail No 7313 à Lisieux à 18h26 arrive à Deauville à 18h56 le début de ce train est un train à supplément : ce train vous convient-il?C6 : e oui ben je vais réfléchir merciV7 : désirez-vous d'autres renseignements?C7 : nonV8 : ne quittez pas C8 : oui merci

DIALORSM1 : SNCF bonjour quel renseignement désirez-vous obtenir?H1 : e les horaires de train pour dreux s'il vous plaîtM2 : quel jour désirez-vous partir?H2 : alloM3 : je répète : quel jour désirez-vous partir?H3 : alloM4 :: je répète : quel jour désirez-vous partir?H4 : e aujourd'huiM5 : à quelle heure désirez-vous partir?H5 : vers vers les trois heures et demie quatre heuresM6 : 3h du matin ou de l'après-midi?H6 : de l'après midiM7 : train express No 3067 1ère et 2ème classe départ Paris-Montparnasse à 16h35 arrivée Dreux à 17h32 sans supplément : ce train vous convient-il?

H7 : e oui ben je vais réfléchir merciM8 : désirez-vous un autre renseignement?H8 : nonM9 : au revoirH9 : au revoir

3.1.2. Erreurs

Les erreurs à proprement parler tiennent pour l'essentiel, outre 3 phénomènesponctuels (problèmes de trains «direct», de supplément et de confirmation), àl'incapacité pour le système d'intégrer dans les demandes d'horaire des éléments liésaux tarifs et de contester des questions auxquelles il est impossible de répondreautrement que cela a déjà été fait. Ces situations de conflit, que l'on rencontreessentiellement dans 3 communications, tiennent à l'attitude de certainscorrespondants qui, de manière générale, s'entêtent à la suite d'un refus et il faudraità la limite que le système soit capable de se fâcher pour les éconduire. Cela va de laréitération d'une question dont la réponse n'est pas considérée comme satisfaisante(Dialors assume ce type de situation par l'utilisation de je répète) à des questions devie privée, dans lesquelles on voit difficilement un traitement automatique intervenir,comme le montre l'exemple 14 :

- En C3 apparaît une première difficulté qui dénote déjà la spécificité de celocuteur : il s'agit du seul phénomène d'écho du corpus d'apprentissage nonassimilable par Dialors qui interpréterait cet énoncé comme une QS à repérageabsolu et non comme une QI.

- Dialors interpréterait C6 comme une QS à repérage absolu sollicitant un trainvers 16h. Il faut bien reconnaître toutefois que la formule vers 16h entre 16h15 et16h30 16h15 peut prêter à confusion !

- Pour C7, Dialors se tromperait totalement et fournirait un horaire sur le trajetParis-Cherbourg (et non Cherbourg-Paris). Le correspondant commence parailleurs à faire intervenir des questions personnelles qu'il faudrait être à même, sinond'interpréter, du moins d'identifier, pour pouvoir prétendre poursuivre lacommunication.

165

Exemple 14: communication conflictuelle difficilement simulableV1 : SNCF bonjour quel renseignement désirez-vous obtenir?C1 : e je voudrais savoir les horaires de paris à cherbourg et de cherbourg à paris e alorson va commencer par e paris cherbourg un départ en fin d'après-midiV2 : quel jour désirez-vous partir?C2 : e un jour de semaineV3 : un turbo 1ère et 2ème classe part de la gare de Paris-Saint-Lazare à 18h23mnarrivée à la gare de Cherbourg à 21h43mn ce train circule tous les jours sauf les vendrediset les dimanches et fêtes : ce train vous convient-il?C3 : e oui oui oui vous m'avez dit quelle heure dix sept heures quarante heinV4 : 18h23C4 : d'a okay alors maintenant e pour e cherbourg paris alors en se e en semaine y a untrain qui arrive vers seize heures quinze seize heures trente par là autour est-ce que vouspouvez préciser l'heure exacteV5 : un autorail 1ère et 2ème classe part de la gare de Cherbourg à 12h22mn arrive à lagare de Caen à 14h09mn là vous devez changer et prendre un express 1ère et 2èmeclasse partant de la gare de Caen à 14h35mn arrivant à la gare de Paris Saint-Lazare à16h59mn : ce train vous convient-il?C5 : e non je crois qu'y en a un qui arrive plus tot hein à la gare Saint-LazareV6 : le turbo 1ère et 2ème classe arrivant à la gare de Paris Saint-Lazare à 16h36mncirculera tous les vendredis à partir du 2 marsC6 : e non ça vas pas non plus ça hein c'est plus tard vers seize heures entre seizeheures quinze et seize heures trente et seize heures quinze arrivée paris montparnasseV7 : le seul train qui vous puissiez prendre arrive à la gare de Paris Saint-Lazare à13h57mnC7 : ah non je crois pas hein c'est pour e je dois attendre une personne e demain jeudiqui arrive de cherbourg qui m'a dit un train entre seize quinze et seize heures trente alorsest-ce que vous pourriez regarder demain précisément pour la journée de demain si y apas un train qui arrive entre 16h et 16h15 vers 16V8 : le train suivant arrivant à 15h48 à Paris Saint-Lazare ne circule pas encore il necirculera qu'à partir du 28 févrierC8 : non non c'est pas 15h48 c'est entre 16h et 16h15V9 : il n'existe pas de train à cette heureC9 : ah bon y a pas de train demain e entre ce qui arrive de cherbourg entre 16h et16h15V10 : non il n'existe pas de train arrivant à Paris Saint-Lazare entre 16h et 16h15mnC10 : ah ben zut zut zut vous êtes sûrV11 : oui je suis sûrC11 : bon ben tant pis vous pouvez me repasser l'opératrice svp vous êtes bien je tiens àvous remercier vous êtes bien gentil est-ce que je dois dire monsieur ou madame allôV12 : ceci n'est pas de mon domaine ne quittez pas je vous passe la personnecompétente

- En C8, comme Dialors ne reconnaît pas les négations, il confirmerait le trainde 16h48 !

- C9 serait correctement interprété si, et c'est une hypothèse purement gratuite,Dialors était capable de parvenir jusque là.

- C10 induirait la question Désirez-vous un autre renseignement ?, alors quel'opératrice ne voit pas d'autre solution à la poursuite de l'interaction que de sedépartir de son langage habituel et de produire un énoncé exceptionnel : il s'agit deconfirmer les craintes du correspondant et non de poursuivre.

166

- Avec C11, on tombe dans la comédie, dès lors que l'on connaît le principe del'expérimentation en tout cas, et on a presque le sentiment d'une duperie, alors que,dans l'ensemble du corpus, ce n'est ni le but ni le cas.

- Avec C11, cela débouche sur une personnalisation, qui se matérialise dans laquestion finale : est-ce que je dois dire monsieur ou madame?

Il est frappant de constater que la grande majorité des phénomènes d'erreur seposent conjointement à travers 6 communications . Tout se passe en somme commesi certains correspondants, que ce soit pour des raisons personnelles ouoccasionnelles, se montraient rétifs au modèle de dialogue implicitement imposé parl'opératrice. On met alors en oeuvre une simulation artificielle, comme l'illustrel'exemple 15, où on relève un ensemble impressionnant de phénomènes difficilementassimilables à ceux auxquels les autres communications ont pu nous habituer. S'ilsn'interdisent pas la simulation, comme dans l'exemple 14, ils induisent trop demodifications pour ne pas la dénaturer :

-C4/H3 ne sont pas interprétables, ce qui n'empêche pas de répondre de manièresatisfaisante, c'est-à-dire de se limiter à interpréter dans cet énoncé ce qui porte surles questions de tarif et d'ignorer le début dans son ensemble. Tout comme C5 dansl'exemple 14, s'il n'y avait pas également cette demande de tarif, Dialors risqueraitd'ailleurs d'interpréter à tort un phénomène d'écho .

- C12/H7 pour sa part est correctement interprété par Dialors, puisque ceténoncé est effectivement compris comme une QI portant sur le supplément. Dialorsn'est toutefois pas à même de procéder comme l'opératrice, c'est-à-dire d'applique lamaxime de satisfaction de Grice et de répondre par avance à des interventionspotentielles du correspondant. Il convient à ce propos de remarquer, d'une part, quesi l'opératrice se départit ainsi de son comportement habituel, c'estvraisemblablement du fait de l'état du dialogue (état dont le modèle permet de rendrecompte), et d'autre part que la simulation devient dès lors bancale puisque lecomportement du correspondant devient une hypothèse relativement peu probable.

- C14/H8 fait enfin l'objet d'un contresens qui, même s'il n'a pas une importancecapitale, n'en est pas moins fâcheux. Le système interprète en effet qu'il est questionde place, c'est-à-dire de réservation, plutôt que de tarif !

3.1.3. Efficacité

Si certaines erreurs ne sont pas récupérables, pour celles qui le sont, le problèmese pose en termes d'efficacité, c'est-à-dire que nous allons envisager les différenteserreurs en fonction du coût de leur récupération éventuelle par Dialors, coût quine peut guère s'exprimer qu'en nombre d'échanges :

- Une erreur telle que la non compréhension de ce dans ce soir coûterait ainsiun échange supplémentaire. Selon toute vraisemblance, il suffira d'un échangeincident pour résoudre le problème.

- Une erreur telle qu'une inversion GD/GA coûterait trois échangessupplémentaires. Le correspondant devra en effet commencer par prendreconscience de l'erreur avant de pouvoir, par différentes QI, compléter soninformation et se trouver à même de fournir une réponse adéquate.

167

Exemple 15 : communication dont la simulation par Dialors est artificielle

CORPUS V1 : SNCF bonjour quel renseignement désirez-vousobtenir?C1 : j'aimerais avoir un renseignement pour un pour unaller pour paris lorient hein savoir l'heure exacte dansl'après-midi du vendredi vingt sept e douze quatre vingtseptV2 : vers quelle heure désirez-vous partir?C2 : vers cinq heuresV3 : un corail 1ère et 2ème classe part de la gare deParis-Montmarnasse à 17h03mn arrive à la gare deLorient à 22h07mn ce train comporte un supplément dela gare Montparnasse à la gare de Rennes : ce train vousconvient-il?C3 : e oui y en aurait-il un autre un peu plus tard ou alorsun autre train qui mette moins de temps pour arriver àlorientV4 : un express 1ère et 2ème classe part de la gare deParis-Montmarnasse à 19h14mn arrive à la gare deLorient à Oh19mn : ce train vous convient-il?C4 :e oui mais je crois je crois que je préfère le premiercelui là de dix sept heures trois à vingt deux heures zérosept et quand on parle de supplément c'est-à-dire quec'est le tarif qui changeV5 : oui il s'agit du tarifC5 : oui et ça serait combien le tarif eV6 : désirez-vous un l'aller simple ou l'aller retour?C6 : e l'aller simpleV7 : en quelle classe voyagez-vous?C7 : en deuxième classe eV8 : le billet 2ème classe aller simple Paris-Lorientcoûte 249F avec le supplément de 26FC8 : le supplément est compris dans les 249FV9 : oui le supplément de 26F est comprisC9 : bon ben je vous remercie e c'est toutV10 : désirez-vous d'autres renseignements?C10 : e oui maintenant ça serait pour e ça serait pour leretour e ça serait pour un retour e le premier le premieravril mille neuf cent quatre vingt sept c'est-à-dire delorient à paris montparnasseV11 : vers quelle heure désirez-vous partir?C11 : e dans l'après-midiV12 : un express 1ère et 2ème classe part de la gare deLorient à 13h45mn arrive à la gare de Paris-Montparnasse à 19h35mn : ce train vous convient-il?C12 : est-ce que c'est un express comme la premièrefois avec un supplémentV13 : non il n'existe pas de train à supplément dansl'après-midi du 1er janvierC13 : bon ben tant pis pour celui-là e de treize heuresquarante cinq et qui arrive à dix neuf heures trente y apas de supplément làV14 : non il n'y a pas de supplémentC14 : et la place c'est deux cent vingt trois le tarif eV15 : oui le tarif est de 223F

C15 : bon ben voilà c'est toutV16 : désirez-vous d'autres renseignements?C16 : non merci

Dialors M1 : SNCF bonjour quel renseignement désirez-vousobtenir?H1 : j'aimerais avoir un renseignement pour un pour unaller pour paris dreux hein savoir l'heure exacte dansl'après-midi du vendredi vingt sept e douze quatre vingtsept

M2 : train omnibus No 6415 1ère et 2ème classe départParis-Montmarnasse à 14h28 arrivée Dreux à 15h32sans supplément : ce train vous convient-il?

H2 : e oui y en aurait-il un autre un peu plus tard ou alorsun autre train qui mette moins de temps pour arriver àdreuxM3 : train omnibus No 6413 1ère et 2ème classe départParis-Montmarnasse à 15h28 arrivée Dreux à 16h33sans supplément : ce train vous convient-il?H3 : e oui mais je crois je crois que je préfère le premiercelui là de quatorze heures vingt huit à quinze heurestrente deux et quand on parle de supplément c'est -à-direque c'est le tarif qui changeM4 : les questions relatives aux TARIFS ne font paspartie de mon domaine : désirez-vous un autrerenseignement?

H4 : bon ben je vous remercie e c'est toutM5 : désirez-vous un autre renseignement?H5 : e oui maintenant ça serait pour e ça serait pour leretour e ça serait pour un retour e le premier le premieravril mille neuf cent quatre vingt sept c'est-à-dire dedreux à paris montparnasseM6 : à quelle heure désirez-vous partir?H6 : e dans l'après-midiM7 : train express No 6346 1ère et 2ème classe départDreux à 15h27 arrivée Paris-Montparnasse à 16h13sans supplément : ce train vous convient-il?H7 : est-ce que c'est un express comme la première foisavec un supplémentM8 : ce train est un train sans supplément

H8 : et la place c'est deux cent vingt trois francs le tarif eM9 : les questions relatives aux RÉSERVATIONS nefont pas partie de mon domaine : désirez-vous un autrerenseignement?H9 : bon ben voilà c'est toutM10 : désirez-vous un autre renseignement?H10 : non merci

168

Nous en arrivons ainsi à deux catégories de problèmes de compréhension,problèmes qui supposent l'adjonction de quelques échanges supposés dans lasimulation avec Dialors. Ces deux catégories regroupent aussi bien les problèmesde représentation interne constatés lors de l'évaluation de Alors que ceux qui seprésentent dans le courant des communications :

- Ceux qui résultent d'une absence de compréhension du système, parexemple avec des expressions telles que tôt le matin ou le plus tôt possible, qui sontsusceptibles d'être immédiatement récupérées, à l'aide d'un seul échange.

- Ceux qui résultent d'une erreur de compréhension, et qui ne peuvent êtrerécupérés que lorsque le correspondant s'en rend compte, c'est-à-dire à la suite d'uneréponse suivie d'au moins autant d'échanges réparateurs qu'il y a eu d'échanges entrel'erreur et la réponse erronée. C'est par exemple le cas lorsque oui ce train meconvient c'est très bien mais est-ce que j'ai la chance samedi d'avoir un train sansproblème pour Avignon est-ce que c'est possible est interprété comme une nouvelleQP sollicitant une train Paris-Avignon, et non comme une QI. C'est la raison pourlaquelle nous avons considéré que, pour toute erreur de compréhension, lasimulation par Dialors devait être créditée de trois échanges supplémentaires pourêtre potentiellement récupérée.

3.2. Corpus d'évaluation

On trouve dans le corpus d'évaluation les mêmes problèmes que dans le corpusd'apprentissage, c'est-à-dire qu'un certain nombre des divergences que l'on peutconstater entre les corpus sont imputables au corpus et non à Dialors :

- Cela concerne tout d'abord l'opératrice qui se départit parfois involontairementde son rôle d'automate, par exemple en interprétant un énoncé tel que un autrecomme une QS implicite, ce qui conduit à proposer le train suivant.

- Cela concerne également les correspondants qui adoptent parfois uncomportement qui ne perturbe pas le système mais dont il ne peut tenir compte : àdiverses reprises par exemple, on trouve des attitudes qui prêtent à rire (faut-il diremonsieur ou madame, qu'est-ce que vous faites ce soir, je trouve que vous avez unetrès belle voix ou vous êtes merveilleux disent par exemple certainscorrespondants).

- On trouve ensuite les mêmes différences de formulation entre les propos del'opératrice et ceux de Dialors : que désirez-vous ? au lieu de quels renseignementsdésirez-vous obtenir ? par exemple.

- On trouve enfin des problèmes liés à la limitation de la tâche à un seulparcours : quelques communications ou quelques négociations, essentiellementconsacrées à des questions tarifaires, sont à exclure ; quelques QI ne peuvent êtreprises en considération car elles concernent la présence d'un wagon-restaurant, lesproblèmes de zones bleues, de TGV et de transport de chiens.

Les erreurs, c'est-à-dire les phénomènes que Dialors est incapable de traiter,même au prix d'un certain nombre d'échanges réparateurs, sont considérablementmoins nombreuses et moins importantes que dans le corpus d'apprentissage. Au lieunotamment de trouver 6 communications sur 70 qui ne puissent se prêter à lasimulation, on n'en trouve qu'une sur 55. Dans celle-ci, reprise dans l'exemple 16, un

169

correspondant demande un train pour Caen alors qu'il veut descendre à Evreux etqu'il s'exprime de façon particulièrement confuse.

Exemple 16 : passage dont la simulation est difficilement envisageableV4 : .......... ce train vous convient-il?C4 : non j'aimerais e en connaître un autre vers dix sept heures et j'aimeraissavoir également si il s'arrête à évreux et à quelle heure s'arrête-t-il à évreuxdonc voilà ma question je voudrais avoir un train vers dix sept heures en dipartant de saint lazare en direction de caen et j'aimerais savoir si il s'arrête àévreux et à quelle heure s'arrête-t-il à évreux aujourd'hui samedi vingt neufdécembreV5 : un corail 1ère et 2ème classe part de la gare de Paris Saint-Lazare à17h25mn arrive à la gare d'Evreux à 18h23mn arrive à la gare de Caen à19h43mn : ce renseignement vous satisfait-il?C5 : c'est absolument c'est parfait donc e vous m'av vous pouvez merappeler me ra me redire les les horaires mais c'est celui-ci qui me le fautpouvez me redire l'horaireV6 : pouvez-vous formuler votre phrase autrement s'il vous plaît?C6 : oui j'aimerais que vous redonniez que vous me redites ce que vousvenez de me dire au sujet du train ...

On ne trouve par ailleurs aucun problème de confusion ou de conflit queDialors ne puisse résoudre. Les seuls cas où un début de raisonnement estnécessaire concernent, à la suite d'une QS, la sollicitation d'un train entre ceux quiviennent d'être proposés. On rencontre en revanche 3 occurrences d'ambiguïté,toutes 3 à propos de demandes de train direct en QS. Tout comme dans le corpusd'apprentissage, les exemples dans lesquels Dialors n'a pas besoin d'une QI portantsur J ou sur PH sont nombreux. Il s'agit en général d'une forme de demande dereformulation, l'opératrice n'acceptant pas les PH floues (dans la matinée).

Pour les cas d'absence de compréhension (cf. définition ci-dessus), certainssont les mêmes que pour le corpus d'apprentissage, alors que d'autres, liés àl'utilisation d'un lexique étranger à Dialors, apparaissent seulement dans le corpusd'évaluation : on trouve ainsi 1 cas de phénomène d'écho, que le système interprètecomme une demande de reformulation (non non non je prendrais celui qui e neufheures cinquante huit), et 4 cas d'absence de compréhension du fait de l'utilisationd'un lexique non prévu : plus de bonne heure , plus tardif , le même jour.

Pour les erreurs de compréhension (cf. définition ci-dessus) enfin, cela selimite à 4 cas similaires : le système inverse GD et GA. Parfois GA = Paris et laquestion ne comporte que GD, et parfois GD et GA sont inversés sans que GD soitprécédé d'un marqueur spécifique.

170

3.3. Bilan

3.3.1. Méthode

Plus encore qu'avec l'analyse dresser un bilan avec le dialogue n'est pas choseaisée. Il existe en effet à la fois différents types d'erreurs et différentes unités demesure :

- Certaines erreurs ne sont pas imputables au système et, parmi celles qui lesont, certaines sont récupérables, et d'autres pas.

- On peut se fonder tantôt sur les différentes communications, tantôt sur lenombre des négociations, voire même sur le nombre d'échanges.

Ainsi, dans le corpus d'apprentissage par exemple, l'évaluation ne peut se fairequ'à partir des éléments suivants :

- 70 communications sont prises en considération. 23 d'entre elles, soit le tiers,ne font strictement aucune difficulté à être menées à partir de Dialors, et 6 ne sontpas vraiment susceptibles de l'être.

- Ces 70 communications couvrent un total de 93 négociations (ce qui revient àcomptabiliser les QP), qui comportent 53 QS, qui peuvent être considérées commedes sous-négociations.

- Ces 93 négociations couvrent enfin 447 échanges, de quelque nature que cesoit.

De ce fait, les erreurs n'ont pas à être mises sur le même plan, et une typologiepeut en être dressée :

- Les erreurs non imputables au système tout d'abord n'ont pas à être prisesen considération.

- Les erreurs non récupérables posent ensuite le problème des limites dusystème. Elles concernent essentiellement la négociation. 6 communications mises àpart, la totalité d'une communication est rarement concernée et, pour les parties qui lesont, il s'agit moins d'un nombre limité d'échanges que de l'unité sémantique encours.

- Les erreurs récupérables posent enfin le problème de l'efficacité du système,efficacité qui s'exprimera cette fois en nombre d'échanges nécessaires pourrécupérer les erreurs.

On aboutit ainsi, non pas à un taux d'erreur unique, mais à une doubleévaluation :

- D'une part se détermine la partie du corpus que le système ne peut traiter, cequi représente 6 communications sur 70 (8,57 % du corpus), auxquelles s'ajoutent 2QS et 4 QP, soit sensiblement 5,3 % des 93 QP + 57 QS du corpusd'apprentissage. 14 % de celui-ci résiste ainsi à la simulation par Dialors, ce quipermet de dégager un taux de compétence de 86 %.

- D'autre part se calculent le nombre d'échanges nécessaire à récupérer les 8occurrences d'absence de compréhension et les 3 erreurs de compréhension. Celasuppose en effet 17 échanges supplémentaires, ce qui représente, par rapport aux

171

447 échanges du corpus d'apprentissage, un accroissement du nombre d'échangesde 3,8 %, ce qui permet de dégager un taux d'efficacité de l'ordre de 96 %.

Précisons, pour terminer quant à la méthode d'évaluation, ce que cettedernière traduit exactement. Il s'agit en effet d'évaluer jusqu'à quel point untraitement automatique est capable de simuler une opératrice qui jouait le rôle d'unemachine et qui s'efforçait donc d'en adopter le comportement présumé. Cela revientdonc à évaluer non pas véritablement les performances de Dialors, mais plutôtjusqu'à quel point on peut actuellement implanter le comportement présumé d'unemachine qui dialogue, sur une tâche bien délimitée, telle que les renseignementsSNCF. La double évaluation, à l'aide, d'une part, d'un taux de compétence et, d'autrepart, d'un taux d'efficacité, doit donc être maniée avec précaution. Autant lesproblèmes d'efficacité sont calculables (si on ne prend pas en compte les problèmesd'entrée vocale bien entendu), autant les problèmes de compétence le sont moins.Ces derniers apparaissent en effet lorsque la communication dérape, c'est-à-direlorsque l'opératrice se départit de son comportement langagier du fait de l'attitude ducorrespondant. Or, si tel n'était pas le cas, le correspondant serait bien forcé de seconformer aux limites du système, et le problème de la compétence deviendrait unproblème d'efficacité. Il est d'ailleurs plus que probable que, dans lescommunications aisément simulables à l'aide de Dialors, les correspondants ontsacrifié l'efficacité de l'interaction aux compétences supposées du système.

3.3.2. Comparaison

Lorsque l'on fait le bilan de cette évaluation, on aboutit aux chiffres indiquésfigure 3, qui n'ont bien entendu de signification que dans le contexte de notre travail:

- Les deux corpus sont d'importance comparable (cf. le nombre denégociations), même si le nombre d'échanges et de communications est légèrementplus important dans le corpus d'apprentissage.

- Le taux de compétence passe de 85 % dans le corpus d'apprentissage à 95 %dans le corpus d'évaluation. Il s'agit là d'une différence considérable due surtout uneinteraction itérative induite par des demandes de reformulation beaucoup plusfréquentes de la part de l'opératrice qui simulait la machine.

Si on reprend maintenant le problème sous l'angle de la double évaluation quenous nous sommes proposé de faire, on constate que :

- Dialors demeure parfaitement efficace tout au long du corpus d'évaluation,même si, du fait des demandes de reformulation et de l'interaction itérative, lasimulation ne peut être considérée comme tout à fait satisfaisante.

- L'introduction massive de demandes de reformulation fait monter le taux decompétence de façon appréciable. Si on évalue, à partir de Dialors, l'efficacité desreformulations produites par les correspondants (en se fondant systématiquement,hypothèse la plus avantageuse, sur le dernier état des séquences reformulatives) onconstate toutefois que, compte tenu des absences et des erreurs de compréhension, letaux d'efficacité chute de 96 % à 80 %.

172

De par sa conception, le corpus ne permet cependant pas d'aboutir à desconclusions aussi fondées qu'à propos du comportement langagier induit par lamachine. La cause de l'évolution du taux d'erreur demeure en effet une hypothèsedont nous nous bornons à croire qu'elle est fondée. L'évolution du taux d'efficacitéquant à lui ne tient pas compte des possibilités d'intégration de certainesfonctionnalités dans le système. En tout état de cause, l'évaluation ne permet pas,alors qu'à propos de l'analyse c'était possible, de dégager des conclusionsparfaitement fondées, dans la mesure où, pour une étude du dialogue, la simpleintroduction de demandes de reformulations modifie trop le type d'interaction.L'évaluation permet toutefois de dégager des conclusions qui nous paraissentintéressantes, même si elles demanderaient à être corroborées par la réalisation,l'étude et l'évaluation d'autres corpus :

- Un système comme Dialors est stable, et la problématique qui le sous-tend, àsavoir de se fonder sur des données attestées, nous semble amplement fondée.

- Le type d'interaction pratiquée peut avoir une influence considérable sur lesperformances d'un système de DHM, et c'est là un phénomène qu'aucun concepteurde système ne pourrait ignorer. Le dialogue est en effet, parmi les traitementsautomatiques du langage, un domaine lié au vivant, où l'interaction s'effectuetotalement en temps réel, et où ce que fait le système influence directement ce queproduit le correspondant.

corpus corpusd’apprentissage d’évaluation

Données(1)communications 70 55négociations 93 95échanges 447 406

Taux de compétence (( 2) 8 5 % 9 5 %communication à problème 6 1négociation à problème 6 3

Taux d'efficacité (( 3) 9 6 % 9 4 %absence de compréhension 8 5erreur de compréhension 3 4

Figure 3 : bilan chiffré

(1) Il s'agit du nombre respectif des communications, des négociations et des échanges dans la les corpusd'apprentissage et d'évaluation.(2) Il s'agit de comptabiliser les communications et les négociations qu'il n'est pas concevable de traiter avecDIALORS. Ces chiffres sont donc à rapporter au nombre correspondant de communications et de négociations pourdégager les pourcentages affichés.(3) Il s'agit de comptabiliser les diverses occurrences d'erreurs qui sont récupérables au prix d'un certain nombred'échanges supplémentaires : 1 pour les absences de compréhension ; 3 pour les erreurs de compréhension. Il suffitalors, pour obtenir les pourcentages affichés, de rapporter le nombre d'échanges supplémentaires nécessaires à lasimulation à celui des échanges correspondants.

173

CORPUSV1 : SNCF bonjour quel renseignement désirez-vous obtenir?C1 : j'aimerais avoir un renseignement pour un pour un aller pour paris lorient hein savoir l'heure exacte dans l'après-midi du vendredi vingt sept e douze quatre vingt septV2 : vers quelle heure désirez-vous partir?C2 : vers cinq heuresV3 : un corail 1ère et 2ème classe part de la gare de Paris-Montmarnasse à 17h03mn arrive à la gare de Lorient à 22h07mn ce train comporte un supplément de la gare Montparnasse à la gare de Rennes : ce train vous convient-il?C3 : e oui y en aurait-il un autre un peu plus tard ou alors un autre train qui mette moins de temps pour arriver à lorientV4 : un express 1ère et 2ème classe part de la gare de Paris-Montmarnasse à 19h14mn arrive à la gare de Lorient à Oh19mn : ce train vous convient-il?C4 :e oui mais je crois je crois que je préfère le premier celui là de dix sept heures trois à vingt deux heures zéro sept et quand on parle de supplément c'est-à-dire que c'est le tarif qui changeV5 : oui il s'agit du tarifC5 : oui et ça serait combien le tarif eV6 : désirez-vous un l'aller simple ou l'aller retour?C6 : e l'aller simpleV7 : en quelle classe voyagez-vous?C7 : en deuxième classe eV8 : le billet 2ème classe aller simple Paris-Lorient coûte 249F avec le supplément de 26FC8 : le supplément est compris dans les 249FV9 : oui le supplément de 26F est comprisC9 : bon ben je vous remercie e c'est toutV10 : désirez-vous d'autres renseignements?C10 : e oui maintenant ça serait pour e ça serait pour le retour e ça serait pour un retour e le premier le premier avril mille neuf cent quatre vingt sept c'est-à-dire de lorient à paris montparnasseV11 : vers quelle heure désirez-vous partir?C11 : e dans l'après-midiV12 : un express 1ère et 2ème classe part de la gare de Lorient à 13h45mn arrive à la gare de Paris-Montparnasse à 19h35mn : ce train vous convient-il?C12 : est-ce que c'est un express comme la première fois avec un supplémentV13 : non il n'existe pas de train à supplément dans l'après-midi du 1er janvierC13 : bon ben tant pis pour celui-là e de treize heures quarante cinq et qui arrive à dix neuf heures trente y a pas de supplément làV14 : non il n'y a pas de supplémentC14 : et la place c'est deux cent vingt trois le tarif V15 : oui le tarif est de 223F

C15 : bon ben voilà c'est toutV16 : désirez-vous d'autres renseignements?C16 : non merci

DIALORSM1 : SNCF bonjour quel renseignement désirez-vous obtenir?H1 : j'aimerais avoir un renseignement pour un pour un aller pour paris dreux hein savoir l'heure exacte dans l'après-midi du vendredi vingt sept e douze quatre vingt sept

H2 : train omnibus No 6415 1ère et 2ème classe départ Paris-Montmarnasse à 14h28 arrivée Dreux à 15h32 sans supplément : ce train vous convient-il?

H2 : e oui y en aurait-il un autre un peu plus tard ou alors un autre train qui mette moins de temps pour arriver à dreuxM3 : train omnibus No 6413 1ère et 2ème classe départ Paris-Montmarnasse à 15h28 arrivée Dreux à 16h33 sans supplément : ce train vous convient-il?H3 : e oui mais je crois je crois que je préfère le premier celui là de quatorze heures vingt huit à quinze heures trente deux et quand on parle de supplément c'est -à-dire que c'est le tarif qui changeM4 : les questions relatives aux TARIFS ne font pas partie de mon domaine : désirez-vous un autre renseignement?

H4 : bon ben je vous remercie e c'est toutM5 : désirez-vous un autre renseignement?H5 : e oui maintenant ça serait pour e ça serait pour le retour e ça serait pour un retour e le premier le premier avril mille neuf cent quatre vingt sept c'est-à-dire de dreux à paris montparnasseM6 : à quelle heure désirez-vous partir?H6 : e dans l'après-midiM7 : train express No 6346 1ère et 2ème classe départ Dreux à 15h27 arrivée Paris-Montparnasse à 16h13 sans supplément : ce train vous convient-il?H7 : est-ce que c'est un express comme la première fois avec un supplémentM8 : ce train est un train sans supplément

H8 : et la place c'est deux cent vingt trois francs le tarif M9 : les questions relatives aux RESERVATIONS ne font pas partie de mon domaine : désirez-vous un autre renseignement?H9 : bon ben voilà c'est toutM10 : désirez-vous un autre renseignement?H10 : non merci

174

175

ConclusionL'intérêt de cette étude de cas ne réside moins dans le fonctionnement d'un

système relativement ad hoc et techniquement relativement simple que dans laméthode développée, à savoir une méthode ascendante, fondée sur des donnéesattestées, à partir d'une partition du corpus en un corpus d'apprentissage et uncorpus d'évaluation. Cette méthode permet notamment d'observer qu'en matière deDHM il serait illusoire de se soucier exclusivement d'augmenter le niveau decompréhension, au détriment de la gestion du canal de communication. Une telleapproche peut également permettre de faire émerger des modélisationséventuellement prometteuses, telle que le modèle de dialogue présenté dans leschapitres 1 et 5.

Dans un travail de ce type, l'outil informatique est moins un but qu'un révélateur,en l'occurrence des réalités linguistiques. Alors que la distinction entre unelinguistique qui s'intéresse au fonctionnement des énoncés et une linguistiqueinteractionnelle peut apparaître comme relativement floue, elle est d'emblée très clairedès lors qu'il s'agit d'implantation informatique : dans un cas, le système doitconstruire une représentation interne ; dans l'autre, il doit être capable d'utiliser cettereprésentation, c'est-à-dire de l'inscrire dans le temps. Dans l'analyse, lacompréhension est statique, dans le dialogue elle est dynamique. Dans un cas, ons'intéresse à la constitution du message, dans l'autre on privilégie sa fonction.

Le système qui est décrit au cours de cette étude de cas peut paraître doté deperformances intéressants, dans la mesure où les taux d'erreur sont faibles. Ceux-citoutefois ne dénotent que fort peu de chose, et ne seraient d'un réel profit que pourcomparer notre approche avec d'autres, à partir des mêmes données. La méthoded'évaluation en revanche, tant en ce qui concerne l'analyse de phrases (erreursnégligeables, à rectification immédiate, à rectification différée, erreurs nonrectifiables) qu'en ce qui concerne le dialogue (taux de compétence, taux d'efficacité)est une méthode tout à fait utilisable en dehors de l'application que nous avonsproposée, même si elle n'est applicable qu'à des tâches de DHM.

Une comparaison avec GUS (genial understanding system) [Bobrow et al. 77]est toutefois possible. Il s'agit d'un système où le dialogue est guidé par les schémas,

176

au sens où une analyse peut être guidée par la syntaxe ou par la sémantique, c'est-à-dire que d'autres aspects peuvent intervenir, mais seulement de manière accessoire,sans risquer de mettre le principe du traitement en cause. Au cours des dernièresannées, ce système est resté la référence en matière de DHM en langage naturel :d'une part, il était novateur, et d'autre part les recherches ultérieures n'ont guèrepermis, quel que soit leur intérêt, la réalisation de systèmes réellement plusperformants. De notre point de vue, c'est un système particulièrement intéressant,tout autant par son fonctionnement que pour ses principes. Consacré à une tâchetrès similaire à celle des renseignements SNCF -la réservation de places d'avion- ilutilise également une BD simplifiée, en l'occurrence la ligne Palo Alto / San Diego.De façon très concrète, les problèmes rencontrés sont souvent les mêmes :manipulation des horaires de départ et d'arrivée, gestion des anaphores et des QS (lesuivant), nécessité des analyses par défaut pour compléter une représentationinterne.

Le fonctionnement de Dialors est par un côté très similaire à celui de GUS, etpar un autre côté totalement différent. Comme dans GUS, l'analyse est guidée par unschéma, c'est-à-dire par une représentation sémantique de la tâche : il s'agit detrouver les renseignements dont on a besoin, et tout ce qui ne concerne pas cesrenseignements est finalement laissé de côté. Le dialogue consiste ensuite àactualiser ce schéma qui contient l'ensemble des éléments nécessaires à l'exécutionde la tâche, c'est-à-dire à la fois les modèles de la tâche et de l'utilisateur, etl'historique et le modèle du dialogue. La démarche qui a présidé au développementde Dialors, à savoir se fonder sur un corpus, est toutefois exactement à l'opposé decelle de GUS. On peut même considérer que Dialors reprend le problème là oùGUS s'arrête. Les auteurs en effet, après avoir donné un exemple de dialogue avecGUS (exemple 1) et explicité le détail du fonctionnement du système, concluent surla réalisation d'un corpus de DHM simulé sur la même tâche, en reprenant unexemple qui illustre tout ce que GUS ne peut pas envisager de faire (exemple 2).Dialors, à l'inverse, est fondé sur un tel corpus, et le problème des outilsinformatiques passe au second plan, ce qui ne l'empêche pas de prendre en comptequasiment toutes les difficultés que [Bobrow et al. 77] considèrent commeinsurmontables (exemple 3).

Ces outils informatiques sont d'ailleurs bien plus simples, pour desperformances supérieures. Cette simplicité des moyens transparaît dans l'utilisationde l'analyse sélective et non d'une analyse exhaustive intégrant les différents niveaux(lexical, morphologique, syntaxique, sémantique et pragmatique notamment). Lelexique est en outre considérablement plus réduit : moins de 50 items contre plus de3000 ! Le schéma se résume ensuite à une grille composée de 6 variables, associéesà un jeu d'attributs. L'activation de procédures inéluctablement similaires se fait enfinde manière conditionnelle, et non par le jeu relativement complexe de servants(procédures automatiques) et de demons (procédures à la demandes) [Charniak 72,74]. Si on peut, dix ans plus tard évidemment, comparer les performances deDialors à celles de GUS et observer que le premier parvient à effectuer certaineschoses (cf. exemple 3) qui demeurent impossibles pour le second (cf. exemple 2) , ilfaut préciser que ces performances dépendent en grande partie de la façon dont ledialogue est abordé. Dans un cas prédomine la volonté d'escamoter tout ce qui

177

pourrait être figé, qui pourrait rappeler la machine. Ainsi que le souhaitaient lesutilisateurs, Dialors affiche au contraire le caractère non animé qui est le sien : ledialogue est figé à dessein, afin d'être mieux maîtrisé, ce qu'illustre l'exemple 3.

Exemple 1 : dialogue effectivement réalisé avec GUS.GUS : Hello. My name is GUS. I can help you plan a simple trip by air. Where do you want to go ?Client : I want to go to San Diego on May 28GUS : What time do you want to leave ?Client : I must be in San Diego before 10 am.GUS : Would you like PSA flight 102 that arrives at 9.15 am ?Client : What the next flight ?GUS : Air California flight 310 that leaves at 8.30 am and arrives at 10.00 am.Client : i'll take the first one.GUS : In what name should I make a reservation, please ?Client : Dan BobrowGUS : I have confirmed the following flight...What date do you want to return on ?Client : On Friday in the eveningGUS : Would you like the flight that leaves at 7.45 pm ?Client : that's fine.GUS : I have confirmed the following flight...Thank you for your calling. Goodbye.

Exemple 2 : fragment de dialogue obtenu avec un compère simulant GUSprésenté par les auteurs comme inenvisageable.

GUS : Do you want a flight leaving at 4.00 pm ?Client : Do you have something closer to 7 ?GUS : Do you want the flight at 7 ?...GUS : Do you want the flight arriving at 8.00 pm ?Client : When does it leave ?GUS : 6.30 pm ?Client : How muchGUS : $22.50 round trip...GUS : When do you like to return ?Client : I would like to leave on the following tuesday, but I have to be back before my first class at 9am.

Exemple 3 : traitement de la traduction de ce même fragment par Dialors.Dialors : train omnibus No 6419 1ère et 2ème classe départ Paris-Montparnasse à 16 H 43arrivée Dreux à 17 H 38 sans supplément : ce train vous convient-il?Correspondant : avez-vous quelque chose plus près de sept heuresDialors : train express No 3269 1ère et 2ème classe départ Paris-Montparnasse à 19 H 28 arrivéeDreux à 20 H 22 sans supplément : ce train vous convient-il?Correspondant : à quelle heure part-ilDialors : ce train part de Paris Montparnasse à 19 h 28Correspondant : le prixDialors : les questions relatives aux TARIFS ne font pas partie de mon domaine : désirez-vous unautre renseignement?Correspondant : pour le retourDialors : quel jour désirez-vous partir?Correspondant : j'aimerais partir le mardi suivant mais je dois etre revenu pour neuf heures avant ledébut de mes coursDialors : train omnibus No 3266 1ère et 2ème classe départ dreux à 7 H 32 arrivée paris à 8 H 36sans supplément : ce train vous convient-il?

Que ce soit GUS ou bien SHDRLU, les plus prestigieux des systèmes deDHM datent des années soixante-dix, et on peut légitimement se demander dans

178

quelle mesure on a réellement progressé au cours des vingt dernières années. Laréponse des spécialistes sera certainement positive, dans la mesure où lamodélisation de la signification intentionnelle et de la signification interactionnelleest récente et tout à fait prometteuse ; celle des utilisateurs vraisemblablementbeaucoup plus tempérée, car on ne peut pas dire que le marché soit envahi par dessystèmes performants et appréciés, alors même que le Minitel offre des possibilitésde diffusion considérables. La fracture entre chercheurs et utilisateurs existed'ailleurs depuis longtemps, et elle revêt une tonalité particulière en DHM, avec lesystème ELIZA comme figure emblématique : les uns jugent sur la fluidité del'interaction, alors que les autres s'intéressent essentiellement à la manipulation dusens que l'interaction dénote. Un système astucieux pourra ainsi aisément séduireles uns et laisser les autres indifférents.

La diffusion de systèmes de DHM repose en définitive sur le problème destâches. Avec entrée au clavier, on devrait voir rapidement se développer des systèmeseffectuant des tâches simples telles que la consultation de bases de données(renseignements SNCF, catalogue de vente par correspondance, fichiers divers...) :tout en apportant un confort d'utilisation certain, cela ne présente aucun danger pourles bases de données en question. Le problème devient plus délicat dès lors qu'il yaction sur les bases de données (réservations SNCF, commandes à distance,modifications de fichiers...), car les erreurs peuvent porter bien davantage àconséquence. Quant aux tâches plus ambitieuses, telles que la consultation despages jaunes de l'annuaire, qui nécessitent quasiment une représentation du mondepour être efficaces, elles continueront encore longtemps à animer les débats delaboratoire, en dépit de réalisations qui pourront être astucieuses et profitables. Avecentrée vocale, tout est bien entendu lié aux progrès de la reconnaissance de la parolemultilocuteur par mots enchaînés, et il n'est pas impossible qu'à moyen terme on soitcapable de faire avec entrée vocale ce que l'on fait actuellement avec entrée au clavier.

Divers enjeux économiques peuvent également influencer le développement dessystèmes de DHM. Ceux-ci sont ainsi susceptibles de devenir l'élément clé d'unepolitique commerciale : par leur intermédiaire, on peut notamment orienter uneclientèle, qui vers certains vols ou certains trains, qui vers certains articles. Pour denombreuses entreprises les outils télématiques sont en outre devenus à ce pointvitaux que toute évolution les concernant (l'introduction de dialogue en langagenaturel en l'occurrence) peut mettre en cause la vie de l'entreprise. Le volume desservices concernés est en outre tellement colossal que tout alourdissement desprogrammes doit être maîtrisé : en 1992, la SNCF par exemple a enregistré 22millions de communications via le Minitel (information communiquée par laDirection de la Recherche de la SNCF), et la troisième société de vente parcorrespondance française -la CAMIF- 2,7 millions. Ce qui est enfin l'objet denombreuses études, c'est le dialogue multi-modal, c'est-à-dire le dialogue par diversmédia : langage écrit et oral bien sûr, mais aussi vision et geste, par l'intermédiaired'une grande variété d'outils : souris (en 2 ou 3 dimensions), écran tactile, crayon dedésignation, vêtements numériques digitaux (gants notamment), casque devisualisation stéréoscopique... : langage, image et geste sont ainsi mis enconcurrence en fonction de leur efficacité dans le DHM.

179

Bibliographie

1. Bibliographie analytique

1.1. Articles spécialisés

Les ouvrages dont les références suivent sont, pour le premier, une compilation commodeoù l'on peut trouver certaines des références mentionnées plus bas, et pour les suivants despublications collectives ou des actes de congrès consacrés notamment aux problèmes dedialogue.

Webber, B.L., Grosz, B. et Sidner, C., 1986, Reedings in Natural Language Processing, K.S.Jones.

Reilly, R.G. ed., 1987, Communication failure in dialogue and discourse, Amsterdam, North-Holland

Taylor, M., Néel, F. et Bouwhvis, D.G. ed., 1989, Structure of multimodal dialog includingvoice, Amsterdam, North-Holland.

Cohen, P., Morgan, J. et Pollack, M. ed., 1990, Intentions in communication, Bradford books atMIT Press.

Néel, F., Pierrel, J.M. et Sabah, G., ed., 1992,Le dialogue homme machine, actes du colloque,GRECO-PRC, Dourdan.

L'article de Grice présente les «maximes» de la conversation, celui de Bobrow et al., lesystème GUS, celui de Sacks et al. les théories conversationalistes et celui de Guyomardet al. le seul système de dialogue oral actuellement utilisé, alors que les autres articlesconstituent les contributions les plus marquantes des années quatre-vingts en matière designification intentionnelle. La publication de J.M. Granchamp est enfin une mise aupoint bibliographique autour du thème du dialogue, dont nous nous sommes inspiré pourla bibliographie alphabétique ci-dessous.

Allen, J. et Perrault, C.R., 1980, Analyzing intention in utterances, Artificial Intelligence 15 - inReedings in Natural Language Processin.

Béroule, D. et Néel, F., 1984, «Une approche de problèmes liés à la communication parléehomme-machine», Actes du 4ème congrès AFCET, Paris, pp. 345-354.

180

Bobrow, D. et al., 1977, , «GUS, a frame-driven dialog system», Artificial Intelligence 8 - inReedings in Natural Language Processin

Carberry, S., 1988, «Modelling the user's plans and goals», Computational Linguistics 14.

Granchamp, J.M., 1993 : «Argumentation et dialogue : une bibliographie», Notes et documentsLIMSI n° 93-27.

Grice, H.P., 1979, «Logique et conversation», Communication n°30.

Grosz, B.,1981, «Focusing and description in Natural Language Dialogs», in Discourseunderstanding, Webber, Joshi et Sag ed., Cambridge University Press.

Grosz, B. et Sidner, C., 1986, «Attention, intentions, and the structure of discourse»,Computational linguistics 12.

Guyomard, M., Siroux, J et Cozannet, A., 1990, «Le rôle du dialogueur pour la reconaissance dela parole. Le cas du système pages jaunes», 18ème JEP, Montréal.

Sacks, H, Schlegloff, E. et Jefferson, G, 1974, «A simplest systematics for the Organisation ofTurn-Taking in Conversation», Language, 30-4.

n° 509 du Monde informatique du 13 07 92 : «Homme-machine : un dialogue à réinventer»

1.2. Ouvrages généraux

Le livre de Roulet et al. présente le modèle genevois, et ceux de Moeschler en développentla modélisation. Les ouvrages de Winograd et de Sabah sont des sommes de référence quicomportent quelques chapitres sur le dialogue. Celui de Weizenbaum est une réflexion surle DHM à parir d'ELIZA. Ceux de Morel et al. développent l'analyse du comportementlangagier induit par la machine, et le livre de Pierrel fait le point sur le fonctionnement etsur les perspectives en matière de dialogue oral.

Carré, R., Dégremont, J.F., Gross, M., Pierrel, J.M. et Sabah, G., 1991, Langage humain etmachine, Paris, Presses du CNRS.

Moeschler, J., 1985, Argumentation et conversation. ELéments pour une analyse pragmatique dudiscours, Paris, Hatier-Credif.

Moeschler, J., Modélisation du dialogue. Représentation de l'inférence argumentative, Paris,Hermès.

Morel, M.A. et al., 1988-1989, Analyse linguistique d'un corpus de dialogue homme-machine,Tomes 1 et 2, Publications de la Sorbopnne nouvelle.

Pierrel, J.M., 1987, Dialogue oral homme-machine, Paris, Hermès.

Roulet, E. et al., 1985, L'articulation du discours en français contemporain, Berne, Peter Lang.

Sabah, G., 1988 et 1989, L'intelligence artificielle et le langage, Paris, Hermes.

Weizenbaum, J., 1976, Computer power and human reason : from judgment to calculation, SanFrancisco, W.H. Freeman.

Winograd, T., 1983, Language as a cognitive process, Volume 1 : syntax, Addison Wesley.

181

1.3. Thèses françaises

Les quelques thèses qui suivent présentent l'avantage d'être écrites en français, d'inclure àchaque fois une présentation du domaine, et d'être assez faciles à trouver. Vilnat, Joab etBilange sont des thèses d'informatique, Joab traitant plus spécifiquement d'EIAO, Falzonest issu d'une thèse d'ergonomie, et Luzzati aborde la question d'un point de vuelinguistique.

Anglessy, N., 1989, DIANA : un système de dialogues naturels entre l’homme et la machine ;application aux services SNCF, Paris VI.

Bilange, E., 1991, Modélisation du dialogue oral finalisé personne-machine par une approchestructurelle, Rennes I.

Bourguet, M.L., 1992, Conception et réalisation d'une interface de dialogue personne-machinemultimodale, I.N.P.G., Grenoble.

Falzon, P., 1989, Ergonomie ecognitive du dialogue, Presses universitaires de Grenoble.

Fréchet, A.L., 1992, Analyse linguistique d'un corpus de dialogue homme-machine (oral finalisé),Paris III.

Grimaldi, L., 1993, Dialogue pédagogique en langue naturelle dans un système intelligent decommunications de connaissances, Paris VI.

Joab, M., 1990, Modélisation d'un dialogue pédagogique en langage naturel, Paris VI.

Luzzati, D., 1989, Recherches sur le dialogue homme-machine : modèles linguistiques ettraitements automatiques, Paris III.

Sadek, M.D., 1991, Attitudes mentales et interaction rationelle : vers une théorie formelle de lacommunication, Rennes I.

Vilnat, A., 1984, L'élaboration d'interventions pertinentes dans une conversation homme-machine,Paris VI.

1.4. Thème littéraire et scientifique des automates

Textes littéraires

Hoffmann, E.T.A., «L'homme au sable», Contes nocturnes.

Collodi, C., , Les aventures de Pinnocchio, histoire d'une marionette.

Villiers de l'Isle-Adam, l'Eve future.

Meyrink, G., Le Golem.

Baum, L.F., Le Magicien d'Oz.

Coppelia : opéra comique sur une musique d'Offenbach.

Coppelia : ballet, sur une musique de L. Delibes.

182

Ouvrages critiques :

Boie, B., 1979 L'homme et ses simulacres, Paris, Corti.

Noiray , J., 1981, Le romancier et la machine dans le roman français (1850-1900), Paris, Corti.

Thème des automates androïdes

Bailly, C., 1987, L’âge d’or des automates : 1848-1914, Paris, Ars Mundi.

Hillier, M., Automata and mechanical toys, Londres, Jupiter books.

Liénard, J.S., 1968, «La machine parlante de Kempelen», Bulletin du Groupe d’AcoustiqueMusicale n° 34, Université de Paris VI.

Liénard, J.S., 1991, «From speeking machines to speech synthesis», Proceedings of the XIIthinternational congress of phonetic sciences, Aix-en-Provence.

Thème des échecs

Anantharaman, T.S. et al ., 1988, «Singular extensions : adding selectivity to brute-forcesearching», Artificial Intelligence, Vol. 43, n°1.

Anantharaman, T.S., 1990, A statistical study of selective min-max search in computer chess,Ph.D. th, Carnegie Mellon University.

Jansen, P.J., 1992, Using knowledge about the opponent in game-tree search, Ph.D. th, CarnegieMellon University.

Levy, D.N.L. et Newborn, M., 1990, How computers play chess, New-York, W.H. Freeman etCo.

Pitrat, J., 1977, «A chess combination program which uses plans», Artificial Intelligence, V. 8,n° 3.

2. Bibliographie alphabétiqueAho, A. ET Jeffrey, U., 1972, The theory of parsing, translation and compiling, Vol. 1, Prentice

Hall, Englewood Cliffs.

Allaire, S., 1973, La subordination dans le français parlé devant les micros de la radiodiffusion,Paris, Klincksieck.

Allen, J.F. et Litman, D.J., 1986, «Plans, goals and language», Actes IEEE.

Allen, J., 1987, Natural language understanding, Menlo Park, Benjamin Cummings.

Allen, J.F. et Perrault, R.C., 1980, «Analyzing intention in utterances», Artificial Intelligence,Vol. 15.

Allen, J.F., 1984, «Towards a general theory of action and time», Artificial Intelligence, Vol. 23.

183

Allen, J.F., 1990, «Two views of intention : comments on Bratman and on Cohen andLevesque», dans Intentions in communication, chapitre 4, Cohen, Morgan etPollack ed., MIT press.

Allen, J.F., Kautz, H.A., Pelavin, R.N. et Tenenberg, J.D., 1991, Reasoning about plans, SanMateo, Morgan Kaufmann.

Anis, J. et Lebrave, J.L., 1986, "Des textes interactifs ?", LINX n° 10.

Anglessy, N., 1989, DIANA : un système de dialogues naturels entre l’homme et la machine ;application aux services SNCF, Thèse de l'Université Paris VI.

Anscombre, J.C. et Ducrot, O., 1983, L'argumentation dans la langue, Philosophie et langage,Pierre Mardaga.

Anscombre, J.C., 1975, «Il était une fois une princesse aussi belle que bonne», Semantikos, Vol.1, n°1.

Appelt, D. 1981, Planning natural language utterances to satisfy multiple goals, Ph.D.th.,Stanford University.

Attal, P., 1976, «L’acte d’assertion», Semantikos, Vol. 1, n°3.

Auchlin, A., 1981, "Mais euh, pis bon, ben alors voilà, quoi. Marqueurs de structuration de laconversation et complétude", Genève, Cahiers de linguistique française n° 2.

Auchlin, A., 1981, "Réflexion sur les marqueurs de structuration de la conversation", Etudes delinguistique appliquée n° 44.

Austin, J.L., 1962, How to do things with words, Oxford university press.

Baker, M.J., 1991, «Negotiating goals in intelligent tutoring model», in New directions inintelligent tutoring systems, NATO ASI, Costa.

Baker, M.J. 1991, The influence of dialogue processes on student’s collaborative generation ofexplanations for simple physical phenomena, Actes International conference on thelearning sciences, Evanston, USA.

Baker, M.J., 1993, «Negotiation in collaborative problem-solving dialogues», rapport interneIRPEACS, Lyon, COAST CR 2-93.

Bakhtine, M., 1977, Le marxisme et la philosophie du langage : essai d'application de la méthodesociologique en linguistique, Paris, Les éditions de Minuit.

Bakhtine, M., 1978, Esthétique et théorie du roman, Paris, Gallimard.

Bassano, D., 1991, «Opérateurs et connecteurs argumentatifs : une approche psycholinguistique»,Intellectica, Vol. 1, n°11.

Béroule, D.et Néel, F., 1984, "Une approche de problèmes liés à la communication parlée homme-machine", in Actes du 4ème congrès AFCET, Paris.

Bench-Capon, T.J.M., Dunne, P.E.S. et Leng, P. H., 1992, «A dialogue game for dialecticalinteraction with expert systems», Actes Journées d'Avignon, France.

184

Berthelin, J.B., 1985, «Le traitement de la contestabilité dans un système de réponse auxquestions», premier chapitre JALONS (quelques systèmes ayant réponse à tout),document interne LIMSI CNRS.

Bilange, E., 1992, Dialogue personne-machine, modélisation et réalisation informatique, Paris,Hermès.

Blanche-Benvéniste, C. et Jeanjean, C., 1987, Le franáais parlé, transcription et édition, Paris,Didier Erudition.

Blanche-Benvéniste, C., 1987, "Syntaxe, choix de lexique et lieu de bafouillage", DRLAV n° 36-37.

Blanche-Benvéniste, C., 1990, Le franáais parlé, études grammaticales, Paris, Editions du CNRS.

Bobrow, D.G., Kaplan , R.M., Norman , D.A., Thompson, T. et Winograd, T., 1977, «GUS, aframe-driven dialog system», Artificial Intelligence, Vol. 8.

Bourguet, M.L., 1992, Conception et réalisation d'une interface de dialogue personne-machinemultimodale, I.N.P.G., Grenoble.

Bouwhuis, D., Néel, F. et Taylor, M. ed.,1989, The structure of multimodal dialogue,Amsterdam, North-Holland.

Bratman, M.E., 1990, «What is intention ?», in Intentions in communication, chapitre 2, Cohen,Morgan et Pollack ed., MIT press.

Bronckart, J.P., 1987, «Interactions, discours, significations», Langue française n° 74.

Bruxelles, S. et Raccah, P.Y., 1987, «Information et argumentation : l'expression de laconséquence», Actes Cognitiva, Paris, France.

Bruxelles , S., Carcagno, D. et Fournier, C., 1987, «Toward the automatic construction of topoifrom the lexicon», Communication and cognition in artificial intelligence, Vol. 6,n°4.

Bunt, H.C. et al., 1984, "The TENDUM dialog system and its theoritical basis", IPO annualprogress report n° 14.

Bunt, H.C., 1989, «Information dialogues as communicative action in relation to partnermodelling and information processing», in The structure of multimodal dialogue,chapitre 4, in Bouwhuis, Néel et Taylor, ed., Amsterdam, North-Holland.

Cadoret, V., 1991, Intégration de contraintes argumentatives dans un système de génération detextes basé sur le modèle sens-texte d'Igor Mel'cuk, Mémoire de DEA de l'UniversitéParis XI.

Caelen, J. et Frechet, A.L., 1992, «Atitudes cognitives et actes de langage en situation decommunication homme-machine», Recherches sur la philosophie et le langage n°14, Paris, Vrin.

Carberry, S., 1990, Plan recognition in natural language dialogue, Cambridge, MIT Press.

Carbonell, C.J. et Hayes, P., 1983, "Recovery strategies for parsing extragrammatical language",American journal of computational linguistics n° 9-3/4.

185

Carel, M., 1992, Vers une formalisation de la «théorie de l'argumentation dans la langue», Thèsede l'EHESS.

Carré, R., Dégremont, J.F., Gross, M., Pierrel, J.M. et Sabah, G., 1991, Langage humain etmachine, Paris, Presses du CNRS.

Céline, L.F., 1955, Entretiens avec le probesseur Y, Paris, Gallimard.

Cerbah, F., 1992, «Generating causal explanations : from qualitative models to natural languagetexts», Actes ECAI, Vienne.

Cerbah, F., 1992, «Integrating qualitative reasoning and text planning to generate causalexplanations», Actes Coling, Nantes.

Chapanis, A., 1980, "Interactive communication : a few research answers for a technologicalexplosion", New trends in man-machine communication, INRIA.

Chapman, D., 1987, «Planning for conjunctive goals», Artificial Intelligence, Vol. 32.

Charniak, E., 1976, "Inference and knowledge II", in Computational semantics, Charniak et Wilksed., Amsterdam, North Holland.

Charniak, E., 1977, "A frame PAINTING : the representation of a common sense knowledgefragment", Cognitive science 1.

Charniak, E., 1978, "On the use of frame knowledge for language comprehension", ArtificialIntelligence, Vol. 11.

Charniak, E., 1981, "A common representation for problem solving and language comprehensioninformation", Artificial intelligence n° 16.

Chin, D., 1984, "An analysis of scripts generation in writing between users and computersconsultants", Actes l'IFIPS .

Christensen, J. et Grove, A., 1991, «A formal model for classical planning», Actes IJCAI,Sydney.

Cohen, P.R. et Perrault, C.R., 1979, "Elements of a plan-based theory of speech acts", Cognitivescience n° 3.

Cohen, P.R. et Levesque, H.J., 1990, «Intention is choice with commitment», Artificialintelligence, Vol. 42.

Cohen, P.R. et Levesque, H.J., 1990, «Persistence, intention, and commitment», dans Intentionsin communication, chapitre 3.

Cohen, M., Morgan, J. et Pollack, M.E., Intentions in communication, Bradford books at MITPress.

Cohen, P.R. et Levesque, H. J., 1991, «Confirmations and joint action», Actes IJCAI, Sydney.

Cohen, P.R., 1987, «Analyzing the structure of argumentative discourse», Computationallinguistics, Vol. 13, n°1-2.

Colby, P.R. et al., 1971, «Artificial paranoïa», Artificial intelligence n° 2.

186

Collins, G., Birnbaum L. , Krulwich, B. et Freed, F.,1991, «Plan debugging in an intentionalsystem», Actes IJCAI, Sydney.

Corbin, P., 1980, "De la production des données en linguistique introspective", inThéorielinguistique et tradition grammaticale, Desseau-Bertonneau ed.

Corbin, P., 1981 : "Regard sur le regard sociolinguistique sur la linguistique ordinaire", Langageet société n° 16.

Crocco, G., 1992, «La logique dialogique : vers un modèle de preuve inductive», Actes ECCOS,Orsay, France.

Culioli, A., 1971, "A propos d'opérations intervenant dans le traitement formel des languesnaturelles", in Mathématiques et sciences humaines n° 34, Gauthier-Villars ed.

Culioli, A., 1973, "Sur quelques contradictions en linguistique", Communications, n° 20.

Culioli, A., 1983, "Pourquoi le français parlé est-il si peu étudié ?" GARS n° 5.

Danlos, L. 1984, Génération automatique de textes en langues naturelles, Thèse de doctorat èssciences, Paris VII.

Danon-Boileau, L., 1976, «Sur la «logique» des textes de loi», Langage, n°. 42.

Davis, M., 1980, «The mathematics of non-monotonic reasoning», Artificial Intelligence, Vol.13.

Davison, A., 1975, «Indirect speech acts and what to do with them», in Syntax and semanticsspeech acts, Cole et Morgan ed., New-York, Academic press Inc.

Dejong, G.F., 1979, Skimming stories in real time, Ph.D.th, Yale University. (résumé dans«Prediction and substanciation, a new approach to natural language processing»,Cognitive Science n° 3, 1979).

Dejong, G., 1982, "An overview of the FRUMP system", in Strategies for natural languageprocessing, Lehnert et Ringle ed., Laurence Erlbaum.

Deulofeu, J., 1972, Recherches en vue d'une étude de l'ordre des constituants en français : la placedes groupes prépositionnels à valeur adverbiale en français oral contemporain, Thésede 3ème cycle, Paris III.

Di Cristo, A., 1975, Soixante et dix ans de recherches en prosodie, Editions de l'Université deProvence.

Dijk, T., 1980, Semantic macrostructures, Lawrence Erlbaum.

Dik, S., 1978, Functional grammars, Amsterdam, North Holland.

Dispaux, G., 1984, La logique et le quotidien, Paris, Les éditions de Minuit.

Dreyfus, H., 1972, "What computer can't do" (version française : Intelligence artificielle : mytheset limites, Flammarion, parue en 1984).

Dreyfus, H., 1979, "From micro-worlds to knowledge representation : AI at an impasse", reprisdans Readings in knowledge representation, 1985, Brachman et Levesque ed., LosAltos, Morgan Kaufmann.

187

Ducrot, O. et al., 1980, Les mots du discours, Paris, Les éditions de Minuit.

Ducrot, O., 1980, Les échelles argumentatives, Paris, Les éditions de Minuit.

Ducrot, O., 1983, «Opérateurs argumentatifs et visée argumentative», Cahiers de linguistiqueFrançaise, Genève, Vol. 5.

Ducrot, O., 1984, Le dire et le dit, Paris, Les éditions de Minuit.

Dyer, M., 1983 : In-depth understanding, MIT Press.

Elhadad, M. et McKeown, K.R., 1990, «Generating connectives», Actes Coling, Helsinki.

Elhadad, M., 1992, «Generating coherent argumentative paragraphs», Actes Coling, Nantes.

Falzon, P., 1989, Ergonomie ecognitive du dialogue, Presses universitaires de Grenoble.

Fauconnier, G., 1984, : Espaces mentaux, aspects de la construction du sens dans les languesnaturelles, Paris, Les éditions de Minuit.

Fillmore, C., 1968, "The case for case", in Universals in linguistic theory, Bach et Harms ed.,Chicago, Rinehart et Winston,.

Fillmore, C., 1969, "Toward a modern theory of case", in Modern studies in English, Readings intransformational grammar, Reibel et Schane ed., Toronto, Prentice-Hall.

Fisher, F., 1988, The logic of real arguments, Cambridge university press.

Flowers, M., McGuire, R. et Birnbaum, L., 1982, «Adversary arguments and the logic of personalattacks», in Strategies for natural language processing, Lehnert et Ringle ed.,Laurence Erlbaum.

Fodor, J., 1975, The language of thought, New York, Thomas Crowell.

Forest, F. et al., 1988, "Une étude sur l'intégration de l'utilisateur dans un dialogue homme-machine en langage naturel", note scientifique LIMSI-CNRS n° 88-11.

Fouqueré, C., 1988, Systèmes d'analyse tolérante du langage naturel, Thèse de l'université Paris-Nord.

Fox, J., Krause, P. et Ambler, S., 1992, «Arguments, contradictions and practical reasoning»,Actes ECAI, Vienne, Autriche.

Francopoulo, G., 1988, Un analyseur du français avec apprentissage inductif de la syntaxe, thèse del'université Pierre et Marie Curie.

Frechet, A.L. et al., 1992, «Analyse lexicale d’un corpus d’interaction homme-machine», Bulletinde la communication parlée n° 2.

Frederking, R., 1986, Natural language dialogue in an integrated computational model, PhD th,Carnegie Mellon University.

Frei, H., 1929, La grammaire des fautes, Paris, Geuthner.

188

Fuchs, C.et al., 1993, Linguistique et traitements automatiques des langues , Paris, HachetteUniversité.

Gadet, F., 1992, Le français ordinaire, Paris, Colin.

Gaiffe, B., Pierrel, J.M. et Romary, L., 1992, «De la référence à la modélisation de la tâche : versune certaine idée du dialogue homme-machine», Actes CHM pôle parole et langagenaturel, Néel, Pierrel et Sabah ed., Dourdan, France.

Gerlach, M. et Sprengler, M., 1988, «Semantic interpretation of pragmatic clues : connectives,modal verbs and indirect speech acts», Actes Coling, Budapest, Hongrie.

Goffman, E., 1959, The presentation of self in everyday life, New-York, Doubleday. (trad. 1973,Minuit, Paris : La mise en scäne de la vie quotidienne).

Goffman, E., 1981, Forms of talk, Basil et Blackwell, Oxford.

Goodwin, Ch., 1981, Conversational organization. Interactions between Speakers and Hearers,New-York, Academic Press.

Gordon, D. et Lakoff, G., 1975, «Conversational postulates», in Syntax and semantics (3) speechacts, Cole et Morgan ed., Academic press Inc.

Goughenheim, G.et al., 1964, L'élaboration du français fondamental, Paris, Didier.

Grandchamp, J.M., 1992, «Retrieving information about railways in a Videotex server usingnatural language», Actes IASTED Applied Informatics Symposium, Innsbruck.

Grau, B., 1983, Analyse et représentation d'un texte d'après le thème du discours, Thèse del'Université Paris VI.

Grau, B., Sabah, G. et Vilnat, A., 1993, «Pragmatique et dialogue homme-machine», TSI.

Grice, H.P., 1975, «Logic and conversation», in Syntax and semantics speech acts, Cole etMorgan ed., Academic press Inc.

Grize, J.B., 1982, De la logique à l'argumentation, Genève, Droz.

Grize, J.B., 1986, «Logique naturelle et vraisemblance», Actes Logique naturelle etargumentation, Royaumont, France.

Grize, J.B., 1990, Logique et langage, Paris, Ophrys.

Grosz, B.J. et Kraus, S., 1993, «Collaborative plans for group activities», Actes IJCAI,Chambéry.

Grosz, B.J. et Sidner, C.L., 1985, «Discourse structure and the proper treatment of interruptions»,Actes IJCAI, Los Angeles.

Grosz, B.J. et Sidner, C.L., 1986, «Attention, intention and the structure of discourse»,Computational linguistics, Vol. 12, n°3.

Grosz, B.J. et Sidner, C.L., 1990, Plans for discourse, in Intentions in communication, chapitre20, Cohen, Morgan et Pollack, ed., MIT press.

Grosz, B.J., 1990, «Collaborative planning for discourse», Actes ECAI, Stockholm.

189

Grunig, B.N. et Grunig, R., 1985, La fuite du sens. La construction du sens dans l'interlocution,Paris, Hatier.

Guez, S., 1990, «A computational model for arguments understanding», Actes COLING,Helsinki.

Guez, S., 1990, «A model for the automatic processing for argument understanding», Actes ECAI,Stockholm.

Guyomard , M. et Siroux, J., 1987, "Constitution incrémentale d'un corpus de dialogues orauxcoopératifs", 16èmes JEP, Hammamet.

Hayes, P.J. et al., 1986, "Parsing spoken language : a semantic caseframe approach", ActesCOLING.

Hayes, P.J. et Carbonell , J.G., 1981, "Multi-strategy parsing and its role in robust man-machinecommunication", CMU CS-81-118.

Hayes, P.J. et Mouradian, G.V., 1980 : "Flexible parsing", Actes 18ème ACL.

Helft, N., Inoue, K. et Poole, D., 1991, «Query answering in circumscription», Actes IJCAI,Sydney.

Herman , P., Sabah , G. et Vilnat, A., 1988, "A question-answering system for the FrenchYellow pages", Computational intelligence n° 4-2.

Jayez, J., 1988, L'inférence en langue naturelle, Paris, Hermès.

Johnson, M., 1991, «Logic and feature structures», Actes IJCAI, Sydney.

Kalinowsky, G., 1972, La logique des normes, Paris, PUF.

Kautz, H., 1990, «A circumscriptive theory of plan recognition», in Intentions in communication,chapitre 6, Cohen, Morgan et Pollack ed., MIT press.

Kayser, D., 1986, "Représentation des connaissances en intelligence artificielle", Actes de l'écoled'été de l'ARC.

Kerbrat-Orecchioni, C., 1980, L'énonciation. De la subjectivit dans le langage, Paris, Colin.

Kerbrat-Orrechioni, C., 1986, L’implicite, Paris, Colin.

Kleiber, G., 1994, Nominales, essai de sémantique référentielle, Paris, Colin.

Lambert, L. et Carberry, S., 1992, «Using linguistic, world, and contextual knowledge in a planrecognition model of dialogue», Actes Coling, Nantes.

Lansky, A.L., 1991, «Localized search for multiagent planning», Actes IJCAI, Sydney.

Levinson, S.C., 1983, Pragmatics, Cambridge university press.

Levinson, S.E. et Shipley, K.L., 1980, «A conversational mode airline information andreservation system using speech input and output», BSTJ, V. 59 n°1.

Lifschitz, V., 1985, «Computing circumscription», Actes IJCAI, Los Angeles.

190

Lifschitz, V., 1991, «Nonmonotonic databases and epistemic queries», Actes IJCAI, Sydney.

Litman, D.J. et Allen, J.F., 1990, «Discourse processing and commonsense plans», in Intentionsin communication, chapitre 17, Cohen, Morgan et Pollack ed., MIT press.

Lochbaum, K.E., Grosz, B.J. e t Sidner, C.L., 1990, «Models of plans to supportcommunication» : an initial report, Actes AAAI, Boston.

Longacre, R.E., 1983, The grammar of discourse, Plenum press.

Luzzati, D., 1983, Recherches sur la structure du discours oral spontané, Thèse de troisième cycle,Paris III.

Luzzati, D., 1987a, "Incidence de la machine sur le comportement langagier : sur l'exemple dedemandes d'horaire SNCF", DRLAV n° 36-37.

Luzzati, D., 1987b, "ALORS : a skimming parser for spontaneous speech processing", Computerspeech and language, n° 2.

Luzzati, D., 1989, Recherches sur le dialogue homme-machine : modèles linguistiques ettraitements automatiques, Thèse d’état, Paris III.

Luzzati, D. et Mariani, J., 1989, "De l'analyse des corpus à la reconnaissance de la parole", LINX..

Luzzati, D., 1990, «Un modèle dynamique pour la gestion de l'interaction homme-machine»,Actes du 4ème colloque de l'ARC, Paris.

Luzzati, D., 1991, L'oral dans l'écrit, Langue française n° 89.

Luzzati, D., 1992a, «Non-normativité et interactivité dans un écrit Minitel», in Néel, Pierrel etSabah ed..

Luzzati, D., 1992b, «Un modèle dynamique pour le dialogue homme-machine», Recherches sur laphilosophie du langage n°14, Grenoble.

Luzzati, D., 1993, «Le dialogue homme-machine», in Linguistique et traitement automatique deslangues, chapitre 12, Fuchs ed., Hachette Université.

Mann, W.C. et Thompson, S.A., 1988, «Rhetorical structure theory : toward a functionnal theoryof text organisation», Text, Vol. 8, n°3.

Mariani, J., 1985, «La reconnaissance de la parole», La Recherche n° 170, repris dans La rechercheen intelligence artificielle, Paris, Le Seuil, 1987).

Martin R. 1986a, «Le vrai, le faux, le vraisemblable et la notion d’univers de croyance», ActesLogique naturelle et argumentation, Royaumont, France.

Martin, R., 1986b, Pour une logique du sens, Paris, PUF.

McCarthy, J., 1980, «Circumscription - a form of non-monotonic reasoning», ArtificialIntelligence, Vol. 13..

McCarthy, J., 1986, «Application of circumscription to formalizing common-sense knowledge»,Artificial Intelligence, Vol. 28.

191

McKeown, K. R., 1985, Text generation, Cambridge university press.

Meunier , A. et Morel, M.A., 1987a, "Les marqueurs de la demande d'information dans un corpusde dialogue homme-machine", Cahiers de linguistique française n° 8.

Meunier , A. et Morel, M.A., 1987b, "Stratégie d'interaction dans un corpus de dialogue homme-machine", DRLAV n° 36-37.

Meyer, M., 1988, «Rhétorique et langage», Langue française n° 79.

Minton, S., Bresina, J. et Drummond, M., 1991, «Commitment strategies in planning : acomparative analysis», Actes IJCAI, Sydney.

Moeschler, J., 1985, Argumentation et conversation ; éléments pour une analyse pragmatique dudiscours, Paris, Hatier.

Moeschler, J., 1989, Modélisation du dialogue ; représentation de l'inférence argumentative, Paris,Hermès.

Moore, J. D. et Pollack, M.E., 1992, «A problem for RST : the need for multi-level discourseanalysis», Computational linguistics, Vol. 18, n°4.

Morel, M.A., 1983, "Vers une rhétorique de la conversation", DRLAV n° 9.

Morel, M.A., 1988, Dialogue homme-machine, premier corpus, Paris, Publications de laSorbonne nouvelle.

Morel, M.A., 1989, Analyse linguistique d’un corpus, deuxième corpus, Paris, Publications de laSorbonne nouvelle.

Morel, M.A. et al., 1985, Analyses linguistiques d’un corpus d’oral finalisé, GRECO-CP, CNRS.

Morin , P. et Pierrel, J.M., 1987, "PARTNER, un système de dialogue oral homme-machine",Actes COGNITIVA, Paris.

Moulin, B., Rousseau, D. et Vanderveken, D., 1991, «Speech acts in a connected discourse : acomputational representation based on conceptual graph theory», Actes Sixth annualworkshop on conceptual graphs, Binghamton.

Nagao, N., 1993, «Abduction and dynamic preference in plan-based dialogue understanding», ActesIJCAI, Chambéry.

Nakatsu , R., Kohda, M., 1980, "A speech recognition machine for connected words", Actes IEEEICASSP.

Nash-Webber, B., 1975, "Semantic support for a speech understanding system", in Representationand understanding, studies in cognitive science, Bobrow et Collins ed., New York,Academic Press.

Nazarenko-Perrin, A., 1992, «Causal ambiguity in natural language : a conceptual representationof 'parce que/because' and 'puisque/since'», Actes Coling, Nantes.

Néel, F., Pierrel, J.M. et Sabah, G. ed., 1992,Le dialogue homme machine, actes du colloque,GRECO-PRC, Dourdan.

192

Nef, F., 1986, «Construction et révision des représentations discursives», Actes Logique naturelleet argumentation, Royaumont, France.

Nef, F., 1988, Logique et langage. Essai de sémantique intensionnelle, Paris, Hermès.

Newell, A. et al., 1973, Speech recognition systems : final report of a study group, Amsterdam,North Holland.

Newell, A., 1982 : "The knowledge level", Artificial intelligence n° 18

Oléron, P., 1983, L'argumentation, Que sais-je ?, Paris, PUF.

Perelman, C. et Olbrechts-Tyteca, L., 1958, Traité de l'argumentation, éditions de l'Université deBruxelles.

Perelman, C., 1968, «Argumentation», dans Encyclopaedia Universalis, Vol. 2.

Perelman, C., 1988, L'empire rhétorique, Paris, Vrin.

Pernel, D., «Le corpus PLUS», Document interne LIMSI-CNRS n°91-19.

Petitjean, A., 1987, «Les faits divers : polyphonie énonciative et hétérogénéité textuelle», Languefrançaise n° 74.

Pierrault-Le Bonniec, G., 1986, «Logique naturelle, logique formelle ; le vrai, le faux, levraisemblable», Actes Logique naturelle et argumentation, Royaumont, France.

Pierrel, J.M. ed., 1984, Dialogue homme-machine à composante orale, Séminaire GRECO-GALF, Nancy.

Pierrel, J.M., 1987, Dialogue oral homme-machine, Paris, Hermès.

Plantin, C., 1990, Essais sur l'argumentation, Paris, Kimé.

Pitrat, J., 1985, Textes, ordinateurs et compréhension, Paris, Eyrolles.

Pitrat, J., 1992, Les métaconnaissances, Paris, Hermès.

Pollack, M.E., 1987, «Some requirements for a model of the plan inference process inconversation», in Communication failure in dialogue and discourse, Reilly ed.,MIT Press.

Pollack, M.E., 1990, «Plans as complex mental attitudes», in Intentions in communication,chapitre 5, Cohen, Morgan et Pollack ed., MIT press.

Proctor , C. et Young, S., 1986, "Dialogue control in conversational speech interfaces", in Thestructure of multi modal dialogue, Bouwhuis, Néel et Taylor ed., Amsterdam, NorthHolland.

Queneau, R., 1965, Bâtons, chiffres et lettres, Paris, Gallimard.

Quilici, A., 1992, «Arguing about planning alternatives», Actes Coling, Nantes.

Quine, W.V., 1992, La poursuite de la vérité, Paris, Le Seuil.

193

Raccah, P.Y., «Où voulez-vous en venir ?», Cahier STS Neuropsychopathologie et sciences de lacognition n°14, Editions du CNRS.

RaccahP.Y., 1985, «Argumentation, sémantique et pragmatique», Actes COGNITIVA, Paris.

Raccah, P.Y., 1990, «Modelling argumentation and modelling with argumentation»,Argumentation, Vol. 4.

Rastier, F., 1991, Sémantique et recherches cognitives, Paris, PUF.

Richard, J.F., 1986, «Le vrai et le faux dans les conduites de recherche et de vérification», ActesLogique naturelle et argumentation, Royaumont, France.

Roulet, E., Auschlin, A., Moeschler, J., Rubattel, C. et Schelling, M., 1985, L’articulation dudiscours en français contemporain, Berne, Peter Lang.

Sabah, G., 1978, Contribution à la compréhension effective d'un récit, Thèse d’état, UniversitéPierre et Marie Curie.

Sabah, G., 1988, L'intelligence artificielle et le langage, Vol. 1, représentations des connaissances,Paris, Hermès.

Sabah, G., 1989, L'intelligence artificielle et le langage, Vol. 2, processus de compréhension,Paris, Hermès.

Sabah, G. et Zock, M., 1988, Advances in natural language generation, Londres, Pinter.

Sachs, J., 1967, "Recognition memory for syntactic and semantic aspects of connected discourse",Perception and psycholonguistics n°2.

Sachs, H., Schlegloff , E. et Jefferson, G., 1974, "A simplest systematics for the Organisation ofTurn-Taking in Converation", Language n°30-4.

Saitta, I., 1980, «Parrallel approach for modelling semantic knowledge», in actes du séminaireGALF, Paimpont, France.

Schank , R. et Abelson, R., 1977, Scripts, plans, goals, and understanding, Hillsdale, LawrenceErlbaum.

Schlegloff, E., 1980, "Preliminaries to preliminaries : 'can I ask you a question ?'", SociologicalInquiry n° 50.

Schlegloff, E., 1982, "Discourse as an interactional achievement : some uses of 'uh uh' and otherthings that come between sentences".

Schmandt , C. et Arons, B., 1986, "Robust parser and dialog generator for a conversational officesystem", Actes American voice input/output society.

Searle, J.R. et Vanderveken, D., 1985, Foundations of illocutionnary logic, Cambridge universitypress.

Searle, J. R., 1969, Speech acts, Cambridge university press.

Selles, T., 1992, Planification et dialogue, Mémoire de DEA de l'Université Paris XI.

194

Siroux, J. et Gillet, D., 1985, "A system for man machine communication using speech", Speechcommunication, vol. 4 n° 4.

Sycara-Cyranski, K., 1985, «Arguments of persuasion in labour mediation», Actes IJCAI, LosAngeles.

Talbi, H., 1989, Vers une représentation formelle des aspects argumentatifs de la signification :élaboration informatique, Mémoire de DEA de l'Université Paris III.

Thomason, R.H., 1990, «Accomodation, meaning, and implicature : interdisciplinary foundationsfor pragmatics», in Intentions in communication, chapitre 16, Cohen, Morgan etPollack ed., MIT press.

Toulmin, T., 1958, The uses of argument, Cambridge university press.

Trognon, A., 1988, «Actes de langage et conversation», Intellectica, 2-6.

Turner, E., 1992, «Organizing dialogue from an incoherent stream of goals», Actes Coling,Nantes.

Turner, R., 1986, Logiques pour l’intelligence artificielle, Paris, Masson.

Van Beek, P. e t Cohen, R., 1991, «Resolving plan ambiguity for cooperative responsegeneration», Actes IJCAI, Sydney.

Vanderveken, D., 1988, Les actes de discours. Bruxelles, Mardaga.

Vernant, D., 1992, «Approche actionnelle et modèle projectif du dialogue informatif», Recherchessur la philosophie et le langage n°14, Paris, Vrin.

Vignaux, G., 1985, «Un modèle d'opérations fondant l'activité langagière», Actes COGNITIVA,Paris.

Vignaux, G., 1988, Le discours acteur du monde ; énonciation, argumentation et cognition, Paris,Ophrys.

Vilain, M., 1990, «Getting serious about parsing plans : a grammatical analysis of planrecognition», Actes AAAI, Boston.

Vilnat, A. et Sabah, G. 1985, «Be brief, be to the point, ... be seated or relevant responses inman/machine conversation», Actes IJCAI, Los Angeles.

Vilnat, A., 1984, Élaboration d’interventions pertinentes dans une conversation homme-machine,Thèse de l'Université Paris VI.

Vilnat, A., 1989, «Relevant responses in man-machine conversation», in The structure ofmultimodal dialogue, chapitre 4, Bouwhuis, Néel et Taylor ed., Amsterdam, North-Holland.

Walker, M.A., 1992, «Redundancy in collaborative dialogues», Actes COLING, Nantes.

Waterworth, J.A., 1986, "Interactive strategies for conversational computers systems" in Thestructure of multi modal dialogue, Bouwhuis, Néel et Taylor ed., Amsterdam, NorthHolland.

195

Weizenbaum, J., 1966, "Eliza - a computer program for the study of natural languagecommunication between man and machine", CACM n° 9.

Weizenbaum, J., 1976, Computer power and human reason : from judgment to calculation, SanFrancisco, W.H. Freeman.

Wilensky, R., 1983, Planning and understanding ; a computational approach to human reasoning,N ew York, Addison-Wesley.

Wilks, Y., Baden, J. et Wang, J., 1991, «Your metaphor or mine : belief ascription and metaphorinterpretation», Actes IJCAI, Sydney.

Winograd , T. et Flores, F., 1986, Understanding computers and cognition : a new fondation fordesign, Ablex Publishing Corporation.

Winograd , T., 1972, Understanding natural language , Edinburgh, Academic press.

Winograd , T., 1983, Language as a cognitive process : syntax, New York, Addison-Wesley.

Winograd, T. et Flores, F., 1986, Understanding computers and cognition : a new foundation fordesign, New Jersey, Ablex Publishing Corporation.

Wu Horng, J.P., et Lytinen, S.L., 1992, «Attitude emergence - an effective interpretation schemefor persuasive discourse», Actes COLING, Nantes.

Yamaoka, T., et Ida, H., 1990, «A method to predict the next utterance using a four-layered planrecognition model», Actes ECAI, Stockholm.

Zlotkin, G., et Rosenschein, G.S. 1991, «Incomplete information and deception in multi-agentnegotiation», Actes IJCAI, Sydney.

196

Index

actes de langage 24-25; 33; 34; 77; 80ALLEN 33; 47; 104ambiguïté 105; 127; 169anacoluthe 68; 106analyse

déterministe 119par mots-clés 109partielle 21; 111prédictive 112; 119sélective 103; 111; 115; 138

analyse guidée parla sémantique 113; 175la syntaxe 113; 122; 175les prédictions 113

ANANTHARAMAN 15anaphore 46; 176apo koïnou 68apprentissage 15; 17; 31appuis du discours 81ATN 115AUSTIN 33automates 17; 18axesd'écartement 144

incident 146; 147-150; 156à l'initiative de la machine 143; 149à l'initiative du correspondant 143;149; 157

régissant 145; 147-150; 156BAKER 141BAUM 49BEROULE 13BERTHELIN 164BILANGE 6; 22; 24

BOBROW 104; 159; 175; 176boîte de Hockett 35BUNT 77; 104buts 23-24, 47caractérisation linéaire 68-69; 107CHAPANIS 104CHARNIAK 159; 176CHIN 49COHEN 20; 33; 47COLBY 111Collodi 18complétude

interactionnelle 78, 141interactive 141

contestation 161; 166corpus

d'apprentissage 62; 101; 126; 131-132;137; 139

d'évaluation 62; 101; 126; 131-132;139

DEJONG 111demandes

antérieures/initiales 87-96de confirmation 69; 148de précision 56; 57; 148de reformulation 56; 57; 148explicatives 148itératives 42

demon 176DESCARTES 18détection de mots dans la parole continue109; 119; 131; 141dialogue

à déroulement linéaire 71; 142

197

à structure hiérarchique 71; 142dirigé par le but 24dirigé par les états 24dirigé par les objectifs 24dirigé par les objets 24incident 34; 36; 37; 38-41régissant 34; 36; 37

DUCROT 16DYER 112échange 34

confirmatif 46; 79réparateur 79; 135subordonné 79évaluatifs 46informatifs 46

échecs 15; 19EIAO 29; 30; 47ELIZA 11; 12; 17; 111ellipse 46; 68; 146embrayeur 88; 91entrée vocale 103; 124; 126; 140; 171erreur 21

à rectification différée 130-133; 135;136

à rectification immédiate 130-133; 134négligeable 130-133 134négligeables 130-133non rectifiable 130-133; 135; 136

état de la tâche 46étiquetage 117; 120evaluation

absence de compréhension 168erreur de compréhension 168concordante 128dialogique 128discordante 128divergente 128interprétative 128

FALZON 31; 32; 49fixation de l’incidence 147; 156fonctions interactives 25-28

communicative 27existentielle 27informative 27

FRUMP 111-114génération 58; 102; 150; 162-163

restitution de phrases 158GOFFMAN 76; 79grammaire sémantique 118-121GRICE 32; 166GUS 149; 176-177historique du dialogue 46; 61; 146; 176HOFFMANN 16-18idiotisme 89

fonctionnel 85

incursion 79inférence 113instanciation

attendue 151impromptue 151

interactionalternative 13; 163itérative 171spontanée 13

interlocuteur générique 47interrogation 25-27

décalées 25; 27directe 33; 66indirecte 25; 27; 66, 126modalisée 25; 27partielle 25; 27; 33totale 25; 126

intervention 34IPP 112; 113JANSEN 15KAYSER 109KEMPELEN 18KERBRAT- ORRECHIONI 76KOHDA 104LA METTRIE 18LEROY 65LEVINSON 104LEVY 15lexique 68-70; 107; 108; 116; 121-123LIENARD 19magicien d'Oz 7; 18; 32MARIANI 109; 141maximalisme des réponses 61; 147; 150méthodes stochastiques 15; 19MEYRINK 18Minitel 13; 20; 25; 29modèle de dialogue 34-38; 46; 51-57; 59;60; 151-152; 176

descriptif 142; 159dynamique 142; 146fonctionnel 142

modèle de l'utilisateur 37; 47; 176modèle de la tâche 46; 146modèle de langage 45modèles de la tâche 37; 176modèles markoviens 141MOESCHLER 6; 33; 77; 141MOPs 112; 115MOREL 50; 62; 65mots-clés 111; 123; 148Nakatsu 104NEEL 13négociation 75; 77; 141NEWBORN 15noyaux informatifs 85

198

noyaux syntaxiques 106-107; 119éclatés 119; 123

OURY 16PAM 112paraboles

du tangram 14des automates 16-18de Coppélia 16-18de la chèvre 16des échecs 15; 19du médicament 15

PARRY 111PASCAL 19PERRAULT 33; 47; 104pertinence 7; 110; 116; 119; 134PEYTARD 28; 29phatique 77; 81phénomène de non normativité 133-135

de bruit 63; 67; 104; 106; 133; 135phonétique 106syntaxique 106

de dislocation 63; 67; 106; 122; 133;135

d'écho 77; 80; 162de liaison 79d'organisation 63; 67; 107

PIERREL 6; 45; 109plans 47portabilité 137pragmatique 108; 116; 123présentation

linéaire 51par rôles 51modélisée 52

principe de contiguïté 125procédure

d'ajustement 57d'approfondissement 57d'encerclement 55; 57; 151de balayage 55; 57; 151de chevauchement 57; 142de liaison 57; 58de relance 143

PROCTOR 104prosodie 136questions principales/secondaires

à repérage absolu 56, 160à repérage relatif 56; 151; 155; 160

questions/réponses

incidentes 36-37; 51-55; 142principales 36-37; 51-55; 142secondaires 51-55; 142

RAPHAËL 11réaction active/passisve 150reconnaissance de la parole 109

analytique 141regard en avant 119règle de contiguïté 136réponse

attendue 26escomptée 26totales 43

retourarbitraire 147en arrière 119forcé 42; 145; 147

RIESBECK 112ROULET 32; 33; 55; 77; 141SABAH 14; 45; 112; 113SACKS 32; 34SAITTA 104SAM 112scénario 112; 113; 114; 115; 149SCHANK 111; 112schéma 115; 116; 118; 119; 138; 150; 176SCHIPLEY 104SEARLE 24; 33sémantique 108; 116servant 176SHDRLU 177SHRDLU 11stratégie

ascendante 112descendante 112; 118; 138

syntaxe 105; 108; 116; 120; 122système de dialogue

historique du dialogue 154; 155modèle de dialogue 154modèle de l'utilisateur 153modèle de la tâche 37; 153; 176

TESNIERES 107théorie des faces 79VANDERVEKEN 24VILLIERS DE L'ISLE-ADAM 18VILNAT 11WATERWORTH 104WEIZENBAUM 11; 109; 111WINOGRAD 11; 109; 111

tâchesopératives 31tâche réflexives 31tâches interprétatives 31

TARDIEU 13Taux

d'efficacité 170-172taux d'erreur 170-172

de compétence 170-172

TESNIERES 107théorie des faces 79VANDERVEKEN 24VILLIERS DE L'ISLE-ADAM 18VILNAT 11WATERWORTH 104WEIZENBAUM 11; 109; 111WINOGRAD 11; 109; 111YOUNG 104