Transcript
Page 1: 6. Modalité d’évaluation

6. Modalité d’évaluation6. Modalité d’évaluation

Myrtille Terrier (2ème année)[email protected]

CRIP5, équipe Diadex. Université René Descartes – Paris VLaLICC FRE 2919, équipe Parole et Langage. Université de Paris-Sorbonne – Paris IV

Société SoNear, logiciels applicatifs pour téléphones mobiles

Grammaire de compréhension à émission de conceptsGrammaire de compréhension à émission de concepts

École d’été Dialogue et Interaction- Juillet 2006- Autran

5. Grammaire d’unification à émission de concepts pour la compréhension5. Grammaire d’unification à émission de concepts pour la compréhension

Taux d’erreur de reconnaissance

- en mots: 2,02%

- en concepts

Couverture de la langue

Taux de réutilisation des contraintes

- syntaxiques

- sémantiques

Grammaire formelle de reconnaissance et de compréhension pour le dialogueGrammaire formelle de reconnaissance et de compréhension pour le dialogue

Représentation du lexique (syntaxe et sémantique lexicale) Représentation du lexique (syntaxe et sémantique lexicale) fondée sur une structuration de traits de modalité et de valeurs fondée sur une structuration de traits de modalité et de valeurs données données

Syntaxe

mot voudraisnature verbe

mode: indicatiftemps: présentpersonne: 1erenombre: sing

mot jenature pronom

sous cat: personnelpersonne: 1erenombre: sing

Sémantique lexicale

lemme vouloirconcept formulationspécialisation expressif: volonté

lemme partirconcept mouvementspécialisation polarité locative: initiale

transitionnel: +

4. Grammaire d’unification4. Grammaire d’unification3. Description des connaissances 3. Description des connaissances linguistiqueslinguistiques

Contraintes logiques sur les traits et les valeursContraintes logiques sur les traits et les valeurs

Contraintes syntaxiquesConcordance des temps, traitement des accords (C1) RUSynt 1 {Accord_Personne_Nombre} :pronom (Personne, Nombre) ∧ verbe (Personne, Nombre)

Unification de la valeur des traits Personne et Nombre

(C2) RUSynt 2 {Accord_Genre_Nombre} :article (Genre, Nombre) ∧ nom (Genre, Nombre)

Contraintes entre les syntagmes (représentation simplifiée)(C3) RUSynt 3 {Phrase} : SN ∧ SV ∧ RUSynt 1 (C4) RUSynt 4 {Phrase} : SN ∧ SPrep (C5) RUSynt 5 {SV} : verbe ∧ Sprep ()(C6) RUSynt 6 {Sprep} : prep ∧ SN

SN: syntagme nominalSV: syntagme verbalSPrep: syntagme prépositionnel

Contraintes sémantiques Contraintes entre les constituants sémantiques (sémantique relationnelle)(C7) RUSem 1 {Trajet_Partiel}: mouvement (polarité locative: Valeur)

∧ mouvement (polarité locative: Valeur) Unification de la valeur du trait Polarité Locative (Valeur)

Analyse des énoncés reconnus Analyse des énoncés reconnus par le système de reconnaissancepar le système de reconnaissance

Grammaire de syntagmes minimaux (chunks) [Abney 91]1. Identification des mots[Je/ pronom] [voudrais/verbe] [partir/verbe] [de/prep] [Paris/nom propre]

2. Conversion d’une suite de mots en chunks (patrons prédéfinis)[Je] [voudrais partir] [de Paris]

3. Construction de phrases à partir des chunks[[Je/SN [voudrais partir/SV] [de Paris/sprep]]

4. Compréhension,grâce aux concepts sémantico-pragamatiques associés à la tête lexicale du chunk (lexique du domaine de la tâche)

<GC1>::= <mouvement><GC2> <mouvement>::= partir |aller<GC2>::= <localisation>|<état><localisation>::= Paris|Lyon|Grenoble<état>::= vacances|retraite

[[mouvement: partir] [localisation:Paris]]

1. Système de reconnaissance 1. Système de reconnaissance

Moteur de reconnaissance vocale Moteur de reconnaissance vocale + +

Modèle de langageModèle de langage

Modèle de langage généraliste (n-gram) Estimation de la probabilité d'un mot

connaissant ses N prédécesseurs

10-15% d’erreurs (Broadcast News)

40% d’erreurs (Meeting Recognition)

2. Grammaire de compréhension2. Grammaire de compréhension

PROBLEMATIQUEPROBLEMATIQUECompréhension de la parole dans des applications de dialogue vocal

CONTRIBUTIONCONTRIBUTION

Modèle de langage peu flexibleNombreuses règles dues à la

spécialisationFaible niveau d’abstraction

Pas d’analyse linguistique profonde (traitement des ellipses, anaphores, cataphores, deixis)

ETAT DE L’ART ETAT DE L’ART Système de dialogue vocal

- J. Dowding, B.A. Hockey, J.M. Gawron, and C. Culy. (2001). Practical issues in compiling typed unification grammars for speech recognition. In Proceedings of the 39th Annual Meeting of the Association for Computational Linguistics, Toulouse, France.

- R. Moore. (1998). Using natural language knowledge sources in speech recognition. In Proceedings of the NATO Advanced Studies Institute.

- M. Rayner, B.A. Hockey, J.-M. Renders, N. Chatzichrisafis and K. Farrell. (2005). Spoken Language Processing in the Clarissa Procedure Browser. ICSI Tech Report TR-05-005.

Modèle de langage formel spécialiséGrammaire hors contexte

<HC1>::= je voudrais <HC2> <HC3><HC2>::= partir|aller<HC3>::= <HC4>|<HC5><HC4>::= en vacances<HC5>::= de <HC6><HC6>::= Paris|Lyon|Grenoble

Une contrainte satisfaite peut émettre un ou plusieurs nouveau(x) concept(s)(C7) RUSem 1 {Trajet_Partiel}: mouvement (polarité locative: finale)

∧ mouvement (polarité locative: finale)Émission nouveau concept: trajet [localisation[cible]]

(C7) RUSem 1 {Trajet_Partiel}: mouvement (polarité locative: initiale)

∧ mouvement (polarité locative: initiale)Émission nouveau concept: trajet [localisation[source]]

Approche flexibleRéutilisation des connaissances syntaxiques et

sémantiques Description hiérarchique

Génération d’une grammaire hors contexte de reconnaissance à partir de cette grammaire [Moore 98][Dowding 01]

Une grammaire d’unification pour modéliser la réponse de l’utilisateur à 1 question

Perspective: génération automatique de grammaires d’unification spécialisées [Rayner 05]

Ex: (C3) ∧ (C4) ∧ (C7)Il peut arriver à Autran ?Je veux revenir à l’hôtel le plus tôt possibleUn billet au départ de la gare de Lyon, s’il vous plaitDemain, je partirai de la place GrenetteIls vont décoller de Lyon à midije vais partir de l’aile nord de l’aéroport RCG

Bibliographie Bibliographie

Recommended