1
6. Modalité d’évaluation 6. Modalité d’évaluation Myrtille Terrier (2 ème année) [email protected] CRIP5, équipe Diadex. Université René Descartes – Paris V LaLICC FRE 2919, équipe Parole et Langage. Université de Paris-Sorbonne – Paris IV Société SoNear, logiciels applicatifs pour téléphones mobiles Grammaire de compréhension à émission de concepts Grammaire de compréhension à émission de concepts École d’été Dialogue et Interaction- Juillet 2006- Autran 5. Grammaire d’unification à émission de concepts pour la compréhension 5. Grammaire d’unification à émission de concepts pour la compréhension Taux d’erreur de reconnaissance - en mots: 2,02% - en concepts Couverture de la langue Taux de réutilisation des contraintes - syntaxiques - sémantiques Grammaire formelle de reconnaissance et de compréhension pour le Grammaire formelle de reconnaissance et de compréhension pour le dialogue dialogue Représentation du lexique (syntaxe et sémantique Représentation du lexique (syntaxe et sémantique lexicale) fondée sur une structuration de traits de lexicale) fondée sur une structuration de traits de modalité et de valeurs données modalité et de valeurs données Syntaxe mot voudrais nature verbe mode: indicatif temps: présent personne: 1ere nombre: sing mot je nature pronom sous cat: personnel personne: 1ere nombre: sing Sémantique lexicale lemme vouloir concept formulation spécialisation expressif: volonté lemme partir concept mouvement spécialisation polarité locative: initiale transitionnel: + 4. Grammaire d’unification 4. Grammaire d’unification 3. Description des connaissances 3. Description des connaissances linguistiques linguistiques Contraintes logiques sur les traits et les Contraintes logiques sur les traits et les valeurs valeurs Contraintes syntaxiques Concordance des temps, traitement des accords (C1) RUSynt 1 {Accord_Personne_Nombre} : pronom (Personne, Nombre) ∧ verbe (Personne, Nombre) Unification de la valeur des traits Personne et Nombre (C2) RUSynt 2 {Accord_Genre_Nombre} : article (Genre, Nombre) ∧ nom (Genre, Nombre) Contraintes entre les syntagmes (représentation simplifiée) (C3) RUSynt 3 {Phrase} : SN ∧ SV ∧ RUSynt 1 (C4) RUSynt 4 {Phrase} : SN ∧ SPrep (C5) RUSynt 5 {SV} : verbe ∧ Sprep () (C6) RUSynt 6 {Sprep} : prep ∧ SN SN: syntagme nominal SV: syntagme verbal SPrep: syntagme prépositionnel Contraintes sémantiques Contraintes entre les constituants sémantiques (sémantique relationnelle) (C7) RUSem 1 {Trajet_Partiel}: mouvement (polarité locative: Valeur) mouvement (polarité locative: Valeur) Unification de la valeur du trait Polarité Locative (Valeur) Analyse des énoncés reconnus Analyse des énoncés reconnus par le système de reconnaissance par le système de reconnaissance Grammaire de syntagmes minimaux (chunks) [Abney 91] 1. Identification des mots [Je/ pronom] [voudrais/verbe] [partir/verbe] [de/prep] [Paris/nom propre] 2. Conversion d’une suite de mots en chunks (patrons prédéfinis) [Je] [voudrais partir] [de Paris] 3. Construction de phrases à partir des chunks [[Je/SN [voudrais partir/SV] [de Paris/sprep]] 4. Compréhension,grâce aux concepts sémantico- pragamatiques associés à la tête lexicale du chunk (lexique du domaine de la tâche) <GC1>::= <mouvement><GC2> <mouvement>::= partir |aller <GC2>::= <localisation>|<état> <localisation>::= Paris|Lyon|Grenoble <état>::= vacances|retraite [[mouvement: partir] [localisation:Paris]] 1. Système de reconnaissance 1. Système de reconnaissance Moteur de reconnaissance vocale Moteur de reconnaissance vocale + + Modèle de langage Modèle de langage Modèle de langage généraliste (n-gram) Estimation de la probabilité d'un mot connaissant ses N prédécesseurs 10-15% d’erreurs (Broadcast News) 40% d’erreurs (Meeting Recognition) 2. Grammaire de compréhension 2. Grammaire de compréhension PROBLEMATIQUE PROBLEMATIQUE Compréhension de la parole dans des applications de dialogue vocal CONTRIBUTION CONTRIBUTION Modèle de langage peu flexible Nombreuses règles dues à la spécialisation Faible niveau d’abstraction Pas d’analyse linguistique profonde (traitement des ellipses, anaphores, cataphores, deixis) ETAT DE L’ART ETAT DE L’ART Système de dialogue vocal - J. Dowding, B.A. Hockey, J.M. Gawron, and C. Culy. (2001). Practical issues in compiling typed unification grammars for speech recognition. In Proceedings of the 39th Annual Meeting of the Association for Computational Linguistics, Toulouse, France. - R. Moore. (1998). Using natural language knowledge sources in speech recognition. In Proceedings of the NATO Advanced Studies Institute. - M. Rayner, B.A. Hockey, J.-M. Renders, N. Chatzichrisafis and K. Farrell. (2005). Spoken Language Processing in the Clarissa Procedure Browser. ICSI Tech Report TR-05-005. Modèle de langage formel spécialisé Grammaire hors contexte <HC1>::= je voudrais <HC2> <HC3> <HC2>::= partir|aller <HC3>::= <HC4>|<HC5> <HC4>::= en vacances <HC5>::= de <HC6> <HC6>::= Paris|Lyon|Grenoble Une contrainte satisfaite peut émettre un ou plusieurs nouveau(x) concept(s) (C7) RUSem 1 {Trajet_Partiel}: mouvement (polarité locative: finale) mouvement (polarité locative: finale) Émission nouveau concept: trajet [localisation[cible]] (C7) RUSem 1 {Trajet_Partiel}: mouvement (polarité locative: initiale) mouvement (polarité locative: initiale) Émission nouveau concept: trajet [localisation[source]] Approche flexible Réutilisation des connaissances syntaxiques et sémantiques Description hiérarchique Génération d’une grammaire hors contexte de reconnaissan à partir de cette grammaire [Moore 98][Dowding 01] Une grammaire d’unification pour modéliser la réponse de l’utilisateur à 1 question Perspective: génération automatique de grammaires d’unification spécialisées [Rayner 05] Ex: (C3) (C4) (C7) Il peut arriver à Autran ? Je veux revenir à l’hôtel le plus tôt possible Un billet au départ de la gare de Lyon , s’il vous plait Demain, je partirai de la place Grenette Ils vont décoller de Lyon à midi je vais partir de l’aile nord de l’aéroport RCG Bibliographie Bibliographie

6. Modalité d’évaluation

  • Upload
    dewei

  • View
    45

  • Download
    0

Embed Size (px)

DESCRIPTION

Grammaire de compréhension à émission de concepts. Myrtille Terrier ( 2 ème année ) [email protected]. - PowerPoint PPT Presentation

Citation preview

Page 1: 6. Modalité d’évaluation

6. Modalité d’évaluation6. Modalité d’évaluation

Myrtille Terrier (2ème année)[email protected]

CRIP5, équipe Diadex. Université René Descartes – Paris VLaLICC FRE 2919, équipe Parole et Langage. Université de Paris-Sorbonne – Paris IV

Société SoNear, logiciels applicatifs pour téléphones mobiles

Grammaire de compréhension à émission de conceptsGrammaire de compréhension à émission de concepts

École d’été Dialogue et Interaction- Juillet 2006- Autran

5. Grammaire d’unification à émission de concepts pour la compréhension5. Grammaire d’unification à émission de concepts pour la compréhension

Taux d’erreur de reconnaissance

- en mots: 2,02%

- en concepts

Couverture de la langue

Taux de réutilisation des contraintes

- syntaxiques

- sémantiques

Grammaire formelle de reconnaissance et de compréhension pour le dialogueGrammaire formelle de reconnaissance et de compréhension pour le dialogue

Représentation du lexique (syntaxe et sémantique lexicale) Représentation du lexique (syntaxe et sémantique lexicale) fondée sur une structuration de traits de modalité et de valeurs fondée sur une structuration de traits de modalité et de valeurs données données

Syntaxe

mot voudraisnature verbe

mode: indicatiftemps: présentpersonne: 1erenombre: sing

mot jenature pronom

sous cat: personnelpersonne: 1erenombre: sing

Sémantique lexicale

lemme vouloirconcept formulationspécialisation expressif: volonté

lemme partirconcept mouvementspécialisation polarité locative: initiale

transitionnel: +

4. Grammaire d’unification4. Grammaire d’unification3. Description des connaissances 3. Description des connaissances linguistiqueslinguistiques

Contraintes logiques sur les traits et les valeursContraintes logiques sur les traits et les valeurs

Contraintes syntaxiquesConcordance des temps, traitement des accords (C1) RUSynt 1 {Accord_Personne_Nombre} :pronom (Personne, Nombre) ∧ verbe (Personne, Nombre)

Unification de la valeur des traits Personne et Nombre

(C2) RUSynt 2 {Accord_Genre_Nombre} :article (Genre, Nombre) ∧ nom (Genre, Nombre)

Contraintes entre les syntagmes (représentation simplifiée)(C3) RUSynt 3 {Phrase} : SN ∧ SV ∧ RUSynt 1 (C4) RUSynt 4 {Phrase} : SN ∧ SPrep (C5) RUSynt 5 {SV} : verbe ∧ Sprep ()(C6) RUSynt 6 {Sprep} : prep ∧ SN

SN: syntagme nominalSV: syntagme verbalSPrep: syntagme prépositionnel

Contraintes sémantiques Contraintes entre les constituants sémantiques (sémantique relationnelle)(C7) RUSem 1 {Trajet_Partiel}: mouvement (polarité locative: Valeur)

∧ mouvement (polarité locative: Valeur) Unification de la valeur du trait Polarité Locative (Valeur)

Analyse des énoncés reconnus Analyse des énoncés reconnus par le système de reconnaissancepar le système de reconnaissance

Grammaire de syntagmes minimaux (chunks) [Abney 91]1. Identification des mots[Je/ pronom] [voudrais/verbe] [partir/verbe] [de/prep] [Paris/nom propre]

2. Conversion d’une suite de mots en chunks (patrons prédéfinis)[Je] [voudrais partir] [de Paris]

3. Construction de phrases à partir des chunks[[Je/SN [voudrais partir/SV] [de Paris/sprep]]

4. Compréhension,grâce aux concepts sémantico-pragamatiques associés à la tête lexicale du chunk (lexique du domaine de la tâche)

<GC1>::= <mouvement><GC2> <mouvement>::= partir |aller<GC2>::= <localisation>|<état><localisation>::= Paris|Lyon|Grenoble<état>::= vacances|retraite

[[mouvement: partir] [localisation:Paris]]

1. Système de reconnaissance 1. Système de reconnaissance

Moteur de reconnaissance vocale Moteur de reconnaissance vocale + +

Modèle de langageModèle de langage

Modèle de langage généraliste (n-gram) Estimation de la probabilité d'un mot

connaissant ses N prédécesseurs

10-15% d’erreurs (Broadcast News)

40% d’erreurs (Meeting Recognition)

2. Grammaire de compréhension2. Grammaire de compréhension

PROBLEMATIQUEPROBLEMATIQUECompréhension de la parole dans des applications de dialogue vocal

CONTRIBUTIONCONTRIBUTION

Modèle de langage peu flexibleNombreuses règles dues à la

spécialisationFaible niveau d’abstraction

Pas d’analyse linguistique profonde (traitement des ellipses, anaphores, cataphores, deixis)

ETAT DE L’ART ETAT DE L’ART Système de dialogue vocal

- J. Dowding, B.A. Hockey, J.M. Gawron, and C. Culy. (2001). Practical issues in compiling typed unification grammars for speech recognition. In Proceedings of the 39th Annual Meeting of the Association for Computational Linguistics, Toulouse, France.

- R. Moore. (1998). Using natural language knowledge sources in speech recognition. In Proceedings of the NATO Advanced Studies Institute.

- M. Rayner, B.A. Hockey, J.-M. Renders, N. Chatzichrisafis and K. Farrell. (2005). Spoken Language Processing in the Clarissa Procedure Browser. ICSI Tech Report TR-05-005.

Modèle de langage formel spécialiséGrammaire hors contexte

<HC1>::= je voudrais <HC2> <HC3><HC2>::= partir|aller<HC3>::= <HC4>|<HC5><HC4>::= en vacances<HC5>::= de <HC6><HC6>::= Paris|Lyon|Grenoble

Une contrainte satisfaite peut émettre un ou plusieurs nouveau(x) concept(s)(C7) RUSem 1 {Trajet_Partiel}: mouvement (polarité locative: finale)

∧ mouvement (polarité locative: finale)Émission nouveau concept: trajet [localisation[cible]]

(C7) RUSem 1 {Trajet_Partiel}: mouvement (polarité locative: initiale)

∧ mouvement (polarité locative: initiale)Émission nouveau concept: trajet [localisation[source]]

Approche flexibleRéutilisation des connaissances syntaxiques et

sémantiques Description hiérarchique

Génération d’une grammaire hors contexte de reconnaissance à partir de cette grammaire [Moore 98][Dowding 01]

Une grammaire d’unification pour modéliser la réponse de l’utilisateur à 1 question

Perspective: génération automatique de grammaires d’unification spécialisées [Rayner 05]

Ex: (C3) ∧ (C4) ∧ (C7)Il peut arriver à Autran ?Je veux revenir à l’hôtel le plus tôt possibleUn billet au départ de la gare de Lyon, s’il vous plaitDemain, je partirai de la place GrenetteIls vont décoller de Lyon à midije vais partir de l’aile nord de l’aéroport RCG

Bibliographie Bibliographie