Upload
lance-giraud
View
107
Download
1
Embed Size (px)
Citation preview
Systeme Question-ReponseSQR
• Presente par
• Abdul Kader Hamdo• Tayeb Zebiche
Plan de la presentation
♦Intoduction
♦Historique
♦Architecture générique de SQR
♦Presentation de QUANTUM
♦Presentation de Tequesta
♦Travaux futures
♦Conclusion
♦References
Systeme Question-reponse
Jean aime Marie. Mais, elle ne veut pas de lui. Un jour le dragon est venu et a enlevé Marie. Jean, est monte sur son cheval, a tué le dragon et, a délivré Marie accepte de se marier avec Jean. Ils ont eu beaucoup d’enfants.
Question: Pourquoi Marie a accepté de se marier avec Jean?
Réponse: parce que elle est endettée envers lui.
Problematique de la question-reponse
“we have information, how can we better serve it”
Plutot que
“we have a query, how can we answer it” [Loucopoulos and Zicari 1992]
Systeme Question-reponse
Les Conferences TREC-Track
Il s'agit de questions pour lesquelles il n'est pas necessaire de faire appel a des capacites de jugement pour produire la reponse, ni de la deduire a partir de plusieurs faits enonces dans le corpus.
The Performance of TREC SystemsThe Performance of TREC Systems
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
8 9 10
TREC
MR
R S
core
Best System
Worst System
Mean System
Sheff ield's Best
Sheff ield's Worst
Analyse de la Question
Contexte de
dialogue
Documents pretraites
Collection de documents
Modele Usager
Pretraitement de collection de documents
Selection de documents candidats
Extraction de Reponse
Generation de reponse
Usager
Analyse de documents candidats
Architecture générique d’un SQR
How many people die from snakebite poisoning in the USA per year
Mot-question focus descriminent
About ten people die a year from snakebites in the USA
candidatUne variante de discriminant
Decomposition d’une question et sa reponse selon TREC
Analyse de la question
• Passages de longueur déterminée (n caracteres) + représentation de vecteur pour chaque passage
• Paragraphes ou phrases
• Text classique avec:– A chaque phrase est assignée un score– Les passages recherchés sont formés en prennant les phrases
de scores élevés
• Extraction de passage basé non seulement sur les mots mais encore sur d’autres caractéristique (ex. construction syntaxiques)
• Passages de longueur particulière (n caracteres) + représentation de vecteur pour chaque passage
Extraction de passages
Extraction de Réponse
Deux techniques principales pour l’extraction de la réponse sont:
1.Arbre de dépendance syntaxico-sémantique
2. Patrons de surface – <Name> (<Answer> -)– <Name> was born on <Answer>– Bons patrons exigent une classification détaillée
Par exemple une question telle que “When was Mozart born?” génère une liste de patrons similaire à:
• <NAME> ( <ANSWER> - )• <NAME> was born on <ANSWER> ,• born in <ANSWER> , <NAME>• <ANSWER> <NAME> was born
Presentation de Quantum
C'est un SQR dont le but est de trouver dans une grande collection une réponse à
une question posée en LN en utilisant une combinaison de RI et analyse
linguistique
Presentation de Quantum
Presentation de Quantum
Presentation de QuantumResultats
Erreurs de classification par fonction d'extraction, pour les 492 questions de TREC-X. Les fonctions raison, manière et objet sont traitées comme inconnu dans la version courante de
QUANTUM
Presentation de Tequesta
Architecture du système TEQUESTA
Exemple de représentation abstrète d’un texte:Teachers in Oklahoma City and some other districts saidthey feared reprisals if they took part in the strike.Il y a trois structures de dépendance :a. head: sayarg(l,1): teacherarg(l,2): in Oklahoma Cityarg(l,3): some other districtb. head: feararg(l,1): teacherarg(l,2): in Oklahoma Cityarg(l,3): some other districtarg(r,4): reprisalc. head: take-partarg(l,1): teacherarg(l,2): in Oklahoma Cityarg(l,3): some other districtarg(r,4): reprisalarg(r,5): in the strike
Tequesta: Analyse de documents
Entités nommées dans TEQUESTA
Evaluation des SQR
Les Systèmes Futures de QR doivent être:
Opportuns : répondre à la question en temps réel, incorporerimmédiatement les nouveaux sources de donnéesExacts : ne détecte pas de réponse si aucune disponible.Rentables : les réponses correctes indépendamment des sources de données fournissent des réponses dans n'importe quel format.Perfectionnés : fournir des réponses logiques, complètes, permettre la fusion de données, incorporez les possibilités du raisonnement. Pertinents : fournir des réponses appropriées dans un contexte interactif pour soutenir les dialogues des utilisateurs.“QA Roadmap” – TREC-10 à -14
Conclusions