14
Pour un système formel de description linguistique Lionel Clément - Benoît Sagot Mosaïque - lundi 14 mai 2007 Inria Futurs Labri - Université Bordeaux 1

Pour un système formel de description linguistique Lionel Clément - Benoît Sagot Mosaïque - lundi 14 mai 2 00 7 Inria Futurs Labri - Université Bordeaux

Embed Size (px)

Citation preview

Page 1: Pour un système formel de description linguistique Lionel Clément - Benoît Sagot Mosaïque - lundi 14 mai 2 00 7 Inria Futurs Labri - Université Bordeaux

Pour un système formel de description linguistique

Lionel Clément - Benoît Sagot

Mosaïque - lundi 14 mai 2007Inria Futurs

Labri - Université Bordeaux 1

Page 2: Pour un système formel de description linguistique Lionel Clément - Benoît Sagot Mosaïque - lundi 14 mai 2 00 7 Inria Futurs Labri - Université Bordeaux

Pour un système formel ...

On est d’accord pour :– Distinguer constituance et dépendance syntaxique

(notion de tête, notion de fonctions grammaticales)– Distinguer ordre des mots (voire la structure

topologique) de la constituance– Séparer syntaxe et sémantique (distinguer les

variantes de valence des variantes de réalisations)– Donner un rôle important au lexique: valence,

contrôle, sélection

Page 3: Pour un système formel de description linguistique Lionel Clément - Benoît Sagot Mosaïque - lundi 14 mai 2 00 7 Inria Futurs Labri - Université Bordeaux

Pour un système formel ...

On est d’accord pour :– Un modèle de la compétence:

– Jugement d’acceptabilité– Paraphrase

– Une grammaire générative :– Engendre seulement phrases acceptables– Minimise « distance » entre paraphrases

– Distinguer des propriétés distributionnelles (relation entre un élément et son contexte syntaxique)

– Distinguer des propriétés inter-phrastiques (relation entre deux éléments d’un paradigme syntaxique)

Page 4: Pour un système formel de description linguistique Lionel Clément - Benoît Sagot Mosaïque - lundi 14 mai 2 00 7 Inria Futurs Labri - Université Bordeaux

Pour un système formel ...• Quelques points de divergence

– Langue / parole• « Choix » lexicaux ?• Structure informationnelle

– Place du lexique dans la grammaire– Aspects calculatoires des formalismes

• Système de description (contrairement à un formalisme basé sur une théorie linguistique)– Modulaire– Monotone– Déclaratif

Page 5: Pour un système formel de description linguistique Lionel Clément - Benoît Sagot Mosaïque - lundi 14 mai 2 00 7 Inria Futurs Labri - Université Bordeaux

Appareil formel proposé

• Opérateurs génériques:– Ordre linéaire: < << > >>– Constituants: C [ A B ] ; C [ A, B ]– Relations, dont les arguments sont des domaines (A–

>B équivaut à { !A, B } ; on peut vouloir { !A B })• Dépendance (étiquetées par un niveau et par un type): –

[SynP:OBJ]–> / {SynP:Obj ….. }Niveaux possibles: SynS, SynP, Sém, Disc ; relation de correspondance inter-niveaux et domaine/constituant:

• Rel. paradigmatique =>• Rel. focus, Rel. topic –f–> , –t–>• Rel. de co-référence directe (sans domaine correspondant) et

indirecte (y compris le domaine associé)

Page 6: Pour un système formel de description linguistique Lionel Clément - Benoît Sagot Mosaïque - lundi 14 mai 2 00 7 Inria Futurs Labri - Université Bordeaux

Etudes de cas

• Disloquées (avec pronom)• structure informationnelle, liage

• Passif• structure informationnelle, relation lexique grammaire,

modularité

• Figement lexical• Collocations, figées

• Contrôle• dépendance syntaxique versus dépendance sémantique

Page 7: Pour un système formel de description linguistique Lionel Clément - Benoît Sagot Mosaïque - lundi 14 mai 2 00 7 Inria Futurs Labri - Université Bordeaux

Etudes de cas - Disloquée (1)Dans le fossé, sa voiture, Jean, il l’a encore mise.

1. Relation de coréférence entre le pronom et son antécédent (non bornée, obligatoire).

Dans le fossé, son cheval, Jean, il l’a encore mis.

Son idée idiote, Jean, il croit pouvoir la proposer à la commission.

2. Relation de focalisation sur l’élément extraitJean, sa voiture, il l’a encore mise dans le fossé.

3. Relation de topicalisation sur l’élément antéposéSa voiture, il l’a encore mise dans le fossé, Jean.

• Relation d’ordre linéaire entre groupe extrait et structure « matrice »

• L’élément extrait n’est pas enchâssé dans la phrase matrice

Page 8: Pour un système formel de description linguistique Lionel Clément - Benoît Sagot Mosaïque - lundi 14 mai 2 00 7 Inria Futurs Labri - Université Bordeaux

Etude de cas - Disloquée (2)Objets

– Co-référence anaphore expression référentielle– Groupe « antécédent »– Groupe « phrase matrice »– Marque « focus », « topic » de l’élément extrait

Contraintes– Pronom co-référenciel de l’antécédent (accord, catégorie, valence)

• Jean (*lui)l’a remarqué, que Marie est partie sans rien lui dire.• Jean lui(*le) a fait part de son chagrin, à Marie.

Note: la proforme peut être un déterminant (« Jean, sa mobylette, elle est trop petite, la selle. »)

– La relation de co-réréfence est entre propositions (le focus définit donc un domaine)

Jean(i), il(i) lui donne un livre.*Jean(i) lui(i) donne un livre.

Page 9: Pour un système formel de description linguistique Lionel Clément - Benoît Sagot Mosaïque - lundi 14 mai 2 00 7 Inria Futurs Labri - Université Bordeaux

Etude de cas - Disloquée (3)Contraintes (suite)

– Ordre linéaire : structure informationnelle du type thème/rhème. Enchâssements croisés impossibles (stratification topologique et non en dépendances syntaxiques)

QuickTime™ et undécompresseur Aucune

sont requis pour visionner cette image.

Jean, son vélo, le guidon, la rouille elle est partie

*Jean, son vélo,le guidon,la rouille elle est partie

– Les autres contraintes: pas spécifiques aux disloquées

*De son frère, il est connu que Jean peint le portrait.

De son frère, Jean peint le portrait.

Page 10: Pour un système formel de description linguistique Lionel Clément - Benoît Sagot Mosaïque - lundi 14 mai 2 00 7 Inria Futurs Labri - Université Bordeaux

Etude de cas - Disloquée (4)

Jean, sa mobylette, selle,la elle est mal réglée

co-référence co-référence

Constituence

Focus

Ordre linéaire, (thème/propos)

co-référence

lexique: réglée (N0,N1)

Insuffisamment lexique: mal (adverbe antéposé)

SUJET

QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.

N1 : "celui qui est réglé"

N0 : "celui qui règle"

Page 11: Pour un système formel de description linguistique Lionel Clément - Benoît Sagot Mosaïque - lundi 14 mai 2 00 7 Inria Futurs Labri - Université Bordeaux

QuickTime™ et undécompresseur Aucune

sont requis pour visionner cette image.

Verbe fini----------------------

S [... [... V ... ] ... ]] ----------------------QuickTime™ et un

décompresseur Aucunesont requis pour visionner cette image.

QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.

QuickTime™ et undécompresseur Aucune

sont requis pour visionner cette image.

QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.

Choix d'un verbe

transitif : expulser

QuickTime™ et undécompresseur Aucune

sont requis pour visionner cette image.

Choix de la diathèse passive :

démotion de l'agent

Léon a été expulsé par les autochtones.

QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.

Construction avecl'auxiliaire être

----------------------V [Vaux ... Vpp] ----------------------

QuickTime™ et undécompresseur Aucune

sont requis pour visionner cette image.QuickTime™ et undécompresseur Aucune

sont requis pour visionner cette image.

QuickTime™ et undécompresseur Aucune

sont requis pour visionner cette image.

Choix de l'expression de

l'agent

QuickTime™ et undécompresseur Aucune

sont requis pour visionner cette image.

Etude de cas - Passif (1)

Page 12: Pour un système formel de description linguistique Lionel Clément - Benoît Sagot Mosaïque - lundi 14 mai 2 00 7 Inria Futurs Labri - Université Bordeaux

Expulser (N0, N1)N0: "Celui qui expulse"N1: "celui qui est expulsé")

QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.

QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.

Voix passive

Contraintes satisfaites:1) Complétude et cohérence : (la complémentation du verbe respecte sa valence)2) La structure topologique est valide (pas de constituence croisée)3) etc, etc...

etc, etc...

QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.Contrainte surles instances

Etude de cas - Passif (2)

QuickTime™ et undécompresseur Aucune

sont requis pour visionner cette image.

C'est les autochtones,

a été expulsé.

Thème/propos

Focus

Léonque

Dépendance Syntaxique

Dépendance Syntaxique

par

Page 13: Pour un système formel de description linguistique Lionel Clément - Benoît Sagot Mosaïque - lundi 14 mai 2 00 7 Inria Futurs Labri - Université Bordeaux

QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.

QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.

...

QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.

QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.

QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.

...

Occurrences d’instances

Système formel (1)

Page 14: Pour un système formel de description linguistique Lionel Clément - Benoît Sagot Mosaïque - lundi 14 mai 2 00 7 Inria Futurs Labri - Université Bordeaux

QuickTime™ et undécompresseur Aucune

sont requis pour visionner cette image.

QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.

QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.

QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.

Partie cohérente et complètede modules:Graphe acyclique

Portée des éléments

Système formel (2)

Contenu d’instance

QuickTime™ et undécompresseur Aucune

sont requis pour visionner cette image.

QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.

QuickTime™ et undécompresseur Aucune

sont requis pour visionner cette image.

QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.

QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.

Ensemble d'éléments linguistiques

(catégorie, groupe, mot,argument, place, etc.)et ensemble de relationssur ces termes.