Upload
bathylle-duquesne
View
103
Download
0
Embed Size (px)
Citation preview
4 juillet 2006 ARC Mosaïque 1
Les Grammaires
d’Arbres Polychromes
Marcel Cori
Université Paris X - Nanterre
CNRS - UMR MoDyCo
le 4 juillet 2006
4 juillet 2006 ARC Mosaïque 2
1. Introduction
2. Les arbres polychromes
3. Grammaires et composition
4. Les traits
5. Les GAP hiérarchisées
4 juillet 2006 ARC Mosaïque 3
1. Introduction
1.1 Motivations
(1) Les motivations sont d’abord linguistiques :
définir un formalisme qui permette de rendre compte d’un certain nombre de phénomènes syntaxiques.
Le formalisme doit être expressif, manipulable par des linguistes.
Les Grammaires d’arbres polychromes (GAP) :Cori et Marandin (1993, 1994, 1998).
4 juillet 2006 ARC Mosaïque 4
(2) Le modèle est un véritable modèle formel, pas un langage.
La puissance en est limitée.
Il y a un lien intime entre les propriétés mathématiques et les représentations linguistiques.
(3) L’informatisation peut par conséquent se faire proprement.
4 juillet 2006 ARC Mosaïque 5
1.2 Une conception très superficielle de la syntaxe
La syntaxe est ce qui règle les suites admissibles dans une langue donnée, l’ordre entre les constituants.
L’ordre et la domination sont liés.
Mais, quand on assemble deux objets pour constituer un objet de niveau supérieur, ce n’est pas nécessairement la concaténation de chaînes qui s’applique.
4 juillet 2006 ARC Mosaïque 6
1.3 Des grammaires syntagmatiques à X-barre
Les grammaires syntagmatiques ne captent pas les parallélismes et les différences entre arbres: il n’y a qu’une façon de dominer.
En X-barre, il y a trois façons de dominer: noyau (ou tête), spécifieur et complément.
Les grammaires d’arbres polychromes permettent:- d’augmenter le nombre de façon de dominer
(couleurs);- de distinguer la position de ce qui occupe la
position (cf. Milner, 1989).
4 juillet 2006 ARC Mosaïque 7
La position noyau peut être occupée par des objets de catégories diverses:
Paul est très sieste
Paul a acheté des fruits, Marie a jeté les pourris
Des complétives ou des infinitives peuvent être sujet :
Dormir me fatigueQue la France gagne la coupe me surprendrait bien
(pas de catégorie vide)
4 juillet 2006 ARC Mosaïque 8
1.4 Prise en compte de certains phénomènes
Les « constituants disjoints »
Pierre a, le pauvre, perdu son emploi
Pierre, Marie en a pleuré, a perdu son emploi
La constituance non bornée
(unbounded branching)
Le ski en été sur les glaciers à trois mille mètre d’altitude
4 juillet 2006 ARC Mosaïque 9
2. Les arbres polychromes2.1 Les couleurs
Chaque branche a une couleur: ceci permet de distinguer entre les différentes manières de dominer.
Il y a un ordre fixe entre les couleurs.
On représente les couleurs par des nombres entiers.
Plusieurs branches filles de même mère peuvent avoir la même couleur. Certaines couleurs peuvent ne pas être présentes.
4 juillet 2006 ARC Mosaïque 10
Le nombre de couleurs est défini au départ.
(5 pour le français)
Les couleurs définissent des positions génériques.
Par exemple, la position 4.
Une position sera définie par un couple:
<étiquette de la mère, couleur de branche>.
Par exemple <GN, 1> ou <GV, 3>.
4 juillet 2006 ARC Mosaïque 11
2.2 Définition formelle
On se donne un nombre p (de couleurs).
A = <X,L,d,P> est un arbre polychrome où
X est l’ensemble des sommets,
L : X Cat est la fonction d’étiquetage, P est un ordre strict partiel de X × X,
d = <d1, d2, …, dp> est une suite de relations antiréflexives de X × X.
La fermeture transitive D de (d1 d2 … dp ) doit vérifier les conditions de Wall (1972), ainsi que deux conditions supplémentaires.
4 juillet 2006 ARC Mosaïque 12
Conditions de Wall
(i) x X y X <x,y> D
(condition de la racine unique)
(ii) x, y X
(<x,y> P <y,x> P) (<x,y> D <y,x> D)
(condition d’exclusivité)
(iii) w, x, y, z X
<w,x> P <w,y> D <x,z> D <y,z> P
(condition de non-croisement)
4 juillet 2006 ARC Mosaïque 13
Conditions supplémentaires
(iv) x, y, z X
<x,y> di <x,z> dj i<j <y,z> P
(condition sur l’ordre entre les couleurs)
(v) x, y, z X
<x,y> di <x,z> dj y z
(<y,z> P <z,y> P)
(ordre entre les fils d’un même sommet)
4 juillet 2006 ARC Mosaïque 14
2.3 La question de la position noyau
Chaque sommet qui a des descendants a un fils en position noyau.
Il y a un seul fils en position noyau.
Soit k un nombre compris entre 1 et p.
(vi) x, y, z X
<x,y> dk <x,z> dk y = z
(vii) x, y X i
<x,y> di z X <x,z> dk
4 juillet 2006 ARC Mosaïque 15
2.4 Un exemple d’arbre polychrome
La position noyau est la position 3.
S
3
GV
1 3
V 5
3 4 4 5
GN Vaux GN S Vpp GN
Jean a l’imbécile, Paul me l’a dit,perdu son emploi
4 juillet 2006 ARC Mosaïque 16
S S GV GV
1 3 1 3 3 5 3
GN GV GS GV GV GN V
3. Grammaires et composition
3.1 Arbres élémentaires
Ce sont des arbres de profondeur 1, et tels qu’il y a au maximum une branche par couleur donnée.
4 juillet 2006 ARC Mosaïque 17
3.2 Grammaires
Une grammaire est donnée par un couple <Cat, B>, où Cat est un ensemble de catégories et B un ensemble (une base) d’arbres élémentaires.
(1) On ne distingue pas un axiome: la grammaire engendre des structures syntaxiques qui ne correspondent pas nécessairement à des phrases.
(2) On ne distingue pas un Vocabulaire terminal. Cela permet de traiter (p. ex.) a tous les jours mangé
4 juillet 2006 ARC Mosaïque 18
3.3 La composition des arbres
Dans le cas général la composition se fait selon l’opération de substitution, qui est associée à la dérivation pour les grammaires formelles.
S S
1 3 1 3
GN GV GN GV
GV 3 5
3 5 V GN
V GN
4 juillet 2006 ARC Mosaïque 19
Mais il y a un cas particulier à considérer:Le ski en été sur les glaciers à trois mille mètres.
GN GN
1 3 3 5
dét N GN GP
GN 3 5
3 5 GN GP
GN GP 3 5
GN GP
1 3
dét N
4 juillet 2006 ARC Mosaïque 20
La composition inclut un compactage.
GN
3 5
GN GP GN
3 5
GN GP
3 5 dét N GP GP GP
GN GP
1 3
dét N
4 juillet 2006 ARC Mosaïque 21
Le réordonnancement : respect de l’ordre des couleurs.
V
3 4 V
V S 3 4 V
V V S 3 4 5
3 5 3 5 Vaux S Vpp
Vaux Vpp Vaux Vpp
a, Paul me l’a dit, perdu
4 juillet 2006 ARC Mosaïque 22
Définitions formellesSoient A’ = <X’,L’,d’,P’> et A" = <X",L",d",P"> deux arbres tels que X’ X" = . Soient a la racine de A" et b une feuille de A’.A’ et A" sont composables selon b ssi L’(b) = L"(a).
Un cas particulier se produit quand: c <c,b> d’k et L’(c) = L’(b). a
A’ c A"
b
4 juillet 2006 ARC Mosaïque 23
On écrit A = [A’, b, A"].Deux cas sont considérés:
A’ A’ c b
A" A"
Propriétés:(1) [[A1, b, A2], b’, A3] = [A1, b, [A2, b’, A3]]
(2) [[A1, b, A2], b’, A3] = [[A1, b’, A3], b, A2]
4 juillet 2006 ARC Mosaïque 24
Étant donnée une base d’arbres élémentaires B, on définit le langage d’arbres T(B) par:(i) A B A T(B) (i) A T(B) A’ B [A’, b, A"] T(B) .
3.4 Langage engendré par une grammaire
Remarque: On peut définir un langage de mots par une GAP :
- en séparant l’ensemble des catégories en un vocabulaire terminal et un vocabulaire non terminal;
- en se donnant un axiome dans VN.
4 juillet 2006 ARC Mosaïque 25
La grammaire qui engendre an bn cn
On prend p = 4 et k = 2.
Une grammaire particulière
S S
1 2 3 4 1 2 4
a S b c a b c
S
a a a b b b c c c
4 juillet 2006 ARC Mosaïque 26
4.1 Approche intuitive
a1:non GV GVa2:non
INTERDIT
a1:non GV GP a1:non GV GNa2:oui a2:oui
a1:oui GV GN a1:oui GV GNa2:oui a2:oui
présente Paul à Marie *présente Paul Marie
4. Les traits
4 juillet 2006 ARC Mosaïque 27
Les arbres de la grammaire
a1:X GV a1:non GVa2:non a2:Y
a1:X GV GP a1:oui GV GNa2:oui a2:Y
GN genre:G
nombre:N
genre:G dét N genre:G nombre:N nombre:N
4 juillet 2006 ARC Mosaïque 28
4.2 Les relations d’interdépendance
GN genre:G
nombre:N
genre:G1 dét N genre:G2 nombre:N nombre:N
G1 G2 G
masc masc masc
fém fém fém
ind masc masc
ind fém fém
4 juillet 2006 ARC Mosaïque 29
Une relation d’interdépendance est associée à tout arbre (élémentaire ou complexe). Lorsqu’on compose deux arbres, on obtient une nouvelle relation d’interdépendance.
Exemple: les temps composés en français
V <temps : T> <aux : App>
V Vpp<temps : Ta> <auxil : A><aux : A> <aux : App>
4 juillet 2006 ARC Mosaïque 30
Relation d’interdépendance:
A App Ta T
avoir avoir présent passé composéavoir être imparfait plus que parfaitêtre nil futur futur antérieuravoir nil passé comp présent surcomposé
plus que p. imparfait surcomposéfutur ant. futur surcomposé
En fait, la relation est le produit des deux relations ci-dessus.
4 juillet 2006 ARC Mosaïque 31
V <temps : T><aux : App>
V Vpp Vpp<temps : Ta’> <auxil : A’> <auxil : A><aux : A’> <aux : A> <aux : App>
A’ A App Ta’ Tavoir avoir avoir présent présent surcompavoir avoir être imparfait imparfait surcompavoir avoir nil futur futur surcomposéavoir être nil
4 juillet 2006 ARC Mosaïque 32
4.3 Définition formellep est un nombre entier, k un nombre inférieur ou égal à p, Cat un ensemble de catégories, T un ensemble d’attributs, E un ensemble (fini) de valeurs, un ensemble de variables.
Un arbre polychrome est donné parA = <X, L, d, P, , F, t, R> où: (ii) : X P(T) (ensemble des attributs pour chaque sommet),
(iii) F = {f1,…, fm} (ensemble des variables de l’arbre),
(iv) x t(x) : (x) E F (valeurs des traits),(v) R Em (relation d’interdépendance).
4 juillet 2006 ARC Mosaïque 33
5. Les GAP hiérarchisées
5.1 Introduction d’une hiérarchie dans les grammaires
(Cori et Marandin, 1998)
Idée : capter les généralités.
Inspirations : la hiérarchie des types de HPSG, d’autres modèles utilisant l’héritage,…
Les règles de la grammaire ne sont pas définies les unes indépendamment des autres.
4 juillet 2006 ARC Mosaïque 34
Arbres sous-spécifiés. La catégorie, la couleur d’une branche ou certains traits peuvent ne pas être spécifiés dans les arbres élémentaires de la grammaire.
Utilisation de variables (pour les traits, les catégories ou les couleurs). La relation d’interdépendance détermine les valeurs possibles pour ces variables.
S
3
Y GV
4 juillet 2006 ARC Mosaïque 35
Relation d’ordre
On définit une relation d’ordre entre les arbres élémentaires de la grammaire.
L’arbre A2 subsume l’arbre A1 quand A1 est plus spécifié que A2.
a0:non X
3
Y Z
A2
S a0:non
3 5
a0:oui GV Y
A1
4 juillet 2006 ARC Mosaïque 36
Graphe d’arbres
En réalité, on se donne a priori le graphe d’arbres élémentaires qui dessine la relation d’ordre (graphe sans circuit). C’est ainsi qu’on définit une grammaire hiérarchisée.
Il faut que cette grammaire soit bien hiérarchisée.
En ce cas, on construit un graphe déduit dans lequel chaque arbre élémentaire hérite des spécifications de tous ses ascendants.
Dans le graphe déduit la relation d’ordre est bien vérifiée.
4 juillet 2006 ARC Mosaïque 37
grammaire hiérarchisée graphe déduit
a0:non X
3
Y Z
S
3
a0:oui GV GN
S
1 3
GN GV
a0:non X
3
Y Z
a0:non S
3
a0:oui GV GN
S a0:non
1 3
GN GV a0:oui
4 juillet 2006 ARC Mosaïque 38
Les grammaires hiérarchisées permettent d’abstraire les propriétés communes à plusieurs constructions et d’isoler les propriétés qui distinguent les constructions.
La hiérarchie permet une représentation unifiée de certaines propriétés.
Ces propriétés peuvent être des propriétés diverses, par exemple des propriétés positionnelles,
mais aussi des propriétés fonctionnelles.
4 juillet 2006 ARC Mosaïque 39
5.2 Les positions du sujet
Il n’y a pas de « position sujet » car le sujet peut occuper différentes positions.
Le sujet canonique
a0:non S
1 3
GN GV a0:oui
Le sujet inversé
S a0:non
3 5
GV GN a0:oui
Jean aime MarieReferont un devoir tous les étudiants qui n’ont pas la moyenne
4 juillet 2006 ARC Mosaïque 40
L’inversion locative
GV a0:non a1:X
3 5
V GNa1:X
S a0:non
1 3
GP GV a0:non
Dans le lit de la petite fille dormait un oursDans la cour mangeait un vagabond*Dans la cour mangeait un vagabond des pommes?Dans la cour mangeait des pommes un vagabond
4 juillet 2006 ARC Mosaïque 41
La représentation (partielle) du sujet
a0:non X
3
Y Z
S
3
a0:oui GV GN
GV
3
Z Y
S
1 3
GN GV
S
3 5
GV GN
GV
1 3
pro GV
GV
3 5
V GN
4 juillet 2006 ARC Mosaïque 42
ConclusionPour définir une grammaire faut-il:
- définir les règles (arbres élémentaires) au niveau le plus bas, et faire ensuite des généralisations ?
- déterminer les principes généraux et ensuite engendrer les règles de niveau inférieur ?
4 juillet 2006 ARC Mosaïque 43
RéférencesCori M. et Marandin J.-M., « Grammaires d'arbres polychromes », TAL vol. 34, n° 1, 1993, pp. 101-132.
Cori M. et Marandin J.-M., « Polychrome Tree Grammars (PTGs) : a formal presentation », dans Current Issues in Mathematical Linguistics, C. Martin-Vide ed., Elsevier, 1994, pp. 141-149.
Cori M. et Marandin J.-M., « Héritage de propriétés dans les grammaires d'arbres polychromes », LINX, Vol. 39, n° 2, 1998, pp. 13-42.
Cori M., « La mathématisation des formalismes syntaxiques », LINX n° 48, 2003, pp. 13-28.
Cori M., « Quelle formalisation pour les fonctions grammaticales ? », Colloque Les fonctions grammaticales : histoire, théories, pratiques, Tromsø, Norvège, octobre 2005, actes à paraître chez Peter Lang.