Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd...

Preview:

Citation preview

Étude et analyse des relatives de la langue arabe

en HPSG et LKB

Inès ZALILA & Kais HADDAR

3rd International Conference on Arabic Language Processing - CITALA 2009 –

May 4th – 5th 2009, Rabat, Morocco

MIRACL, Faculté des sciences de Sfax, Tunisie

2

Traitement Automatique des Langues Naturelles

Applications informatiques pour traiter automatiquement les langues naturelles

Phase d’analyse de la source

morphologique syntaxique sémantique pragmatiquelexicale Analyse Syntaxique

Introduction

Étude des règles pour une bonne formation des phrases

2/38

3

...Introduction

Le phénomène des relatives ( الموصولي (المركب

fréquent

existant dans toutes les langues

centre d’intérêt pour plusieurs chercheurs

L’analyse syntaxique est une phase délicate

partie modélisation

partie implémentation

Simplifier la phase de construction d’un analyseur syntaxique (i.e., outils de génération, heuristiques)

Insuffisance des recherches pour l’analyse syntaxique des relatives arabes

Interaction avec les phénomènes linguistiques

Diversité des formes possibles des phrases relatives

Complexité de la structure des phrases relatives

3/38

4

Objectifs

Spécifier en TDL une grammaire HPSG pour les

relatives arabes

Étudier et dégager la typologie des phrases relatives

détailler les schémas traitant les relatives arabes

Spécifier en TDL la grammaire élaborée

Expérimenter avec la plate-forme linguistique LKB

4/38

5

PLAN

Introduction

État de l’art

Typologie de la phrase relative arabe

HPSG pour les relatives arabes

Spécification TDL de la grammaire conçue

Expérimentation avec LKB et évaluation

Conclusion et perspectives5/38

6

État de l’art

La construction d’un analyseur syntaxique à partir d’une grammaire élaborée

Génération automatique

Construction propre

(Elleuch , 2004) et (Mâaloul , 2005) (Garcia, 2005), (Laurens, 2007) et (Loukam and Laskri, 2007)

Extensibilité du code

Maintenance facile

Choix de la démarche d’analyse (ascendante, descendante)

Ergonomie de l’interface

Résultats non robustes

Maintenance difficile

Extensibilité difficile

Entrées et Sorties sont bien définies

Coût moins cher (temps et efforts)

Ergonomie testée

Résultats robustes

6/38

7

PLAN

Introduction

État de l’art

Typologie de la phrase relative arabe

HPSG pour les relatives arabes

Spécification TDL de la grammaire conçue

Expérimentation avec LKB et évaluation

Conclusion et perspectives7/38

8

Typologie de la phrase relative arabe

La proposition relative en Arabe ( المركب(الموصولي

Les noms conjonctifs arabes 

, , , , , التي, الذي لو أن أن8 من ... ,ما

Joindre un nom conjonctif à une proposition verbale

ou nominale

إلى سافر االمتحان في نجح الذي الولد فرنسا

8/38

9

...Typologie de la phrase relative arabe

Une hiérarchie de type inspirée de la théorie grammaticale ancienne (Dahdah A., 1992), (Abdelwahed A., 2004) et des travaux de recherche antérieurs (Boukédi, 2008)

Signe

SyntagmeMot

PrépositionnelVerbal Nominal

Nom

Décliné Non décliné

Particule

opérativeNon opérative

Verbe

QuadrilitèreTrilitère

9/38

10

...Typologie de la phrase relative arabe

Un nom conjonctif est un nom

Nom

Décliné Non décliné

VariableNon variablePronomNon significatif

Pr. Démonstratif

Prépositionnel

Agissant sur les noms

Agissant sur les verbes

Nominal

Commun

SpécifiéPr. Relatif

PrépositionnelNominal

Ag. nomsAg. verbesCommunSpécifié

non décliné non significatif

Répartition selon leur fonction

10/38

11

...Typologie de la phrase relative arabe

Typologie

Exigent l’existence d’une proposition verbale juste après

le nom conjonctif

Nom conjonctif nominal spécifié

Nom conjonctif nominal commun à l’exception de « « أّي

Nom conjonctif prépositionnel agissant sur les verbes

Exigent l’existence d’une proposition nominale juste après

le nom conjonctif

Nom conjonctif prépositionnel agissant sur les noms

Nom conjonctif commun « « أّي

Basée sur la nature de la proposition qui suit le nom

conjonctif

11/38

12

...Typologie de la phrase relative arabe

1) Forme 1

Nom conjonctif (forme1) + une proposition verbale

Nom conjonctif (forme2) + une proposition nominale

األب مريض أن8أوضح الولد

L’enfant [qui [a réussi dans l’examen]] a voyagé a France

سافر الذيالولد االمتحان في نجحفرنسا إلى

Le père a déclaré [que [l’enfant est malade]]

2) Forme 2

12/38

13

PLAN

Introduction

État de l’art

Typologie de la phrase relative arabe

HPSG pour les relatives arabes

Spécification TDL de la grammaire conçue

Expérimentation sur LKB et évaluation

Conclusion et perspectives13/38

14

HPSG pour les relatives arabes

HPSG (Head-driven Phrase Structure Grammar) (Sag,

1994)

Théorie d’unification évoluée à base de contraintes

Modélisation de principes grammaticaux universels

Richesse des entrées lexicales

14/38

15

La structure de base de HPSG est la structure de traits typés

Chaque trait décrit un type d’information bien déterminé

PHON < >

SS LOC

NONLOC

CONT

CAT VALENCE

S-ARG <>

TETE MAJ

SLASH

IND

...HPSG pour les relatives arabes

15/38

PHON < ذّيال >

SS LOC

CAT

CONT

TETE

VAL

MAJ اسم

NFORM مبني

NAT مبهم

DEFINI –

RFORM اسمي

RTYPE خاص

SPEC SV:

DEC مبني

SPR< SN >COMPS < >

1

INDPer 3e

GEN masc

NOMB sing

2

...HPSG pour les relatives arabes

Exemple de SAV

16/38

17

PHON < #أن>

SS LOC

CAT TETE

VAL

MAJ اسم

NFORM مبني

NAT مبهم

DEFINI –

RFORM حرفي

RTYPE على عاملاالسم

SPEC SN(DEC منصوب):

DEC مبني

SPR< >COMPS < >

2

...HPSG pour les relatives arabes

17/38

18

Schéma de marquage

Décomposition des phrases : basée sur des schémas standards ( schémas de Domination Immédiate (DI))

Le schéma de marquage pour traiter les relatives

LOC 1

VAL < >

MARQUE 3

2

SS CAT TETE

2

VAL < >CATLOC SS 4

TETE 1

MARQUE 3

LOC

VAL < >

SS CAT TÊTE marqueur [SPEC ]4

Fils tête Fils marqueur

...HPSG pour les relatives arabes

18/38

Forme 1

LOC 1

VAL < >

MARQUE 3

2

SS CAT TETE

2

VAL < >CATLOC SS

4 TETE 1

MARQUE 3

LOC

VAL < >

SS CAT TÊTE marqueur [SPEC ]4

Fils têteFils marqueur

PHON < في نجح الذي < االمتحان

PHON < االمتحان في < نجحPHON < الذي >

...HPSG pour les relatives arabes

19/38

20

Forme 2

LOC 1

VAL < >

MARQUE 3

2

SS CAT TETE

2

VAL < >CATLOC SS

4TETE 1

MARQUE 3

LOC

VAL < >

SS CAT TÊTE marqueur [SPEC ]4

Fils têteFils marqueur

PHON < مريض الولد < أن8

PHON < مريض < الولدPHON < 8أن >

...HPSG pour les relatives arabes

20/38

21

Schéma de modification

Le schéma de modification : traite le phénomène des relatives

LOC 1

VAL < >

MARQUE 3

2

SS CAT TETE

LOC

VAL < >

SS CAT TÊTE [MOD ]3

Fils modifieur

...HPSG pour les relatives arabes

2

VAL < >CATLOC SS 3

TETE 1

Fils tête

21/38

22

LOC 1

VAL < >

MARQUE 3

2

SS CAT TETE

LOC

VAL < >

SS CAT TÊTE [MOD ]3

Fils modifieur

...HPSG pour les relatives arabes

2

VAL < >CATLOC SS

3TETE 1

Fils tête

PHON < في نجح الذي الولد < االمتحان

PHON < الولد > PHON < في نجح الذي < االمتحان

22/38

23

PLAN

Introduction

État de l’art

Typologie de la phrase relative arabe

HPSG pour les relatives arabes

Spécification TDL de la grammaire conçue

Expérimentation avec LKB et évaluation

Conclusion et perspectives23/38

Spécification TDL de la grammaire conçue

TDL (Type Description Langage) est similaire à la

représentation HPSG

Opérateur Fonction

& Adjonction des contraintes sur des types

# [a..z] Indexation des structures

: = L’élément à gauche est une instance de celui de droite

[ ] Définition d’une structure de trait

< > Définition d’une liste

, Séparation des couples attribut-valeur dans une SAV

. Fin d’une description de type

24/38

25

PHON < ذيال >

SS LOC

CAT

CONT

TETE

VAL

MAJ اسم

NFORM مبني

NAT مبهم

DEFINI –

RFORM اسمي

RTYPE خاص

SPEC فعل

DEC مبني

SPR<SN(masc,sing,3e)>

COMPS < >

INDGEN mascNOMB singPER 3e

‘aalladhy := lex-nom-non-decline

[PHON <! “’aalladhy" !>, SS [LOC [CAT. TETE[ MAJ nom, NFORM nondecliné, NAT nonsignificatif, DEFINI non, RFORM nominal, RTYPE specifié, SPEC < SS.LOC.TETE verbe >, DEC saturé],

VAL [ SPR < SS.LOC.TETE nom >, COMPS < [ ] >],

CONT [ GEN masc, NOMB sing, PER 3e]]]].

…Spécification TDL de la grammaire conçue

Spécification d’une SAV

25/38

26

VAL < >

1TÊTE

MARQUE 3

2

TÊTE

VAL < >

1

24

TÊTE marqueur [ SPEC ]4

VAL < >

MARQUE 3

regle-marquage :=

regle-bin-t-fin &

[SS.LOC.

CAT [ VAL [ ],

MARQUE #marque],

BRS [

BRS-NTETE

< [SS.LOC.CAT [TETE relatif

&[SPEC #tete]

MARQUE

#marque]] >,

BR-TETE [SS #tete &

[LOC.CAT [ VAL [] ]] ]

]].

…Spécification TDL de la grammaire conçue

Spécification d’un schéma DI

26/38

27

PLAN

Introduction

État de l’art

Typologie de la phrase relative arabe

HPSG pour les relatives arabes

Spécification TDL de la grammaire conçue

Expérimentation avec LKB et évaluation

Conclusion et perspectives27/38

28

Expérimentation avec LKB et évaluation

LKB (Linguistic Knowledge Building) (Ann Copestake,

02) est un environnement de développement

Chargement des grammaires implémentées en TDL

Fabriquée en LISP

Fichiers LISP (i.e., script.lsp)

Fichiers TDL (i.e., type.tdl, lexique.tdl, regle_syn.tdl)

28/38

29

...Expérimentation avec LKB et évaluation

Expérimentation sur LKB

29/38

30

Fichier in : « test.txt » Fichier out : « resultat.txt »

...Expérimentation avec LKB et évaluation

30/38

31

La grammaire est expérimentée sur

Corpus de 300 phrases

Phrases relatives de différentes formes

Interaction avec différents phénomènes linguistiques

syntagme d’annexion

syntagme descriptif

syntagme de subordination

800 mots

...Expérimentation avec LKB et évaluation

31/38

32

...Expérimentation avec LKB et évaluation

93 % des phrases sont analysées correctement

Nbre d’analyse

(n)

Nbre de phrasesayant n

analyse(s)

0 14

1 174

2 10

> 2 2

200

32/38

33

...Expérimentation avec LKB et évaluation

Absence de règles syntaxiques pour des phénomènes

linguistiques

Interaction entre les différents phénomènes linguistiques

33/38

34

PLAN

Introduction

État de l’art

Typologie de la phrase relative arabe

HPSG pour les relatives arabes

Spécification TDL de la grammaire conçue

Expérimentation avec LKB et évaluation

Conclusion et perspectives34/38

35

Conclusion et perspectives

Proposition d’une typologie des relatives pour l’Arabe

Étude du phénomène des relatives en Arabe

Étendre la grammaire HPSG pour couvrir les relatives

arabes

Expérimentation de la grammaire conçue avec LKB

Spécification TDL de la grammaire HPSG conçue

35/38

36

...Conclusion et perspectives

Enrichir le lexique pour une meilleure couverture lexicale

Détailler des schémas HPSG pour couvrir les

phénomènes linguistiques arabes

Tester l’ analyseur syntaxique sur d’autres types de

corpus

Concevoir d’autres modules

36/38

37

Merci

Pour

votre attention

...Expérimentation avec LKB et évaluation

Module de translittération automatique

Recommended