38
Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing - CITALA 2009 – May 4th – 5th 2009, Rabat, Morocco MIRACL, Faculté des sciences de Sfax, Tunisie

Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

Embed Size (px)

Citation preview

Page 1: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

Étude et analyse des relatives de la langue arabe

en HPSG et LKB

Inès ZALILA & Kais HADDAR

3rd International Conference on Arabic Language Processing - CITALA 2009 –

May 4th – 5th 2009, Rabat, Morocco

MIRACL, Faculté des sciences de Sfax, Tunisie

Page 2: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

2

Traitement Automatique des Langues Naturelles

Applications informatiques pour traiter automatiquement les langues naturelles

Phase d’analyse de la source

morphologique syntaxique sémantique pragmatiquelexicale Analyse Syntaxique

Introduction

Étude des règles pour une bonne formation des phrases

2/38

Page 3: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

3

...Introduction

Le phénomène des relatives ( الموصولي (المركب

fréquent

existant dans toutes les langues

centre d’intérêt pour plusieurs chercheurs

L’analyse syntaxique est une phase délicate

partie modélisation

partie implémentation

Simplifier la phase de construction d’un analyseur syntaxique (i.e., outils de génération, heuristiques)

Insuffisance des recherches pour l’analyse syntaxique des relatives arabes

Interaction avec les phénomènes linguistiques

Diversité des formes possibles des phrases relatives

Complexité de la structure des phrases relatives

3/38

Page 4: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

4

Objectifs

Spécifier en TDL une grammaire HPSG pour les

relatives arabes

Étudier et dégager la typologie des phrases relatives

détailler les schémas traitant les relatives arabes

Spécifier en TDL la grammaire élaborée

Expérimenter avec la plate-forme linguistique LKB

4/38

Page 5: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

5

PLAN

Introduction

État de l’art

Typologie de la phrase relative arabe

HPSG pour les relatives arabes

Spécification TDL de la grammaire conçue

Expérimentation avec LKB et évaluation

Conclusion et perspectives5/38

Page 6: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

6

État de l’art

La construction d’un analyseur syntaxique à partir d’une grammaire élaborée

Génération automatique

Construction propre

(Elleuch , 2004) et (Mâaloul , 2005) (Garcia, 2005), (Laurens, 2007) et (Loukam and Laskri, 2007)

Extensibilité du code

Maintenance facile

Choix de la démarche d’analyse (ascendante, descendante)

Ergonomie de l’interface

Résultats non robustes

Maintenance difficile

Extensibilité difficile

Entrées et Sorties sont bien définies

Coût moins cher (temps et efforts)

Ergonomie testée

Résultats robustes

6/38

Page 7: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

7

PLAN

Introduction

État de l’art

Typologie de la phrase relative arabe

HPSG pour les relatives arabes

Spécification TDL de la grammaire conçue

Expérimentation avec LKB et évaluation

Conclusion et perspectives7/38

Page 8: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

8

Typologie de la phrase relative arabe

La proposition relative en Arabe ( المركب(الموصولي

Les noms conjonctifs arabes 

, , , , , التي, الذي لو أن أن8 من ... ,ما

Joindre un nom conjonctif à une proposition verbale

ou nominale

إلى سافر االمتحان في نجح الذي الولد فرنسا

8/38

Page 9: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

9

...Typologie de la phrase relative arabe

Une hiérarchie de type inspirée de la théorie grammaticale ancienne (Dahdah A., 1992), (Abdelwahed A., 2004) et des travaux de recherche antérieurs (Boukédi, 2008)

Signe

SyntagmeMot

PrépositionnelVerbal Nominal

Nom

Décliné Non décliné

Particule

opérativeNon opérative

Verbe

QuadrilitèreTrilitère

9/38

Page 10: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

10

...Typologie de la phrase relative arabe

Un nom conjonctif est un nom

Nom

Décliné Non décliné

VariableNon variablePronomNon significatif

Pr. Démonstratif

Prépositionnel

Agissant sur les noms

Agissant sur les verbes

Nominal

Commun

SpécifiéPr. Relatif

PrépositionnelNominal

Ag. nomsAg. verbesCommunSpécifié

non décliné non significatif

Répartition selon leur fonction

10/38

Page 11: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

11

...Typologie de la phrase relative arabe

Typologie

Exigent l’existence d’une proposition verbale juste après

le nom conjonctif

Nom conjonctif nominal spécifié

Nom conjonctif nominal commun à l’exception de « « أّي

Nom conjonctif prépositionnel agissant sur les verbes

Exigent l’existence d’une proposition nominale juste après

le nom conjonctif

Nom conjonctif prépositionnel agissant sur les noms

Nom conjonctif commun « « أّي

Basée sur la nature de la proposition qui suit le nom

conjonctif

11/38

Page 12: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

12

...Typologie de la phrase relative arabe

1) Forme 1

Nom conjonctif (forme1) + une proposition verbale

Nom conjonctif (forme2) + une proposition nominale

األب مريض أن8أوضح الولد

L’enfant [qui [a réussi dans l’examen]] a voyagé a France

سافر الذيالولد االمتحان في نجحفرنسا إلى

Le père a déclaré [que [l’enfant est malade]]

2) Forme 2

12/38

Page 13: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

13

PLAN

Introduction

État de l’art

Typologie de la phrase relative arabe

HPSG pour les relatives arabes

Spécification TDL de la grammaire conçue

Expérimentation sur LKB et évaluation

Conclusion et perspectives13/38

Page 14: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

14

HPSG pour les relatives arabes

HPSG (Head-driven Phrase Structure Grammar) (Sag,

1994)

Théorie d’unification évoluée à base de contraintes

Modélisation de principes grammaticaux universels

Richesse des entrées lexicales

14/38

Page 15: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

15

La structure de base de HPSG est la structure de traits typés

Chaque trait décrit un type d’information bien déterminé

PHON < >

SS LOC

NONLOC

CONT

CAT VALENCE

S-ARG <>

TETE MAJ

SLASH

IND

...HPSG pour les relatives arabes

15/38

Page 16: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

PHON < ذّيال >

SS LOC

CAT

CONT

TETE

VAL

MAJ اسم

NFORM مبني

NAT مبهم

DEFINI –

RFORM اسمي

RTYPE خاص

SPEC SV:

DEC مبني

SPR< SN >COMPS < >

1

INDPer 3e

GEN masc

NOMB sing

2

...HPSG pour les relatives arabes

Exemple de SAV

16/38

Page 17: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

17

PHON < #أن>

SS LOC

CAT TETE

VAL

MAJ اسم

NFORM مبني

NAT مبهم

DEFINI –

RFORM حرفي

RTYPE على عاملاالسم

SPEC SN(DEC منصوب):

DEC مبني

SPR< >COMPS < >

2

...HPSG pour les relatives arabes

17/38

Page 18: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

18

Schéma de marquage

Décomposition des phrases : basée sur des schémas standards ( schémas de Domination Immédiate (DI))

Le schéma de marquage pour traiter les relatives

LOC 1

VAL < >

MARQUE 3

2

SS CAT TETE

2

VAL < >CATLOC SS 4

TETE 1

MARQUE 3

LOC

VAL < >

SS CAT TÊTE marqueur [SPEC ]4

Fils tête Fils marqueur

...HPSG pour les relatives arabes

18/38

Page 19: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

Forme 1

LOC 1

VAL < >

MARQUE 3

2

SS CAT TETE

2

VAL < >CATLOC SS

4 TETE 1

MARQUE 3

LOC

VAL < >

SS CAT TÊTE marqueur [SPEC ]4

Fils têteFils marqueur

PHON < في نجح الذي < االمتحان

PHON < االمتحان في < نجحPHON < الذي >

...HPSG pour les relatives arabes

19/38

Page 20: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

20

Forme 2

LOC 1

VAL < >

MARQUE 3

2

SS CAT TETE

2

VAL < >CATLOC SS

4TETE 1

MARQUE 3

LOC

VAL < >

SS CAT TÊTE marqueur [SPEC ]4

Fils têteFils marqueur

PHON < مريض الولد < أن8

PHON < مريض < الولدPHON < 8أن >

...HPSG pour les relatives arabes

20/38

Page 21: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

21

Schéma de modification

Le schéma de modification : traite le phénomène des relatives

LOC 1

VAL < >

MARQUE 3

2

SS CAT TETE

LOC

VAL < >

SS CAT TÊTE [MOD ]3

Fils modifieur

...HPSG pour les relatives arabes

2

VAL < >CATLOC SS 3

TETE 1

Fils tête

21/38

Page 22: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

22

LOC 1

VAL < >

MARQUE 3

2

SS CAT TETE

LOC

VAL < >

SS CAT TÊTE [MOD ]3

Fils modifieur

...HPSG pour les relatives arabes

2

VAL < >CATLOC SS

3TETE 1

Fils tête

PHON < في نجح الذي الولد < االمتحان

PHON < الولد > PHON < في نجح الذي < االمتحان

22/38

Page 23: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

23

PLAN

Introduction

État de l’art

Typologie de la phrase relative arabe

HPSG pour les relatives arabes

Spécification TDL de la grammaire conçue

Expérimentation avec LKB et évaluation

Conclusion et perspectives23/38

Page 24: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

Spécification TDL de la grammaire conçue

TDL (Type Description Langage) est similaire à la

représentation HPSG

Opérateur Fonction

& Adjonction des contraintes sur des types

# [a..z] Indexation des structures

: = L’élément à gauche est une instance de celui de droite

[ ] Définition d’une structure de trait

< > Définition d’une liste

, Séparation des couples attribut-valeur dans une SAV

. Fin d’une description de type

24/38

Page 25: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

25

PHON < ذيال >

SS LOC

CAT

CONT

TETE

VAL

MAJ اسم

NFORM مبني

NAT مبهم

DEFINI –

RFORM اسمي

RTYPE خاص

SPEC فعل

DEC مبني

SPR<SN(masc,sing,3e)>

COMPS < >

INDGEN mascNOMB singPER 3e

‘aalladhy := lex-nom-non-decline

[PHON <! “’aalladhy" !>, SS [LOC [CAT. TETE[ MAJ nom, NFORM nondecliné, NAT nonsignificatif, DEFINI non, RFORM nominal, RTYPE specifié, SPEC < SS.LOC.TETE verbe >, DEC saturé],

VAL [ SPR < SS.LOC.TETE nom >, COMPS < [ ] >],

CONT [ GEN masc, NOMB sing, PER 3e]]]].

…Spécification TDL de la grammaire conçue

Spécification d’une SAV

25/38

Page 26: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

26

VAL < >

1TÊTE

MARQUE 3

2

TÊTE

VAL < >

1

24

TÊTE marqueur [ SPEC ]4

VAL < >

MARQUE 3

regle-marquage :=

regle-bin-t-fin &

[SS.LOC.

CAT [ VAL [ ],

MARQUE #marque],

BRS [

BRS-NTETE

< [SS.LOC.CAT [TETE relatif

&[SPEC #tete]

MARQUE

#marque]] >,

BR-TETE [SS #tete &

[LOC.CAT [ VAL [] ]] ]

]].

…Spécification TDL de la grammaire conçue

Spécification d’un schéma DI

26/38

Page 27: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

27

PLAN

Introduction

État de l’art

Typologie de la phrase relative arabe

HPSG pour les relatives arabes

Spécification TDL de la grammaire conçue

Expérimentation avec LKB et évaluation

Conclusion et perspectives27/38

Page 28: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

28

Expérimentation avec LKB et évaluation

LKB (Linguistic Knowledge Building) (Ann Copestake,

02) est un environnement de développement

Chargement des grammaires implémentées en TDL

Fabriquée en LISP

Fichiers LISP (i.e., script.lsp)

Fichiers TDL (i.e., type.tdl, lexique.tdl, regle_syn.tdl)

28/38

Page 29: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

29

...Expérimentation avec LKB et évaluation

Expérimentation sur LKB

29/38

Page 30: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

30

Fichier in : « test.txt » Fichier out : « resultat.txt »

...Expérimentation avec LKB et évaluation

30/38

Page 31: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

31

La grammaire est expérimentée sur

Corpus de 300 phrases

Phrases relatives de différentes formes

Interaction avec différents phénomènes linguistiques

syntagme d’annexion

syntagme descriptif

syntagme de subordination

800 mots

...Expérimentation avec LKB et évaluation

31/38

Page 32: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

32

...Expérimentation avec LKB et évaluation

93 % des phrases sont analysées correctement

Nbre d’analyse

(n)

Nbre de phrasesayant n

analyse(s)

0 14

1 174

2 10

> 2 2

200

32/38

Page 33: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

33

...Expérimentation avec LKB et évaluation

Absence de règles syntaxiques pour des phénomènes

linguistiques

Interaction entre les différents phénomènes linguistiques

33/38

Page 34: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

34

PLAN

Introduction

État de l’art

Typologie de la phrase relative arabe

HPSG pour les relatives arabes

Spécification TDL de la grammaire conçue

Expérimentation avec LKB et évaluation

Conclusion et perspectives34/38

Page 35: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

35

Conclusion et perspectives

Proposition d’une typologie des relatives pour l’Arabe

Étude du phénomène des relatives en Arabe

Étendre la grammaire HPSG pour couvrir les relatives

arabes

Expérimentation de la grammaire conçue avec LKB

Spécification TDL de la grammaire HPSG conçue

35/38

Page 36: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

36

...Conclusion et perspectives

Enrichir le lexique pour une meilleure couverture lexicale

Détailler des schémas HPSG pour couvrir les

phénomènes linguistiques arabes

Tester l’ analyseur syntaxique sur d’autres types de

corpus

Concevoir d’autres modules

36/38

Page 37: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

37

Merci

Pour

votre attention

Page 38: Étude et analyse des relatives de la langue arabe en HPSG et LKB Inès ZALILA & Kais HADDAR 3rd International Conference on Arabic Language Processing -

...Expérimentation avec LKB et évaluation

Module de translittération automatique