14
LES RESSOURCES LANGAGIERES : CONSTRUCTION ET EXPLOITATION ~ 109 ~ Le projet DictAm Dictionnaire électronique des verbes amazighe- français Samira MOUKRIM Laboratoire Ligérien de Linguistique-Université d‘Orléans [email protected] 1. Introduction Dans le cadre de la promotion de la diversité linguistique dans la société de la connaissance, nous nous proposons d‘élaborer un dictionnaire électronique des verbes amazighe-français (DictAm). Ce dictionnaire vise à rendre compte de l‘ensemble des verbes dans le domaine berbère : conjugaison, diathèse et sens. Le DictAm a également une visée comparative dans la mesure où il rassemble et rend accessible les matériaux lexicaux des différentes variétés dialectales. Le présent article a pour objectif de présenter le DictAm (Dictionnaire Electronique Amazigh), un projet à travers lequel nous entendons produire une nouvelle ressource linguistique susceptible d‘intégrer le berbère dans les nouvelles technologies de l‘information. 2. Motivations La langue berbère est parlée dans plusieurs pays d‘Afrique (Maroc, Algérie, Tunisie, Lybie, Egypte, Mauritanie, Mali et Niger). Elle est partout minoritaire et diversifiée en de nombreuses variétés dialectales. Cette langue est aussi pratiquée au sein de l‘Union Européenne (France, Allemagne, Pays Bas, Belgique, Italie, Espagne). Pour diverses raisons socio-historiques et politiques, le berbère a connu un grand retard de la recherche linguistique. Le lexique reste le maillon faible des études berbères. Les outils lexicographiques disponibles semblent limités car dispersés et

Le projet DictAm Dictionnaire électronique des verbes ...tal.ircam.ma/conference/docs/ticam2011/Le projet DictAm.pdf · ... sous forme de texte ou de tableau afin de les imprimer

  • Upload
    vudien

  • View
    216

  • Download
    3

Embed Size (px)

Citation preview

LES RESSOURCES LANGAGIERES : CONSTRUCTION ET EXPLOITATION

~ 109 ~

Le projet DictAm Dictionnaire électronique des verbes amazighe-

français

Samira MOUKRIM Laboratoire Ligérien de Linguistique-Université d‘Orléans

[email protected]

1. Introduction

Dans le cadre de la promotion de la diversité linguistique dans la société de la connaissance, nous nous proposons d‘élaborer un dictionnaire électronique des

verbes amazighe-français (DictAm). Ce dictionnaire vise à rendre compte de l‘ensemble des verbes dans le domaine berbère : conjugaison, diathèse et sens. Le DictAm a également une visée comparative dans la mesure où il rassemble et rend accessible les matériaux lexicaux des différentes variétés dialectales.

Le présent article a pour objectif de présenter le DictAm (Dictionnaire Electronique Amazigh), un projet à travers lequel nous entendons produire une nouvelle ressource linguistique susceptible d‘intégrer le berbère dans les nouvelles

technologies de l‘information.

2. Motivations

La langue berbère est parlée dans plusieurs pays d‘Afrique (Maroc, Algérie,

Tunisie, Lybie, Egypte, Mauritanie, Mali et Niger). Elle est partout minoritaire et diversifiée en de nombreuses variétés dialectales. Cette langue est aussi pratiquée au sein de l‘Union Européenne (France, Allemagne, Pays Bas, Belgique, Italie, Espagne).

Pour diverses raisons socio-historiques et politiques, le berbère a connu un grand retard de la recherche linguistique. Le lexique reste le maillon faible des études berbères. Les outils lexicographiques disponibles semblent limités car dispersés et

LES RESSOURCES LANGAGIERES : CONSTRUCTION ET EXPLOITATION

~ 110 ~

les travaux existants sont partiels et ne concernent qu‘un seul parler (ou dialecte).

C‘est la raison pour laquelle nous proposons un support unique à l‘essentiel de l‘information lexicale verbale berbère.

Comme beaucoup d‘autres langues africaines, le berbère n‘a guère bénéficié des

avancées de l‘informatique : un dictionnaire sous format électronique est très attendu. Par ailleurs, l‘apprentissage du français par des berbérophones nécessite le

développement d‘outils didactiques qui prennent en considération leur langue maternelle. Le dictionnaire proposé peut être intégré également dans une perspective de didactique du berbère à des francophones.

3. Genèse du projet DictAm

L‘idée du dictionnaire électronique des verbes berbères est née lorsque nous avons voulu évaluer le degré de variation au sein des verbes communs d‘un

certain nombre de parlers berbères1. Au début, nous avons utilisé des fiches (papier) pour classer les verbes collectés. Ce qui devenait de moins en moins pratique au fur et à mesure que le nombre de verbes et de parlers augmente.

Cela nous a poussé à réfléchir à la conception d‘une base de données qui

pourrait nous faciliter l‘organisation de l‘information et dans le même temps

nous permettre de visualiser les convergences et divergences entre les parlers berbères étudiés.

4. Conception du DictAm

4.1. Méthodologie

Lors de l‘élaboration du DictAm, nous nous sommes interrogée, d‘une part,

sur la démarche à suivre pour la structuration des données, et d‘autre part, sur le traitement de la diversité linguistique.

En ce qui concerne la structuration des données, les verbes sont classés par ordre alphabétique de leur forme aoriste-impératif afin de faciliter la

1 C‘était en 2003-2004, après l‘institutionnalisation de l‘amazighe au Maroc et le début de

sa standardisation.

LES RESSOURCES LANGAGIERES : CONSTRUCTION ET EXPLOITATION

~ 111 ~

consultation. Nous avons opté pour ce type de classement et non pour le classement par racine pour les raisons suivantes :

- Le DictAm s‘adresse aussi bien aux usagers avertis qu‘aux non-avertis (i.e. qui n‘ont pas acquis les structures morphologiques élémentaires du berbère) ;

- Du point de vue de l‘usage, il est plus aisé de chercher un mot en se référant à sa lettre initiale que d‘en dégager la racine ;

- Le classement par racine présente un certain nombre de problèmes, en particulier lorsque celle-ci a subi des modifications au point de devenir méconnaissable2.

La dimension bilingue du DictAm se manifeste au travers de l‘association

pour chaque entée lexicale berbère d‘un équivalent en langue française. Par

ailleurs, la structuration et le format des données ont été pensés de manière à permettre un transfert des données sélectionnées vers un document Word ou Excel (et prochainement HTML).

Quant au traitement de la diversité linguistique, le DictAm a été conçu de manière à couvrir le plus de parlers (et de dialectes) possibles et à centraliser toutes les données lexicales verbales des différentes variétés dialectales. La manière dont les données sont présentées permet de faire des rapprochements des différents parlers/dialectes (cf. figures 3, 5 et 6).

La structure de la base de données a été déterminée en prenant en compte toutes les caractéristiques du verbe3 dans cette langue :

o En berbère, Le verbe peut être simple ou dérivé (causatif, passif, réciproque, etc.)

o Le verbe se présente sous trois thèmes principaux : l‘aoriste, l‘inaccompli et l’accompli (auxquelles nous pouvons rajouter l‘accompli négatif et l‘inaccompli négatif

4). o Les verbes sont généralement classés selon le nombre de consonnes

radicales. On distingue plusieurs types de verbes : les verbes

2 Cf. Taïfi (1990 : VI-XVI) pour plus de détails sur les différentes modifications que peut subir la racine en berbère. 3 Pour déterminer la structure de la base de données, nous avons examiné les principaux

travaux qui ont porté sur le verbe en berbère, ce qui nous a permis de prendre en compte

toutes les caractéristiques du verbe. 4 Et le prétérit intensif (résultatif) pour le touareg.

LES RESSOURCES LANGAGIERES : CONSTRUCTION ET EXPLOITATION

~ 112 ~

monolitères (constitués d‘une seule consonne radicale), bilitères (2 consonnes), trilitères (3 consonnes), quadrilitères (4 consonnes) et quinquilitères (rares).

Toutes les informations concernant le verbe se présentent comme suit :

4.2. Matériaux

Figure 1 : Formulaire de saisie

L‘alimentation de la base de données s‘est faite à partir des sources

documentaires existantes : - Les dictionnaires classiques (version papier) - Les lexiques et glossaires (accompagnant les descriptions grammaticales, recueil de textes, monographies…) - Exploitation systématique des textes publiés

LES RESSOURCES LANGAGIERES : CONSTRUCTION ET EXPLOITATION

~ 113 ~

Actuellement, le DictAm comporte près de 3000 verbes dans une

soixantaine de parlers berbères. C‘est un travail qui est en cours de réalisation et qui a pour ambition de répertorier tous les verbes berbères ainsi que leurs équivalents en français.

Pour la programmation du DictAm, nous avons fait appel à El Amrani Mohammed, informaticien en Allemagne, qui nous a aidé à concrétiser ce projet :

Figure 2 : Informations auteur et programmeur

LES RESSOURCES LANGAGIERES : CONSTRUCTION ET EXPLOITATION

~ 114 ~

4.3. Un nouveau clavier

Pour la notation du berbère, nous avons choisi dans un premier temps la graphie à base latine car elle permet une large diffusion.

Comme les claviers dont nous disposons sont faits pour les langues indo-européennes, nous avons crée un nouveau clavier (DictAm_ARIAL), avec Microsoft Keyboard Layout Creator, qui permet d‘établir des raccourcis,

pour taper directement au clavier les caractères spéciaux :

Travaillant dans une perspective de partage et de mutualisation, nous avons eu recours dernièrement aux polices Unicode, ce qui permet une large compatibilité avec les ordinateurs et logiciels récents.

Nous envisageons également d‘introduire la graphie à base tifinaghe, en

particulier après son intégration dans le standard Unicode (/ISO 10646).

5. Description du DictAm

Le principal intérêt du DictAm réside, d‘une part, dans la rapidité d‘accès

aux données, et d‘autre part, dans la possibilité qu‘il offre de rapprocher des

données issues de différentes variétés dialectales.

Toutes les informations concernant le verbe sont saisies dans le formulaire présenté dans la figure1 ci-dessus. Dans l‘interface de consultation, la fenêtre CHERCHER permet de répondre à n‘importe quelle requête dès lors que cette interface permet de la formuler. Le fait de taper un verbe dans cette case permet d‘accéder automatiquement à toutes les informations le

concernant dans une multitude de parlers berbères, comme il apparaît dans la figure 3, qui présente le verbe ddu :

LES RESSOURCES LANGAGIERES : CONSTRUCTION ET EXPLOITATION

~ 115 ~

Figure 3 : le verbe ddu

En ce qui concerne l‘AFFICHAGE, nous pouvons faire un affichage normal

(afficher tous les verbes dans tous les parlers) ou faire un tri : - Afficher uniquement les verbes simples (tous les verbes simples ou

un seul type de verbes simples : monolitères, bilitères ou trilitères, etc.) - Afficher uniquement les verbes dérivés… - Afficher les verbes communs à deux ou plusieurs parlers afin de les

comparer, etc.

La fonction EXPORTER permet d‘exporter les données, sous forme de texte

ou de tableau afin de les imprimer ou les réexploiter via d‘autres logiciels.

LES RESSOURCES LANGAGIERES : CONSTRUCTION ET EXPLOITATION

~ 116 ~

Figure 4 : Les statistiques

Nous avons ajouté récemment une nouvelle fonction : les STATISTIQUES5, qui donnent un aperçu sur le nombre de verbes dans chaque parler, le nombre des verbes simples, le nombre des verbes dérivés, en fonction du type, etc.

5 En construction.

LES RESSOURCES LANGAGIERES : CONSTRUCTION ET EXPLOITATION

~ 117 ~

6. Le DictAm : une visée comparative

Comme nous l‘avons mentionné plus haut, la manière dont les données sont présentées permet de visualiser les convergences et les divergences entre les différentes variétés dialectales. A titre d‘illustration, soit les verbes afif et rar, présentés respectivement dans les figures 5 et 6 (infra). Ces deux verbes manifestent une variation de voyelle(s) et/ ou de schème(s) d‘un parler à

l‘autre :

Figure 5 : le verbe afif

LES RESSOURCES LANGAGIERES : CONSTRUCTION ET EXPLOITATION

~ 118 ~

Le verbe « afif » se présente à l‘aoriste sous trois formes : afif (Aït Ayyache, Zayane, Zemmour, Aghbalou : Aït Messaoud), ifif (Aït Merghad, Aït Seghrouchen, Beni Iznassen d‘aklim, Beni Iznassen de Tafoghalt,

Kebdana de Qauriat Arkmane), afuf (Agadir , Iwrikn, Achtoukn, Tiznit, Ouarzazat, Igliwa, Tafraout). Dans tous ces parlers, il y a un syncrétisme entre l‘aoriste et l‘accompli à l‘exception du parler de Aït Merghad ou

l‘accompli se réalise afuf au lieu de ifif. Quant à l‘inaccompli, il est formé,

dans tous ces parlers, par la préfixation de tt- à l‘aoriste correspondant. Si l‘on prend la forme de l‘aoriste, par exemple, qui se présente sous trois formes selon les parlers :

Aoriste schème Voyelles

afif vcvc a-i-

ifif vcvc i-i-

afuf vcvc a-u-

Dans un processus de normalisation, quelle forme retenir ?

Deux solutions sont envisageables : soit on prend la forme d‘origine i.e. la

plus ancienne, soit on opte pour le critère de la représentativité dialectale, en choisissant la forme la plus usitée par le plus grand nombre de parlers. Bien qu‘il ne soit pas toujours facile de trouver la forme d‘origine de tous les

verbes, nous pouvons opter pour la première solution avec la possibilité de recourir à la seconde dans le cas où la première s‘avère impossible.

Si l‘on examine les formes ssiff, ttussiff et asiff, avec lesquelles ce verbe est en rapport de dérivation, et qui sont respectivement sa forme factitive, sa forme passive et son nom d‘action, nous constatons que dans la position pré-radicale –où la forme verbale afif/ifif/afuf présente soit la voyelle i soit la voyelle a– c‘est la voyelle i qui semble être la plus ancienne. Quant à la voyelle intra-radicale –qui se présente sous deux formes i ou u– l‘examen des formes ssifif, afif et afifn montre que c‘est la voyelle i qui pourrait être la

LES RESSOURCES LANGAGIERES : CONSTRUCTION ET EXPLOITATION

~ 119 ~

plus ancienne. En effet, pour le verbe afif/ifif/afuf, les voyelles thématiques de base pourraient être i...i.. donc c‘est la forme ifif qui pourrait être la plus ancienne. Les autres formes (afif/afuf) sont probablement le produit d‘une

évolution.

Figure 6 : le verbe rar

Si pour le verbe ifif (/afif/afuf), le schème sur lequel est construit le radical (vcvc) est le même dans tous les parlers examinés, ce n‘est pas le cas du

verbe rar/rr/arr (cf. figure 5). A l‘aoriste ce verbe se présente sous trois formes correspondant à trois schèmes différents : rr (Aït Seghrouchen, Figuig, Zayane, Zemmour, Beni Iznassen d‘aklim, Beni Iznassen de

Tafoghalt, Kebdana de Qauriat Arkmane) / rar (Ayt Ayyache, Aghbalou : Aït Messaoud, Aït Merghad, Aït Attab, Agadir, Iwrikn, Achtoukn, Tiznit, Ouarzazat, Igliwa, Tafraout) / arr (Inzgane) :

LES RESSOURCES LANGAGIERES : CONSTRUCTION ET EXPLOITATION

~ 120 ~

Aoriste schème Voyelle

rr cc ∅

rar cvc -a-

arr vcc a-

A partir des formes dérivées de ce verbe : mrara , ssmrara , tturar, tararit, etc. nous pouvons constater que c‘est la forme rar qui pourrait être la plus ancienne, de même que le schème correspondant (cvc).

Ainsi, le DictAm permet-il de visualiser et de rendre accessible les différentes formes sous lesquelles peut apparaître le verbe dans une grande partie de parlers berbères. Ce qui n‘est pas sans importance pour la

standardisation de la langue.

7. Mise à disposition et perspectives

Au terme du projet, la disponibilité et la diffusion des données auprès du public visé (chercheurs, étudiants, etc.) seront assurées au travers d‘une

interface Web déclinée dans les deux langues afin de renforcer l‘accessibilité. Il sera possible également d‘utiliser le DictAm dans les deux

sens amazighe-français et français-amazighe. Une documentation simplifiée visant les internautes non avertis sera rédigée et mise en ligne afin de documenter la consultation des données.

Le DictAm peut être diffusé également au moyen d‘autres supports, papier,

CD-rom, clé USB, etc. Ainsi, les utilisateurs pourront le consulter en ligne ou hors ligne pour des usages aussi divers que l‘éducation de base et

l‘enseignement en général, la traduction, la comparaison des variétés dialectales, et toutes autres activités en relation avec l‘apprentissage ou la

recherche.

Par ailleurs, il est prévu que des données audio viennent compléter le dispositif et, à terme, un fichier son, soit éventuellement associé à certaines entrées, quand cela est possible.

LES RESSOURCES LANGAGIERES : CONSTRUCTION ET EXPLOITATION

~ 121 ~

Enfin, nous envisageons, une fois le dictionnaire des verbes stabilisé, d‘intégrer les autres unités du discours (les noms, prépositions, etc.) afin de

construire un dictionnaire général du berbère sous format électronique.

8. Conclusion Ainsi conçu, le DictAm répondra à trois types de besoins :

- Les besoins relatifs à la collecte et à l‘organisation des données lexicales issues des différentes variétés de l‘amazighe - Les besoins des apprenants - Les besoins des comparatistes et des chercheurs qui travaillent sur l‘amazighe

En préservant toute la richesse héritée des différentes variétés dialectales et en intégrant l‘amazighe dans les nouvelles technologies de l‘information, le

DictAm va sûrement contribuer à la promotion de cette langue.

Références

Azdoud, D. (1997), Lexique commun des Ait Hadiddou du Haut Atlas, El Jadida, Thèse de doctorat d‘état. Faculté des Lettres et des Sciences humaines. Boukous, A. (2003), « La standardisation de l‘amazighe : quelques prémisses », Standardisation de l’amazighe, Actes du séminaire organisé par le Centre de l‘Aménagement Linguistique à Rabat, 8-9 décembre 2003, Publication de l‘Institut Royal de la Culture Amazighe, Série : Colloques et séminaires n°3.

Boumalk, A. et Bounfour, A. (2001), Vocabulaire usuel de tachelhit, tachelhit-

français, Rabat, éd. Centre Tarik Ibn Zyad.

Cohen, M. (1969), Essai comparatif, sur le vocabulaire et la phonétique du

chamito-sémitique. Paris, Ed. librairie Honoré Champion

Dallet J.-M. (1982), Dictionnaire kabyle-français, Paris, Selaf, (XI + 1056 p. ; 7ème vol. français-kabyle).

Delheure J. (1984), Dictionnaire mozabite-français, Paris, Selaf, (XVI + 322 p.)

Delheure J. (1987), Dictionnaire ouargli-français, Paris, Selaf

Dray M. (1998), Dictionnaire français-berbère. Dialecte des Ntifa, Paris, L‘Harmattan, (510 p.)

LES RESSOURCES LANGAGIERES : CONSTRUCTION ET EXPLOITATION

~ 122 ~

El Mountassir, A. (2003), Distionnaire des verbes Tachelhit-Français (Parler berbère du sud du Maroc), Paris, L‘Harmattan

Foucauld Ch. De (1951), Dictionnaire touareg-français, dialecte de l‘Ahaggar,

Imprimerie de France, 4 vol. (2028 p.)

Haddachi, A. (2000), Dictionnaire de tamazight : parler des Ayt Merghad (Ayt yaflman), Imp. Beni Snassen

Jordan A. (1934), Dictionnaire berbère-français, Rabat, Editions Omnia

Moukrim, S. (2003), La flexion verbale en tamazight (parler de Zayane), Mémoire de DESA, Université Mohamed V, Rabat

Moukrim, S. (2009), « L‘expression du présent actuel en arabe marocain, berbère tamazight et français, parlés à Orléans », in Revue Sémantique et Pragmatique (n° double 25-26)

Moukrim, S. (2010), Morphosyntaxe et sémantique du « présent » : une étude

contrastive à partir de corpus oraux, arabe marocain, berbère tamazight et

français (ESLO/LCO), Thèse de doctorat, Université d‘Orléans

Naït-Zerrad, K, (1999), Dictionnaire des racines berbères, Paris– Louvain : Edition Peeters.

Oussikoum, B. (1995), Dictionnaire tamazight-français (parler des Ayt Wirra), Beni-Mellal, Thèse de doctorat d‘état. Faculté des Lettres et des Sciences Humaines.

Rahho, R. (2005), Dictionnaire berbère-français. Parler des Beni- Iznassen, Fès, Thèse de doctorat. Faculté des Lettres et des Sciences Humaines, Dhar El Mehraz

Serhoual, M. (2002), Lexicologie, lexicographie et sémantique berbères : 1)

Lexicologie amazighe 2) Dictionnaire tarifit - français, Tétouan, Thèse de doctorat d‘état. Faculté des Lettres et des Sciences Humaines.

Taïfi M. (1991), Dictionnaire tamazight-français (Parlers du Maroc central), Paris, L‘Harmattan-Awal, (XXII + 880).

Taine-Cheikh C. (2008) Dictionnaire zénaga-français, Berber Studies 20, Rüdiger Köpper Verlag. Köln