13
Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés. La formalisation du vocabulaire latin problèmes de méthode Ghislaine VIRÉ Le sujet que je me propose de traiter ne correspond peutMêtre pas exac- tement au thème qui a été retenu pour ce colloque, à savoir "Le nombre et le texte. Méthodes quantitatives dans les études littéraires et linguistiques". En effet, mon propos vise à identifier les problèmes que pose la structuration du vocabulaire latin dans la perspective d'un traitement automatisé et, dans un second temps, à concevoir les solutions susceptibles de résoudre ces difficultés. C'est dire que mon travail se situe en amont de l'ordinateur, plus précisément à ce stade de la recherche - délicat, mais passionnant entre tous - qui touche à l'analyse du problème. La plupart des réflexions que je vais vous proposer relèvent donc du domaine méthodologique, le domaine - faut-il encore le rap- peler? - dans lequel l'utilisation de l'ordinateur suscite souvent des remises en question novatrices des vues traditionnelles attachées à nos disciplines. Ceci dit, je m'en voudrais de taire la principale raison de ma présence à Liège: j'ai tenu à m'associer à l'hommage amical rendu à Étienne Évrard à l'occasion de ce colloque et saisir l'occasion qui m'était offerte de le remercier pour l'accueil qu'il m'a réservé, il y a plus de quinze ans, au certificat d'études complémentaires en analyse linguistique par ordinateur du L.A.S.L.A. et pour l'intérêt qu'il a toujours témoigné aux travaux que nous effectuons au G.I.T.A., tant dans le domaine de l'E.A.O. que dans le traitement automatisé des textes. * * * Les travaux que j'ai entrepris dans le domaine du vocabulaire se situent daus le cadre plus large de l'expérimentatioll, au niveau du latin, du système d'enseignement assisté par ordinateur implanté à l'V.L.B. (le système PLATO). Au-delà, ou plutôt en deçà de l'élaboration de didacticiels - essentiellement centrés sur des exercices d'entraînement aux automatismes linguistiques -

La formalisation du vocabulaire latin problèmes de …promethee.philo.ulg.ac.be/RISSHpdf/Annee1988/Articles/GVire.pdf · été de sélectionner encore d'autresmots, qui tous appartiennent

  • Upload
    dolien

  • View
    216

  • Download
    0

Embed Size (px)

Citation preview

Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés.

La formalisation du vocabulaire latinproblèmes de méthode

Ghislaine VIRÉ

Le sujet que je me propose de traiter ne correspond peutMêtre pas exac­tement au thème qui a été retenu pour ce colloque, à savoir "Le nombre et letexte. Méthodes quantitatives dans les études littéraires et linguistiques". Eneffet, mon propos vise à identifier les problèmes que pose la structuration duvocabulaire latin dans la perspective d'un traitement automatisé et, dans unsecond temps, à concevoir les solutions susceptibles de résoudre ces difficultés.C'est dire que mon travail se situe en amont de l'ordinateur, plus précisémentà ce stade de la recherche - délicat, mais passionnant entre tous - qui toucheà l'analyse du problème. La plupart des réflexions que je vais vous proposerrelèvent donc du domaine méthodologique, le domaine - faut-il encore le rap­peler? - dans lequel l'utilisation de l'ordinateur suscite souvent des remises enquestion novatrices des vues traditionnelles attachées à nos disciplines.

Ceci dit, je m'en voudrais de taire la principale raison de ma présence àLiège: j'ai tenu à m'associer à l'hommage amical rendu à Étienne Évrard àl'occasion de ce colloque et saisir l'occasion qui m'était offerte de le remercierpour l'accueil qu'il m'a réservé, il y a plus de quinze ans, au certificat d'étudescomplémentaires en analyse linguistique par ordinateur du L.A.S.L.A. et pourl'intérêt qu'il a toujours témoigné aux travaux que nous effectuons au G.I.T.A.,tant dans le domaine de l'E.A.O. que dans le traitement automatisé des textes.

** *

Les travaux que j'ai entrepris dans le domaine du vocabulaire se situentdaus le cadre plus large de l'expérimentatioll, au niveau du latin, du systèmed'enseignement assisté par ordinateur implanté à l'V.L.B. (le système PLATO).Au-delà, ou plutôt en deçà de l'élaboration de didacticiels - essentiellementcentrés sur des exercices d'entraînement aux automatismes linguistiques -

Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés.

346 GHISLAINE VJRÉ

notre objectif général consiste à dégager d'un certain nombre de matièresgrammaticales du latin les structures profondes permettant de les formaliseret, si possible, d'en tirer des algorithmes de résolution de problème. Je tiensà préciser d'emblée que par structures profondes d'une matière j'entendsl'organisation logique qui sous-tend l'ensemble de cette matière et s'enracinedans l'histoire de la langue. Si, dans le domaine de la morphologie, celle duverbe surtout, il est possible de parvenir à une structuration parfaite, fondéesur un schéma général!, pour le vocabulaire, le problème se pose en termestout différents, ne fût-ce que parce que l'ensemble des données sur lesquelles ontravaille est beaucoup plus difficile à cerner que dans le cas de la conjugaisonoù on part d'un nombre fini de formes.

Pour définir les limites de mes recherches, je préciserai tout d'abord quemon travail n'a ni l'ambition, ni la prétention d'embrasser la totalité duvocabulaire latin. Pour des raisons d'ordre matériel et aussi parce que le but queje poursuis est de nature pédagogique, le point de départ de mes dépouillementsest le lexique de base pnblié par mes collègues J.-H. Michel et M. Gester2

, quiregroupe les qnelque 3500 mots les pIns fréquenunent utilisé par les anteursfigurant au programme de l'enseignement secondaire belge. Il va sans dire quela notion de fréquence, quelle qu'en soit par ailleurs l'utilité pour l'acquisitiond'un vocabulaire élémentaire, aboutit souvent à tronquer les familles de mots età faire disparaître une partie de la richesse lexicale d'une langue. Force m'a doncété de sélectionner encore d'autres mots, qui tous appartiennent à la langue del'époque classiqne et à celle de débnt de l'Empire et, pour ce faire, j'ai enrecours au dictionnaire d'Ernout et Meillet 3 et au dictionnaire publié par leL.A.S.L.A.4 j à ce propos je tiens à remercier mon collègue J. Denooz qui a eula gentillesse de me faire parvenir les listings complémentaires qui m'ont permisd'affiner mes dépouillements.

** *

La première structuration à laquelle on songe tout naturellement lorsqu'ils'agit de traiter le vocabulaire est évidemment celle qui repose sur les familles demots (c'est-à-dire les familles fondées sur l'étymologie); non seulement c'est la

1 Gh. VIRÉ, Une expérience d'enseignement assisté par ordinateur: la conjugaison latine,Grec et Latin en 1981, Bruxelles, 1981 , pp. 93-105.

2 J.-H. MICHEL et M. GESTER, Lexique de base du latin, Anvers, 1967.

3 A. ERNOUT et A. MEILLET, Dictionnaire étymologique de la langue latine. Histoire desmots, 4e édition, Paris, 1967.

4 Dictionnaire et index inverus de la langue latine, Liège, 1981.

Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés.

LA FORMALISATION DU VOCABULAIRE LATIN 347

présentation adoptée de plus en plus souvent dans les manuels de référence 1 maisc'est aussi un schéma qui semble , à première vue , correspondre parfaitementà une des structures non linéaires les plus utilisées en informatique: je veuxparler de l'arbre.

Est-il nécessaire de rappeler que l'arbre est conçu comme un ensemble finid'éléments répartis entre la racine A et les sous-arbres qui y sont directementrattachés B, C, D, chacun de ceux-ci pouvant, à son tour, servir de racine à denouveaux sous-arbres E,F,G, ...

E F

H J

niveau 0

niveau 1

niveau 2

niveau 3

Figure 1

L'arbre pris au sells mathématique du terme se distingue donc de l'arbregénéalogique dans la mesure où les mariages entre cousins, même éloignés, sontexclus. Généralement la racine est définie comme étant de niveau zéro et toutsous-arbre est de niveau égal à la racine à laquelle il se rattache, augmentéed'une unité.

S'appliquant parfaitement à toute classification logiquement ordonnée, lastructure arborescente devrait pouvoir s'adapter aussi aux: familles de mots dulatin. On peut, en effet, poser comme hypothèse de travail qu'il devrait êtrepossible de concevoir un schéma théorique en forme d'arbre qui reprendraitl'ensemble des potentialités du lexique latin, étant bien entendu que, pourchaque famille, ne seraient effectivement occupées que les cases correspondantaux mots attestés dans la tradition littéraire. Si cette hypothèse s'avéraitfondée, il devrait être possible, dans la perspective d'un traitement automatisé,d'attribuer à chaque mot un numéro d'ordre qui tienne compte tout à la fois desa catégorie grammaticale et du niveau auquel il se situe par rapport au motsimple pris pour racine de l'arbre. En guise d'illustration, je citerai le code quenous avions prévu d'utiliser, en l'appliquant 1 pour plus de facilité, à une partieseulement de la famille de ire.

Toute codification est arbitraire, chaque utilisateur décidant des élémentsqu'il souhaite privilégier dans le classement j on peut donc également ramener

Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés.

348

56.00.00.00

56.54.00.00

56.54.13.00 156.54.15.00

56.54.13.21

ambitus

GHISLAINE VIRÉ

niveau 0

niveau 1

niveau 2

niveau 3

Figure 2

1er chiffre: catégorie grammaticale(1 = subst. j 2 :;:: adj. i 3 = nom de nombre i 4 :;:: adj. pron. i 5 = verbe i6 =adv. j 7 = prép.)

2e chiffre: sous-catégorie grammaticalePar ex. 51 = le canj.} 52 = 2e canj., 53 3e canj., 54 4e canj.,55 = 4e canj. bis. 56 =v. remarquables.

le code grammatical à un seul chiffre et ajouter uu code indiquant s'il s'agitd'un dérivé ou d'un composé.

Pour séduisante qu'elle soit, à première vue, cette structuration n'estcependant pas entièrement satisfaisante dans tous les cas. Ainsi, les mots quise rattachent à une même racine sans avoir de lien direct les uns avec lesautres ne trouvent-ils pas aisément place au sein de l'arbre, la seule solutionscientifiquement acceptable consistant à les considérer chacun comme motsimple, ce qui revient à multiplier les schémas, donc à atomiser les structures.Le cas des mots issus de la racine *lfic-j*Hic- est exemplaire à cet égard: lux,lumen, Luna, lustrare, luculentus... n'ayant guère de dérivés ou de composésconstituent les racines d'arbres souvent squelettiquesj en revanche, le cas desisto, sto et *-stano (ce dernier attesté seulement en composition) est plusfavorable) dans la mesure où de sisto et de sto sont issus des mots nouveaux.

La systématisation du vocabulaire débouche rapidement sur des cas limitesque le philologue se voit contraint de trancher) sans que les données actuellesde la lexicographie latine lui en donnent toujours les moyens. Ainsi) commentsituer) l'un par rapport à l'autre, les trois mots iudex, iudicare et iudicium?S'il est certain que iudicare est le dérivé direct de iudex, iudicium doit-il êtreconsidéré comme un substantif de formation parallèle au verbe ou comme ledérivé de celui-ci) bâti sur le même schéma que gaudium à partir de gaudere?Pour ma part, j 'incline à placer iudicare et iudicium au même niveau) ne fût­ce que parce que les témoignages parallèles ne fournissent aucun critère dechoix (d'une part, il y a très peu de substantifs en -ium dérivés de verbes dela première conjugaison - fiagitium, opprobr-ium, suspirium -j d'autre part,

Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés.

LA FORJ,fALISATION DU VOCABULAIRE LATIN 349

dans le cas de arbiter, on met généralement sur le même plan arbitrari etarbitrium) .

o

1

2

3

Figure 3Famille de decet

o

1

2

3

Figure 4

Famille de aequus

A ces difficultés, somme toute surmontables moyennant l'interventiondu philologue, s'en ajoutent d'autre, plus fondamentales, qui remettent enquestion l'adéquation même de la structure arborescente à la formalisationdu vocabulaire. Quand on adopte un schéma théorique, il est indispensable,en bonne méthode, d'examiner la façon dont se distribuent les cases vides,autrement dit les modalités selon lesquelles le schéma se réalise effectivementdans chaque cas. Or, si l'on a la curiosité de comparer les structures de plusieursfamilles, que celles-ci remontent à un mot simple de même nature grammaticaleou pas, on est frappé de constater combien ces schémas diflèrent les uns desautres i je n'en veux pour preuve que les trois structures suivantes qui visualisentles familles de decet, videre et aequas (voir figures 3 à 5). On doit en conclureque le schéma théorique en forme d'arbre n'a pas vraiment de portée générale

Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés.

in'V

iseTe

re'V

iser

e

vide

re

Fig

ure

5

Fam

ille

de

vide

re

'"~ o ~ " > Z '" g '"

Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés.

LA FORMALISATION DU VOCABULAIRE LATIN 351

et a fortiori qu'il ne traduit pas les structures profondes de la langue, telles queje les ai défiuies au début de mon exposé.

S'il peut paraître normal d'admettre que tous les sous-arbres théoriquesne soient pas réellement occupés dans chaque famille, il est exclu, en revanche,d'accepter la présence de cases vides entre une racine de niveau 0 et un sous­arbre de uiveau 2 par exemple:

niveau 0

niveau 1

niveau 2

Figure 6

Or, il faut bien reconnaître que nombre de mots latins obéissent au schémaqui vient d'être tracé, dans la mesure où ils dérivent d'un mot qui n'est pasattesté (seditio par rapport à ire par exemple) ou dont on ne peut affirmersans risque d'erreur d'où ils sont issus: où situer periurus, où situer iniurus,mot relativement rare, mais à l'origine de iniuria, beaucoup plus souventutilisés? Autre exemple, autre difficulté: que faire de verbes tels que aedificare,sacrificare, significare ou testificari, tous attestés à date ancienne (c'est-à-direavant 100 A.C.)6, alors que le substantif ou l'adjectif dont ils pourraient être ledénominatif n'apparaît que postérieurement? Encore faut-il s'interroger sur laquestion de savoir si pareille filiation est correcte. En effet, l'étude des verbesen -fica1'e attestés à travers toute la latinité a montré que, si, pour la forme,ces verbes semblent devoir être mis en relation avec des composés nominaux,il ne paraissent pas, pour la plupart, dériver de composés connus en -Jex ou enficus. D'autre part, même si l'on ne doit guère s'étonner de ce que les verbesen -ficare soient plus nombreux que les composés en -fex ou en -ficus, il esttroublant de constater que, à certains de ces noms bien attestés dans la langue,comme apiJex, ne correspondent pas de formes verbales. A cela s'ajoutent encoreles indications chronologiques qui font apparaître que, même quand nom etverbe coexistent, le second ne dérive pas nécessairement du premier, soit quele nom fût tombé en désuétude au moment où le verbe s'est formé, soit que lenom fût postérieur au verbe. La multiplication des verbes en -ficare s'expliquevraisemblablement par le fait que, grâce à ce procédé, la langue se trouvait dotéed'une formation spécifiquement factitive et, dès lors, on se trouve en présenced'une originalité propre au latin qui consiste à approprier au verbe certains

5 A. ERNOUT et A. MEILLET, op. cit., p. 329.

6 X. MIGNOT, Les verbes dénominatifs latins, Paris, 1969, p. 352.

Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés.

352 GHISLAINE VIRÉ

traits de la composition nominale et à utiliser comme suffixe verbal un élémentqui conserve en partie sa parenté avec un mot de sens plein7 • Dans ce cas, ou nepeut parler de dénominatif à suffixe complexe, pas plus qu'on ne peut supposerun hypothétique nom àl'origine du verbe. La question de méthode qui se poseest double: cl 'uue part, comment situer un mot comme sacrificare dans l'arbreschématisant la famille de sacer? D'autre part, faut-il également faire figurerce mot dans la famille de fa cere, et, si oui, de quelle façon faut-il l'y insérer?

Un autre exemple confirme, si besoin en est encore, les difficultés métho­dologiques que crée l'utilisation de l'arbre mathématique: je l'emprunte, luiaussi, à la catégorie des dénominatifs, l'une des formations les plus productivesdu latin. Si 1'011 veut classer des verbes comme irasci ou mitescere (attestésdès 100 A.C.), on ne peut que les mettre en relation directe avec ira et mitis s.L'étude approfondie des verbes eu -sclre a permis de montrer que la filiationnormale était celle qui, partant d'un thème nominal, donnait naissance à unverbe dénominatif qui, à son tour, servait de base à un déverbatif en -scel'eexprimant le développement progressif de l'action. Il s'agit donc, une fois en­core, d'une innovation du latin qui a repris le morphème -sc- servant à former unverbe à partir d'un verbe, pour l'utiliser avec des thèmes nominaux et étendreainsi considérablement son aire d'extension9 • Simplement on ignore, dans uncertain nombre de cas, si le verbe en sefre a été bâti directement sur le substantifou sur l'adjectif ou si, au contraire, l'évolution normale s'est produite, le motintermédiaire - c'est-à-dire le dénominatif - n'étant plus attesté. Pour enrevenir à la structure arborescente qui nous occupe, faut-il situer ces verbes en-seere (ou en -sei) au même niveau que les dénominatifs de formation régulièreet si, en bonne méthode, on estime inacceptable de supposer l'existence de motsdont la tradition ne conserve pas la trace et qu'on doive, dès lors, mettre tousle dénominatif sur le même plan, quel que soit le suffixe utilisé, le schéma est-ilencore parfaitement cohérent?

Le problème qui vient d'être posé dépasse d'ailleurs largement le cadrede l'innovation propre au latin qui vient d'être évoquée à propos du casparticulier des dénominatifs j il concerne, en réalité, toutes les formationsanalogiques, à propos desquelles on doit se demander s'il faut leur octroyerla même place qu'aux formations régulières dont elles s'inspirent. Autrementdit, eommunieare, dénominatif de communis bâti non pas directement sur lethème de l'adjectif, mais à l'aide du suffixe complexe -ica- IO est-il en tous points

7 Ibid., pp. 356-361.

8 Ibid., p. 150.

9 Ibid., pp. 227-228.

10 Ibid., pp. 324-326.

Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés.

LA FORMALISATION DU VOCABULAIRE LATIN 353

comparable aux dénominatifs de la première conjugaison du type curare ouiudicare, tirés en droite ligne du substantif? De même, l'adjectif meticulosus quiemprunte toute la finale de pericu/osus doit-il être considéré comme l'adjectifd'abondance (suffixe -osus) dérivé de metus, alors que sa formation s'expliquepar le rapprochement de sens qui s'est produit entre les notions toutes prochesde crainte et de danger 11 ?

La conclusion s'impose, me semble-t-il, que le rapprochement que l'on esttenté de faire entre les familles de mots et la structure arborescente au sensmathématique du terme s'avère totalement inopérant dans la perspective de laformalisation. Et sur ce point, je rejoins la réflexion que notre collègue G. Serbata faite dans un tout autre contextej s'attachant à étudier les substantifs latinsformés à l'aide du suffixe -bu/um, il fait très justement remarquer qu'il ne suffitpas de juxtaposer un mot terminé par ce suffixe et un autre mot, nom ouverbe, de même radical pour rendre compte de la structure du substantif et ilinsiste sur le fait qu'il faut vérifier que les liens qu'on établit entre les deux motsconstituent bien une relation de dépendance 12 • Telle est exactement la questionqui se pose lorsqu'il s'agit de structurer le vocabulaire latin par familles de mots,mais sans qu'il soit possible d'y apporter une réponse assurée dans chaque cas.

** *

Un second type de structuration, fondé sur les procédés de formation desmots, m'a semblé requérir un examen attentif, dans la mesure où, ne visant plusà établir des liens verticaux entre les mots, mais définissant des axes horizontauxau sein du lexique, il fait disparaître la notion de uiveau de dérivation à l'originedes difficultés insurmontables que je viens de mentionner. il va sans dire quela liste des procédés de formation des mots ne peut être délimitée une foispour toutes dès le départ et, de ce fait, la structure doit se présenter sousla forme d'un système ouvert de classement plutôt que d'obéir à un schémathéorique général, comme c'était le cas pour les familles de mots. L'objection quisurgit immédiatement porte sur le point de savoir s'il s'agit d'une structurationsuffisamment élaborée, justiciable d'un traitement automatisé. La réponse mesemble pouvoir être positive à la double condition que la classification desprocédés de la dérivation et de la composition soit suffisamment affinée et sedouble de la mise en évidence des séries de mots les plus productives dont lalangue porte le témoignage. C'est donc vers l'analyse des différentes facettes

11 A. ERNOUT, Les adjectifs latins en -6sus et en -ulel1tu~, Paris, 1949, p. 85.

12 G. SERBAT, Les dérivés nominaux latin~ à suf/i:te média tif, Paris, 1975, p. 18.

Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés.

354 GHISLAINE VIRÉ

de cette structuration que mes recherches se sont orientées après le rejet duschéma en forme d'arbre.

Qui dit formalisation fondée sur les procédés de formation des mots ditnécessairement hiérarchie des critères de classement, ces derniers ne pouvantpas être identiques pour les dérivés et pour les composés. Dans le premier cas,la prééminence doit être réservée à la nature grammaticale du mot de départet à celle du mot dérivé, le suffixe n'intervenant qu'ensuite. En ce qui concerneles composés, le critère principal me semble devoir être la nature grammaticaledu composé, la nature des éléments qui le constituent et les relations qui lesunissent constituant les deuxième et troisième niveaux d'analyse; à ce proposil faut utiliser avec prudence les notions de progressivité et de régressivitéproposées par certains pour les composés nominaux13 , étant donné que, dansun certain nombre de cas, les multiples sens d'un composé ne permettent pasde le classer dans une catégorie plutôt que dans une autre.

C'est bien évidemment au niveau de la délimitation des suffixes que gîtla difficulté. En l'absence de toute étude d'ensemble portant sur la dérivation,on est forcé de se référer aux quelques ouvrages publiés sur tel ou tel type deformation qui offrent le grand avantage d 'être fondés sur des dépouillementsexhaustifs et de réactualiser les indications quelquefois vieillies du dictionnaired'Ernout et Meillet. Bien que conçus dans une optique toute différente dela mienne, ces travaux mettent en évidence trois principes méthodologiquesessentiels auxquels je ne puis que souscrire 14 : tout d'abord, la nécessité deconcilier perspective synchronique et diachronique, la première aidant à définirla valeur d'un suffixe donné par opposition aux autres valeurs du système danslequel il se place, la seconde faisant appel aux groupements sémantiques àl'origine de nouvelles dérivations; en second lieu, il importe de tenir comptede la date d'apparition dans les textes des mots porteurs d'un même suffixe,quelles que soient les difficultés auxquelles se heurte ce type de recherche.Enfin, il convient de distinguer les mots de structure claire pour la consciencelinguistique du locuteur de ceux dans lesquels, la base n'étant plus nettementidentifiable, la valeur sémantique unissant le suffixe au thème ne peut êtreétablie directement par celui qui parle.

Pour répondre aux exigences qui viennent d'être définies, les suffixesdoivent se distribuer sur deux axes, le premier qui va de la formation régulièreà la formation complexe ne passant par la formation analogique, le second qui

13 Fr. BADER, La formation des composés nominaux du latin, Paris, 1962.

14 Je pense notamment aux ouvrages suivants: X. MIGNOT, op. cit. i J. PERROT, Les dérivéslatin.s en ·men et ~mentum, Paris, 1961 i H. QUELLET, Les dérivés latin..s en -or, Paris, 1969jG. SERBAT, op. cit.

Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés.

LA FORMALISATION DU VOCABULAIRE LATIN 355

prend en compte l'époque à laquelle le mot est attesté pour la première foisdans la languej sur ce dernier point, on peut s'inspirer de la chronologie ­en six ou hlùt périodes - proposée par J. Perrot 15 et reprise par X. Mignot,H. Quellet et G. Serbat 1". Pour justifier l'ordre de présentation des suffixessur le premier axe, je voudrais citer trois cas qui me semblent exemplaires:les formes différentes sous lesquelles apparaissent en latin les quatre suffixesindo-européens dits instrumentaux, mais auxquels G. Serbat préfère donner lequalificatif de médiatifs, - je veux parler des suffixes latins -bulum, -brum,-cu/um, -crum et -trum - doivent être suivies de la mention de la formeélargie -aculum dont le développement a accompagné l'expansion des verbesde la première conjugaison et qui a ainsi contribué à conserver au suffixe-culum une vitalité consta~te et une structure identique tout au long de lalatinitp1. De la même façon, les suffixes -men et -mentum, qui ont l'un etl'autre servi à former nombre de substantifs du vocabulaire courant, ont évoluédifféremment, notamment parce que le suffixe -mentum s'étant lié à daterelativement ancienne à des thèmes en -a- a connu, sous la forme -amentum,un développement parallèle à celui des verbes de la première conjugaison1S. Sil'on veut être précis, en plus des formes -men, -mentum et -amentum, doiventencore être repris, sous la "même rubrique, les suffixes complexes et apparentés-monium, -monia et -mnus dont l'aire d'extension est beaucoup plus limitée19

Comme troisième et dernier exemple, je citerai le cas du suffixe -osus utilisépour former des adjectifs à partir de substantifs: à côté de la forme -osus doiventen apparaître deux autres, celle déjà mentionnée précédemment -cu/osus, quiexplique la formation analogique de meticulosus, et la forme -uosus, attestéedans les mots de type aestuosus et passée ensuite à d'autre mots où la présencedu -u ne se justifiait pas (voluptuosus par exemple); il est amusaut de noter àce propos que le français a repris ce même suffixe pour former des mots comme"délictueux", bâti directement sur delictum, l'adjectif en -uosus n'étant pasattesté20 !

C'est au travers de subdivisions semblables à celles que je viens d'esquisser,qui tiennent compte de la mouvance de certaines formations au fil des siècles,qu'on a des chances, me semble-t-il, d'atteindre les structures profondes enra­cinées dans la langue. Il va de soi que les données de la sémantique, rebelles plus

15 J. PERROT, op. cit, p. 33.

16 X. MIGNOT, op. dt., p. Hi H. QUELLET, op. cit., p. 32i G. SERBAT, op. cît., p. 12.

17 G. SERBAT, op. cit, p. 125.

18 J. PERROT, op. cit., p. 133 et pp. 175-177.

19 Ibid., pp. 28-29.

20 A. ERNOUT, op. cit. (Les adieetifs), p. 84.

Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés.

356 GHISLAINE VIRÉ

que toutes autres à la formalisation, n'ont d'autre rôle à jouer dans la recherchedes structures que de faire mieux saisir les oppositions qui se manifestent entresufflxesj ainsi constate-t-on que les substantifs en -or (-oris) dérivés de verbesexpriment très souvent des états de durée relativement limitée, engendrantl'agitation de l'individu et le mettant dans l'impossibilité de réagir2 ', alors qued'autres substantifs, tirés d'adjectifs et formés à l'aide des suffixes -ia/-itia ou-tas (-tatisJ, marquent davantage des états ou des sentiments permanents: ilme suffit, pour illustrer cette constatation, de citer Jurar et insania ou encoreumor et caritas.

fi me reste, pour terminer, à aborder le problème des séries les plusproductives du latin et à réintroduire ainsi, dans les limites du raisonnable,la notion de niveau de dérivation et/ou de composition. Il est vain) me semble­t-il, de vouloir s'attacher à la forme extérieure des dérivés et des composés, desmots de même nature grammaticale et, qui plus est, pourvus du même suffixepouvant obéir à des schémas différents: ainsi) inimicitia, dérivé de l'adjectifinimicus, lui-même composé de amicus, l'adjectif tiré du verbe amare, auquelon peut opposer invidia, le substantif correspondant à l'adjectif invidus, tirédu verbe invidere) composé du simple videre. Mieu~ vaut, dès lors, partir dela structure grammaticale du dérivé ou du composé et analyser les formationssuccessives auxquelles il remonte, tout en sachant que cette démarche ne peutporter ses fruits que pour les mots séparés du mot simple par un ou deuxniveaux de dérivation et/ou de composition) étant donné que les mots qui sontdavantage éloignés du mot simple ne sont pas suffisamment nombreux dansla langue classique pour que des conclusions significatives puissent se dégager.Sans vouloir entrer dans le détail, je dirai que, sur la base du dépouillemeutdu lexique de base) il apparaît qu'un verbe situé au niveau deux par rapportau mot simple auquel il se rattache sera, dans la majorité des cas, un composécl 'un dénominatif (admirar-i composé de mirari, le dénominatif de mirus) oubien le composé d'un verbe dérivé (cogitare composé de agitare, le fréquentatifde agere). Dans le cas d'un substantif, l'éventail des combinaisons possiblesest plus large, la structure substantif dérivé de verbe composé étant de loin laplus fréquente et aucun latiniste ne s'en étonnera (occasus et accasio, dérivés deoccidere, le composé de cadere). On pourrait multiplier les exemples et montrerainsi que, quels que soient les écueils auxquels se heurte la formalisation duvocabulaire, il devrait être possible d'identifier les quelques principes cohérentsqui ont guidé l'évolution et l'enrichissement de la langue. Une fois ces principesdéfinis, il devrait être possible d'établir des relations entre les séries les plusproductives et les suffixes évoqués précédemment.

21 H. QUELLET, op. cit., pp. 185-188.

Extrait de la Revue Informatique et Statistique dans les Sciences humaines XXIV, 1 à 4, 1988. C.I.P.L. - Université de Liège - Tous droits réservés.

LA FORMALISATION DU VOCABULAIRE LATIN 357

Les voies dlinvestigation que je viens de tracer ne sont encore que deshypothèses de travail dont le bien-fondé doit être vérifié sur la base d'un corpusplus étenduj c'est là Pobjectif que je me suis fixé pour les mois à venir.