14
Essai de lexico-statistique historique du français contemporain Author(s): Jean Dubois Source: La Linguistique, Vol. 1, Fasc. 2 (1965), pp. 103-115 Published by: Presses Universitaires de France Stable URL: http://www.jstor.org/stable/30248775 . Accessed: 15/06/2014 22:01 Your use of the JSTOR archive indicates your acceptance of the Terms & Conditions of Use, available at . http://www.jstor.org/page/info/about/policies/terms.jsp . JSTOR is a not-for-profit service that helps scholars, researchers, and students discover, use, and build upon a wide range of content in a trusted digital archive. We use information technology and tools to increase productivity and facilitate new forms of scholarship. For more information about JSTOR, please contact [email protected]. . Presses Universitaires de France is collaborating with JSTOR to digitize, preserve and extend access to La Linguistique. http://www.jstor.org This content downloaded from 188.72.126.109 on Sun, 15 Jun 2014 22:01:53 PM All use subject to JSTOR Terms and Conditions

Essai de lexico-statistique historique du français contemporain

Embed Size (px)

Citation preview

Page 1: Essai de lexico-statistique historique du français contemporain

Essai de lexico-statistique historique du français contemporainAuthor(s): Jean DuboisSource: La Linguistique, Vol. 1, Fasc. 2 (1965), pp. 103-115Published by: Presses Universitaires de FranceStable URL: http://www.jstor.org/stable/30248775 .

Accessed: 15/06/2014 22:01

Your use of the JSTOR archive indicates your acceptance of the Terms & Conditions of Use, available at .http://www.jstor.org/page/info/about/policies/terms.jsp

.JSTOR is a not-for-profit service that helps scholars, researchers, and students discover, use, and build upon a wide range ofcontent in a trusted digital archive. We use information technology and tools to increase productivity and facilitate new formsof scholarship. For more information about JSTOR, please contact [email protected].

.

Presses Universitaires de France is collaborating with JSTOR to digitize, preserve and extend access to LaLinguistique.

http://www.jstor.org

This content downloaded from 188.72.126.109 on Sun, 15 Jun 2014 22:01:53 PMAll use subject to JSTOR Terms and Conditions

Page 2: Essai de lexico-statistique historique du français contemporain

ESSAI DE LEXICO-STATISTIQUE HISTORIQUE

DU FRANMAIS CONTEMPORAIN

Les mots commengant par << h- par JEAN DUBOIS

I. - INTRODUCTION

La lexicologie ne comporte pas seulement I'6tude du fonction- nement synchronique du lexique, l'analyse des systemes formels et la determination des structures qui d6finissent les morphbmes (ou monemes) lexicaux; elle fait place aussi A la definition des couches lexicales, historiquement diff6rentes, dont I'en- semble forme le vocabulaire du frangais contemporain. Il s'agit d'examiner les rapports entre deux variables : d'une part le volume des masses lexicales (celui-ci variera en fonction de la fr6quence d'emploi); d'autre part les apports lexicaux (ceux-ci sont deffinis par la date d'apparition des unit6s lexicales en frangais). Ces etudes qui, en dernibre analyse, visent a donner a la glottochronologie, prise en son sens le plus large, un statut particulier dans une langue dont P'histoire nous est connue, posent une s rie de problbmes m6thodologiques que nous nous

proposons d'aborder dans un premier temps, pour ensuite evaluer les resultats obtenus en prenant un echantillonnage specifique (mots frangais commenqant par le grapheme h).

a) Le problBme des divers (< corpus ).

Definir les couches diachroniques du frangais contemporain, c'est d'abord d6finir le ou les corpus a partir desquels on fera cette etude. Le corpus lexical peut tre 6tabli sur des bases de frequence d'usage; un lexique se dffinit par le volume de

This content downloaded from 188.72.126.109 on Sun, 15 Jun 2014 22:01:53 PMAll use subject to JSTOR Terms and Conditions

Page 3: Essai de lexico-statistique historique du français contemporain

104 JEAN DUBOIS

communications dans lequel il entre; sa grandeur va done varier avec ce volume lui-meme. On a ainsi un premier ensemble de 1 000 mots, ceux qui sont les plus frequemment rencontr6s dans la langue commune; les communications enregistrees dans divers milieux sont alors considr6res comme repr6senta- tives d'un ensemble plus vaste, comme un 4chantillonnage de la langue. Le premier corpus envisag6 est done la liste (F) des 1 063 mots les plus fr6quents, contenus dans les tables statis-

tiques du frangais fondamental (v. G. Gougenheim, R. Mich6a, P. Rivenc, A. Sauvageot, L'Vlaboration du frangais b14ementaire, Didier, 1956, r66d. en 1964).

Si on accroit le nombre des unit6s lexicales en se plagant S un niveau de frequence d'emploi plus has, on obtient des

ensembles plus vastes, mais toujours nombrables. En fait si de tels lexiques existent, ils sont fondes sur des 6tudes parcel- laires, des enquetes dispersees ou meme sur des ref6rences a

l'usage personnel. Toutefois, dans la mesure meme oii les unit6s qu'ils contiennent restent en nombre limit6, on est en droit de

penser que la marge d'erreurs est restreinte; il n'est pas ill6- gitime de consid6rer son propre langage comme une variante valable de la norme. On posshde ainsi des dictionnaires de 3 000 mots (G) : G. Gougenheim, Dictionnaire fondamental de la langue frangaise, Didier, 1958; et de 5 000 mots (M) : G. Mator6, Dictionnaire du vocabulaire essentiel, Larousse, 1963.

Si on veut considerer des ensembles plus vastes, le dic- tionnaire sera form6 des termes usuels qui entrent dans les conversations courantes et des termes techniques qui se ren- contrent dans les communications entre des locuteurs n'appar- tenant pas a un milieu professionnel particulier (ainsi on retient le vocabulaire de l'aviation usuel entre les gens qui n'exercent

pas un metier dans l'industrie aeronautique). Ce lexique que l'on a ainsi d'fini par le caractere de ( disponibilit6 ) forme le

corpus de cette deuxieme zone. Encore peut-on envisager deux

etapes successives : un dictionnaire de 25 000 termes (Dic- tionnaire du frangais contemporain, en pr6paration) et un autre de 45 000 termes (le Petit Larousse). Si l'on fait appel a des dictionnaires plus vastes on prendra alors comme corpus le Dictionnaire 6tymologique de Dauzat qui contient 50 000 termes environ ou le Grand Dictionnaire Larousse encyclopedique (80 000 termes), le Littr-, le Dictionnaire general, etc.

This content downloaded from 188.72.126.109 on Sun, 15 Jun 2014 22:01:53 PMAll use subject to JSTOR Terms and Conditions

Page 4: Essai de lexico-statistique historique du français contemporain

ESSAI DE LEXICO-STATISTIQUE HISTORIQUE 105

Nous avons done a notre disposition un groupe de corpus; ceux-ci, tant dans l'intention de leurs auteurs que dans leur realisation pratique, sont des images de lexiques dont le para- metre variable serait la frtquence d'occurrence (( supposee D dans les enoncis des locuteurs contemporains des milieux urbains, a un Age ohi l'on n'a pas encore constat6 un arret dans le developpement du code : F (Frangais fondamental) = 1 063 mots; G (G. Gougenheim) = 3 000 mots; M (Mator6) = 5 000 mots, D (Dict. dufrangais contemporain) = 25 000 mots; L (Petit Larousse) = 42 000. On peut ajouter a cette liste un lexique de 2 000 mots environ de Vander Beke (VB), 4tabli sur les bases du frangais &crit et non plus parl6 comme F ou G.

On peut supposer qu'avec des m*thodes paralleles, fondies sur les memes criteres, les 1 063 mots de F vont se retrouver dans G et dans M; et ceci se revle exact. En revanche on constate que les 2 000 mots de VB ne se retrouvent pas int&- gralement dans G et M s'ils sont contenus dans D et L; le stock des racines n'est pas en effet le meme dans la langue 6crite et dans la langue parl6e. Ce qui est moins attendu, c'est que les 3 000 mots de G ne se retrouvent pas tous dans les 5 000 de M; les 6carts ne sont pas absolument negligeables. Ils viennent du fait que les deux auteurs ont pris pour base leur propre langage et ont d6montr6 ainsi qu'il n'y avait pas adequation des variantes individuelles. Ces diffirences ne sont pas telles cependant qu'elles remettent en cause la progression entre G et M. Enfin tous les mots de G, M, D, VB se trouvent dans L.

Les ensembles lexicaux sont ainsi fix6s selon une variable

contr6l1e : une fr6quence d'occurrence de plus en plus basse et une augmentation continue du nombre des unit6s lexicales.

b) Le probleme de l'apparition de l'unit6 lexicale (datations et

origines). Pour mener a bien l''tude entreprise, chaque terme doit

etre date et son origine determin6e. Les dictionnaires 6tymolo- giques et historiques du frangais ont souvent des sources communes (les dictionnaires de Godefroy, de Tobler Lommatsch, de Meyer-Liibke). La publication de FE W de W. von Wartburg est suffisamment avancee pour fournir des recensions s6rieuses. Les efforts de B. Quemada au Centre du Vocabulaire

franuais

This content downloaded from 188.72.126.109 on Sun, 15 Jun 2014 22:01:53 PMAll use subject to JSTOR Terms and Conditions

Page 5: Essai de lexico-statistique historique du français contemporain

106 JEAN DUBOIS

ont abouti ' des publications qui permettent d'ameliorer considdrablement le systhme des datations. Mais si le nombre des incertitudes 6tymologiques a diminu6 dans des proportions importantes, les dates d'apparition restent sujettes a caution, surtout si on les accepte sans examen critique.

On a donc recherch6 pour chaque terme contenu dans L

(et a plus forte raison dans G, F, M, D, VB) la date d'apparition telle qu'elle est connue ou telle qu'elle a pu etre verifi e par H. Mitterand ou par moi-meme au cours de la refection du Dictionnaire etymologique et historique de Dauzat (edition de 1965). Il existe certaines incertitudes et des timoignages controversis. Or il est apparu qu'en utilisant deux parametres diffrents on pouvait diminuer notablement les inconvenients de cette incertitude : le premier sera constitue par l'origine des mots puisque celle-ci est beaucoup moins sujette a caution et que l'incertitude est sur ce point reduite, le second sera constitue par la date d'apparition. La correlation entre les deux faits permet de mettre en evidence certaines contradictions

(par exemple : origine latine populaire et date d'apparition au xyve si cle) qui sont examinees pour chaque cas particulier : le mot qui est issu par voie populaire et qui n'est cependant attest6 qu'au xIve siecle peut etre un emprunt dialectal ou le resultat de releves insuffisants. Ce double parambtre a 6t6 a la base des groupes glottochronologiques suivants utilises

pour les etudes entreprises (les criteres 4tant indiques entre

parentheses) :

0 : fonds primitif (origine latine, formation populaire; mots

attest's du xe siecle au xIue sicle); 1 : fonds primitif (origine germanique; attestis entre le XIe et

le xme sidcle) ; 2 : latinisation premiere (origine latine, calques ou emprunts

directs ; mots du xe siecle au XVe si'cle) ; 3 : emprunts etrangers (origine non latine; mots de l'ancien

et moyen frangais du xIe sitcle , 1450);

4 : derives et composes (derivation ou composition frangaise du xIe siecle a 1450);

5 : latinisation seconde (origine latine; calques ou emprunts directs depuis 1450) ;

6 : emprunts trangers (origine non latine, depuis 1450);

This content downloaded from 188.72.126.109 on Sun, 15 Jun 2014 22:01:53 PMAll use subject to JSTOR Terms and Conditions

Page 6: Essai de lexico-statistique historique du français contemporain

ESSAI DE LEXICO-STATISTIQUE HISTORIQUE 107

7 : derives et composes (formations frangaises, depuis 1450); 7 a (sur bases frangaises et latines) ; 7 b (sur bases 6trangbres et en particulier sur bases grecques).

8 : onomatopies.

La distinction de ces groupes a permis de resoudre certaines difficult6s que posaient quelques unit6s lexicales. Elle &vite lParbitraire de la premiere attestation; ceci dans toute la mesure du possible.

c) L'exploitation des resultats.

Chaque terme ainsi cod6, des tris successifs sont effectu6s entre les divers groupes afin de mettre en evidence une premiere serie de ph6nombnes :

a) l'importance relative du fonds primitif de la langue dans le vocabulaire fondamental (groupes 0 et 1) et l'ivolution de ce pourcentage relativement a la masse lexicale considerie;

b) les courbes d'emprunt selon le corpus envisage, c'est-a-dire en fonction de l'Ntendue du lexique (groupes 3 et 6) ;

c) les correlations existant entre la forme des bases et la nature de la suffixation selon la variable constitude par la masse lexicale (groupes 4 et 7);

d) les proportions respectives de la latinisation (groupes 2 et 5) et des emprunts 6trangers (groupes 3 et 6) dans la formation du lexique technique commun.

Il est evident que d'autres problkmes se sont poses au cours de la recherche ; de plus les resultats n'auront leur pleine valeur que lorsque des tris successifs (effectues manuellement ou sur machine mecanographique) auront et6 effectues pour la totalit6 des unites lexicales contenues dans L. Mais il a paru utile de donner un premier aperqu des resultats obtenus a partir d'un echantillon defini.

On a choisi les mots commenqant par le graphbme h (repr&- sentant environ 2 % du stock general). On sait que cette lettre se trouve aussi bien '

l'initiale de termes d'emprunts 6trangers (h dit (( aspir' )) qu' 'l'initiale de mots latins oih elle a 6t6 restitude ; le graphbme a servi ' la distinction graphique de u et v (huit, huile) de i et j (hi'ble). En se donnant ainsi un ensemble

oh les mots d'emprunt et les termes savants sont nombreux

This content downloaded from 188.72.126.109 on Sun, 15 Jun 2014 22:01:53 PMAll use subject to JSTOR Terms and Conditions

Page 7: Essai de lexico-statistique historique du français contemporain

108 JEAN DUBOIS

on se propose un 6chantillonnage particulier ; or si les propor- tions de chaque groupe se r6vMent conformes dans F a ceux

que P'on retrouve pour les autres lettres, les premieres conclu- sions n'en peuvent etre que plus d6cisives.

II. - LA DATERMINATION DES COUCHES DIACHRONIQUES DU VOCABULAIRE FONDAMENTAL

Le Franfais fondamental (1 063 mots) comporte 17 mots

commenqant par la lettre h, y compris l'onomatop~e hein. Celle-ci sert de support d'intonation dans la phrase ou de forme

d'appel; elle manifeste surtout I'incomprehension de l'auditeur

(fonction de feed-back). Les termes repertorids (9 substantifs, 3 adjectifs, 2 verbes,

2 adverbes, 1 interjection) se repartissent en 4 groupes : 1) fonds

primitif d'origine latine : 8 mots, soit 47 %; 2) latinisation

premiere : 4 mots, soit 23,5 %; 3) derivation sur le fonds

primitif : 3 mots, soit 17,6 %; 4) emprunt Ctranger ancien : 1 mot, soit 5,8 %; 5) onomatopee : 1 mot.

Si l'on examine le detail, on constate que : a) Le fonds primitif d'origine latine (mots de formation

dite populaire) est repr'sent6 par les huit mots suivants directement issus du latin et apparus dans les textes entre le xe et la fin du xIIe siecle : haut (altum, plus action d'un

germanique hauh-), heure (horam), hiver (hibernum), homme

(hominem), hotel (hospitalem), huile (oleum), hui (octo), soit 5 substantifs, 2 adjectifs et 1 adverbe.

b) Les calques du latin, issus de la latinisation du Moyen Age, sont reprksentes par 4 mots relev6s dans des textes qui vont du milieu du xIIe siecle a la fin du XIve si cle : habiter (habitare), habitude (habitudo), histoire (historia), hopital (hospitalis) ; l'an- ciennet6 de deux de ces calques se manifeste par une adaptation morphologique (histoire, hapital). Il y a trois substantifs et 1 verbe.

c) Les derives de mots du fonds primitif sont form6s s l'aide de suffixations propres au francais : habiller (sur bille

avec analogie de habit), heureux et heureusement. Ce dernier n'est attest6 qu'au xvie sicle, mais il faut tenir compte du rendement fonctionnel moins dlev6 des adverbes en -ment, variante combinatoire des adjectifs; la diffirence d'occurrence

This content downloaded from 188.72.126.109 on Sun, 15 Jun 2014 22:01:53 PMAll use subject to JSTOR Terms and Conditions

Page 8: Essai de lexico-statistique historique du français contemporain

ESSAI DE LEXICO-STATISTIQUE HISTORIQUE 109

se manifeste encore ' l'heure actuelle puisque heureux occupe

dans les tables de frequence le rang 572 et heureusement le

rang 719. On peut done l'aligner sur heureux qui, comme habiller, est du xIre sibcle.

d) L'emprunt 6tranger est le terme d'origine arabe hasard, atteste au xue sibcle.

e) L'onomatopde hein n'est relev'e qu'au xvme si*cle, mais on peut penser, sans crainte d'erreur, qu'il s'agit 1a d'un dffaut de notation : on ne peut rien infirer de cette date toute

provisoire. Les premieres conclusions que l'on peut presenter sont les

suivantes : a) importance du fonds primitif dans le vocabulaire fondamental : pres de 50 % des mots appartiennent a ce groupe alors que les mots commenqant par la lettre h pouvaient etre

presumes, pour une bonne part, d'origine savante ou fran- cique; b) importance du fonds, populaire ou savant, d'origine latine : 15 mots sur 17 sont issus directement ou par emprunt du latin, soit 88 %; c) faible part en revanche des emprunts 6trangers (1 mot) dans une lettre qui en comporte beaucoup a d'autres niveaux; d) absence totale dans le groupe riper- tori6 de mots d'origine francique alors m8me que de nombreux termes issus de cette langue apparaitront aux stades suivants.

Si l'on examine les fr quences d'occurrence des mots commencant par la lettre h, on constate qu'elles sont en quelque sorte indiff6rentes a leur origine savante ou populaire; les 7 mots les plus frequents sont heure (82 - populaire), huit (180 - pop.), histoire (196 - savant), homme (253 - pop.), habiter (438 - savant), haut (479 - pop.), hier (484 - pop.).

Nous avons dit que la proportion des mots commen.ant par h repr6sentait environ 2 % du vocabulaire total. Il1 est a remarquer cependant que cette proportion varie selon l'ensemble considdr6 : il n'est pas indiffirent de constater que ce nombre de 17 (sur 1 063) que l'on trouve pour Le Frangais fondamental repr6sente la proportion la plus basse (1,6 %) : F 1,6 %; G 1,7 %; VB 2 %; M 2 %; L 2,14 %; Littre, 2,10 % ; Dict. general 2,03 % ; Hatier 2,37 %.

En effet G a 51 termes commenqant par h (sur 3 000 mots), M 87 (sur 5 000), VB 40 (sur 2 000) dans la langue 6crite et L 1 028 (sur 42 000). Autrement dit la proportion des mots

This content downloaded from 188.72.126.109 on Sun, 15 Jun 2014 22:01:53 PMAll use subject to JSTOR Terms and Conditions

Page 9: Essai de lexico-statistique historique du français contemporain

110 JEAN DUBOIS

commeneant par la lettre h augmente en fonction du caractere 6crit de la langue et en fonction de l'accroissement des termes

techniques. Ceci ne fait que confirmer la double observation empirique

que l'accroissement du vocabulaire se fait avec des termes savants et que le stock des racines de la langue 6crite n'est pas le meme que celui de la langue parlie.

III. - LES MODELES DIACHRONIQUES D'ACCROISSEMENT DU VOCABULAIRE

On peut observer dans le tableau suivant la transformation des modbles diachroniques du frangais selon l'accroissement du nombre d'unitis lexicales.

F VB G M

Fonds primitif latin 8 10 11 13 - francique .. 0 4 7* 6

Latinisation premiere 4 18 19 32** - seconde 0 0 0 3

Emprunts etrangers : Av. xve s 1 1 3 3 Apr. xve s 0 0 1 4

D6riv6s et compos6s : Av. xve s 2 5 8 15 Apr. xve s 1 1 2 10

Onomatop6es*** ......... 1 1 0 1

TOTAL ................. 17 40 51 87

* Dont 1 apr~s le xve si6cle. ** Dont 9 issus du grec par I'intermidiaire du latin savant.

*** Onomatop6e : hein pour F, hilas, pour VB et M.

M contient G et VB; il y a cependant un petit nombre de termes qui se trouvent actuellement en G (hair, hirondelle, horloger, houblon) et d'autres seulement dans VB (hite, hausser, humble) : les seconds s'expliquent par le fait qu'ils appartien- nent a la langue 6crite soutenue.

On constate que : a) Le nombre de mots du fonds primitif augmente tres peu;

aussi la proportion en regard du lexique tendra-t-elle a diminuer

This content downloaded from 188.72.126.109 on Sun, 15 Jun 2014 22:01:53 PMAll use subject to JSTOR Terms and Conditions

Page 10: Essai de lexico-statistique historique du français contemporain

ESSAI DE LEXICO-STATISTIQUE HISTORIQUE 111

rapidement, elle passe de prbs de 50 %, ' 14,4 % dans M

(5 000 mots). b) L'accroissement du lexique, dans tous les domaines

(vocabulaire g*ndral et lexiques fonctionnels), se fait par les deux processus de la latinisation (calques et emprunts directs au latin) et de la derivation, dont le r6le a eti longtemps meconnu (les affirmations arbitraires et inconsiderees sur

l'inaptitude du frangais a former des deriv6s ne manquant pas dans les etudes de lexique). La latinisation, qui est surtout le fait de l'ancien frangais, passe de 29 % dans F a 42 % dans M. On remarque que, dans la langue 6crite fondamentale (2 000 mots), la proportion des latinisations est importante puisque le pourcentage est de 40 %. Ceci confirme le fait que le lexique 'crit est structurellement diff6rent du lexique de la langue parlie. La ddrivation repr6sente 17,6 % dans F et 27,7 % dans M. On constate aussi que le nombre des deriv6s est sensiblement le meme pour les deux piriodes consideries avant ou aprbs le xve siecle. Cette stabilit6 s'oppose a la rigres- sion du ph6nomZne de la latinisation au XVLe sibcle.

c) Les emprunts 4trangers restent en revanche peu nom- breux ; il faut des lexiques plus vastes qui font appel

' un degr6 de technicit6 plus 6lev"e pour qu'apparaissent les termes 6tran- gers parmi lesquels on compte les formes issues d'616ments grecs. Toutefois parmi les 35 latinisations attest6es avant le xve siecle se trouvent dej\ 9 termes issus du grec par l'inter- mediaire du latin.

d) Les termes issus du francique appartiennent aujourd'hui B la langue "crite. Ils apparaissent en effet dans VB ; mais, en concurrence avec des termes issus du latin, ils se sont repartis a un autre niveau de langue (haine, hdte, hardi, etc.). Leurs occurrences et leurs distributions restent assez basses dans les listes de VB : hardi 25 (39 occurrences); haine 24 (51 occur- rences); hdte 24 (34 occurrences); heurter 33 (49 occurrences).

IV. - LA COMPOSITION DIACHRONIQUE DU VOCABULAIRE DE L

Au niveau de la langue commune et des lexiques fonction- nels les plus usuels (Petit Larousse 42 000 mots), il a etc possible d'approfondir l'analyse. La lettre h comporte 1 028 termes;

This content downloaded from 188.72.126.109 on Sun, 15 Jun 2014 22:01:53 PMAll use subject to JSTOR Terms and Conditions

Page 11: Essai de lexico-statistique historique du français contemporain

112 JEAN DUBOIS

leur composition historique est la suivante (I indique la premiere partie du sikcle; II la deuxieme moiti6) :

a) Avant 1450: av. xIe si'cle 9 mots; xIe siecle 23 mots; xme siecle (I) 45 mots ; xIIe sicle (II) 114 mots ; xIe si'cle (I) 14 mots; xyje si cle (II) 60 mots; xIve sibcle (I) 27 mots; xyve si cle (II) 50 mots; xve si"cle (I) 21 mots; soit 363 mots ou 35 % du total.

b) Entre 1450 et 1750: xve si'cle (II) 48 mots ; xve siecle (I) 69 mots; xvle sicle (II) 83 mots; xvIue si'cle (I) 35 mots; xvIIe sicle (II) 45 mots ; xvule sidcle (I) 36 mots ; soit 316 mots ou 30 %.

c) Apres 1750: xvIme siecle (II) 69 mots; xIxe siecle (I) 79 mots; xIxe sitcle (II) 144 mots; xxe si'cle 57 mots; soit 349 mots ou 34 %.

Si l'on tient compte des distances historiques (5 siecles

pour la premiere periode, 3 siecles pour la deuxitme, 2 sibcles pour la troisisme), on constate que l'accroissement du volume lexical, dans la mesure oii il n'appartient plus au fonds primitif ou A la zone la plus frequente, se fait par un appel A des unit6s relativement r'centes. Pres du 1/3 du lexique de la lettre h est postirieur A 1750 (date d'apparition).

La transformation des techniques qui s'est accelerke A partir du xvIlme si'cle, la nicessit6 de traduire de nouveaux besoins et de nouvelles sciences ont provoqu6 le renouvellement et I'accroissement du lexique.

Cette repartition par grandes piriodes historiques a pour avantage aussi de neutraliser le phenomene d'enregistrement par les dictionnaires; celui-ci est tres apparent dans le detail des tableaux donn6s ci-dessus : ainsi le xIxe sidcle (II) repr6- sente l'apparition des grands dictionnaires de la deuxieme

partie du siecle (Littre, Larousse, editions de Bescherelle, etc.). Sur le plan de la formation des mots, on compte 663 mots

suffixes soit A partir de bases d'origine frangaise ou 6trangbre, soit au moyen de calques du latin, avec integration secondaire au systhme frangais. La proportion des termes derives et int6gres est done de 64,49 % du lexique commenqant par h; ce pour- centage correspond A celui que d'autres etudes avaient permis d'obtenir A partir d'autres 6chantillons (v. J. Dubois, Essai

This content downloaded from 188.72.126.109 on Sun, 15 Jun 2014 22:01:53 PMAll use subject to JSTOR Terms and Conditions

Page 12: Essai de lexico-statistique historique du français contemporain

ESSAI DE LEXICO-STATISTIQUE HISTORIQUE 113

sur la d.rivation sufixale, Larousse, 1963). La r6partition est la suivante :

10 Suffixes entrant dans la transformation du syntagme verbal en syntagme nominal (noms dits d'action et d'etat) : -age 20 mots; -ment 19 mots; -tion 24 mots; -zero 7 mots

(diverbaux); -is 2 mots; -ure 4 mots; -tude 1 mot. Il existe aussi 1 mot en -ing (anglais). La proportion de termes suffixes en -age et en -tion est plus forte que dans l'ensemble du lexique (v. op. cit.), elle traduit l'importance des vocabulaires techniques dans h.

20 Suffixes entrant dans la transformation du syntagme verbal (etre + adjectif) en un syntagme nominal (noms dits de qualit6, de systeme, etc.) : -it6 27 mots; -isme 22 mots; -ie 56 mots; -ise 1 mot; -eur (f.) 4 mots; -esse 3 mots; -erie 9 mots; -ence/-ance 1 mot. La proportion des termes en -ie est trbs forte; elle s'explique comme pour -tion et -age.

30 Suffixes entrant dans la transformation de l'6nonce mini- mal en syntagme nominal (noms d'agent et d'instrument) : -eur 28 mots; -er (anglais) 1 mot; -oir 3 mots; -i're 5 mots; -ier 19 mots. L'importance relative de -eur s'explique par le

caractbre r6cent du lexique technique. 40 Suffixes specifiques :

- suffixes collectifs : -aie 1 mot; -de 3 mots ; -at 1 mot; - suffixes diminutifs et pejoratifs : -eau 7 mots; -on, -illon

7 mots; -et, -ette 12 mots; -ule 1 mot; -ot, -ote 2 mots; -ard 1 mot; -in, -ine 9 mots; -asse 1 mot;

- suffixes techniques :-idges 1 mot; -ium 6 mots; -ion

(physique) 1 mot.

50 Suffixes entrant dans la transformation d'un syntagme nominal

a) en un Cnonc6 minimal (etre + adjectif) :-aire 8 mots; -if 1 mot; -eux 14 mots; -ique 52 mots; -iste 12 mots; -al/el 10 mots; -ien 11 mots; -ain 4 mots; -ieme 1 mot;

b) en un syntagme verbal : verbes derives (46),

L'importance des suffixes -ique, -al/el, -iste est a mettre en relation avec l'importance de -ie, -tion, -isme; elle a la meme origine.

LA LINGUISTIQUE, II 8

This content downloaded from 188.72.126.109 on Sun, 15 Jun 2014 22:01:53 PMAll use subject to JSTOR Terms and Conditions

Page 13: Essai de lexico-statistique historique du français contemporain

114 JEAN DUBOIS

60 Suffixes entrant dans la transformation d'un syntagme verbal en un autre syntagme verbal :

a) adjectifs : -ant 12 mots; -able 5 mots; -", i, u 9 mots; b) verbes : -iser 7 mots; -fier 1 mot.

70 Suffixe adverbialisateur : -ment 18 mots. 80 Les formations savantes des lexiques techniques, prati-

quement inexistantes au niveau des 5 000 mots de M, devien- nent trbs nombreuses ici : 114 termes formis avec des elements

d'origine grecque, 7 avec des elements d'origine latine.

Si l'on examine le detail des emprunts aux langues 6tran-

geres (autres que le grec), on constate la repartition suivante : 1) Langues germaniques et scandinaves 116 mots ; allemand 19

(dont 1 hongrois) ; anglais 23 (dont 1 algonquin, 1 caraibe, 1 anc. fr.); n'erlandais 12; scandinave 9; francique, 53.

2) Langues romanes 12 mots : espagnol 8 (dont 1 caraibe, 1 arabe); italien 2; provencal 1; occitan 1.

3) Arabe 10 mots. 4) Origine obscure 4 mots.

I1 faut ajouter 1 japonais, 1 tartare et 1 calque de l'anglais. La proportion des emprunts anciens a des langues comme

le francique, le scandinave, le moyen nierlandais, etc., est a ce niveau considerable (12,5 %); on voit qu'elle ne s'est pas retrouv6e dans le vocabulaire de F. Le module du lexique fondamental ne peut pas servir de base a des moddles de voca- bulaire plus 6tendus : les rapports structurels sont profond&- ment modifies. La proportion des emprunts a des langues non romanes est considerable (129 termes). Les causes en sont diverses et variables selon les epoques, mais le h apparait souvent comme la marque graphique d'un terme etranger (a l'initiale comme postconsonantique).

Dans le m8me ordre d'idies (expressivitd) on note le grand nombre d'onomatopies (15) et de noms propres devenus substantifs communs (17).

Les conclusions, toutes provisoires, que nous permet cette

premiere etude sont les suivantes : 1. Les moddles lexicaux varient structurellement selon le

volume de l'ensemble lexical (difini selon sa frequence

This content downloaded from 188.72.126.109 on Sun, 15 Jun 2014 22:01:53 PMAll use subject to JSTOR Terms and Conditions

Page 14: Essai de lexico-statistique historique du français contemporain

ESSAI DE LEXICO-STATISTIQUE HISTORIQUE 115

d'occurrence) : on ne peut pas infirer du plus petit au

plus grand. 2. Les proportions des couches diachroniques dans le

vocabulaire fondamental (F) traduisent l'origine latine du frangais; elles restent constantes si l'echantillon alphabitique est suffisamment vaste. Les proportions des couches diachro- niques dans un vocabulaire usuel (L), tres vaste, traduisent en revanche la constitution historique du frangais ; elles varient selon le caractbre de r1'chantillon alphabetique et ne peuvent 8tre valablement d6finies que lorsque 1'ensemble du lexique aura et6 tudi6 de la meme maniere.

3. Les modbles lexicaux de la langue 6crite ne sont pas seulement diff6rents de ceux de la langue parl6e dans une etude de fonctionnement synchronique; ils le sont aussi dans une perspective diachronique. Constitution comme fonctionnement permettent de considerer ces deux moddles comme deux sous- ensembles qui se definissent chacun d'une maniere specifique.

This content downloaded from 188.72.126.109 on Sun, 15 Jun 2014 22:01:53 PMAll use subject to JSTOR Terms and Conditions