126
De la Lexicologie à la Lexicographie / From Lexicology to Lexicography Francine Melka & M. Celeste Augusto (eds.) Utrecht, juin / june 2002 Utrecht University Utrecht Institute of Linguistics OTS Trans 10 3512 JK Utrecht Phone: +31-(0)30-253 6006 Fax: +31-(0)30-253 6000 Email: [email protected]

De la Lexicologie à la Lexicographie

  • Upload
    dophuc

  • View
    259

  • Download
    8

Embed Size (px)

Citation preview

Page 1: De la Lexicologie à la Lexicographie

De la Lexicologie à la Lexicographie / From Lexicology to Lexicography

Francine Melka & M. Celeste Augusto (eds.)

Utrecht, juin / june 2002

Utrecht University Utrecht Institute of Linguistics OTS Trans 10 3512 JK Utrecht Phone: +31-(0)30-253 6006 Fax: +31-(0)30-253 6000 Email: [email protected]

Page 2: De la Lexicologie à la Lexicographie
Page 3: De la Lexicologie à la Lexicographie

De la Lexicologie à la Lexicographie / From Lexicology to Lexicography

Francine Melka & M. Celeste Augusto (eds.)

Table des matières / Table of content Francine Melka & M. Celeste Augusto

Préface 4 Introduction 7

Pierre Corbin Lexicographie et linguistique : une articulation difficile. L'exemple du domaine français 9

Maria Fernanda Bacelar do Nascimento Associations lexicales: du corpus aux dictionnaires 39

Willy Martin Lexicography, Lexicology, Linking and the Hub-and-Spoke Model 55

M. Celeste Augusto Le dictionnaire comme outil d'apprentissage 73

Jan Schroten Light Verb Constructions in Bilingual Dictionaries 87

Francine Melka La création morphologique dans le dictionnaire 100

Liste des auteurs / Authors list 126

Page 4: De la Lexicologie à la Lexicographie

De la Lexicologie à la Lexicographie

Préface (Départements de langues française et portugaise/UiL-OTS Université d’Utrecht) C’est à l’Université d’Utrecht que s’est tenu, le 18 juin 1999, le colloque intitulé « De la lexicologie à la lexicographie » et dont nous vous présentons ici six contributions. Cette journée d’études et d’échanges a été organisée par les départements de Français et de Portugais de l’Université d’Utrecht et a été rendue possible grâce à l’appui financier de l’Institut Camões de Lisbonne et de l’Institut de Recherche de Linguistique, UiL-OTS, de l’Université d’Utrecht. Les buts de ce colloque étaient d’examiner dans quelle mesure les deux notions de « lexicologie » et de « lexicographie » s’appuient l’une sur l’autre, s’utilisent mutuellement, se soutiennent, chacune avec ses idiosyncrasies, et aussi de revoir nos idées conventionnellement admises que la lexicologie s’élève au rang de science alors que la lexicographie n’est qu’un « bricolage » plus ou moins réussi. Ce projet reflète une longue collaboration des départements de portugais, de français et d’espagnol de l’Université d’Utrecht, tant du point de vue de la recherche que de celui de l’enseignement : diverses publications communes, séminaire commun, collaboration à et rédaction de dictionnaires bilingues (Espagnol/Néerlandais et Néerlandais/Espagnol, Français/Néerlandais et Néerlandais/Français). Last but not least, l’entreprise la plus récente, commencée en 1998 et qui s’achèvera en 2003, concerne le projet de dictionnaire bilingue Portugais/Néerlandais, Néerlandais/Portugais, dirigé par M. Celeste Augusto. Ce projet, qui touche à sa fin, met en pratique l’utilisation d’un instrument manipulateur permettant la réversibilité des bases de données dans l’élaboration de dictionnaires bilingues (voir la contribution de Willy Martin dans ce même volume). Les contributions réunies dans ce volume discutent divers aspects des rapports entre la lexicologie et la lexicographie en général et plus particulièrement en français, en portugais, en anglais et en espagnol. La première contribution, celle de Pierre Corbin, « Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français », s’inscrit, comme son titre l’indique, dans un cadre de production de dictionnaires français monolingues et examine les apports réels et potentiels de la linguistique à la lexicographie ; les apports de la lexicographie à la lexicologie ne seront pas envisagés ici, bien qu’une telle étude ne soit pas dépourvue d’intérêt. L’auteur, qui s’occupe de la formation de lexicographes dans le cadre du D.E.S.S. de lexicographie à Lille, et cela depuis de nombreuses années, déplore que les tensions entre les deux disciplines ne soient pas toujours positives et invoquent des raisons principalement économiques et techniques : le « rentabilisme » ne laisse que peu de place à la créativité et à l’innovation. Puis, Pierre Corbin analyse en détails le rôle que la lexicologie pourrait avoir dans le domaine de la lexicographie ; il

Page 5: De la Lexicologie à la Lexicographie

décrit, entre autres, les apports potentiels de la sémantique lexicale (à la Wierzbicka) à la définition lexicographique. Dans la deuxième contribution, «Associations lexicales : du corpus aux dictionnaires », Fernanda Bacelar do Nascimento nous propose une nouvelle façon d’envisager la lexicographie portugaise en utilisant des bases de données électroniques. L’auteur donne une série d’exemples, dans laquelle elle montre comment les informations sont collectées et vérifiées. Cette façon nouvelle d’envisager la production des dictionnaires portugais monolingues ouvre la porte à toutes sortes de possibilités. Willy Martin, dans la troisième contribution, «Lexicology, Lexicography, Linking and the Hub-and-Spoke Model», décrit le modèle « Hub-and-Spoke » utilisé pour la fabrication de dictionnaires bilingues et qui est notamment à la base du dictionnaire bilingue portugais-néerlandais et néerlandais-portugais, en cours de confection à Utrecht et dont il a été question plus haut. L’essentiel de ce modèle consiste à rendre l’un des volumes du dictionnaire bilingue profitable à l’autre volume. Dans ce modèle, les concepts sont organisés de telle façon que leurs expressions lexicales dans les diverses langues peuvent être facilement retrouvées et contrôlées. Ainsi les deux volumes du dictionnaire bilingue sont-ils préparés de manière uniforme et cohérente : ce modèle permet d’éviter les oublis et surtout les disparités entre les deux volumes et il offre en plus une information claire et systématique. La quatrième contribution, « Le dictionnaire comme outil d’apprentissage » de M.Celeste Augusto, montre que le traitement lexicographique de l’information contextuelle en ce qui concerne les items lexicaux pourrait aider l’apprenant d’une Langue 1 ou 2. L’auteur insiste sur la nécessité et les avantages de baser toutes les descriptions lexicographiques sur des notions lexicales appropriées, ceci pouvant s’appliquer aussi bien à la production de dictionnaires monolingues qu’à celle des dictionnaires bilingues. Concrètement, l’auteur analyse un certain nombre d’entrées choisies dans des dictionnaires portugais monolingues et aussi dans le dictionnaire néerlandais-portugais en cours d’élaboration, dans lequel l’emploi des segments contextualisés est fréquent. La cinquième contribution, «Light Verb Constructions in Bilingual Dictionaries», porte sur les collocations, c’est-à-dire les expressions composées d’un verbe-support et d’un nom complément d’objet direct. L’auteur, Jan Schroten, discute leur traitement dans les dictionnaires monolingues et bilingues espagnols, anglais et néerlandais. A la question de savoir quel verbe-support est suivi de quel nom dans quelle langue, la réponse n’est pas aisée à trouver dans les dictionnaires. On ne peut en blâmer les lexicographes, qui ont besoin pour résoudre ces problèmes de l’aide des linguistes, lexicologues et sémanticiens, qui, à leur tour, sont incapables de produire des réponses définitives. Les lexicographes doivent, donc, se contenter de solutions pragmatiques et très pratiques. Dans la sixième et dernière contribution, « La création morphologique dans le dictionnaire », Francine Melka présente les résultats d’une étude sur la

5

Page 6: De la Lexicologie à la Lexicographie

productivité morphologique en français moderne et sur l’éventuelle influence de la langue anglaise sur la structure morphologique du français actuel (formations des dérivés et des composés). La comparaison de deux éditions de dictionnaires français monolingues de 1970 et 1993, qui est le point de départ de cette étude, montre aussi que la lexicographie peut fournir des données pas forcément complètes, mais intéressantes à la lexicologie. Avant de clore cette introduction, nous voudrions remercier les instances qui nous ont permis la publication de ce volume : l’Université d’Utrecht et plus particulièrement l’Institut de Recherche de Linguistique de cette université, UiL-OTS et son secrétariat. Bova Marina Utrecht

6

Page 7: De la Lexicologie à la Lexicographie

From Lexicology to Lexicography

Introduction Francine Melka & M. Celeste Augusto

(Departments of French and Portuguese Language /UiL-OTS Utrecht University)

The workshop “De la lexicologie à la lexicographie” (“From Lexicology to Lexicography”), organized by the French and Portuguese Departments of Utrecht University, was held in Utrecht, on June 18, 1999. Six contributions to this workshop are included in this volume and are introduced here. Financial support for this workshop was given by the “Instituto Camões” of Lisbon, and by the Utrecht Institute of Linguistics OTS. The six contributions discuss how lexicology and lexicography are related and how they influence and support each other. This project is the result of a long collaboration between the Spanish, French and Portuguese Departments at Utrecht University as far as research and teaching are concerned (diverse publications, collaboration in bilingual dictionaries, etc.). The last project concerns the publication of a bilingual dictionary Portuguese-Dutch and Dutch-Portuguese, which should be finished in 2003, under the direction of M. Celeste Augusto. The contributors to this volume discussed lexicographic and lexicological work on a few languages: English, Dutch, French, Portuguese and Spanish. In the first contribution, “Lexicographie et linguistique: une articulation difficile. L’exemple du domaine français”, Pierre Corbin examines which real and potential contributions linguistics brings to lexicography, in the context of French monolingual dictionaries. (The contribution of lexicography to lexicology will not be discussed here, not by lack of interest). The author, who started (and still directs) a program offering a degree of Lexicography at the University of Lille some 8 years ago, regrets that the two disciplines (lexicography and linguistics) do not support each other in a positive way. The reasons put forward are mainly economical and technical: innovation and creativity are expansive, and the making of a dictionary should be profitable. Corbin analyses also the role which lexicology could have and should have in lexicography, specially what lexical semantics could bring to the lexicographic definition. In the second contribution, “Associations lexicales: du corpus aux dictionnaires”, Fernanda Bacelar do Nascimento gives an example of a novel way of doing Portuguese lexicography, by using electronic databases. Giving some sets of examples, the author shows how Portuguese lexicographic information can be gathered and checked. In this way, new and better Portuguese monolingual (and bilingual) dictionaries can be launched in the future. In the third contribution, “Lexicography, Lexicology, Linking and the Hub-and-Spoke Model”, Willy Martin describes the Hub-and-Spoke model for the production of multilingual dictionaries, which is at the basis of the Portuguese-Dutch / Dutch-Portuguese dictionary project. The main question is how one volume of a bilingual dictionary can be made beneficial to the other volume. Using a lexicological model in which concepts are organized in a systematic fashion, their lexical expression in different languages can be worked out and checked. In this way, the two volumes of a bilingual dictionary can be prepared in

Page 8: De la Lexicologie à la Lexicographie

a uniform and coherent way. The benefits of this model are that mismatches in the two volumes are avoided, and that the information is given in a clear and systematic way. In the fourth contribution, “Le dictionnaire comme outil d’apprentissage”, M. Celeste Augusto shows how a careful treatment of contextual information on lexical items will help the language learner. She stresses the necessity of basing all lexicographic descriptions on suitable lexical notions, and points out the benefits of this approach. This method should be used in the production of both monolingual and bilingual dictionaries. In order to exemplify her aims the author analyzes some series of entries found in monolingual Portuguese dictionaries and also some entries of the Dutch-Portuguese dictionary in progress, where the benefits of frequent use of contextualized examples are shown. In the fifth contribution, “Light Verb Constructions in Bilingual Dictionaries”, Jan Schroten deals with collocations, that is, expressions composed of a direct object and a support verb. He discusses how they are treated in monolingual and bilingual Spanish, English and Dutch dictionaries. The answer to the question which support verb accompanies which direct object nouns in which language turns out to be difficult to find in dictionaries. Lexicographers are not to blame: they need the help of linguists, lexicologists and semanticists, to solve the problems. The experts, in turn, are unable to give final answers. For the time being, lexicographers have to find pragmatic and practical solutions. In the sixth contribution, “La création morphologique dans le dictionnaire”, Francine Melka presents the results of a study on morphological productivity in modern French and discusses the possible influence of English language on the morphological structure of French (items formed by derivation and composition). The comparison of two editions of a French monolingual dictionary, one published in 1970 and the other one in 1993, shows, among other things, that lexicography can also contribute to lexicology, even if the data is far from being complete. We would like to thank Utrecht University and specially UiL-OTS and its secretarial staff for making this publication possible. Utrecht Bova Marina

8

Page 9: De la Lexicologie à la Lexicographie

Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français 1

Pierre Corbin

Université Charles de Gaulle - Lille III (France) Dans le domaine français, les relations entre lexicographie et linguistique semblent aujourd’hui suffisamment distendues et, pour le futur proche, compromises pour que leur problématique puisse apparaître actuellement presque comme une question d’école, sans réelle portée pratique ni perspectives évidentes d’évolution à court terme, pour des raisons qui seront exposées. Cet état de fait n’interdit pas, cependant, de continuer à réfléchir de façon prospective à ce que pourraient être des relations interactives plus satisfaisantes entre les deux domaines. C’est ce à quoi s’emploiera cette contribution, qui s’inscrit dans un triple contexte : – celui d’un débat international qui s’est développé dans le courant des années quatre-vingt, autour notamment de la formation des lexicographes et de la place qu’il convient de faire à la linguistique au sein de celle-ci 2 ; – celui d’une série de textes que j’ai publiés, seul ou avec Danielle Corbin, soit sur cette question 3, soit sur l’état du marché dictionnairique français 4, et qui développent certains des points qui ne seront qu’effleurés ici ; – celui d’une dizaine d’années d’expérience lilloise de formation de lexicographes dans le cadre du Diplôme Européen de Lexicographie, devenu en 1999 le D.E.S.S. “Lexicographie et Terminographie”, lui-même redéployé en DESS “Lexicographie, Terminographie et Traitement automatique de corpus” à partir de la rentrée universitaire 2002 5. Il ne sera question ici que de lexicographie générale monolingue et, conformément à une pratique très commune dont la Journée d’étude dans laquelle s’inscrit cette contribution (cf. supra n. 1) fournit une nouvelle occurrence, que des apports réels ou potentiels de la linguistique à la lexicographie : sans doute

1 Toute ma reconnaissance va à Francine Melka, qui, alors qu’il ne m’était pas possible de le prononcer moi-même, eut l’obligeance de lire de façon impromptue, lors de la Journée d’étude « De la lexicologie à la lexicographie » du 18 juin 1999 à l’Université d’Utrecht, le texte de la communication de laquelle procède le présent article, qu’elle eut encore la patience d’attendre bien longuement. Durant toute cette période, mon épouse Danielle était malade, et elle est décédée peu avant que je n’achève la version prédéfinitive du présent texte, qui se ressent nécessairement du contexte particulier de son élaboration, mais que j’ai eu à cœur de permettre à Francine Melka d’éditer quand même, en remerciement pour son soutien plein d’humanité. Merci aussi à mon fils François d’avoir pris le relais de sa mère comme relecteur privilégié. 2 Dans l’ordre chronologique, les contributions les plus marquantes sont celles de Gates (1979), Sinclair (1984), Ilson ed. (1986) – qui inclut notamment Gates (1986), Hartmann (1986), Hausmann (1986) et Rey (1986) –, Gates (1989), Landau (1989), Battenburg (1991), Frawley ed. (1993) – qui inclut notamment Atkins (1993) et Zgusta (1993) –, Pascual Ferrando (1994). 3 Dans l’ordre chronologique, P. Corbin (1984), Cabré Castellví (1994), P. Corbin (1995). 4 P. Corbin (1985, 1991 et 1998). 5 On trouvera toutes les informations concernant cette formation sur le site Web de l’Université Charles de Gaulle - Lille III (http://www.univ-lille3.fr/www/Recherche/silex/index.html).

Page 10: De la Lexicologie à la Lexicographie

Pierre Corbin

faut-il voir dans cette orientation coutumière de la connexion entre les deux disciplines le cheminement qui est supposé mener de la théorie à la pratique, ou de la science à la technique6. L’exposé s’articulera en trois moments. Le premier donnera la mesure de l’actuelle désaffection de la lexicographie française pour la linguistique au regard de l’intérêt qu’elle lui porta naguère. Seront ensuite circonscrites les conditions dans lesquelles la lexicographie pourrait légitimement faire appel à la linguistique, puis examinées les potentialités d’apport de celle-ci à la lexicographie. 1. Splendeur et déshérence de l’usage de la linguistique dans la lexicographie générale monolingue française contemporaine Cela fait plus de quinze ans qu’il n’est pas paru en France de dictionnaire général monolingue qui donne une forme lexicographique consistante à des contributions descriptives et/ou théoriques émanant du champ de la linguistique 7. Cette récession venant après deux décennies durant lesquelles la linguistique avait abondamment investi la production dictionnairique nationale, la réaction première peut être de déplorer ce nouvel état de fait, et l’analyse de l’évolution des conditions économiques, technologiques, humaines et culturelles de production des dictionnaires concomitante à ce changement de cap éditorial ne peut que conforter le sentiment que celui-ci constitue une régression. L’interprétation de ce phénomène à la lumière de facteurs uniquement externes risque cependant d’avoir un caractère réducteur : dans la longue histoire de la lexicographie française, ces quelques années de flambée linguistique pourraient aussi être considérées comme une parenthèse conjoncturelle dans une tradition pratique qui a constitué de façon autonome ses canons d’approche utilitaire du lexique, surtout si l’on s’accordait à

6 Pour autant, il ne serait dépourvu ni d’intérêt ni de pertinence d’envisager les relations entre les deux disciplines en inversant leur orientation. Il y aurait en effet à dire sur les rapports inégalement experts que les linguistes entretiennent (ou n’entretiennent pas) avec les dictionnaires en tant que sources documentaires, et qui s’échelonnent entre l’ignorance et l’excès de confiance : – à l’un des pôles, on trouverait des travaux, dont l’inventaire reste à établir, qui, aussi étonnant que cela puisse paraître, traitent de matières lexicales sans s’appuyer sur une consultation significative des dictionnaires ; – l’autre pôle regrouperait des études qui, pour diverses raisons, sont indexées trop étroitement sur les données fournies par tel dictionnaire particulier, et qui, de ce fait, identifient ainsi de façon hasardeuse le lexique français à cette représentation dictionnairique spécifique ; on peut songer ici, en première analyse, à Dubois (1962) ou, à un moindre degré, à Zwanenburg (1983) : le premier appuie sa description de l’évolution de la suffixation en français de 1900 à 1961 (p. 8) sur la comparaison des éditions de 1906 et 1961 du Petit Larousse (p. 10) ; le second étudie la préfixation des suffixes « savants » et « non savants » dans les noms en -age, -ment et -ion à partir de la nomenclature du Dictionnaire du français contemporain en assumant les inconvénients de sa démarche, qu’il s’efforce de pondérer par des incursions ponctuelles dans d’autres recueils (pp. 7-8). D’autres exemples pourraient être évoqués. 7 La chronologie prise en compte n’envisage, pour les dictionnaires multivolumes à parution échelonnée, que la date de mise sur le marché du premier volume : par exemple, pour le Trésor de la langue française, 1971 (et non 1994, date de parution du dernier volume).

10

Page 11: De la Lexicologie à la Lexicographie

Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français

reconnaître que tout n’était pas impérissable dans les “apports” de nos expérimentations de lexicographie linguistique. Le dossier est donc complexe, et on ne l’épuisera pas ici : il intéresse conjointement l’histoire de la lexicographie, de la linguistique, de la didactique et de l’édition. Je m’en tiendrai à un premier cadrage factuel, assorti de quelques pistes interprétatives. 1.1. Panorama de la lexicographie générale monolingue française contemporaine d’inspiration linguistique Un nombre relativement important de dictionnaires français monolingues notoires de l’après-guerre portent la trace de la pénétration, sous diverses formes, de la linguistique contemporaine dans la pratique lexicographique. En gros, l’arrivée de ces dictionnaires sur le marché s’échelonne sur une petite vingtaine d’années, du milieu des années soixante au début des années quatre-vingt, ce qui coïncide avec l’essor de la linguistique comme discipline académique et avec sa diffusion dans le domaine de la didactique. On peut, par commodité, les présenter groupés en deux ensembles : – les dictionnaires Larousse de Jean Dubois et de sa mouvance ; – les autres dictionnaires. 1.1.1. Les dictionnaires Larousse de Jean Dubois et de sa mouvance – Le coup d’envoi, qui est aussi le point de départ d’une série de dictionnaires Larousse français et anglais dont Jean Dubois est le pivot et qui mobilisent de façon récurrente un petit ensemble de rédacteurs, est donné en 1966 par le Dictionnaire du français contemporain 8, destiné à l’enseignement du français à un niveau avancé et comme tel restreint à 25 000 « termes » 9, dont la démultiplication des adresses homomorphes et les regroupements en blocs-articles de mots apparentés par leur structure morphologique et leurs propriétés sémantiques et syntaxiques témoignent d’influences distributionnelles (intérêt

8 Rédaction : Jean Dubois, René Lagane, Georges Niobey, Didier Casalis, Jacqueline Casalis, Henri Meschonnic. 9 « Avant-propos », p. III. La réédition augmentée de 1980 (Dictionnaire du français contemporain illustré) fera monter la nomenclature à « 33 000 mots » (« Avant-propos », p. V).

11

Page 12: De la Lexicologie à la Lexicographie

Pierre Corbin

marqué pour les contraintes rectionnelles 10) et transformationnelles (conception des faits d’affixation comme matérialisant des relations entre phrases 11) 12. – En 1975, le Lexis 13, dictionnaire de référence de grande envergure (« plus de 70 000 termes » 14), se voit appliquer les mêmes principes distributionnels 15 et transformationnels 16, ce qui ne va pas sans paradoxe concernant le mode de structuration de la nomenclature adopté pour un dictionnaire de cette nature 17. – Deux ans plus tard, la mise en œuvre de principes comparables débouche sur la publication d’un dictionnaire d’apprentissage initial du français, le Larousse de base (1977) 18, qui reprend la maquette d’un Dictionnaire d’anglais. Niveau 1 paru en 1975 19, et dont les « 2 581 mots » fondamentaux permettent d’accéder à un lexique de « 7 700 termes » 20 par le moyen de relations transformationnelles

10 À titre d’exemple, les deux blocs-articles associés à la forme verbale déporter donnent un aperçu des effets de l’application des options adoptées dans ce dictionnaire : – le premier bloc regroupe l’adresse verbale déporter, suivie d’un nom de personne, dans l’acception politique de cet item (« Déporter quelqu’un, l’emmener de force hors de sa résidence pour des raisons politiques (souvent au passif) : Des millions de personnes ont été déportées par les régimes totalitaires dans des camps de concentration. ») et les adresses nominales déportation et déporté, e ; – le deuxième bloc regroupe l’adresse verbale déporter, avec un sujet ’non humain’, dans l’acception physique de cet item (« (sujet nom de chose) Déporter quelque chose, quelqu’un, le déplacer, le faire dévier de sa trajectoire : Un avion déporté par un fort vent latéral. Le choc a déporté la voiture dans le virage. ») et l’adresse nominale déportement. 11 « Les possibilités qu’offrent les systèmes de suffixation et de préfixation pour passer d’une construction de phrase à une autre construction, d’un verbe à un substantif, d’un substantif à un adjectif, etc., ont été mises en évidence dans cet ouvrage par des regroupements autour des termes de base ; » (« Avant-propos », p. III). L’annexe « Suffixes et préfixes » (pp. XIX-XXII) décline et exemplifie une sélection de paradigmes transformationnels de cet ordre. 12 Les principes linguistiques mis en application dans le Dictionnaire du français contemporain et la généalogie de dictionnaires qu’il ouvre sont ceux dont la théorie s’expose de 1965 à 1971, chez le même éditeur (Larousse), dans les grammaires françaises et anglaises de Jean Dubois et de Françoise Dubois-Charlier, qui adaptent certains apports du structuralisme et la mouture transformationnelle du modèle génératif (Dubois 1965, 1967 et 1969, Dubois & Dubois-Charlier 1970, Dubois-Charlier 1970 et 1971). 13 Direction : Jean Dubois ; rédaction : Jean-Pierre Mével, Geneviève Chauveau, Sylvie Hudelot, Claude Sobotka-Kannas, Dorine Morel. 14 « Préface », p. VII. 15 Le traitement de la forme verbale déporter et des mots apparentés se fait selon des modalités similaires à celles observées dans le Dictionnaire du français contemporain (cf. supra n. 10). 16 Cette fois, c’est l’article « Dérivation » (pp. XXXIX-XLII) du « Dictionnaire grammatical » inséré en annexe (pp. XIII-LXXI) qui accueille une sélection amplifiée de « transformations » affixales dérivées de celles du Dictionnaire du français contemporain. 17 Sur le caractère surprenant du choix d’appliquer à un dictionnaire de consultation étoffé un dispositif d’adressage que les perturbations de l’ordre alphabétique qu’il induit qualifient davantage pour un dictionnaire d’apprentissage comme le Dictionnaire du français contemporain, cf. P. Corbin (1998, n. 32). 18 Direction : Jean Dubois, avec la collaboration de Françoise Dubois-Charlier ; rédaction : Christine Eyrolles, Sylvie Hudelot, Danielle Leeman, Jean-Pierre Mével, Claude Sobotka-Kannas. 19 Rédaction : Françoise Dubois-Charlier, Jacqueline Blériot, Éliane Koskas. 20 « Préface », p. III.

12

Page 13: De la Lexicologie à la Lexicographie

Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français

intégrées dans la rubrique « commentaire lexical » (codée « L. » 21) 22. Enrichi de dessins humoristiques imprégnés de stéréotypes culturels 23, ce dictionnaire est republié en 1978 sans changements significatifs sous le titre Dictionnaire du français langue étrangère. Niveau 1 24, et relayé en 1979 par un Niveau 2, élaboré selon les mêmes principes et qui fait état d’« environ 10 000 termes » distribués sur « 5 000 entrées » 25. 26 – Dans la mouvance des dictionnaires de Jean Dubois, on peut encore évoquer deux réalisations lexicographiques éditées par Larousse durant les années soixante-dix : • le Grand Larousse de la langue française en 7 volumes (1971-1978) 27,

dictionnaire “de langue” de référence de l’éditeur, dont le texte proprement lexicographique est de facture conventionnelle, mais dont le paratexte inclut un abondant traité « De la formation des unités lexicales » (pp. IX-LXXXI) dû à Louis Guilbert 28, qui, dans sa partie synchronique (pp. XXXII-LXXXI), donne son plein développement au traitement transformationnel de la formation de mots construits 29 ;

21 « Préface », p. IV. 22 Exemple : « L. maternel, elle (adj.) L’amour d’une mère pour son enfant → l’amour maternel. » (s.v. mère). 23 Cf. P. Corbin (1985, § 1., nn. 12-14). 24 Sur le changement d’affichage matérialisé par cette renomination, cf. P. Corbin (1985, § 1.). 25 « Préface », p. IX. 26 L’équivalent du Niveau 2 pour l’anglais paraît l’année suivante (1980), sous le titre Dictionnaire de l’anglais contemporain. Direction : Françoise Dubois-Charlier ; rédaction : Françoise Dubois-Charlier, Richard Wakely, Jacqueline Blériot, avec la collaboration de David Jones, Jacques Durand, James Thorne, George Blue. La nomenclature de ce dictionnaire est de « 15 000 mots anglais » (« Préface », p. V). 27 Direction : Louis Guilbert, René Lagane, Georges Niobey, avec le concours d’Henri Bonnard, Louis Casati, Alain Lerond. 28 Écho lointain au « Traité de la formation de la langue française » qui précédait, au tournant du XXe siècle, le Dictionnaire général de la langue française d’Hatzfeld, Darmesteter & Thomas (1890-1900). 29 L’extrait ci-dessous, qui concerne la formation de noms sur bases nominales au moyen du suffixe -iste, permet de se construire une représentation de ce modèle de formation des mots construits et de prendre la mesure de son caractère largement contre-intuitif :

« I. G. LA RELATION NOM → NOM 1. G. 1. Nom → nom d’animé ou de non-animé. Si le terme de base de la transformation est un nom de non-animé, et le résultat de cette transformation un nom d’animé, la transformation implique une phrase sous-jacente qui rend compte du passage de la classe des non-animés à la classe des animés. Cette phrase de base est de forme factitive : le N (= animé) fait que le N (= objet non animé) est. La séquence le N fait que rend compte de la catégorie “animé”, et la séquence que le N (non-animé) est, de la relation établie entre le non-animé et l’animé : Il fait que le chapeau est → le chapelier. [...] 1. G. 1. 3. DERIVATION PAR LE SUFFIXE -iste. La transformation est réalisée à partir de la même phrase sous-jacente : Il fait que le piano est (fonctionne) → le pianiste. Il fait que la grève est → le gréviste. Les termes résultant de la transformation peuvent fonctionner syntaxiquement comme noms et comme adjectifs (il est affichiste) :

13

Page 14: De la Lexicologie à la Lexicographie

Pierre Corbin

• et le Nouveau Larousse des débutants (1977) 30, dictionnaire d’« environ 16 000 mots » 31 qui propose aux élèves de l’école élémentaire une version adoucie des principes de regroupement d’adresses en blocs-articles inaugurés dans le Dictionnaire du français contemporain.

1.1.2. Autres dictionnaires En dehors de cette famille étendue de dictionnaires Larousse, trois ouvrages méritent encore d’être mentionnés au titre d’imprégnations diverses par des théories linguistiques : – le Trésor de la langue française, grand dictionnaire de corpus piloté par le C.N.R.S. et couvrant deux siècles de documentation textuelle à forte dominante littéraire, qui, au fil des articles de ses 16 volumes parus entre 1971 et 1994, porte la trace d’influences linguistiques composites, notamment dans ceux qui sont consacrés à des mots grammaticaux, où la marque de Robert Martin se fait particulièrement sentir 32 ; – le Robert méthodique (1982), conçu par Josette Rey-Debove pour l’enseignement du français à un niveau avancé (comme le Dictionnaire du français contemporain), et qui présente la particularité d’associer à sa nomenclature de « 34 290 mots » les « 1 730 éléments » de formation des mots construits qui y figurent 33, isolés selon une méthodologie de segmentation qui se réclame des principes distributionnels d’Eugene Nida 34 ;

anesthésie → anesthésiste bagage → bagagiste congrès → congressiste dent → dentiste essai → essayiste finale → finaliste garage → garagiste.

Le syntagme verbal le N est peut représenter des réalisations diverses : bagagiste = “que les bagages sont transportés” ; congressiste = “que le congrès a lieu” ; dentiste = “que la dent est soignée” » (p. XL).

Pour un commentaire interprétatif et critique approfondi de cette conception du lexique construit, cf. D. Corbin (à paraître, chap.1, § 3.2.2.1.). 30 Direction : René Lagane ; rédaction : Jean-Pierre Mével, Micheline Daumas, Christine Eyrolles. 31 « Préface », p. IV. 32 Le début de l’article consacré à l’article défini le, la, les suffit à mettre en évidence la technicité des caractérisations du fonctionnement sémantique des mots à sens instructionnel (cf. infra n. 56) qui constitue en ce domaine l’originalité du Trésor de la langue française par rapport à l’ensemble de la production dictionnairique contemporaine :

« I. – Emplois spécifiques. [Le locuteur présume que le contenu du subst. suffit à l’interlocuteur pour identifier ce dont il s’agit ; le subst. qui suit a un référent repérable par rapport à un savoir donné, par rapport à l’espace construit par le discours ou par rapport à la situation énonciative] »

33 « Présentation », p. VII. 34 « Cette description du lexique se veut structurale, distributionnelle et morphologique ; elle espère retrouver dans le vocabulaire actuel toutes les régularités qui permettent de l’expliciter et de le mémoriser.

14

Page 15: De la Lexicologie à la Lexicographie

Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français

– le Grand dictionnaire encyclopédique Larousse (1982-1985), dictionnaire “encyclopédique” de référence (15 volumes et 191 147 articles) dirigé par Claude Dubois, qui présente l’originalité, inattendue pour un dictionnaire de ce type, d’adapter, par le relais de Jean Dubois, les descriptions des rections verbales produites par le Laboratoire d’Automatique Documentaire et Linguistique (L.A.D.L.) de Maurice Gross 35. Jusqu’à nouvel ordre, cet ouvrage est le dernier dictionnaire général monolingue français publié à mettre à profit avec systématicité des savoirs élaborés dans le champ de la linguistique.

Il faut remarquer que, d’une façon générale – c’est-à-dire à l’exception du Grand dictionnaire encyclopédique Larousse –, l’utilisation d’apports de théories et de descriptions linguistiques contemporaines dans les dictionnaires répertoriés ne se fait pas sur la base d’une collaboration paritaire entre des lexicographes et des linguistes, mais que les maîtres d’œuvre sont des linguistes, qu’il s’agisse d’universitaires passés à la lexicographie comme Jean Dubois et Louis Guilbert chez Larousse, ou Paul Imbs et Bernard Quemada pour le Trésor de la langue française, ou bien d’une lexicographe devenue docteur en linguistique, ce qui est le cas de Josette Rey-Debove chez Robert. Ceci n’est pas sans signification pour la désimplication de la linguistique dans la production dictionnairique ultérieure, en raison du fait que cet ensemble remarquable d’ouvrages parus sur une durée assez courte apparaît comme le produit de l’action volontariste d’individualités fortes qui ont exploité lexicographiquement certaines conceptions et pratiques linguistiques, et non comme la résultante d’une coopération institutionnalisée entre deux corporations, dont la tradition n’existe pas en France : même dans le cas du Grand dictionnaire encyclopédique Larousse, la collaboration avec des linguistes du L.A.D.L. passe par la médiation de Jean Dubois.

Le principe adopté est celui du linguiste Eugene Nida* : pour un lexique quantitativement déterminé (ici 34 290 mots), on recherche les mots qui ont des morphèmes liés communs, chaque morphème devant figurer dans deux mots au moins avec un entourage différent (par ex. USU- est dégagé de USUFRUIT et USUFRUCTAIRE, non de USUFRUIT et USUFRUITIER). Par ailleurs, on ne peut identifier un morphème que si les “restes” sont également des morphèmes (par ex. USU- est repéré parce que FRUCT- et -AIRE existent chacun dans deux mots au moins). -------- * Eugene NIDA, Morphology. The Descriptive Analysis of Words, 1946. » (« Note sur les fondements théoriques et la méthode », p. XVI) 35 Quatre membres de ce laboratoire (Maurice Gross, Jean-Paul Boons, Alain Guillet et Christian Leclère) sont crédités dans la liste des « Principaux collaborateurs » (pp. XXXVI-XLVII). Le traitement du verbe souhaiter est représentatif du dispositif descriptif adopté :

« SOUHAITER v. t. (lat. pop. *subtushaitare, du lat. class. subtus, sous, et du frq. *haitan, ordonner, promettre) [conj. 4]. 1. Souhaiter qqch, souhaiter + inf., que + subj., désirer qqch, en former le vœu, le souhait : Je souhaite pouvoir vous aider, que tout aille bien. Souhaiter la fin de la guerre. — 2. Souhaiter qqch, de + inf. à qqn, le désirer, l’espérer pour lui, en former le vœu, à son intention : Je vous souhaite bien du bonheur. Je leur souhaite de réussir. — 3. S’emploie dans des formules de politesse, de présentation de vœux : Je vous souhaite une bonne nuit. Souhaiter la bonne année à ses amis, la bienvenue à des visiteurs. — 4. Souhaiter sa fête, son anniversaire à qqn, lui témoigner de la sympathie à l’occasion de sa fête, de son anniversaire. — 5. Je lui en souhaite, je lui (vous, etc.) souhaite bien du plaisir, vœu ironique à l’adresse de qqn qui s’expose à des ennuis (fam.). »

15

Page 16: De la Lexicologie à la Lexicographie

Pierre Corbin

Le tableau qui précède ne serait cependant pas complet sans la mention d’un frémissement actuel sous la forme (informatisée) de l’élaboration en cours du Dictionnaire d’apprentissage du français langue étrangère et seconde (DAFLES) coordonné par Jean Binon, Serge Verlinde & Thierry Selva 36, qui reprend les principes d’un dictionnaire spécialisé, le Dictionnaire d’apprentissage du français des affaires (DAFA), réalisé précédemment (2000) par la même équipe selon des principes comparables, et qui adapte sous une forme accessible les fonctions lexicales mel’čukiennes. Il ne semble pas complètement fortuit que cette réactualisation de l’injection de linguistique dans un produit dictionnairique ressortissant à la lexicographie générale soit le fait d’universitaires extrahexagonaux (ils sont enseignants à l’université de Leuven) impliqués dans des pratiques de didactique des langues, et non d’entreprises lexicographiques privées nationales à but lucratif37.

1.2. Quelques éléments d’explication de la désaffection actuelle de la lexicographie française monolingue pour la linguistique Plusieurs facteurs, d’importance variable mais dont les effets convergent, peuvent être invoqués à la fois comme indices et comme causes du coup d’arrêt donné aux ouvertures des décennies précédentes et de la désaffection pour la linguistique qu’on peut observer actuellement dans la lexicographie monolingue française : 1.2.1. Facteurs économiques Les dictionnaires coûtent cher à produire, et leur rentabilité est à la fois incertaine et, en tout état de cause, inférieure à celle d’autres secteurs de l’édition (par exemple la littérature générale). Ces risques inhérents à l’édition dictionnairique ont fragilisé, au début des années quatre-vingt, les maisons familiales qu’étaient Larousse et Robert, et précipité leur rachat par un grand groupe éditorial, le Groupe de la Cité 38. Ce groupe, après avoir été absorbé par Havas en 1997, est lui-même passé, en 1998, sous le contrôle du nouveau groupe Vivendi (ex-Générale des Eaux), géant mondial de la distribution d’eau 39 redéployé dans la communication 40. La date de la disparition de Larousse et de Robert en tant qu’entreprises indépendantes (autour de 1985) 41 coïncide avec celle de la désaffection de la lexicographie française pour la linguistique, et cette coïncidence semble tout sauf fortuite.

36 Projet consultable sur le site www.kuleuven.ac.be/alfalex. 37 Peut-être le Dictionnaire du français usuel de Jacqueline Picoche & Jean-Claude Rolland, paru en Belgique, participe-t-il aussi de ce renouveau, mais le caractère tout récent de cet ouvrage (2002) au moment où s’achève la rédaction du présent article ne m’a pas permis de mener les investigations souhaitables à son sujet. 38 Cf. P. Corbin (1991, § 1.1. et 1998, § 1.1.1.). 39 Cf. par exemple l’offre publique de vente d’actions parue dans L’Express 2499, 27 mai-2 juin 1999, pp. 60-61. 40 Cf. par exemple Challenges 145, mars 2000, p. 41, et Première 281, été 2000, pp. 21-22. 41 Cf. P. Corbin (1998, § 1.1.1.).

16

Page 17: De la Lexicologie à la Lexicographie

Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français

Désormais concentrée, pour l’essentiel, dans deux grands groupes industriels, Vivendi (pour Larousse-Bordas et Robert) et Lagardère (pour Hachette), l’édition dictionnairique française est entrée dans l’ère du rentabilisme, caractérisé par un ensemble de dispositions dont aucune ne va dans le sens de la créativité, de l’innovation et de la prise de risques : – précarisation des conditions de travail, par le développement des emplois temporaires (contrats à durée déterminée, free lance) au détriment des emplois stables 42 ; – rentabilisation de la production des ouvrages, par l’intensification de la dérivation de nouveaux dictionnaires à partir de dictionnaires existants, qui permet de diversifier les catalogues en réduisant les coûts et les délais de fabrication : la lexicographie française actuelle s’étiole dans l’accommodement des restes et le déficit de projets originaux d’envergure 43 ; – gestion standardisatrice des catalogues, par la suppression, le reformatage ou le défaut de maintenance de dictionnaires souvent innovateurs mais qui ne passent pas tous pour des succès commerciaux − la stratégie des producteurs se calquant, ici comme ailleurs, sur le comportement des acheteurs : disparition du Dictionnaire du français langue étrangère (cf. supra § 1.1.1.) et du Robert oral-écrit (1989, « environ 17 000 mots » 44), dont la nomenclature principale était constituée d’adresses transcrites dans une codification phonétique spécifique ; défaut de service de suite pour le Grand Larousse de la langue française (cf. supra § 1.1.1.), retiré du marché, et pour le Lexis (ibid.), commercialisé depuis un quart de siècle sans modifications significatives (avec les incidences que l’on imagine en matière de non-actualisation des terminologies, en informatique par exemple) ; remise en ordre alphabétique strict, dans le Dictionnaire du français au collège (1986), de la nomenclature de la refonte du Dictionnaire du français contemporain de 1980 (cf. supra § 1.1.1.) ; remplacement de l’original Petit Robert des enfants (1988, « environ 16 500 mots » 45, format 20 × 25 cm) par le Robert junior (1993, « 20 000 mots » 46, format 14,5 × 19,5 cm), plus conforme aux standards des ouvrages concurrents (Maxi-débutants Larousse (« 20 000 mots » 47), Dictionnaire Hachette juniors (« 18 500 entrées » 48), Le tour du mot Bordas (« 16 000 entrées » 49) : tous de format 14,5 × 19,5 cm) et reciblé vers les élèves des dernières classes de l’école élémentaire dans le cadre d’une évolution éditoriale d’ensemble qui a vu ensuite concurrence et standardisation se porter aussi sur le créneau plus récent des classes axées sur l’apprentissage de la lecture 50, 51.

42 Cf. P. Corbin (1998, § 1.1.1.). 43 Cf. P. Corbin (1998, § 2., notamment pp. 93 sqq.). 44 « Préface », p. XII. 45 « Préface » de l’édition sous le titre Le Robert des jeunes (1991), p. X. 46 Première et quatrième de couverture. 47 Première et quatrième de couverture de l’édition de 1991. 48 Quatrième de couverture de l’édition de 1990. 49 Quatrième de couverture de l’édition de 1988. 50 Le monopole du Mini débutants Larousse (1985, « 5 400 mots » (quatrième de couverture)), premier dictionnaire de ce type, est rompu par la parution, en 1996, du Dictionnaire Hachette

17

Page 18: De la Lexicologie à la Lexicographie

Pierre Corbin

1.2.2. Facteurs techniques Le développement de la lexicographie assistée par ordinateur et de la

commercialisation de dictionnaires sur CD-ROM et les perspectives de la lexicographie en ligne ont amené les éditeurs à concentrer une part importante de leurs efforts sur l’informatisation de dictionnaires figurant à leurs catalogues dans des versions imprimées. Divers ouvrages plus ou moins importants ont maintenant été adaptés à ce nouveau support, quelquefois dans plusieurs versions 52. Une conséquence de la mise en œuvre de ce transfert technologique est qu’il s’effectue, au moins pour un temps, au détriment de la réflexion foncière sur le contenu linguistique des dictionnaires et de l’investissement dans des projets nouveaux53. 1.2.3. Facteurs humains

La génération des linguistes-lexicographes-métalexicographes qui pendant quelques décennies ont fait la richesse et l’originalité de la lexicographie française et qui ont établi les fondements de l’analyse historique et technique des dictionnaires (Jean Dubois, Alain Rey, Josette Rey-Debove, Bernard Quemada) termine sa carrière sans être remplacée. Les lexicographes français d’aujourd’hui ne sont pas des linguistes, mais simplement des techniciens de la lexicographie, qui n’interviennent pas dans le champ de la métalexicographie. 1.2.4. Facteurs culturels La diffusion restreinte et erratique, dans le grand public, des savoirs émanant du champ de la linguistique ne paraît pas prédisposer les utilisateurs de dictionnaires, dans leur grande masse, à faire le succès commercial de répertoires trop innovants en matière de traitement linguistique du lexique (cf. infra § 2.1.), ce qui ne peut que conforter la circonspection des éditeurs en la matière (cf. supra n. 51).

benjamin (« plus de 6 000 mots » (première de couverture)), vite rejoint par le Robert benjamin (1997, « 6 000 mots » (première et quatrième de couverture)), d’apparence extérieure très similaire, et par le Petit Fleurus (1998, « plus de 5 000 mots » (quatrième de couverture)) ; cette concurrence débouche, en 1999, sur la refonte du Mini débutants, rebaptisé Dictionnaire Mini débutants (« 6 200 mots » (première et quatrième de couverture)). 51 L’évolution économique de l’édition dictionnairique caractérisée par les facteurs qui viennent d’être évoqués va de pair avec celle de l’édition savante en linguistique, qui subit elle aussi les effets des concentrations industrielles et est de plus en plus axée sur la production de manuels plutôt que d’ouvrages fondamentaux (cf. infra § 1.2.4.). 52 Par exemple pour le Petit Larousse, en compilation avec d’autres dictionnaires dans les deux éditions du Bibliorom Larousse de 1996 et 1998 (version 2.0), et commercialisé à plusieurs reprises de façon indépendante depuis 1997 (version 1.01). 53 En outre, certains professionnels décrivent comme non florissant le marché des CD-ROM, parlant même à leur propos de support dépassé, et s’interrogent sur la stratégie qu’il convient d’adopter concernant Internet, ce qui ramène aux contraintes économiques bloquant l’esprit d’innovation.

18

Page 19: De la Lexicologie à la Lexicographie

Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français

2. Circonscription raisonnée des besoins linguistiques de la lexicographie générale monolingue

L’absence actuelle d’intérêt des éditeurs de dictionnaires français pour l’utilisation lexicographique de la linguistique n’interdit nullement de tenter de circonscrire ce que pourraient être les besoins de la lexicographie en la matière. La réponse doit être modulée en fonction de la visée qui préside à l’élaboration de dictionnaires particuliers : – Plus un dictionnaire sera destiné prioritairement à servir de relais, lors de consultations ponctuelles, entre des discours (à interpréter ou à produire) et des locuteurs ayant atteint leur maturité linguistique et auxquels on peut présupposer une capacité d’inférence vis-à-vis des informations qu’ils y trouvent, ou encore à familiariser de jeunes apprenants natifs simultanément avec le lexique et avec le dictionnaire, moins le recours à la linguistique sera utile pour son élaboration, à laquelle pourvoira suffisamment le savoir-faire professionnel de lexicographes supposés rompus à des techniques rédactionnelles spécifiques 54, en principe dotés d’un sens linguistique affiné, et appuyés sur la logistique de leurs instances de production. – Par contre, plus on assignera à un dictionnaire des contraintes rigoureuses d’adéquation dans la description d’un sous-ensemble sélectionné du lexique d’une langue donnée, qu’il s’agisse de le constituer en somme de connaissances de référence sur le fonctionnement de celui-ci, ou de l’adapter aux besoins d’apprenants allophones avancés, ou encore de l’exploiter informatiquement, par exemple dans un système de traduction assistée par ordinateur, plus le recours à la linguistique deviendra nécessaire pour mobiliser des savoirs qu’il n’est plus du ressort des lexicographes d’élaborer dans le cadre de leur activité ordinaire. Je développerai successivement ces deux points, dans la continuité de P. Corbin (1995, § 2.2.2.) et (1998, § 4.), mais en prenant appui sur des données largement nouvelles. 2.1. Limites de l’usage de la linguistique en lexicographie monolingue Ce n’est pas un hasard si l’essentiel de la production dictionnairique française actuelle s’inscrit dans la tradition d’empirisme artisanal (nonobstant l’évolution des conditions de production) qui fonda la lexicographie comme pratique destinée à rendre des services pratiques. Chacun, en effet, semble y trouver son compte : les éditeurs privés, que leurs intérêts bien compris, dans une économie de marché, n’incitent pas à investir inconsidérément dans des projets hasardés et gourmands en temps d’élaboration et en surface imprimée qui s’écarteraient trop des routines éprouvées ; mais aussi sans doute la grande masse des utilisateurs, qu’on peut supposer à la fois non disposés, sauf motivations très spécifiques, à surmonter les 54 Dans l’hypothèse, bien sûr, où ces qualités traditionnelles n’auraient pas été entamées d’une part par l’évolution des conditions de travail qui fait la part belle au recrutement d’équipes de rédacteurs temporaires au détriment de l’enracinement dans la culture rédactionnelle des entreprises spécialisées (cf. supra § 1.2.1.), d’autre part par l’extension de la pratique de dérivation d’ouvrages évoquée précédemment (ibid.), qui tend à donner le pas à la technique du couper-coller sur la pratique de la rédaction d’articles.

19

Page 20: De la Lexicologie à la Lexicographie

Pierre Corbin

difficultés d’accessibilité des informations qu’induiraient des productions dictionnairiques rompant avec les dispositifs les plus habituels (cf. supra § 1.2.4.), et plus ou moins accoutumés à composer avec les approximations et incomplétudes de ceux-ci (cf. infra § 2.1.3. et 2.1.4.) – sinon, pourquoi le genre s’en perpétuerait-il ? La substance même de ces dictionnaires conventionnels porte donc témoignage de ce que la lexicographie monolingue peut proposer aux utilisateurs sans avoir recours aux “sciences” du langage, lesquelles d’ailleurs ne sont pas sur tous les points dépositaires d’alternatives convaincantes. Apprécier la mesure dans laquelle cette option est pertinente revient donc à évaluer le potentiel d’utilité pratique des dictionnaires ainsi produits. En première analyse, on peut soutenir que les secteurs de la praxis dictionnairique dans lesquels elle semble le plus légitime sont la catégorisation, le traitement de la prononciation, les définitions, les contextualisations, les marques de registres et de domaines, et l’ordre des acceptions et des expressions complexes. 2.1.1. La catégorisation La catégorisation des unités répertoriées peut et doit se limiter au métalangage le plus communément en vigueur, même si du champ de la linguistique émanent d’une part des arguments qui établissent son inadéquation partielle, et d’autre part des alternatives tant classificatoires que terminologiques. Ce constituant basique des articles de dictionnaires, déterminant pour l’identification des items représentés par les adresses, est soumis à des pesanteurs culturelles qui ne permettent que des évolutions lentes : si, comme c’est souvent le cas, un dictionnaire est destiné à un éventail ouvert de générations, sa terminologie catégorielle aura de bonnes chances d’être indexée sur le formulaire scolaire en vigueur deux ou trois décennies plus tôt. 2.1.2. Le traitement de la prononciation Concernant la transcription de la prononciation des items-adresses, le recours à l’Alphabet Phonétique International (A.P.I.) qui s’est installé puis généralisé dans les quatre dernières décennies 55 – pour autant qu’on le considère comme un apport de la linguistique –, s’il constitue désormais un impératif auquel aucun éditeur n’envisagerait de se soustraire, n’en reste pas moins pour nombre d’utilisateurs des dictionnaires un code dont la maîtrise ne va pas de soi : l’échec commercial du Robert oral-écrit, qui utilisait un système de transcription adapté de l’A.P.I. (cf. supra § 1.2.1.), en est un indice, et il est des lexicographes notoires pour considérer que les systèmes de transcription ancestraux bricolés à partir de l’alphabet ordinaire atteignaient probablement mieux leur objectif, ce que corrobore la présence courante dans les dictionnaires monolingues français d’un tableau aidant à décoder les signes de l’A.P.I. à partir de la graphie de mots donnés en exemples dont la prononciation est supposée connue des utilisateurs.

55 Premiers dictionnaires français monolingues à l’utiliser de façon systématique : le Dictionnaire du français contemporain en 1966 et le Petit Robert en 1967.

20

Page 21: De la Lexicologie à la Lexicographie

Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français

2.1.3. Les définitions Le traitement définitionnel du sens et, le cas échéant, de la référence des items lexicaux à sens descriptif 56, qui joue un rôle essentiel dans l’organisation de la grande masse des articles de la majorité des dictionnaires généraux monolingues, peut remplir sa fonction pratique de différentes manières, sans être nécessairement soumis à des contraintes de rigueur sémantique extrême. S’il est raisonnable de faire, avec Wierzbicka (1985), l’hypothèse que la maîtrise active des unités lexicales à sens descriptif suppose celle de la structure des concepts correspondants 57, on peut, pour les consultations de dictionnaires qui n’ont pas pour finalité la stabilisation durable de savoirs lexicaux (au premier rang desquelles celles qui sont faites au titre de la compréhension d’énoncés), se satisfaire de moindres exigences et s’accommoder jusqu’à un certain point d’une relative approximation définitionnelle, pour autant qu’elle suffit à permettre aux utilisateurs de se faire une représentation au moins approchée du sens ou du référent des items en effectuant certaines inférences interprétatives : ce que, de fait, font couramment les locuteurs natifs confrontés à des définitions qui se limitent à des débroussaillages sémantico-référentiels, qu’elles émanent de dictionnaires ou constituent la substance d’explications métalinguistiques formulées par d’autres locuteurs. La mesure de l’écart entre les deux ordres d’exigences est donnée par ce qui sépare, par exemple, les définitions de tasse, voisines et restreintes à un petit nombre de propriétés, que proposent des dictionnaires généraux notoires comme le Nouveau Petit Robert 2000 58 (« Petit récipient à anse ou à oreille, servant à boire ») ou le Petit Larousse illustré 2001 59 (« Petit récipient à anse dont on se sert pour boire »), et le prototype expérientiel, plus dense et articulé, qu’en synthétise Martin (1993 : 152-153) 60, qui, bien que celui-ci n’en fasse pas

56 Cf. Kleiber (1997 : 32-33) : « L’hypothèse que nous suggérons est que le sens obéit à deux modèles référentiels différents : le modèle descriptif, celui qui indique quelles sont les conditions (nécessaires et suffisantes ou prototypiques) auxquelles doit satisfaire une entité pour pouvoir être désignée ainsi, et le modèle instructionnel, qui marque le moyen d’accéder au, ou de construire le référent. Le premier est prédicatif, le deuxième met en jeu des mécanismes dynamiques (déictiques, inférentiels), qui ne constituent pas des propriétés du référent, mais des balises plus ou moins rigides pour y arriver. » 57 « One reason why precise, exhaustive definitions of lexical items are needed is because this is the only way to explain a culture to outsiders. » (p. 4). « To state the meaning of a word, it is not sufficient to study its applicability to things ; what one must do above all is to study the structure of the concept which underlies and explains that applicability. » (p. 18). 58 « près de 60 000 mots » (« Préface du Nouveau Petit Robert », p. XI). 59 « 59 000 mots » et « 28 000 noms propres » (quatrième de couverture). 60 « Une tasse est un récipient qui sert à boire. Parmi les autres objets du même type (verre, coupe, bol, gobelet...), la tasse se distingue en ceci qu’elle est munie d’une anse (ou d’une oreille). Ce trait est partagé seulement avec le bock, mais celui-ci est plus grand, il est en verre et il est fait pour boire de la bière. En termes de conditions nécessaires et suffisantes, la tasse peut donc se définir comme un “petit récipient servant à boire, muni d’anse ou d’oreille”. Mais il va sans dire que l’expérience que le locuteur a de la tasse va bien au-delà de ce contenu minimal.

21

Page 22: De la Lexicologie à la Lexicographie

Pierre Corbin

mention, manisfeste une grande parenté d’inspiration avec la construction conceptuelle très fouillée et quasi téléologique développée par Wierzbicka (1985) à propos de cup 61. Pour autant, ces approfondissements de concepts qui émanent de linguistes ne sont pas en rupture, dans leur mode d’élaboration, avec ce qui fonde la pratique définitionnelle des lexicographes : une démarche introspective appuyée sur une expérience de locuteurs 62, ce qui définit seulement une posture heuristique, sans autrement fournir de procédures méthodologiques. Conséquemment, il n’y a pas de différence d’essence entre l’investigation des prototypes par les linguistes et les définitions ordinaires des lexicographes, mais seulement des écarts de complétude, de complexité et de cohésion qui sont sujets à varier fortement en fonction de la nature des projets dictionnairiques :

– Par sa forme, la tasse est généralement ronde (les angles n’en faciliteraient pas l’usage), plus large en haut qu’en bas (jamais l’inverse, si l’on veut qu’elle se vide aisément) ; la conséquence est qu’une tasse se renverse ; aussi est-elle habituellement posée sur une soucoupe. – La matière de la tasse est, dans la plupart des cas, la céramique (faïence vernissée ou émaillée, porcelaine, parfois terre cuite) ; les tasses en verre, en matière plastique, en argent ou en inox sont inhabituelles ; pour être agréable aux lèvres, la céramique ne doit pas être trop épaisse : la conséquence est hélas qu’une tasse peut se casser. – La fonction de la tasse est également précise : on n’y boit pas n’importe quoi : des boissons chaudes, pas de la bière, du vin ou de la limonade ; et pas n’importe quelle boisson chaude : du thé ou du café. Naturellement on peut utiliser la tasse à toutes sortes d’usages : pour y présenter des raisins de Corinthe, pour y faire de la vinaigrette, pour y nettoyer un pinceau dans de la thérébentine... Mais ce sont là des usages déviants. La destination normale de la tasse n’est pas celle-là. Ainsi se dessine un objet beaucoup plus riche que les traits pertinents ne le laissaient attendre. » 61 « Thus, the meaning of a word such as cup or mug is not an arbitrary collection of mutually independent features, but a structured whole, where tout se tient. Neither the concept of a prototypical cup nor the range of variability can accurately be described if this fact is not understood. Since each individual component of a concept such as cup is determined by the unifying principle underlying them all, the components are not mutually independent, and their variability cannot be individually assessed. For example, size is not independent of the presence or absence of a handle. A cup without a handle can only marginally be called a cup, but a small cup can more easily remain thinkable of as a cup than a large one (for instance Chinese tea cups and Turkish coffee cups are small and may have no handles). A cup must be designed in such a way that it should be possible to drink from it by lifting it to the mouth with one hand, and not even the whole hand but just two fingers and thumb. To meet this requirement a large cup must have a handle, but a small cup can get by without it. » (p. 30). La définition détaillée (2 pages) de cup articule conséquemment la finalité des objets ainsi dénommés avec diverses propriétés prenant en compte matière, aspect, taille et mode d’utilisation (pp. 33-34). 62 Cf. Wierzbicka (1985 : 19) : « In the case of words describing natural kinds or kinds of human artefacts, to understand the structure of the concept means to describe fully and accurately the idea (not just the visual image) of a typical representative of the kind : that is to say, the prototype. And to describe it fully and accurately we have to discover the internal logic of the concept. This is best done not through interviews, not through laboratory experiments, and not through reports of casual, superficial impressions or intuitions (either of ’informants’ or the analyst himself), but through methodical introspection and thinking. »

22

Page 23: De la Lexicologie à la Lexicographie

Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français

(i) Les dictionnaires les plus élaborés pourront être à même de fournir l’essentiel de la matière conceptuelle, quitte à la répartir, si leur dispositif microstructurel s’y prête, entre définition et développement encyclopédique. Ainsi en va-t-il dans le Grand dictionnaire encyclopédique Larousse pour l’article tasse, qui connecte à une définition plus détaillée que celles du Nouveau Petit Robert 2000 et du Petit Larousse illustré 2001 une rubrique encyclopédique qui inscrit dans une perspective historique une évolution des relations fonctionnelles entre finalité, forme et substance des objets dénommés tasse tout à fait compatible avec l’analyse de cup par Wierzbicka 63.

(ii) À l’autre extrémité de la gamme, par contre, on rencontrera des dictionnaires dont les définitions ne recensent même pas toujours un nombre de propriétés suffisant pour satisfaire à des exigences d’explicitation minimale : – Dans les petits utilitaires portatifs à bon marché, communément non rédigés directement mais dérivés par réduction de dictionnaires plus importants (cf. supra § 1.2.1.), la simplification définitionnelle déterminée par la recherche de l’économie typographique se traduit volontiers par un déficit de caractérisation. Le Petit dictionnaire français Larousse de 1998, par exemple, bon représentant de cette catégorie de répertoires avec ses « 38 000 mots, expressions et locutions » et ses « 5 000 noms propres » 64, présente ainsi un florilège de définitions seulement catégorisantes (poker : « Jeu de cartes ») ou faussement caractérisantes (poire : « Fruit du poirier » (1.), cette définition étant prise dans une relation circulaire avec celle de poirier : « Arbre fruitier dont le fruit est la poire »). – À l’inverse, des dictionnaires pour jeunes apprenants natifs peuvent s’en tenir à des définitions caractérisantes qui font l’économie de la catégorisation, à l’image de celle, par ailleurs cognitivement assez riche, que propose pour tasse le Mini débutants Larousse de 1985 (cf. supra n. 50), destiné aux élèves des cours préparatoire et élémentaire (« On boit le thé, le café dans une tasse. La tasse a une anse pour la tenir à la main. On la met sur une soucoupe. ») 65. On reconnaît dans cette ellipse de l’élément catégorisant un écho aux définitions spontanées en

63 « 1. Petit récipient de forme ovoïde, cylindrique ou demi-sphérique, généralement muni d’une anse, parfois d’un couvercle, et qui sert à boire. (V. part. encycl.) […] – ENCYCL. Dès le Moyen Âge, on donna souvent le nom de tasse à des vases ou à des coupes à boire en argent ou en vermeil dans lesquels on dégustait du vin ou des liqueurs. Ce n’est qu’au XVIIIe s. que la tasse prit sa forme spécifique, bien qu’encore variée en galbe et en dimensions, avec l’usage du thé, du café et du chocolat. La délicatesse et la légèreté de la porcelaine en firent dès lors le matériau de choix pour les services, qui comprenaient généralement 12 pièces ; décorée par les plus grands peintres céramistes (notamment à Sèvres), la tasse devint aussi objet d’ornement. On en fabriqua également en faïence, d’un coût moins élevé, dont certaines, de grandes dimensions, pour les cabarets. » 64 Quatrième de couverture. 65 Le Dictionnaire Mini débutants refondu de 1999 (cf. supra n. 50) présente un schéma définitionnel plus canonique qui réintègre les éléments catégorisateurs (tasse : « Une tasse est un petit récipient avec une anse. On l’utilise pour boire certaines boissons »), probablement sous l’influence conjuguée des effets normalisateurs de l’informatique éditoriale et des dispositifs adoptés entretemps par des dictionnaires concurrents (ibid.) : Dictionnaire Hachette benjamin de 1996, tasse : « Petit récipient avec une anse. » ; Robert benjamin de 1997, tasse : « Une tasse, c’est un petit récipient avec une anse, dans lequel on boit. ».

23

Page 24: De la Lexicologie à la Lexicographie

Pierre Corbin

« C’est pour… » des enfants, qui n’ont pas toujours la faveur de l’institution scolaire, et dont Le gros dico des tout petits (1993, « 3 006 mots » 66), présenté comme réalisé par enquête auprès d’« enfants âgés de cinq à six ans » 67, porte témoignage, par exemple s.v. casserole (« C’est pour faire chauffer ou cuire à manger sur le feu ou sur une plaque »).

(iii) Par ailleurs, dans des dictionnaires de tous ordres on trouvera des insuffisances et des erreurs, imputables non à un manque de connaissances linguistiques, mais seulement à un déficit d’approfondissement de l’investigation définitionnelle ordinaire : – Insuffisante, la restriction de la définition de mots construits comme l’adjectif poissonneux à leur sens compositionnel (“Qui abonde en poissons”), assumée sous une forme ou une autre par un large échantillon de nos dictionnaires 68 sans les ajustements référentiels nécessaires (l’indication que les poissons doivent être vivants, une rivière pleine de poissons morts ne pouvant plus être dite poissonneuse ; la mention du fait que, de façon privilégiée, ce sont des biotopes qui pourront être qualifiés de poissonneux, et qu’ils le seront d’autant mieux que l’abondance des poissons y sera accompagnée d’une répartition tendant à saturer leur espace). – Erronée, la confusion définitionnelle entre les mots et les choses, observable par exemple dans la définition d’atchoum par “Bruit…” que retiennent divers dictionnaires 69, atchoum n’étant pas le bruit que fait un éternuement, mais la codification conventionnelle de ce bruit en français, qui diffère de celles de l’anglais (atishoo), de l’allemand (hatschi), du néerlandais (hatsjie), de l’espagnol (¡achís!), etc. 70.

Tous les manques relevés en (ii) et (iii) sont bien réels, et des dictionnaires de même catégorie que ceux qui ont été épinglés dont les définitions comporteraient

66 « Introduction », p. 7. 67 « Introduction », p. 7. 68 « Qui abonde en poisson(s) » : Trésor de la langue française, Petit Larousse illustré 2001, Dictionnaire Hachette encyclopédique illustré 2001, Petit dictionnaire français 1998, Dictionnaire universel de poche Hachette de 1999 ; « Qui contient de nombreux poissons » : Nouveau Petit Robert 2000, Robert méthodique, Robert de poche. Etc. 69 « Bruit que fait un éternuement » : Petit dictionnaire français 1998 ; « Bruit produit par un éternuement » : Grand Robert de la langue française, Nouveau Petit Robert 2000, Le Robert de poche. Etc. Assez nombreux sont les dictionnaires qui ne comportent pas d’adresse atchoum. 70 Les mêmes dictionnaires ne commettent d’ailleurs pas la même bévue pour d’autres onomatopées. Ce flottement est illustré exemplairement dans le Nouveau Petit Robert 2000, plus vigilant pour drelin (« Onomatopée évoquant le bruit d’une clochette, d’une sonnette ») ou vlan (« Onomatopée imitant un bruit fort et sec »), mais qui traite boum (« Bruit de ce qui tombe, explose », s.v. 1. boum 1.) comme atchoum. Au sein d’une lignée dérivationnelle chez un même éditeur, on peut aussi observer des démarcations qui manifestent un retour critique sur le texte source, par exemple dans le Robert méthodique (1982), qui se singularise, par rapport au Petit Robert de 1977, en donnant d’atchoum une définition adéquate : « Onomatopée servant à transcrire le bruit d’un éternuement », s.v. atchoum 1° (autre exemple de ce type de démarquage du Robert méthodique au sein de la généalogie des dictionnaires Robert dans P. Corbin 1989a, § 2.2.2. et 2.3.2.1.2.).

24

Page 25: De la Lexicologie à la Lexicographie

Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français

davantage de spécifications ou moins d’erreurs seraient à coup sûr meilleurs 71. Pour autant, il ne paraît pas nécessaire d’appeler la linguistique à la rescousse : – d’une part parce que, sans rechercher le paradoxe ni porter un regard panglossien sur la production dictionnairique monolingue française actuelle, on peut relativiser l’importance de ces insuffisances si l’on se représente le couple constitué par un dictionnaire et un utilisateur natif aguerri comme une sorte de système expert dans lequel le second ajuste ses attentes et ses interprétations par rapport à la matière que lui fournit le premier : on n’utilisera pas un dictionnaire utilitaire pour s’initier aux règles du poker ; poire fait partie de ces mots qui ne peuvent pas ne pas figurer dans un dictionnaire au regard de leur usualité et de la familiarité de leur référent, mais dont celles-ci font supposer, en retour, que les articles qui leur sont consacrés ne compteront pas parmi les plus visités par les utilisateurs (au moins au titre de leur sens premier) 72 ; il n’est pas déraisonnable d’imaginer que ceux-ci pourront pallier d’eux-mêmes le manque définitionnel concernant poissonneux en application des mêmes mécanismes cognitifs qui ont amené les rédacteurs à le produire, vraisemblablement de façon inconsciente ; et la distorsion définitionnelle observée pour atchoum, pour effective qu’elle soit, n’en demeure pas moins une subtitilité de nature à titiller davantage la sensibilité des linguistes et autres professionnels de la langue et de la métalangue qu’à troubler le tout-venant des usagers ; – d’autre part parce que les améliorations qualitatives que l’on serait en droit de souhaiter et qui se lisent en filigrane dans les commentaires critiques qui précèdent ne sollicitent pas, en l’occurrence, d’autres qualifications que les compétences ordinaires des lexicographes. 2.1.4. Les contextualisations Le déploiement systématique du potentiel combinatoire des unités ne saurait sans dommage, au regard de ce que peut être la complexité de celui-ci, faire l’économie du recours à des concepts et des procédures proprement linguistiques (cf. infra § 2.2.2.). Mais cette exigence outrepasse les finalités ordinairement assignées par la lexicographie conventionnelle à l’exhibition de contextualisations pour les items-adresses, qui vise non à l’exhaustivité, mais à la suggestion, modulable en fonction des types de dictionnaires, de tendances distributionnelles et à l’ostentation des cooccurrences les plus remarquables, ainsi qu’au 71 Par exemple, dans les dictionnaires utilitaires de poche, si le Dictionnaire universel de poche Hachette de 1999 (« 40 000 noms communs » et « 10 000 noms propres » (première de couverture)), qui ignore atchoum, ne se démarque pas significativement du Petit dictionnaire français dans le traitement des autres mots pris ici comme exemples, le Robert de poche de 1995 (« 39 000 mots de la langue » et « 6 000 noms propres » (première de couverture)) tend en revanche à proposer des définitions plus riches en traits spécificateurs, notamment pour poker (« Jeu de cartes et d’argent basé sur des combinaisons (cinq cartes par joueur). » (s.v. poker I.)) et pour poire (« Fruit du poirier, charnu, à pépins, allongé et ventru. » (s.v. poire 1.)). 72 Cf., appliquées à un autre objet dictionnairique, les réflexions de Béjoint (à paraître) sur les items dont on pourrait faire l’économie dans la nomenclature de dictionnaires bilingues destinés à aider les lectures cursives de textes en langue étrangère (dictionnaires dits « de décodage » ou « de médiation ») quand les mêmes formes ont (en gros) les mêmes sens dans les deux langues impliquées.

25

Page 26: De la Lexicologie à la Lexicographie

Pierre Corbin

renforcement des cadrages sémantico-référentiels opérés par les définitions – à charge pour les usagers, ici encore, de combler les manques plus ou moins accentués des articles sur la base de leurs connaissances générales et des informations particulières que leur fournit le contexte textuel de l’item pour lequel ils consultent le dictionnaire. Sans présenter les qualités de complétude et de traitement méthodique que l’on est en droit d’attendre de descriptions linguistiques, les dictionnaires de quelque importance, que peuvent désormais étayer corpus et concordanciers électroniques, sont susceptibles de proposer un échantillon honorable de contextualisations 73. Et de dictionnaires aux ambitions plus restreintes (cf. supra § 2.1.3.), on n’attendra pas autre chose que des contextualisations parcellaires plus suggestives que proprement descriptives, autorisant tout au plus un butinage supputatif dans telle ou telle direction, ce qui peut à nouveau être illustré par des exemples pris dans le Petit dictionnaire français de 1998 : selon les articles, on pourra se croire autorisé à identifier des classes contextuelles, comme dans le cas d’« étang poissonneux » s.v. poissonneux, euse, qui incite à faire l’hypothèse que la définition (cf. supra n. 68) vaut dans le contexte de noms référant à des étendues d’eau insérées dans des écosystèmes naturels 74, mais ne permet pas d’inférer (cf. supra § 2.1.3., (iii)) que ce contexte est exclusif (puisqu’on ne parlera pas d’un aquarium poissonneux 75) ; ou encore se faire une idée des types de compléments possibles d’un item verbal pour un de ses sens, par exemple « diminuer le mérite de quelqu’un » s.v. diminuer 2., mais pas des contraintes éventuelles sur son sujet, que la définition (« Déprécier, rabaisser ») n’éclaire pas non plus ; ou simplement prendre acte de l’existence d’un contexte sans pouvoir risquer d’extrapolations, cas de figure illustré par la mention de la séquence « avoir le hoquet » s.v. hoquet à la suite de la définition (« Contraction brusque du diaphragme »), qui ne renseigne pas sur le caractère exclusif, privilégié ou aléatoire de la cooccurrence avec le verbe support avoir, ni sur le caractère contraint ou libre du déterminant le dans cette 73 Mais l’interprétation de leur statut n’est pas toujours dépourvue d’équivoque. Les séquences en italiques maigres des dictionnaires Robert, en particulier, se signalent par une polyvalence maximale de nature à troubler les utilisateurs, comme en témoigne par exemple l’article café du Nouveau Petit Robert 2000, dans lequel cette codification s’applique à des énoncés construits (Il boit dix cafés par jour (I.3.)), des énoncés cités (« À onze ans, Robert et Anselme s’arrangent, en revenant de l’école, pour s’arrêter devant un café-chantant où, dès six heures, on entend de la musique » (II., citation de Mallet-Joris)), des unités codées de complexité variable, glosées (C’est (un peu) fort de café (I.3., paraphrasé par « c’est exagéré, invraisemblable »)) ou non (Café au lait (I.3.)), et de purs supports de renvois analogiques sans statut linguistique ou discursif mais pouvant constituer des éléments de définition des items auxquels ils servent à renvoyer (Variétés de café (I.1., séquence introduisant un renvoi à arabica, robusta, moka, dont elle constitue l’hyperonyme définitionnel – et de fait, les définitions de robusta et de moka 1. commencent par « Variété de café »)). 74 Ce que certains dictionnaires assument définitionnellement, par exemple le Grand Larousse de la langue française (« Se dit d’un cours d’eau, d’un lac, d’une mer, etc., où le poisson se trouve en abondance ») ou le Grand Robert de la langue française (« Qui contient de nombreux poissons (en parlant d’un cours d’eau, d’un lac, de la mer…) »). 75 La définition de poissonneux dans le Lexis, plus riche que d’autres en ce qu’elle mentionne l’élément aqueux (« Se dit d’une eau qui contient de nombreux poissons »), passe néanmoins à côté de cette discrimination.

26

Page 27: De la Lexicologie à la Lexicographie

Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français

cooccurrence, etc. Dans les limites circonscrites par son ordre de grandeur, le Petit dictionnaire français peut apparaître comme représentatif des pratiques observables en matière de contextualisation dans bon nombre de dictionnaires orientés de façon privilégiée vers l’aide à la compréhension (ce qu’il est convenu d’appeler “décodage”) 76, ni systématiques, ni extensifs, ni explicites, et qui ne requièrent pas la rigueur de description linguistique des emplois que l’on est en droit d’attendre de dictionnaires expressément orientés vers l’aide à l’expression (dictionnaires dits d’“encodage”), qui ne peuvent pas prendre appui sur la même présupposition d’interactivité entre le texte dictionnairique et le bagage langagier des usagers. 2.1.5. Indicateurs de registres et de domaines (vs indicateurs de transition de sens) La présence d’indicateurs de registres et de domaines, dont la fonction est de discriminer les usages, est, pour cette raison même, souhaitable dans les dictionnaires de tous ordres et elle peut continuer à se faire selon les conventions en vigueur, non parce que ceux-ci seraient des modèles d’adéquation, notamment en matière de registres, mais faute d’un dispositif susbtitutif émanant du champ linguistique qui serait applicable à l’échelle du lexique global 77. En revanche, mieux vaut faire l’économie des indications de transitions de sens (figuré, par extension, par analogie, par métaphore, par métonymie, etc.), qui ne sont pas indispensables à la compréhension de chaque sens particulier envisagé pour lui-même, et dont le maniement adéquat suppose la maîtrise appropriée de connaissances non triviales en sémantique lexicale (cf. infra § 2.2.3.). Si les dictionnaires conventionnels un peu substantiels n’ont pas souvent cette prudence (ibid.), les dictionnaires limités à des ambitions utilitaires modestes observent par contre assez communément cette partition aussi circonspecte que fonctionnelle, à l’instar du Petit dictionnaire français de 1998, dont l’article cocotte illustre représentativement le parti pris différentiel en matière de recours à des classes d’indicateurs :

« cocotte nf 1. Petite marmite en fonte. 2. Poule, dans le langage enfantin. 3. Morceau de papier plié, figurant une poule. 4. FAM Femme de mœurs légères. 5. FAM Terme d’affection. »

Un article ainsi conçu prend en compte la variation sociolinguistique en affectant aux emplois 4. et 5. l’indicateur de registre « FAM. », mais son organisation n’obéit pas à des principes sémantiques, puisqu’il regroupe dans une même unité de consultation deux mots cocotte qui n’ont pas le même étymon (respectivement

76 Pour les mêmes emplois des trois mots considérés, les deux concurrents directs du Petit dictionnaire français (cf. supra n. 71) apparaissent nettement en retrait en matière de contextualisation (aucune cooccurrence dans aucun des deux). 77 Cf. P. Corbin (1989b, § 4.). Certains ouvrages, par exemple ceux consacrés par Bernet & Rézeau au français parlé (Dictionnaire du français parlé, 1989 ; Richesses lexicales du français contemporain, 1995), présentent des spécifications pragmatiques plus subtiles que le tout-venant des dictionnaires, mais ils le doivent au sens de la langue et au soin des rédacteurs, non à l’influence de la linguistique.

27

Page 28: De la Lexicologie à la Lexicographie

Pierre Corbin

les emplois 1. 78 et 2.-5. 79), et n’indique aucune filiation de sens entre ces quatre dernières acceptions, alors qu’il serait concevable d’envisager des relations de dérivation sémantique, d’ailleurs inégalement aisées à décrire, entre les emplois 2. et respectivement 3., 4. et 5., appuyées sur des similarités de forme (3.) ou de comportement (4.) 80 ou des relations de familiarité partagée (5.) 81. 2.1.6. L’ordre des acceptions et des expressions complexes Corrélativement, plus on assigne à des dictionnaires l’objectif de rendre des services pratiques (essentiellement en matière de compréhension) lors de consultations ponctuelles, plus l’ordre des acceptions et des expressions complexes doit être orienté vers la facilité de consultation, c’est-à-dire privilégier les classements par fréquence, par domaines et par ordre alphabétique, ce qui dispense ces dictionnaires d’avoir à construire une logique linguistique de dérivation sémantique. Cette organisation purement fonctionnelle communément répandue s’observe notamment dans divers dictionnaires “encyclopédiques”, dont le Nouveau Larousse encyclopédique de 1994 constitue un exemplaire représentatif, par exemple à travers son article cheval :

« CHEVAL n.m. (lat. caballus, rosse) -1. Grand mammifère domestique caractérisé par la longueur des membres. (Longévité jusqu’à 30 ans ; ordre des ongulés ; famille des équidés.) Le cheval hennit, pousse son cri. La femelle du cheval est la jument ; son petit est le poulain. (V. ENCYCL.) -2. Équitation : Faire du cheval. -3. Viande de cheval. -4. (Abrév.). Cheval-vapeur. || Cheval de bois, jouet d’enfant figurant un cheval, en usage autrefois. || Chevaux de bois, manège. DR. Cheval fiscal (abrév. CV), unité de mesure de cylindrée par laquelle on détermine notamm. le montant de la vignette et des primes d’assurance pour les véhicules automobiles. JEUX. Petits chevaux, jeu de société se jouant avec des figurines ayant une tête de cheval. LITTER. Cheval de Troie, gigantesque cheval de bois grâce auquel une poignée de Grecs, cachés à l’intérieur, réussirent à pénétrer dans Troie. SPORTS. Cheval de saut, agrès sur lequel les gymnastes prennent appui, après une course d’élan, pour effectuer un saut. »

Dans ce type d’organisation, le développement sur la langue générale précède ceux qui portent sur les domaines spécialisés, repérables par des marques en petites capitales grasses ; dans le développement sur la langue générale, les sens (ici : 1.-3.) précèdent les cooccurrences (ici : 4.) ; les cooccurrences du développement sur la langue générale sont ordonnées alphabétiquement ; et les développements sur les domaines spécialisés se succèdent dans l’ordre alphabétique des marques de domaines. Nul besoin de linguistique pour maîtriser de tels dispositifs. 78 « p.-ê. du moy. fr. coquasse « récipient », altér. de coquemar » selon le Nouveau Petit Robert 2000, s.v. 2. cocotte. 79 « onomat. → 2. coco » selon le Nouveau Petit Robert 2000, s.v. 1. cocotte. 80 Selon le Dictionnaire historique de la langue française, ce sens « se greffe sur la valeur hypocoristique du terme comme nom enfantin de la poule » (s.v. 2. cocotte), mais ce dictionnaire n’explicite pas les modalités de cette “greffe”. 81 Les deux dictionnaires concurrents du Petit dictionnaire français (cf. supra n. 71) adoptent des options voisines, nonobstant un dédoublement d’adresses dans le Robert de poche.

28

Page 29: De la Lexicologie à la Lexicographie

Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français

2.2. Besoins en linguistique de la lexicographie monolingue Si donc, pour ce qui relève d’une lexicographie conventionnelle axée sur les consultations de dépannage, les lexicographes peuvent faire l’économie des lumières des linguistes, il n’en va plus de même pour l’élaboration de dictionnaires auxquels on assigne une vocation descriptive, que celle-ci soit ou non orientée vers la didactique, et des exigences de rigueur, de cohérence et de systématicité. Les lexicographes peuvent alors beaucoup plus crucialement être amenés à souhaiter croiser la route des linguistes, qui ont cette vocation pour raison d’être, avec une liberté en plus – celle de disposer du temps nécessaire à l’analyse –, mais aussi, assez communément, une exigence en moins – celle d’avoir à traiter le lexique dans sa globalité. Les besoins en apports linguistiques de ces dictionnaires qui se donnent ou se donneraient pour objectif de présenter une description quelque peu fouillée du lexique sont faciles à établir : il suffit de dresser le catalogue des faits dont le traitement présente des inadéquations descriptives dans les dictionnaires existants les plus élaborés. On n’en trouvera ici qu’un aperçu, qui pointe quelques problèmes récurrents (les unités linguistiques non-dénominatives, la syntaxe des unités lexicales, les indicateurs de transitions de sens), mais sans chercher à être exhaustif. 2.2.1. Les unités linguistiques non-dénominatives Les unités linguistiques non-dénominatives (mots “grammaticaux”, auxiliaires, éléments de formation de mots construits,…) comptant parmi celles dont le fonctionnement est le plus complexe et, partant, le plus difficile à décrire, il n’est pas surprenant que leur traitement dictionnairique manifeste de sérieuses carences, même dans des ouvrages de référence :

– S’agissant des mots “grammaticaux” (pronoms, déterminants, connecteurs, prépositions…), l’expérience du Diplôme Européen de Lexicographie puis du DESS “Lexicographie et Terminographie”, dans lesquels un enseignement spécifique est régulièrement consacré à leur traitement lexicographique, nous a montré que celui-ci tendait à être plus en prise sur la linguistique descriptive dans le Trésor de la langue française, qui, ainsi qu’il a déjà été indiqué (cf. supra § 1.1.2. et n. 32), a bénéficié pour ces mots de l’expérience de linguistes comme Robert Martin, que dans tout autre dictionnaire, mais au prix d’une technicité formulatoire à la fois hors de portée des lexicographes ordinaires et non assumable par une lexicographie à vocation commerciale qui, dans le meilleur des cas, ne peut, à l’instar du Grand Robert de la langue française, qu’opérer un contournement du métalangage et se cantonner dans l’implicite. – Quant au traitement lexicographique des éléments de formation de mots, que ce soit dans des articles de la nomenclature ou dans des tableaux ou des répertoires annexes, il présente beaucoup de déficits d’inventaire, de cohérence et d’adéquation dans l’ensemble des dictionnaires existants. On peut, certes, établir des hiérarchies : observer, par exemple, que le recensement de ces éléments est très conséquent dans le Trésor de la langue française, sans toutefois être exhaustif ; ou encore retenir que il est fait une place dans le Robert méthodique à l’ensemble des éléments qui y sont repérés comme constitutifs des unités lexicales

29

Page 30: De la Lexicologie à la Lexicographie

Pierre Corbin

qui reçoivent le statut d’adresses, ce qui n’implique pas que l’on cautionne tous ses découpages. Mais aucun dictionnaire ne présente un tableau vraiment satisfaisant du fonctionnement des affixes et des formants de mots composés du français, et plusieurs sont réellement désastreux. Un peu plus de vigilance et de bon sens permettrait, bien sûr, d’éviter certaines aberrations, mais le déficit global du panorama d’ensemble traduit une difficulté foncière à décrire correctement les éléments considérés sans le support d’une théorie consistante de la construction d’unités lexicales. On trouvera dans D. Corbin (1997a), outre un court échantillon de défaillances dictionnairiques observées (§ 2.) 82, un programme raisonné de description lexicographique des affixes dérivationnels (§ 3.), articulé en neuf rubriques : « variantes allomorphiques », « flexion », « prononciation », « catégorie », « histoire », « sens », « catégorie lexicale des bases », « catégorie lexicale des mots construits », « contraintes sur les bases ». 2.2.2. La syntaxe des unités lexicales Une autre difficulté importante pour une lexicographie descriptive est constituée par la syntaxe des unités lexicales, et particulièrement des verbes, qui, dans les dictionnaires existants, présente également beaucoup d’insuffisances dans toutes ses dimensions, qu’il s’agisse des constructions prises en compte, de l’articulation des constructions entre elles et avec le traitement des sens, ou de la combinatoire lexicale. Les distorsions entre les structures visibles et les structures effectives de certaines constructions de compléments de verbes, par exemple, créent de réelles difficultés de traitement dans les dictionnaires qui sont rédigés sans apport linguistique spécifique : c’est le cas notamment pour les propositions infinitives directes introduites par le complémenteur de, dans le traitement desquelles le Trésor de la langue française semble mieux tirer son épingle du jeu qu’une bonne partie de la production dictionnairique, ce qu’illustre par exemple la structuration de l’article décider 83 : la construction décider de + infinitif y est légitimement regroupée en I.B.2.b, au sein des emplois transitifs directs (I.), avec la construction décider que + subordonnée conjonctive (I.B.2.a) sous la définition « Prendre un parti, déterminer une issue, conduire quelque chose à un résultat

82 Sur ce point, cf. aussi P. Corbin (1995, § 2.2.1.). 83 « I. – Emploi trans. dir. [...] B. – P. ext. Prendre un parti, déterminer une issue, conduire quelque chose à un résultat définitif. 1. Vieilli. [L’objet désigne un subst. inanimé abstr. ou un nominal indéf.] [...] 2. [L’obj. est une subordonnée complétive] a) [Le suj. du verbe sub. est différent de celui de la principale] Décider + subordonnée conjonctive. [...] b) [Le suj. du verbe sub. est le même que celui de la principale] Décider de + inf. [...] II. – Emploi trans. indir. A. – [Le suj. désigne une pers.] 1. Décider de + subst. Arbitrer, déterminer, juger. a) Décider de + subst. désignant une pers. [...] b) Décider de + subst. désignant un inanimé abstr. (parfois concr.). [...] »

30

Page 31: De la Lexicologie à la Lexicographie

Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français

définitif » (B.), et elle est dissociée de la construction décider de + substantif (II.A.1.), correspondant à la définition « Arbitrer, déterminer, juger » et traitée ainsi qu’il convient parmi les emplois transitifs indirects (II.) 84. Ce traitement linguistiquement cohérent et appuyé sur la distinction sous-jacente non triviale entre un de proprement prépositionnel et un de complémenteur peut être contrasté, à titre d’exemple, à celui du Nouveau Petit Robert 2000 85, défendable du point de vue de la commodité de consultation, mais linguistiquement inconséquent et peut-être sous-informé, qui traite uniformément toutes les constructions en de de décider comme transitives indirectes (II.), dissociant ainsi décider de + infinitif de sa variante décider que (I.2.), décrite adéquatement comme transitive directe (I.), ce qui conduit inévitablement à une redondance définitionnelle entre les deux constructions : « Arrêter, déterminer (ce qu’on doit faire) ; prendre la décision de », qui chapeaute la construction conjonctive, a pour écho « prendre la résolution, la détermination de », qui glose la construction infinitive. 2.2.3. Les indicateurs de transitions de sens L’usualité de l’utilisation lexicographique d’indicateurs de transitions de sens (figuré, par extension, par analogie, par métaphore, par métonymie, etc.) et, partant, sa relative vulgarisation n’impliquent pas qu’elle soit aisée (cf. supra § 2.1.5.), ni ne doit donner à penser qu’elle puisse sans risque, si elle vise à la cohérence, faire l’économie de la référence à une théorie globale du sens lexical qui articule les types majeurs de relations sémantiques au sein du lexique 86. Dans les dictionnaires courants qui utilisent de telles notations, il est trop aisé d’en repérer les dysfonctionnements pour ne pas considérer qu’ils traduisent une insécurité des rédacteurs aussi compréhensible que non blâmable face à une entreprise qui les dépasse. Sinon – c’est-à-dire si la tâche était simple –, comment expliquerait-on, par exemple, que dans l’article café du Nouveau Petit Robert

84 Le Grand dictionnaire encyclopédique Larousse, en raison des conditions particulières qui ont déterminé son traitement des constructions verbales (cf. supra § 1.1.2.), opère, lui aussi, une répartition satisfaisante des constructions en de de décider : regroupement sous l’emploi transitif de décider de + infinitif avec décider qqch (action) et décider que + indicatif sous le sens « prendre le parti de faire qqch, se déterminer à entreprendre qqch, prendre la résolution qu’un événement ait lieu ; résoudre » (décider v. t. 1.) ; traitement de décider de qqch comme emploi transitif indirect susceptible d’avoir un sujet référant à une personne (« se déterminer sur telle action à mener, telle date à choisir, tel choix à faire » (v. t. ind. 1.)) ou à une chose (« être l’élément décisif qui entraînera telle action, tel événement, tel choix » (v. t. ind. 2.)). 85 « I. V.tr. dir. [...] 2. MOD. Arrêter, déterminer (ce qu’on doit faire) ; prendre la décision (3°) de. ⇒ arrêter, fixer. [...] Il n’a encore rien décidé. [...] DECIDER QUE. Il décide qu’il n’ira pas travailler. [...] II. V. tr. ind. DECIDER DE QQCH. (PERSONNES) Disposer en maître par son action ou son jugement. Le chef de l’État décide de la paix et de la guerre. L’arbitre décidera de la régularité des coups. ⇒ arbitrer, 1. juger. Laissez-nous en décider. – (CHOSES) Déterminer, être la cause principale. [...] ◊ DECIDER DE (et l’inf.) : prendre la résolution, la détermination de. Ils ont décidé de partir, ils en ont décidé ainsi. Décidons de nous retrouver à huit heures. » 86 Cf. par exemple, dans un cadre de sémantique vériconditionnelle, le calcul sur les additions et effacements de traits sémantiques proposé par Martin (1992, chap. II, § II.) pour donner des appuis méthodologiques à l’utilisation de ces indicateurs.

31

Page 32: De la Lexicologie à la Lexicographie

Pierre Corbin

2000 87, on pointe des extensions discutables pour « Café soluble, lyophilisé » (I.1.), qui ne refère pas moins à des états différents du café que « Café en grains, moulu », non marqué, ou pour « Le moment où l’on prend le café, après le repas » (I.3.), qui pourrait bien n’être qu’un sens contextuel et non lexical, alors que dans le même temps on omet des métonymies patentes pour « Boisson obtenue par infusion de grains torréfiés et moulus » (I.3.) ou « Lieu public où l’on consomme des boissons » (II.) ?

3. Qu’est-ce que la linguistique peut apporter à la lexicographie (descriptive) ?

Le développement précédent (§ 2.) a fourni des éléments de circonscription de la pertinence du recours à la linguistique dans l’activité lexicographique. Reste à voir maintenant les modalités de cette contribution. Dans son principe, la linguistique peut beaucoup de choses pour l’amélioration des dictionnaires descriptifs, puisque la description adéquate du fonctionnement des langues est constitutive de son programme actuel. Le simple fait de pouvoir pointer toute une gamme de carences observables dans les traitements dictionnairiques est à lui seul l’indice qu’il existe au moins un autre regard sur les faits considérés, et la mise en relief des bénéfices que le Trésor de la langue française a tirés de la participation de linguistes à son élaboration donne des indications sur les potentialités de cette collaboration interdisciplinaire. Si le principe est clair, la mise en pratique n’a pas la même évidence. Deux difficultés majeures de transmission des connaissances se posent en effet : celle de l’accès des lexicographes aux savoirs linguistiques disponibles, et celle de la conversion de ces savoirs par les lexicographes en textes dictionnairiques décodables par des utilisateurs non spécialistes 88. 3.1. L’accès des lexicographes aux savoirs linguistiques L’accès des lexicographes aux savoirs linguistiques qui pourraient leur être utiles dans leur pratique n’est pas chose aisée. La linguistique n’est pas aujourd’hui une discipline unifiée dans ses fondements et dans ses méthodes, qui proposerait, dans divers secteurs, un ensemble de résultats stabilisés. Tout au 87 « n. m. [...] I. 1. Graines du fruit du caféier, contenant un alcaloïde aux propriétés stimulantes [...] ◊ Ces graines torréfiées. Paquet de café. Café en grains, café moulu. Moulin* à café. – PAR EXT. Café soluble, lyophilisé. 2. PAR METON. Caféiers. Une plantation de café. [...] 3. Boisson obtenue par infusion de grains torréfiés et moulus. [...]. – Tasse, bol de café. Il boit dix cafés par jour. Mettre deux sucres dans son café. – Petit déjeuner où l’on boit du café. Un café complet*. Un café croissant. – Préparation à base de café. Café irlandais. [...]. ◊ PAR EXT. Le moment où l’on prend le café, après le repas. Venez pour le café. Offrir des liqueurs au café. 4. Adj. inv. Café au lait : couleur brun clair. II. [...] Lieu public où l’on consomme des boissons. [...] » 88 Pour l’essentiel, les développements qui suivent redistribuent selon un autre schéma d’exposition une matière déjà déployée dans P. Corbin (1998, § 4.).

32

Page 33: De la Lexicologie à la Lexicographie

Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français

contraire, elle apparaît, au moins pour le domaine français, comme une constellation de courants éparpillés et quelquefois conflictuels, proposant des productions inégalement adéquates et falsifiables parmi lesquelles il n’est pas aisé de se repérer avec sûreté, dont les divers champs d’étude ne s’intègrent pas dans une articulation coordonnée et ne présentent pas le même degré d’aboutissement, et dont la diffusion a souvent un caractère semi-confidentiel. Or les lexicographes, même si on leur suppose une formation de base un peu solide en linguistique (ce qui n’est pas toujours le cas), n’ont ordinairement pas le temps, dans l’exercice de leur profession, d’effectuer de longues recherches pour savoir où trouver l’information utile, ni pour extraire des travaux savants ce qui est strictement applicable pour leur pratique : l’exception du Trésor de la langue française ne doit pas abuser ici, dans la mesure où il s’agit d’un dictionnaire qui a échappé aux lois ordinaires de la production dictionnairique commerciale, et dont le financement sur fonds publics a permis aux rédacteurs une latitude documentaire hors de portée des lexicographes travaillant pour l’édition privée. Il faudrait donc que les lexicographes puissent disposer de travaux qui calibreraient les résultats des recherches linguistiques exploitables dictionnairiquement dans une mise en forme propice à une utilisation sans médiation. On pourrait penser à des sortes de métadictionnaires, c’est-à-dire des dispositifs de compilation d’analyses linguistiques systématiques et extensives d’unités lexicales, qui ne seraient pas directement lisibles par des lecteurs profanes, mais dans lesquels des lexicographes suffisamment formés pourraient puiser directement des données qu’ils devraient ensuite convertir dans des formats textuels accessibles aux usagers 89. Deux projets, inégalement développés et dont les finalités aussi bien que les styles diffèrent radicalement, retiennent particulièrement l’attention, sans pour l’instant présenter un développement suffisant pour une exploitation en vraie grandeur :

(i) dans le domaine de la combinatoire lexicale, le Dictionnaire explicatif et combinatoire du français contemporain d’Igor Mel’čuk, qui vise à donner une description sémantico-syntaxique systématique des unités lexicales du français en recourant à une codification assez élaborée mais pas impénétrable 90, s’est concrétisé jusqu’à présent dans l’analyse de quelques centaines d’unités distribuée en quatre volumes depuis 1984 ;

(ii) dans le domaine de la construction d’unités lexicales, le Dictionnaire constructionnel du français de Danielle Corbin (ex-Dictionnaire dérivationnel du français), qui vise à rendre compte de la forme, de la structure et du sens des mots construits en allant du sens construit au sens descriptif, présente un état

89 On peut relire comme des maquettes métadictionnairiques les descriptions longues, fouillées et rédigées selon des modalités métalinguistiques spécifiques que Wierzbicka (1985) donne de concepts associés à différents items lexicaux de l’anglais dénommant des espèces naturelles ou des objets manufacturés (cf. supra n. 61). 90 La présentation la plus globale de la démarche se trouve dans Mel’čuk, Clas & Polguère (1995).

33

Page 34: De la Lexicologie à la Lexicographie

Pierre Corbin

d’avancement encore plus faible : quelques maquettes ont été publiées 91 et un fascicule était en préparation au moment du décès de sa conceptrice 92. D’autres modèles de métadictionnaires seraient imaginables, et on ne peut que regretter que les travaux de ce type soient pour l’instant encore trop sporadiques. Peut-être faut-il y voir, au moins pour le domaine français, l’effet d’une sensibilité insuffisante aux problèmes de lexicographie, qui irait de pair avec le fait que la place de cette discipline dans nos cursus universitaires est très réduite. 3.2. La vulgarisation dictionnairique des savoirs linguistiques À supposer que soit résolue la question de l’accès des lexicographes à la linguistique utile, il reste celle des modalités du transfert de l’apport de celle-ci dans des dictionnaires ordinaires, ce qui pose notamment des problèmes de métalangage qui peuvent être assez épineux. La terminologie métalinguistique qu’on a la latitude d’utiliser dans des dictionnaires destinés à un large public est en effet nécessairement très conservatrice et décalée de plusieurs décennies par rapport à celle de la recherche vive, parce qu’elle ne peut que s’aligner, sous peine d’incompréhension, sur celle qui a été sanctionnée par l’apprentissage scolaire commun à l’ensemble d’une population (cf. supra § 2.1.1.). Dans certains cas, les problèmes terminologiques peuvent être contournés avec une réelle réussite : on peut considérer par exemple que le Grand dictionnaire encyclopédique Larousse a réussi à intégrer de façon satisfaisante la description des structures argumentales des verbes inspirée du L.A.D.L. dans le moule des codifications dictionnairiques ordinaires (cf. supra § 1.1.2. et nn. 35 et 83). Mais dans d’autres cas, l’adaptation est moins évidente. La notion de complémenteur évoquée précédemment (cf. supra § 2.2.2.), par exemple, est très utile pour éclairer l’existence de deux emplois du mot de en français et pour distinguer celui qui précède certains infinitifs de l’emploi prépositionnel ordinaire. Mais le fait comme le terme, d’ailleurs opaque, ne sont connus que d’un très petit nombre de locuteurs francophones ayant reçu un enseignement linguistique un peu poussé et dispensé dans des cadres théoriques particuliers ; conséquemment, à supposer que les lexicographes s’approprient la notion, il n’est pas envisageable qu’ils l’importent telle quelle dans les dictionnaires, et leur marge de manœuvre pour ruser avec la terminologie en vigueur n’est pas très importante, puisque, derrière les mots inconnus du public, se dissimulent des notions qui le sont tout autant, ce qui impose des stratégies d’évitement du métalangage. Ces observations vaudraient pour bien d’autres termes, dont certains de ceux qui sont en usage dans les maquettes des métadictionnaires que j’ai mentionnés.

Pour tous ces motifs, on peut se demander si, pour un certain temps encore, dont la durée n’est pas appréciable, les apports de la linguistique ne pénétreront

91 D. & P. Corbin (1991), D. Corbin (1993 et 1997b). 92 J’espère pouvoir en publier l’état le plus avancé dans des délais pas trop éloignés, et j’aimerais, à terme, prolonger ce projet, ce qui ne se ferait sans doute pas sans infléchissement – n’est pas Danielle Corbin qui veut – mais pourrait, même avec une réorientation, présenter de réelles vertus métadictionnairiques.

34

Page 35: De la Lexicologie à la Lexicographie

Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français

pas que de façon très marginale les dictionnaires, même descriptifs, destinés à un public de non-spécialistes.

Bibliographie Dictionnaires

Bibliorom Larousse : voir Petit Larousse (illustré). Dictionnaire d’anglais. Niveau 1, Paris, Librairie Larousse, 1975. Dictionnaire d’apprentissage du français des affaires = BINON Jean, VERLINDE Serge, VAN DYCK

Jan & BERTELS Ann, Dictionnaire d’apprentissage du français des affaires. Dictionnaire de compréhension et de production de la langue des affaires, Paris, Didier, 2000.

Dictionnaire de l’anglais contemporain, Paris, Librairie Larousse, 1980. Dictionnaire du français au collège, Paris, Larousse, 1986. Dictionnaire du français contemporain, Paris, Librairie Larousse, 1966 ; nouv. éd., Dictionnaire

du français contemporain illustré, 1980. Dictionnaire du français langue étrangère. Niveau 1, Paris, Librairie Larousse, 1978. Dictionnaire du français langue étrangère. Niveau 2, Paris, Librairie Larousse, 1979. Dictionnaire du français parlé = BERNET Charles & REZEAU Pierre, Dictionnaire du français

parlé. Le monde des expressions familières, Paris, Seuil, 1989. Dictionnaire du français usuel = PICOCHE Jacqueline & ROLLAND Jean-Claude, Dictionnaire du

français usuel. 15 000 mots en 442 articles, Bruxelles, De Boeck Duculot. Dictionnaire explicatif et combinatoire du français contemporain = MEL’ UK Igor e.a.,

Dictionnaire explicatif et combinatoire du français contemporain. Recherches lexico-sémantiques, 4 vol., Montréal, Les Presses de l’Université de Montréal, 1984-1988-1992-2000.

Dictionnaire général de la langue française = HATZFELD Adolphe, DARMESTETER Arsène & THOMAS Antoine, Dictionnaire général de la langue française du commencement du XVIIe siècle jusqu’à nos jours, 2 vol., Paris, Librairie Delagrave, 1890-1900.

Dictionnaire Hachette benjamin, Paris, Hachette Éducation, 1996. Dictionnaire Hachette encyclopédique illustré, millésime 2001, Paris, Hachette, 2000. Dictionnaire Hachette juniors. 1. Langue française, Paris, Hachette, 1990 ; 1e éd., Dictionnaire

Hachette juniors, 1980. Dictionnaire historique de la langue française, éd. enrichie, 3 vol., Paris, Dictionnaires Le Robert,

1998. Dictionnaire Mini débutants : voir Mini débutants. Dictionnaire universel de poche, nouv. éd., Le Livre de poche 8530, Paris, Hachette, 1999. Grand dictionnaire encyclopédique Larousse, 15 vol., Paris, Librairie Larousse, 1982-1985. Grand Larousse de la langue française en 7 volumes, Paris, Librairie Larousse, 1971-1978. Grand Robert de la langue française = Le Grand Robert de la langue française. Dictionnaire

alphabétique et analogique de la langue française, 2e éd. entièrement revue et enrichie, 9 vol., Paris, Le Robert, 1985.

Larousse de base. Dictionnaire d’apprentissage du français, Paris, Librairie Larousse, 1977. Le gros dico des tout petits = DUHAMEL Claude-Alain & BALAZ Carole, Le gros dico des tout

petits. 3 000 mots racontés par les enfants, Paris, J.-C. Lattès, 1993. Le tour du mot. Dictionnaire Bordas Le junior, Paris, Bordas, 1988 ; 1e éd., Le tour du mot, 1985. Lexis. Dictionnaire de la langue française, Paris, Librairie Larousse, 1975. Maxi débutants : voir Nouveau Larousse des débutants. Mini débutants. Mon premier vrai dictionnaire, Paris, Larousse, 1985 ; nouv. éd., Dictionnaire

Mini débutants, 1999. Nouveau Larousse des débutants, Paris, Librairie Larousse, 1977 ; nouv. éd., Maxi débutants. Le

dictionnaire CE2, CM, Larousse, 1986 ; nouv. éd., 1991. Nouveau Larousse encyclopédique. Dictionnaire en 2 volumes, Paris, Larousse, 1994. Nouveau Petit Robert : voir Petit Robert.

35

Page 36: De la Lexicologie à la Lexicographie

Pierre Corbin

Petit dictionnaire français, éd. entièrement nouvelle, Paris, Larousse, 1998. Petit Fleurus = Le Petit Fleurus, Paris, Éditions Fleurus, 1998. Petit Larousse (illustré) = Petit Larousse illustré. Nouveau dictionnaire encyclopédique, millésime

1906, Paris, Librairie Larousse, 1905 ; Petit Larousse, millésime 1961, 1960 ; Le Petit Larousse illustré, millésime 2001, Larousse, 2000. Éditions électroniques sur CD-ROM : Bibliorom Larousse, Liris Interactive / Larousse / Microsoft, 1996 ; Le Petit Larousse, version 1.01, Liris Interactive / Larousse, 1997 ; Bibliorom Larousse 2.0, Havas Interactive / Larousse / Microsoft Corporation, 1998 ; Le Petit Larousse 2000, Larousse Multimédia, 1999 ; Le Petit Larousse 2001, Larousse / HER, 2000 ; Le Petit Larousse 2002, Larousse / VUEF, 2001.

Petit Robert = Le Petit Robert. Dictionnaire alphabétique & analogique de la langue française, Paris, Société du Nouveau Littré, 1967 ; nouv. éd., 1977 ; Le Nouveau Petit Robert. Dictionnaire alphabétique et analogique de la langue française, Dictionnaires Le Robert, 1993 ; éd. mise à jour, 2000.

Petit Robert des enfants = Le Petit Robert des enfants. Dictionnaire de la langue française, Paris, Dictionnaires Le Robert, 1988 ; rééd., Le Robert des jeunes. Dictionnaire de la langue française, 1991.

Richesses lexicales du français contemporain (BERNET Charles & REZEAU Pierre dir.), Nancy, Centre National de la Recherche Scientifique / Klincksieck, 1995.

Robert benjamin = Le Robert benjamin, Paris, Dictionnaires Le Robert, 1997. Robert de poche = Le Robert de poche, Paris, Dictionnaires Le Robert, 1995. Robert des jeunes : voir Petit Robert des enfants. Robert junior = Le Robert junior illustré, Paris, Dictionnaires Le Robert, 1993. Robert méthodique = Le Robert méthodique. Dictionnaire méthodique du français actuel, Paris, Le

Robert, 1982. Robert oral-écrit = Le Robert oral-écrit. L’orthographe par la phonétique, Paris, Dictionnaires Le

Robert, 1989. Trésor de la langue française. Dictionnaire de la langue du XIXe et du XXe siècle (1789-1960), 16

vol., Paris, Éditions du Centre National de la Recherche Scientifique (t. 1-10) / Gallimard (t. 11-16), 1971-1994.

Autres références ATKINS B.T.S. (1993), « Theoretical lexicography and its relation to dictionary-making », in

William Frawley ed., pp. 4-43. BATTENBURG John D. (1991), English Monolingual Learners’ Dictionaries. A User-oriented Study,

Lexicographica Series Maior 39, Tübingen, Max Niemeyer Verlag. BEJOINT Henri (à paraître), « Vers un dictionnaire bilingue de “médiation” », communication aux

3es Journées de lexicographie bilingue de l’INALCO, Paris, 12-13 octobre 2000, à paraître dans les Actes.

CABRE CASTELLVI M. Teresa (1994), « Entrevista a Danielle Corbin i Pierre Corbin, directors del Diploma Europeu de Lexicografia », Caplletra. Revista internacional de filologia 17, pp. 337-348.

CORBIN Danielle (1993), « Morphologie et lexicographie : la représentation du sens dans le Dictionnaire dérivationnel du français », in Aafke Hulk, Francine Melka & Jan Schroten éds, Du lexique à la morphologie : du côté de chez Zwaan, Amsterdam / Atlanta, Rodopi, pp. 63-86.

CORBIN Danielle (1997a), « Décrire un affixe dans un dictionnaire », in Georges Kleiber & Martin Riegel éds, Les formes du sens. Études de linguistique française, médiévale et générale offertes à Robert Martin à l’occasion de ses 60 ans, coll. Champs linguistiques, Louvain-La Neuve / Paris, Duculot, pp. 79-94.

CORBIN Danielle (1997b), « La représentation d’une “famille” de mots dans le Dictionnaire dérivationnel du français et ses corrélats théoriques, méthodologiques et descriptifs », Recherches linguistiques de Vincennes 26, pp. 5-37 + Supplément, pp. I-VIII.

CORBIN Danielle (à paraître), Le lexique construit. Méthodologie d’analyse. CORBIN Danielle & CORBIN Pierre (1991), « Vers le Dictionnaire dérivationnel du français »,

Lexique 10, pp. 147-161.

36

Page 37: De la Lexicologie à la Lexicographie

Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français

CORBIN Pierre (1984), « Lexicographe-conseil », Lez Valenciennes. Cahiers de l’UER Froissart 9, numéro spécial XXe anniversaire, Université de Valenciennes, pp. 113-121.

CORBIN Pierre (1985), « Le monde étrange des dictionnaires (6). Le commerce des mots », Lexique 3, pp. 65-124.

CORBIN Pierre (1989a), « Pour une lecture généalogique des dictionnaires généraux monolingues français contemporains », in Gregory James ed., Lexicographers and their Works, Exeter Linguistic Studies 14, University of Exeter, pp. 29-54.

CORBIN Pierre (1989b), « Les marques stylistiques/diastratiques dans le dictionnaire monolingue », in Franz Josef Hausmann, Oskar Reichmann, Herbert Ernst Wiegand & Ladislav Zgusta Hrsg., art. 57, Berlin / New York, Walter de Gruyter, pp. 673-680.

CORBIN Pierre (1991), « Le maquis lexicographique. Aperçus sur l’activité lexicographique monolingue dans le domaine français à la fin du XXe siècle », Le français aujourd’hui 94, pp. 6-26.

CORBIN Pierre (1995), « L’articulation entre la pratique lexicographique, la métalexicographie et la linguistique dans la formation et dans l’activité des lexicographes », in Jean Pruvost éd., Les dictionnaires de langue. Méthodes et contenus. La journée des dictionnaires 1994, Centre de Recherche Texte / Histoire, Université de Cergy-Pointoise, pp. 81-112.

CORBIN Pierre (1998), « La lexicographie française est-elle en panne ? », Cicle de conferències 96-97. Lèxic, corpus i diccionaris, Barcelona, Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra, pp. 83-112.

DUBOIS Jean (1962), Étude sur la dérivation suffixale en français moderne et contemporain. Essai d’interprétation des mouvements observés dans le domaine de la morphologie des mots construits, Paris, Librairie Larousse.

DUBOIS Jean (1965), Grammaire structurale du français : nom et pronom, coll. Langue et langage, Paris, Librairie Larousse.

DUBOIS Jean (1967), Grammaire structurale du français : le verbe, coll. Langue et langage, Paris, Librairie Larousse.

DUBOIS Jean (1969), Grammaire structurale du français : la phrase et les transformations, coll. Langue et langage, Paris, Librairie Larousse.

DUBOIS Jean & DUBOIS-CHARLIER Françoise (1970), Éléments de linguistique française : syntaxe, coll. Langue et langage, Paris, Librairie Larousse.

DUBOIS-CHARLIER Françoise (1970), Éléments de linguistique anglaise : syntaxe, coll. Langue et langage, Paris, Librairie Larousse.

DUBOIS-CHARLIER Françoise (1971), Éléments de linguistique anglaise : la phrase complexe et les nominalisations, coll. Langue et langage, Paris, Librairie Larousse.

FRAWLEY William ed. (1993), Dictionaries. Journal of The Dictionary Society of North America 14, « Forum on the Theory and Practice of Lexicography ».

GATES Edward (1979), « A survey of the teaching of lexicography », Dictionaries. Journal of the Dictionary Society of North America 1, pp. 113-130.

GATES Edward (1986), « Preparation for lexicography as a career in the United States », in Robert Ilson ed., pp. 82-88.

GATES Edward (1989), « The training of lexicographers », in Franz Josef Hausmann, Oskar Reichmann, Herbert Ernst Wiegand & Ladislav Zgusta Hrsg., art. 10a, pp. 94-97.

GUILBERT Louis (1971), « De la formation des unités lexicales », in Grand Larousse de la langue française en 7 volumes, t. 1, pp. IX-LXXXI.

HARTMANN R.R.K. (1986), « The training and professional development of lexicographers in the UK », in Robert Ilson ed., pp. 89-92.

HAUSMANN Franz Josef (1986), « The training and professional development of lexicographers in Germany », in Robert Ilson ed., pp. 101-110.

HAUSMANN Franz Josef, REICHMANN Oskar, WIEGAND Herbert Ernst & ZGUSTA Ladislav Hrsg. (1989), Wörterbücher / Dictionaries / Dictionnaires. Ein internationales Handbuch zur Lexikographie / An International Encyclopedia of Lexicography / Encyclopédie internationale de lexicographie, t. 1, Berlin / New York, Walter de Gruyter.

ILSON Robert ed. (1986), Lexicography. An Emerging International Profession, The Fulbright Papers, Proceedings of Colloquia, vol. 1, Manchester / Dover (New Hampshire), Manchester University Press.

37

Page 38: De la Lexicologie à la Lexicographie

Pierre Corbin

KLEIBER Georges (1997), « Sens, référence et existence : que faire de l’extra-linguistique ? », Langages 127, pp. 9-37.

LANDAU Sidney I. (1989), Dictionaries. The Art and Craft of Lexicography, 2e éd., Cambridge / New York / Port Chester / Melbourne / Sidney, Cambridge University Press ; 1e éd., Charles Scribner’s Sons, 1984.

MARTIN Robert (1992), Pour une logique du sens, coll. Linguistique nouvelle, Paris, Presses Universitaires de France ; 1e éd., 1983.

MARTIN Robert (1993), « Typicité et sens des mots », in Danièle Dubois dir., Sémantique et cognition. Catégories, prototypes, typicalité, Paris, CNRS Éditions, pp. 151-159 ; 1e éd., 1991.

MEL’ ČUK Igor, CLAS André & POLGUERE Alain (1995), Introduction à la lexicologie explicative et combinatoire, coll. Champs linguistiques, Louvain-la-Neuve, Éditions Duculot.

PASCUAL FERRANDO Emili (1994), « La professió de lexicògraf », Caplletra. Revista internacional de filologia 17, pp. 125-135.

REY Alain (1986), « Training lexicographers : some problems », in Robert Ilson ed., pp. 93-100. SINCLAIR John M. (1984), « Lexicography as an academic subject », in R.R.K. Hartmann ed.,

LEXeter’83 Proceedings. Papers from the International Conference on Lexicography at Exeter, 9-12 September 1983, Lexicographica Series Maior 1, Tübingen, Max Niemeyer Verlag, pp. 3-12.

WIERZBICKA Anna (1985), Lexicography and Conceptual Analysis, Ann Arbor, Karoma Publishers.

ZGUSTA Ladislav (1993), « Lexicography, its theory, and linguistics », in William Frawley ed., pp. 130-138.

ZWANENBURG Wiecher (1983), Productivité morphologique et emprunt, Linguisticae Investigationes Supplementa 10, Amsterdam / Philadelphia, John Benjamins Publishing Company.

38

Page 39: De la Lexicologie à la Lexicographie

Associations lexicales: du corpus aux dictionnaires

Maria Fernanda Bacelar do Nascimento Centro de Linguística da Universidade de Lisboa

Ma contribution pour cette Journée d’Études portera sur le thème suivant:

en quoi le Corpus de Référence du Portugais Contemporain et les outils informatiques qui lui sont associés peuvent faire avancer la lexicographie portugaise?

L’utilisation des corpus en lexicographie n’est pas une nouveauté; au contraire, ils ont été depuis toujours la source primaire des dictionnaires. Un excellent exemple de cette utilisation dans la lexicographie portugaise est le premier (et le seul) volume du Dicionário de Língua Portuguesa publié par l’ Academia das Ciências de Lisboa, en 1793. En fait, la lexicographie a été brillamment cultivée au Portugal pendant les XVIIIe et le XIXe siècles; par contre, la plupart des dictionnaires portugais actuels sont d’une assez faible valeur et restent très loin derrière la production internationale laquelle reflète, de plusieurs façons, le développement des études linguistiques contemporaines.

Pour ce qui est de l’utilisation des corpus, nous savons que, dans les vingt dernières années, le développement de l’informatique et la capacité grandissante des ordinateurs a apporté des bénéfices immenses au travail des lexicographes, soit en leur permettant l’accès à des corpus très vastes et très diversifiés, soit en leur offrant des possibilités presque illimitées d’exploration de ces corpus du point de vue de la quantité et de la qualité des données.

Je m’en tiendrai au domaine du portugais européen et actuel quant à l’utilisation des corpus pour l’élaboration de dictionnaires. J'esquisserai la description de quelques ressources linguistiques disponibles au Centre de Linguistique, notamment le Corpus de Référence du Portugais Contemporain et les outils informatiques d’exploration des données. Finalement, je présenterai quelques exemples de l’emploi d’un outil conçu pour l’extraction d’associations lexicales – le Dictionnaire de Combinatoires du Portugais; ce Dictionnaire constitue une source d'informations sur la langue et sur les usages de la langue très importante pour le développement de la lexicographie portugaise.

Un dictionnaire de langue, quel que soit son modèle ou son support (en papier ou électronique) est conçu autour d’un problème central: l’identification, la distinction et la description des sens particuliers de chaque entrée. C’est, indiscutablement, l’information que la plupart des usagers considèrent comme la plus importante, soit pour le décodage, soit pour l’encodage du discours.

Nous savons bien que beaucoup d’éléments contribuent à la construction des sens des mots et, aussi, que les dictionnaires, selon leurs modèles particuliers, rendent compte de ces faits de sens en utilisant les définitions, les exemples, les citations, les marques sociolinguistiques et aussi les phénomènes combinatoires observés sur le plan lexical, syntaxique, textuel, etc., qui caractérisent les différents usages et acceptions d’un mot.

Page 40: De la Lexicologie à la Lexicographie

Maria Fernanda Bacelar do Nascimento

La plupart des dictionnaires portugais de langue, que je connais, publiés dans ces dernières années ne révèlent pas de marques sensibles d’innovation ni dans le fond ni dans la forme. En les analysant, on ne perçoit pas une interaction entre les théories linguistiques, les études lexicales les plus récentes et les pratiques lexicographiques, interaction qui est décisive pour l’enrichissement de la lexicologie et de la lexicographie.

Dans les dictionnaires parus le plus récemment, les sens de chaque mot continuent à être décrits à travers une série de définitions paraphrastiques discrètes: le choix des acceptions, ainsi que son ordre de présentation se fait en acceptant ce qui est enregistré dans les dictionnaires précédents ou selon la compétence linguistique des lexicographes. Dans ces dictionnaires, on ne voit aucun indice d’une approche empirique, d’une exploration sémantique des corpus reposant sur l’idée que le sens se construit en contexte et par le contexte. Cet état de choses est en contradiction avec les possibilités mises à la disposition des lexicographes, à savoir l’exploration des grands corpus électroniques.

Faire des dictionnaires, ayant recours seulement aux sources secondaires rend la lexicographie parfaitement statique; faire appel à l’intuition du lexicographe a, aussi, des inconvénients connus: dans la plupart des cas, son intuition ne lui permet pas de décrire les usages fréquents d’un mot, ce qui est très évident quand il s’agit, par exemple, d’usages où l’on peut observer des phénomènes de lexicalisation ou de grammaticalisation.

Il faut, aussi, bien sûr, réfléchir aux limites des approches empiriques car les résultats de ces approches dépendent, parmi d'autres, de la qualité du corpus et de la qualité des analyses.

À ce propos, on peut lire dans le volume Les Linguistiques de Corpus de Benoît Habert et alii, (1997, p. 105) "… les contraintes d’une approche lexicographique [consistent] à inférer des propriétés en langue à partir d’observations faites sur corpus, à partir de ce qui est attesté. Cette approche repose sur l’hypothèse que le corpus est un reflet acceptable de la manière dont les mots sont effectivement employés. (…) Le corpus détermine, par ailleurs, la couverture lexicographique: seuls les mots et les sens attestés peuvent être décrits".

Je suis vraiment convaincue qu’on ne peut pas se passer des connaissances accumulées dans les dictionnaires précédents, de même qu’on ne peut pas se passer de la compétence linguistique du lexicographe; mais je crois qu’aujourd’hui, on ne peut pas non plus se passer du recours aux corpus électroniques et aux outils informatiques d’exploration de ces données linguistiques primaires sous peine de perdre des informations d’une grande valeur et cela à plusieurs niveaux, par exemple: des informations importantes pour la désambiguïsation morphosyntaxique et sémantique des mots, pour l’observation des contraintes de sélection ou des phénomènes de synonymie et, plus largement, pour repérer les relations lexicales attestées.

Je cite de nouveau Benoît Habert: "Le travail lexicographique ne peut reposer entièrement sur le corpus. Mais si les informations extraites des corpus doivent être controlées, corrigées, complétées, elles constituent, néanmoins, une vue d’ensemble sur l’emploi d’un mot et une source importante pour la rédaction

40

Page 41: De la Lexicologie à la Lexicographie

Associations lexicales: du corpus aux dictionnaires

d’entrées de dictionnaire. Pour exploiter ce type de données, le lexicographe devra acquérir l’expérience des outils permettant de les obtenir, afin de dépister les points faibles de telle entrée, d’identifier les associations douteuses, de repérer les effets d’une analyse syntaxique inexacte ou ambiguë, et de compléter les informations extraites par ses propres méthodes d’investigation", (Habert, B. et alii, 1997, p.105).

Le Corpus de Référence du Portugais Contemporain (CRPC) du Centre de Linguistique de l’Université de Lisbonne (CLUL) est un corpus électronique qui contient, actuellement, 92 millions de mots; il est constitué par des échantillons de plusieurs types de textes du discours écrit (littéraire, journalistique, technique, scientifique, didactique, économique, parlementaire, juridique, etc.) et du discours oral (spontané et formel) du Portugal, du Brésil, des cinq pays africains de langue officielle portugaise, de Macau et de Timor. Du point de vue chronologique, le corpus contient des textes depuis la seconde moitié du XIX e siècle jusqu’à nos jours; la plus grande partie des textes est postérieure à l’année 1970.

Les principaux objectifs du Projet sont de: - produire des ressources linguistiques, en particulier des corpus oraux

et écrits de variantes nationales et régionales du portugais, ainsi que des outils informatiques pour l’extraction de connaissances, à partir de ces corpus;

- assurer l’actualisation du corpus ainsi que l’accès et la mise à la disposition de ces ressources à tous ceux qui travaillent soit dans la recherche fondamentale, soit dans la production de grammaires, de lexiques et de dictionnaires conventionnels ou électroniques, dans la traduction, dans l’enseignement ou dans le contexte de l’ingénierie des langues, des technologies linguistiques ou des télécommunications.

Les outils d’extraction des données associés au corpus fournissent des informations sur:

- les fréquences des occurrences; - la lémmatisation des formes (lémmatisation théorique puisque

seulement une petite partie du corpus est annotée); - les concordances; - les combinatoires. À propos de combinatoires, je voudrais présenter le Dictionnaire de

Combinatoires du Portugais. Il s’agit d’un projet de recherche sur les associations lexicales du portugais contemporain, portant sur un souscorpus de 12 millions de mots mais qui peut être appliqué à d’autres corpus.

Nous pouvons avoir accès aux informations suivantes: - la liste de toutes les formes lexicales du corpus avec les fréquences à

l’écrit et à l’oral; - la liste des lemmes théoriques de ces formes; - toutes les paires de mots de fréquence égale ou supérieure à 2 (2

millions et demi de paires) et qui ont une distance entre les éléments de 1 à 5 places à gauche et de 1 à 5 places à droite du noeud;

41

Page 42: De la Lexicologie à la Lexicographie

Maria Fernanda Bacelar do Nascimento

- la liste des lèmmes co-occurrents du noeud; - la fréquence du noeud dans le corpus et dans les paires ; - les indices combinatoires des paires (résultat statistique obtenu à

partir de l’information mutuelle); - les listes brutes des concordances des paires avec un contexte

restreint (une ligne) ou avec un contexte élargi. Ces listes sont organisées par lèmmes (du noeud et des co-occurrents) et contiennent des données de fréquence et les indices combinatoires;

- les associations de 5, 4, 3 et 2 mots contigus avec la fréquence et les contextes;

- les références bibliographiques de chaque contexte. En partant de ces résultats, nous voulons étudier les mots: - dans leurs relations avec d’autres mots avec lesquels ils co-occurrent

plus au moins systématiquement, de façon continue ou discontinue; - dans leurs relations avec les traits grammaticaux qui se dégagent de la

co-occurrence lexicale; - dans leurs relations énonciatives et contextuelles. J’ai choisi de vous parler surtout des faits d’associations lexicales parce

qu’ils sont assez négligés dans la plupart des dictionnaires portugais contemporains et, pourtant, ils contribuent fortement à la connaissance du fonctionnement et de la signification des mots. Les dictionnaires présentent surtout les phraséologies et, très peu de fois ou très assystématiquement, des co-occurrences préférentielles ou d’autres idiosyncrasies combinatoires qui correspondent au principe idiomatique de sélection lexicale, pour utiliser la terminologie de Sinclair (1991, p.110).

C’est exactement ici que l’intuition du lexicographe n’est pas suffisante, soit dans le choix, soit dans l'établissement de leur degré de figement, ou de leur fréquence dans les divers usages. Le recours au corpus est, dans ce cas, absolument indispensable.

Je présenterai quelques exemples de résultats obtenus après l’analyse lexicale des données brutes fournies par le Dictionnaire de Combinatoires du Portugais et qui mettent en évidence plusieurs types d’information que je crois utiles aux études du lexique en général et, notament, aux travaux lexicographiques.

Voici d'abord, un exemple qui prouve l’importance de l’équilibre du corpus.

Le même mot "azul", observé en deux corpus de dimensions semblables (corpus littéraire: 1.200.000 d'occurrences; corpus journalistique: 1.000.000 d'occurrences) a comme co-occurrents privilégiés des mots assez différents:

Ex. 1. Échantillon des concordances de "azul" <bleu> dans le corpus

littéraire: calor e luz. Também aquele céu azul me não dizia nada. Chamei um hã linda de sol brilhante, céu azul e mar azul. Estava maré vaza. seiras. A tarde macia, com céu azul, e o Sol morno cobrindo a ver saio em Olhão deslumbrado. Céu azul cobalto - por baixo chapadas bichos tivessem descido do céu azul e andassem ali perto, num voo

42

Page 43: De la Lexicologie à la Lexicographie

Associations lexicales: du corpus aux dictionnaires

la amenidade do tempo, dum céu azul puríssimo, subiram lentamente ando há sol, vento fresco, céu azul? E esta gente que acordou ind s@i. As estrelas luziam no céu azul e diáfano, a brisa temperada ciam, negros, torrados. No céu azul as últimas arribações tinham ra um rasto de estrelas no céu azul brilhante que estávamos a pis no próprio pescoço. Vê no céu azul, o negro velho. Não é a Lua, de estrelas cintilantes no céu azul. ar o caminho da estação. O céu azul cobria o homem que não temia : e, apesar do sol vivo, o céu azul parecia leve e muito remoto. ro do Santa Rosa melando o céu azul. - O Santa Rosa botou hoje? - rmada pelo mar azul e pelo céu azul, com uma borda de areal onde

céus azuis, densas florestas, / altas n luas, lagos, ramarias, / ... ... sol brilhante, céu azul e mar azul. Estava maré vaza. Pôs o fato variavam com a cor do mar, mar azul, verde, mar de chumbo nas noi @tINICIAL@t O mar azul e branco e as luzidias / Pedr a pincelada, maior, para o mar azul que não tem fim, até à linha i e que empoeira de azul o mar azul, fundindo-se com a névoa do a concha azul, formada pelo mar azul e pelo céu azul, com uma bord ... ... moço, bem entroncado, de olho azul, indaga: - Vocês lá , que sab mesmo - conveio o moço de olho azul. - Também eu quero mulher prà . Uma lágrima aflorava o olho azul de Frida, a voz embargada, um ôs nele o aço frio do seu olho azul: - Que tem um Baléi que se ca nem parecia gerada ali, olhos azuis, e era esbelta como um vime. cabelos louros, aqueles olhos azuis que lhe enchiam a alma de al ram no corpo da criança. Olhos azuis, cabelos loiros, linda... - com as lindas pennas de olhos azues e sahiu pavoneando por alli Um inglês, em frente, de olhos azuis e vagos, parecia nem dar pel de que só as mulheres de olhos azuis valiam afeição de homem. Con stas mulheres loiras, de olhos azuis e rosto comprido - as da Foz ção de Cristo loiro e de olhos azuis vai desabar, vai ter que adm sentava-se um cavador de olhos azuis, alto, que era o Gary Cooper de pele cor de leite, de olhos azuis, de cabelos loiros como os d s Neném, a bela Neném de olhos azuis, de tranças louras, toda sua deles serem loiros e de olhos azuis. Nunca ninguém nos explicou udo... Irradiava-lhe dos olhos azuis e límpidos uma decisão e uma s por ela, por causa dos olhos azuis e do talhe do corpo. As saud otilde tivesse os mesmos olhos azuis e aquêle talhe de corpo que tu os olhos verdes? «Nos olhos azuis de Georgina arde, em sereno m agonizava, a falar nos olhos azuis da menina, riu-se compassiva voz rouca, uma chama nos olhos azuis, que estavam quase pretos. - de bicho brilhou-lhe nos olhos azuis. - Não gostas dele, Manuel! ura luz do céu, como nos olhos azuis. «Nem o fogo - e o fumo das uanto tinha que dar. «Os olhos azuis de Georgina não dizem senão » O homem contemplou os olhos azuis e o cabelo grisalho ralo, do elho, queimado, tinha os olhos azuis, a barba e os cabelos ruivos les cabelos louros, e os olhos azuis, a pele macia, branca como a imado, a barba ruiva, os olhos azuis. Minutos depois o preá torci sem anéis... / Tinha os olhos azuis... Era loura e dançava... / os voltava a si. Os seus olhos azuis perdiam a névoa da morte. O otadas as cores, os seus olhos azuis sem nada dentro, o corpo mol ágrimas corriam dos seus olhos azuis sobre o pai, como um morto, ina de nórdico, nos seus olhos azuis, no seu loiro bigode de rapa do Henrique. O homem viu olhos azuis, e o cabelo muito curto e lo

Ex. 2. Échantillon des concordances de "azul" <bleu> dans le corpus journalistique: AR DE RELEVO NA EUROPA A bandeira azul da Europa foi este ano at s) e 93 (102 praias) . A bandeira azul da Europa é um galardão a e em 1996 irão hastear a bandeira azul correspondem a 34 por cen nacional é a Associação bandeira Azul da Europa - Seccão Portug 995 não tinha praias com bandeira azul) passou a dispor de duas: s medidas. A Campanha da bandeira Azul da Europa tem como object scarreta, a «Comissão da bandeira Azul disse não a quatro das ci ratado» pela Comissão da bandeira Azul, salientando que «se as f zem parte da Campanha da bandeira Azul. No que respeita a Portug das praias têm feito da bandeira azul. Para a associação, desde

43

Page 44: De la Lexicologie à la Lexicographie

Maria Fernanda Bacelar do Nascimento

ue, não vendo a habitual bandeira azul, poderão desconfiar da qu ade das praias lagao sem bandeira azul A Câmara de Lagoa deliber ade das praias lagoa sem bandeira azul Elisabete Rodrigues A Câm Lagoa, apesar de não ter bandeira azul, a autarquia esclarece qu liberou não içar a única bandeira azul atribuída às praias do co liberou não içar a única bandeira azul atribuída às praias do co Senhora da Rocha a única bandeira azul atribuída ao concelho, um ualidade ambiental valeu bandeira azul a 114 praias e quatro mar a Balnear das Velas. As bandeiras azuis passam este ano a estar veram o mesmo número de bandeiras azuis de 1995, embora em muito io recorde em número de bandeiras azuis da Europa, que foram atr s deixou de ter as duas bandeiras azuis ganhas em 1995, mas em c ão norte, com mais duas bandeiras azuis, e o Alentejo, com mais iástico povo empunhando bandeiras azuis e brancas, tudo acompanh aquela que ganhou mais bandeiras azuis, passando de 17 para 25. Algarve, com menos seis bandeiras azuis, foi a região que perdeu ... ... o Sul, em Mostar, os 52 capacetes azuis espanhós da Forpronu que nicações, em apoio aos "capacetes azuis" . S. J.A. namo não precisavam de "capacetes azuis" . Os moçambicanos são b que, com a chegada dos "capacetes azuis" , os preços subiram em do mandato aos 14 mil "capacetes azuis" instalados nos territór clara. Quando eles [os capacetes azuis] olham pela primeira vez A morte de 26 capacetes azuis por pistoleiros somalis eneral haverem morto 26 capacetes azuis paquistaneses. (Ver pág. e agora cerca de 7. 500 capacetes azuis e não deverá estar em co No Líbano, centenas de capacetes azuis foram mortos desde a cri o de um certo número de capacetes azuis, com o objectivo declara s jamais sofridas pelos capacetes azuis, desde os tempos da inte garmente conhecidos por capacetes azuis, de acordo com o uniform aram a tiro 26 dos seus capacetes azuis, complicando bastante a no Inverno, em dias frios de céu azul. No entanto, prefiro a Ca para os franco-atiradores: um céu azul, limpo e luminoso, sem ne ... ... ois madrilenos "louros e de olhos azuis" foram argumentos sufici o se fosse hoje, inglesa de olhos azuis, cabelos louros, bonita, . Samir, muçulmano loiro de olhos azuis, 12 anos magríssimos, fa ... ... e do CRSS usava as verbas do saco azul para reforçar o seu peso er a existência de qualquer "saco azul" , mas Silva Júnior acusa a social de Aveiro tinha um "saco azul" no BCP que o seu preside as sobre a existência de um "saco azul" não controlado no CRSS s inheiros provenientes de um "saco azul" cuja existência era desc irmado a a existência de um saco azul" , prometendo "assumir to "es". Uma vez recolhidos, os sacos azuis serão levados para uma e

Les exemples fabriqués, quoiqu’ils soient bien formés du point de vue syntaxique, sont très souvent considérés comme inacceptables par les locuteurs natifs. C’est un problème qui concerne l’usage, l’environnement textuel, les co-occurrences lexicales et que le lexicographe a du mal à résoudre sans avoir recours aux données attestées. C’est le cas, par exemple, des mots présentés comme des synonymes mais qui, comme le montrent les exemples 3 et 4 (combinatoire des mots "vasto" <vaste> et "amplo" <ample>) présentent des différences assez remarquables quand on observe leurs combinatoires éclairées par les contextes relevés dans un corpus bien équilibré. Cela peut aider le lexicographe, soit s’il veut choisir des citations, soit s’il veut s’appuyer sur les faits observés pour fabriquer des exemples plus naturels.

Ex. 3. Échantillon des combinatoires du mot "amplo" <ample>

Nombre de contextes sélectionnés :24 CONSENSO <consensus> Nombre de contextes générés: 24) amplos consensos IC: 10.277

44

Page 45: De la Lexicologie à la Lexicographie

Associations lexicales: du corpus aux dictionnaires

Nombre de contextes de la pair:7 consensos amplos (distance entre les formes:1)Répartition: source, fichier J7,4 do povo neste tempo: procura de consensos amplos e dinâmicos, em torno de «novo patriotismo» sampaio quer consensos amplos António Vinagre José Man o Grade Sampaio voltou a pedir «consensos amplos» para os «objectivos ess novo patriotismo» sampaio quer consensos amplos Sampaio voltou a pedir «c amplos Sampaio voltou a pedir «consensos amplos» para os «objectivos ess s graves», apelou à procura de «consensos amplos e dinâmicos, em torno de os de democracia é a de que os consensos "amplos e dinâmicos", em torno d Nombre de contextes de la pair:2 amplos consensos (distance entre les formes:1)Répartition: source, fichier J2,2 didamente, no PS estão em moda os amplos consensos. Até às legislativas de om o seu discurso no Pontal gerar amplos consensos fora das hostes laranja amplo consenso IC:7.856

Nombre de contextes de la pair:15 amplo consenso (distance entre les formes:1)Répartition: source, fichier A3,2 J12,10 gionalização e muito menos sem um amplo consenso, ou na Assembleia da Repú a a regionalização se houvesse um amplo consenso mas afinal basta a compan , em 1986, se deve estabelecer um amplo consenso, afinal, um Pacto Educati gionalização e muito menos sem um amplo consenso, ou na Assembleia da Repú a a regionalização se houvesse um amplo consenso mas afinal basta a compan ue deve ser encontrada na base de amplo consenso nacional, o que exige int PS). E voltou a defender «o mais amplo consenso possível» entre os partid nterior não ter sido resultado de amplo consenso político, pelo que teve, da regionalização resultar de um amplo consenso entre todas as forças pol nteressados e depois de obtido um amplo consenso". Um piscar de olhos aos ndentes em tribunal. Resultado de amplo consenso estabelecido entre todos ndentes em tribunal. Resultado de amplo consenso estabelecido entre todos está empenhado em promover o mais amplo consenso democrático em torno dess de do PS para se encontrar o mais amplo consenso que se revelar possível e e disponíveis para estabelecer um amplo consenso em volta desta matéria, é

Nombre de contextes sélectionées:18 DEBATE <débat> (nombre de contextes générés:18) amplo debate IC:6.560

Nombre de contextes de la pair:16 amplo debate (distance entre les formes:1) Répartition: source, fichier A4,1 R2,2 J10,10 , igualmente, a conveniência de um amplo debate interno que vá «tão longe tugal. Entretanto, tivera lugar um amplo debate, onde se verificaram as c ama do Governo prevê "estudos e um amplo debate quanto às condições organ facção, a Revolta Activa, propondo amplo debate para a redefinição da est elaborados estudos e promovido um amplo debate quando às condições organ facção, a Revolta Activa, propondo amplo debate para a redefinição da est ho vai defender a realização de um amplo debate interno sobre o tema e da o sábado. A assembleia suscitou um amplo debate que permitiu filtrar idei o foram objecto, como deveriam, de amplo debate técnico e político nos vá precedidas, na sua óptica, por um amplo debate público. António Guterres ece que essa ampla discussão, esse amplo debate, não terá sido tanto assi lo, até fins de 1993; mereceram um amplo debate, não só no seio das magis ssa altura até agora tem havido um amplo debate sobre as grandes revisões o território fosse precedida de um amplo debate público por forma a refor uar a ser vossa leitora sugiro: um amplo debate de modo a que participem uar a ser vossa leitora sugiro: um amplo debate de modo a que participem

45

Page 46: De la Lexicologie à la Lexicographie

Maria Fernanda Bacelar do Nascimento

Nombre de contextes de la pair: 2 debate amplo (distance entre les formes:3)Répartition: source, fichier A1,1 T1,1 tivo primordial é o de permitir o debate aberto e amplo juiz e os entre oeduzida inclusão e articulação no debate metodológico mais amplo da antrop

Nombre de contextes sélectionnés:13 ESPAÇO <espace> (nombre de contextes générés:13) espaço amplo IC: 5.706

Nombre de contextes de la pair: 9 amplo espaço <ample espace> (distance entre les formes:1) Répartition: source, fichier A1,1 R1,1 T1,1 U1,1 J5,4 asicamente, pela criação de um amplo espaço de lazer, de convívio, pedon digital, travão de disco e um amplo espaço debaixo do assento para todo a que "não sejamos somente "um amplo espaço de comércio livre" e tenhamo is do que tudo, ao percorrer o amplo espaço que se não via. «Curiosa est nte educativa e tornando-o num amplo espaço de realização do cidadão, pr a circulação, alargando-se num amplo espaço, a sala aberta sobre a paisa ção dos tempos livres. Terá um amplo espaço para convívio e formação nas Para além disso, ali, naquele amplo espaço, toda a gente pode apreciar cto3" inaugurar um novo e mais amplo espaço no seu bairro de sempre, o B

Nombre de contextes de la pair: 4 espaço amplo (distance entre les formes:1) Répartition: source, fichier R1,1 T1,1 U1,1 J1,1 himento aos lisboetas "será um espaço amplo e confortável, sem barreiras idade a que ele o obrigara: no espaço amplo do Terreiro ainda vazio de c por referenciar a análise a um espaço amplo (que como tal não chega a se loja Luís Cunha Decoração. Um espaço amplo e funcional onde poderá enco

Nombre de contextes sélectionnés:9 VISÃO <vision> (nombre de contextes générés:9) visão ampla <vision ample> IC:6.667 Nombre de contextes de la pair:6 visão ampla (distance entre les formes: 2)Répartition: source, fichier R1,1 T2,2 E1,1 J2,2 s no sector das inspecções: "Uma visão mais ampla" e "um trabalho mais efi antropólogos - seja através duma visão mais ampla das relações sociais, de balhos possuem o de permitir uma visão mais ampla e correcta de agrupament ste com o peso atómico . Com uma visão mais ampla, @iMendeleiev@i colocou avés da leitura que consegui uma visão mais ampla da vida. "US" - Para faz tugal é um país aliado e tem uma visão mundial ampla». O representante per

Nombre de contextes de la pair:3 visão ampla (distance entre les formes:1) Répartition : source, fichier T1,1 U1,1 J1,1 m alegrias nem tristezas, nem a visão ampla da cidade ao sol; e senti de melhor, devia ter-se agido com visão ampla e não ao sabor dos calendári arão melhor a necessidade desta visão ampla do fenómeno. O primeiro refe

Nombre de contextes sélectionnés:8 SAIA <jupe> (nombre de contextes générés:8) saia ampla IC:6.846

46

Page 47: De la Lexicologie à la Lexicographie

Associations lexicales: du corpus aux dictionnaires

Nombre de contextes de la pair:6 saia ampla <jupe ample> (distance entre les formes:1) Répartition : source, fichier R4,3 U2,2 ensarilhando as pernas perras na saia ampla e comprida, levou-me até à sal a lãzinha cor de ervilha seca, a saia ampla e comprida, o casaquinho curto esa 2- Top bordado a conotilho e saia ampla trabalhada a tule e veludo, br que usam. @t@bA CINTURA FINA E A SAIA AMPLA RETOMAM OS SEUS DIREITOS@b@t O com barbas de baleia no busto e saia ampla. Depois viria o exagero das cr laço atrás. Fita encrustrada, na saia ampla 3 - É de popeline de riscas es

Nombre de contextes de la pair:2 saia ampla (distance entre les formes:2) Répartition : source, fichier R2,2 canotilho e fio prateado com saia muito ampla, de lindíssimo corte, do mes a galão ou ponto em cruz 3 - Saia muito ampla, executada em lainage fina,

Nombre de contextes sélectionnés:7 SUFICIENTEMENTE <suffisamment> (Nombre de contextes générés:7) suficientemente amplo IC:6.622

Nombre de contextes de la pair:4 suficientemente amplo (distance entre les formes:1) Répartition : source, fichier T4,3 Fernandes «um pátio inferior suficientemente amplo para que nele decorre igência de um pátio interior suficientemente amplo para que nele se dese em que basear-se num acervo, suficientemente amplo, de resultados das ob erização estrutural deve ser suficientemente amplo. A tal aconselham a c suficientemente ampla IC: 6.438

Nombre de contextes de la pair:3 suficientemente ampla (distance entre les formes:1) Répartition : source, fichier T1,1 J2,2 exemplificativo, mas que é suficientemente ampla para abranger os núcleos é relativamente clara mas suficientemente ampla. Quanto à dicção, prima p enho moderno e rectilíneo, suficientemente ampla para agrupar revistas e j

Nombre de contextes sélectionnés:7 DISCUSSÃO <discussion> (nombre de contextes générés:7) discussão ampla IC: 6.109

Nombre de contextes de la pair : 4 ampla discussão (distance entre les formes:1) Répartition : source, fichier A1,1 J3,3 ições nacionais, tema que gerou ampla discussão. O representante do GD de s governos decidiu escamotear a ampla discussão pelas suas populações do do. No entanto, parece que essa ampla discussão, esse amplo debate, não t concelho, o PDM foi alvo de uma ampla discussão dos órgãos autárquicos e

Nombre de contextes de la pair : 3 discussão ampla distance entre les formes:2) Répartition : source, fichier: J3,3 o Gomes, poderia ter havido uma discussão mais ampla sobre esta matéria. " ede-se de novo muita calma, uma "discussão pública ampla profunda e cautel ede-se de novo muita calma, uma "discussão pública ampla profunda e cautel

47

Page 48: De la Lexicologie à la Lexicographie

Maria Fernanda Bacelar do Nascimento

A-Assemblée de la République; J- Journal ; D- Droit; R- Magazine; T- Livre téchnique; E- Livre didactique; U- Livre litéraire ;

Ex. 4. Échantillon des combinatoires du mot "vasto" <vaste>

Nombre de contextes sélectionnés: 27 GAMA <gamme> (nombre de contextes générés:27)

vastíssima gama <gamme très vaste> IC: 7.615

Nombre de contextes de la pair : 2 vastíssima gama (distance entre les formes:1) Répartition : source, fichier R2,2 de beleza natural e apresenta uma vastíssima gama de produtos que vão dos , encontrará no "Saiaecasaco" uma vastíssima gama de tecidos e cortes únic gama vasta 7.162

Nombre de contextes de la pair:23 vasta gama (distance entre les formes:1) Répartition : source, fichier R12,11 L1,1 J10,7 au atarvés da transacção de uma vasta gama de produtos essenciais. Alguns m condições vantajosas devido à vasta gama de serviços oferecidos, aos be ruir laseres sintonizáveis numa vasta gama do espectro luminoso visível, tural de Belém uma exposição da vasta gama de produtos médicos e de aplic s firmas». A empresa possui uma vasta gama de produtos, destacando-se, to io privilegiado de pagamento. A vasta gama de cartões que inundou o merca ceiro. têm já ao seu dispor uma vasta gama de cartões, não só na vertente elho da Amadora tem atraído uma vasta gama de actividades económicas, das ersões tem à sua disposição uma vasta gama de opções, como expansões de m onhecimento com pormenor de uma vasta gama de materiais metálicos, refrac para o Macintosh, fornecem uma vasta gama de funções para várias operaçõ nome de costas largas para uma vasta gama de sistemas operativos ligeira g e publicidade que oferece uma vasta gama de serviços e está apta a resp promoção da sua imagem e da sua vasta gama de produtos. Esta decisão surg entrou no mundo da escrita Uma vasta gama de qualidade em canetas, em qu de maquilhagem, oferecendo uma vasta gama de produtos e uma excelente re elhor para todos os gostos: uma vasta gama de préconfeccionados, concebid ional. Este hotel dispõe de uma vasta gama de quartos, todos com varanda ozes, creme de gruyère. Uma tão vasta gama de queijos complementa e refor ão da Brooksfield apresenta uma vasta gama de modelos absolutamente encan rmatos diferentes, cobrindo uma vasta gama de apuradas dentaduras, fabric ional. Este hotel dispõe de uma vasta gama de quartos, todos com varanda ade de mostrar, uma vez mais, a vasta gama dos seus recursos. Prossegue,

Nombre de contextes de la pair: 2 gama vasta (distance entre les formes:2) Répartition : source, fichier L2,2 o clima ocorrem numa gama muito vasta de escalas da fenomenologia. Vão des A utilização de uma gama tão vasta de materiais provoca a busca de novas

Nombre de contextes sélectionnés: 27 ÁREA <aire> (nombre de contextes générés:27)

áreas vastas IC: 6.749

48

Page 49: De la Lexicologie à la Lexicographie

Associations lexicales: du corpus aux dictionnaires

Nombre de contextes de la pair: 5 vastas áreas (distance entre les formes:1) Répartition : source, fichier R1,1 L3,2 J1,1 é terem como principal componente vastas áreas de várzea entre encostas d que se estendia desde a Europa até vastas áreas do Atlântico Norte. Este i ividir o território de Portugal em vastas áreas com características climát amente, o POZOR, ao reconhecer que vastas áreas sob a jurisdição da APL po e seria @B"entregar"@B sem combate vastas áreas aos "mujaheeden", esperand

Nombre de contextes de la pair : 2 áreas vastas(distance entre les formes:2) Répartition : source, fichier L1,1 J1,1 m, igualmente, sentir em áreas mais vastas, alguns mesmo à escala dos dife p riamente ditas, abarcam áreas tão vastas como a organização interna orien

vastíssima área 6.458

Nombre de contextes de la pair: 2 vastíssima área (distance entre les formes:1) Répartition : source, fichier R2,2 dade de chegada ao rio nessa vastíssima área. Por outro lado, em áreas em nvolvem a urbanização de uma vastíssima área da cidade, sem que a câmara vasta área 5.677

Nombre de contextes de la pair: 18 vasta área (distance entre les formes:1) Répartition : source, fichier R5,5 L7,5 J6,6 na ilha da Madeira e destruiu vasta área florestal, já atingiu o concel ilância electrónica sobre uma vasta área oceânica (Paços de Ferreira, M ojos estão espalhados por uma vasta área, alguns deles são semelhantes nto constitui o centro de uma vasta área ajardinada, já projectada, a q e pairara, imemorial, sobre a vasta área. Todavia, o lado de lá da calç ceirais do Mondego. Toda esta vasta área se anima de cenas particulares al, a salsa. Após a horta uma vasta área perfumada de árvores de espinh criado um governo livre numa vasta área continental, sem terem sacrifi cêndio que na Páscoa consumiu vasta área do concelho de Albergaria-a-Ve meningo-encefalite) como pela vasta área geográfica que abrange, no Ext sivamente humana, que tem uma vasta área de distribuição que engloba, p tureza", "a vizinhança de uma vasta área naturalizada protegida" (prote ndo o que está em causa é uma vasta área de grande sensibilidade. "Quer posta, este livro abrange uma vasta área que interessa a qualquer mulhe com sentimento». Abarcam uma vasta área de actuação, sendo Margarida a Portugal onde se encontra uma vasta área montanhosa que dá pelo nome de , viram esta peça. Daí que na vasta área de Campolide se siga com muita plano que vai beneficiar uma vasta área com cerca de quatro mil habita

Nombre de contextes sélectionnés: 13 ZONA <zone> (nombre de contextes générés :13)

vastíssima zona IC: 6.521

Nombre de contextes de la pair: 2 vastíssima zona (distance entre les formes:1) Répartition : source, fichier R1,1 J1,1 os nossos direitos sobre uma vastíssima zona desse oceano que tão intimame riental da cidade, que é uma vastíssima zona por cima da av. Gago Coutinho vastas zonas 6.039

49

Page 50: De la Lexicologie à la Lexicographie

Maria Fernanda Bacelar do Nascimento

Nombre de contextes de la pair: 3 vastas zonas (distance entre les formes:1) Répartition : source, fichier A1,1 L1,1 J1,1 desenvolvimento económico de vastas zonas inóspitas ou escassamente povoad go assume, é a existência de vastas zonas do globo em que as mulheres, tal o sul pelo Tejo, formam duas vastas zonas de terrenos paleozóicos, uma cor vasta zona 4.928

Nombre de contextes de la pair: 8 vasta zona (distance entre les formes:1) Répartition : source, fichier R2,2 L1,1 J5,5 um lado, na «destruição de uma vasta zona verde e, por outro, numa espécie uindo as próprias termas e uma vasta zona de serra, em pleno Parque Nacion sul, saibamos construir, nesta vasta zona do Atlântico, que nos é tão fami cêndios reduziram a cinzas uma vasta zona das freguesias de Valadares, San ria, prevendo a criação de uma vasta zona de comércio livre. Este acordo, ha freguesia de Santa Eulália, vasta zona um pouco acidentada, granítica e 60 mil pessoas oriundas de uma vasta zona do interior que vai até Santarém gico. Uma vedação circunda uma vasta zona de areia, aqui e ali montículos

Nombre de contextes sélectionnés : 11 REGIÃO <région> (nombre de contextes générés:11) vastas regiões IC: 6.372

Nombre de contextes de la pair : 6 vastas regiões (distance entre les formes:1) Répartition : source, fichier R1,1 L4,3 J1,1 mento da ordem mercantil a vastas regiões do globo antes empobrecidas pe multimoda de países ou de vastas regiões, mesmo que não sejam cosmópoli e importância sanitária em vastas regiões do Oriente. Os adultos vivem n ea de distribuicão engloba vastas regiões de África e do Médio Oriente, nte pressão demográfica em vastas regiões do mundo; - o envelhecimento d agicamente absorvido pelas vastas regiões selvagens da savana queniana. vasta região 3.843

Nombre de contextes de la pair: 3 vasta região (distance entre les formes:1) Répartition : source, fichier R1,1 L1,1 J1,1 egisto da actividade nessa vasta região submarina, sobre a qual se dispõe Primavera. Todavia, em tão vasta região de clima mediterrânico, onde a pl l. Pólo chama Cathay a uma vasta região da China do Norte, onde ficava a vasto região 3.382

Nombre de contextes de la pair: 2 vasto região (distance entre les formes:3) Répartition : source, fichier L2,2 as únicas excepções do vasto lençol da região dos terrenos terciários. Na cortando de lés a lés o vasto losango da região. O trabalho de erosão apen

Nombre de contextes sélectionnés : 9 ESPAÇO <espace> (nombre de contextes générés:9) vastos espaços IC: 6.296

50

Page 51: De la Lexicologie à la Lexicographie

Associations lexicales: du corpus aux dictionnaires

Nombre de contextes de la pair: 2 vastos espaços (distance entre les formes:1) Répartition : source, fichier L1,1 J1,1 jovens actrizes e actores. Os vastos espaços da Alfândega do Porto serão negações e afirmações ocupam vastos espaços da sua alma. Ela move-se rìt vasto espaço 4.607

Nombre de contextes de la pair: 7 vasto espaço (distance entre les formes:1) Répartition : source, fichier R2,1 L3,3 J2,2 ocuparam rapidamente um vasto espaço do mercado daquele tipo de folhas o mal acostumados àquele vasto espaço, a tanta luz, ao seu próprio chiq mesas espalhadas por um vasto espaço, tinha o nome de Toque-de-Classe. ntais, que enquadravam o vasto espaço onde (lembrava-se sempre disso, q e colunas em mármore, um vasto espaço cheio de luz e silêncio; se os tr sombro? Mais uma vez, um vasto espaço entre duas longas filas de coluna ociais e culturais deste vasto espaço nacional, contribuindo, simultane

Nombre de contextes sélectionnés: 9 LEQUE <éventail> (nombre de contextes générés: 9) vasto leque IC: 7.570

Nombre de contextes de la pair : 9 vasto leque (distance entre les formes:1) Répartition : source, fichier R4,4 J5,5 até Outubro, que inclui um vasto leque de matérias: direitos fundamentai r Koj é responsável por um vasto leque de iniciativas de promoção da cul que permite a oferta de um vasto leque de possibilidades de licenciatura desta medida resultou num vasto leque de comissões cobradas pelos banco ia destinado a analisar um vasto leque de assuntos internacionais, onde Dão a verdadeira noção do vasto leque de produtos que a mulher pode e d , a Conferência adoptou um vasto leque de medidas administrativas e jurí Um bom entrevistado tem um vasto leque de aasuntos abordáveis e disserta Um bom entrevistado tem um vasto leque de assuntos abordáveis sabe disse

Nombre de contextes sélectionnés: 7 PLANÍCIE <plaine> (nombre de contextes générés:7) vasta planície IC: 7.222

Nombre de contextes de la pair: 7 vasta planície (distance entre les formes:1) Répartition : source, fichier L7,4 arremessar a água. Agora, na vasta planície, só havia homens de armas. Os agora toda negra e triste. Na vasta planície, jazem os Jacques mortos. Fin breavam. Em volta, por toda a vasta planície, era uma confusão de carros d a todo o momento desmaia e a vasta planície vaporizada ilumina-se de uma es. É um saleiro. Ao longe na vasta planície retalhada, correndo a par de da e brilhante do restolho, a vasta planície, em que se distinguem dissemi é como um beduíno do Nilo. A vasta planície matizada de povoações e bosqu A-Assemblée de la République; J- Journal ; D- Droit; R- Magazine; L- Livre;

51

Page 52: De la Lexicologie à la Lexicographie

Maria Fernanda Bacelar do Nascimento

L’observation des combinatoires d’un mot révèle aussi, assez nettement, les divers sens liés aux différents domaines thématiques dans lesqueles il est employé. L’exemple 5 (combinatoires du mot "complexo") en est la preuve.

Ex. 5. Échantillon des combinatoires du mot "complexo" <complexe>

Nombre de contextes sélectionnés :27 DESPORTIVO <sportif> complexo desportivo IC:7.205 Nombre de contextes de la pair :25 complexo desportivo (distance entre les formes:1) eitas no molhe do rio, do complexo desportivo da Cova e do parque intern ra, conseguiu uma sala no complexo desportivo da Lapa, que vai partilhar es, as quais se situam no complexo desportivo da Luz. Aí, os ficheiros e mil; à tarde, inaugurei o Complexo Desportivo de Pedrouços, que inclui o r, mas, tratando-se de um complexo desportivo de um clube, é evidente qu ilhão Borges Coutinho, no complexo desportivo do Estádio do Sport Lisboa vai utilizar o remodelado complexo desportivo do Estádio Universitário. l contos para as obras do complexo desportivo do Monte Aventino. No dia ndonava as instalações do Complexo Desportivo do Vitória sob apupos da m s a mais na construção do complexo desportivo e cultural do Monte Aventi ação directa. As obras no complexo desportivo e de lazer do Luso, na zon em acesso aos relvados do complexo desportivo Knockrabo, onde a selecção tárquica -, o projecto do complexo desportivo municipal de Santo Tirso p a construção de um grande complexo desportivo municipal, onde não faltar naquele que já é o melhor complexo desportivo português vocacionado para eitadas". A construção do Complexo Desportivo Regional - 1ª fase, relati ulo está na construção do complexo desportivo regional da Cova. Aqui, os complexos desportivos IC:6.281 Nombre de contextes de la pair :2 complexos desportivos (distance entre les formes:1) em cinemas, casas particulares e complexos desportivos abandonados. Em po ndo - a rua termina numa zona de complexos desportivos onde a esta hora e

Nombre de contextes sélectionnés:25 TURÍSTICO <touristique> complexo turístico IC:7.766 Nombre de contextes de la pair:20 complexo turístico (distance entre les formes:1) a qual se ergue o acolhedor complexo turístico. Chegados à margem da alb riscas, enfiados num antigo complexo turístico, encontram-se desesperado tra-se refugiado num antigo complexo turístico de luxo, sobre o lago Tan plexo turístico na Caparica Complexo turístico na Caparica A Câmara Muni conjunto arquitectónico do complexo turístico e hoteleiro que dotará Se m obras de restruturação do complexo turístico da Penha, além de estar p de instalação de um enorme complexo turístico na Península de Tróia, le poucos meses um importante complexo turístico na Quinta da Fonte Quente foi inaugurado um magnífico complexo turístico: o Caesar Park Penha Long nto do hotel, integrado num complexo turístico atingido pela ampliação d

52

Page 53: De la Lexicologie à la Lexicographie

Associations lexicales: du corpus aux dictionnaires

ra da sua compra em 1982, o complexo turístico encontrava-se em adiantad resa referiu ao EXPRESSO, o complexo turístico será contruído em pleno b e Sebastião JORNAL PUBLICO: Complexo turístico na Caparica Complexo turí Judas lança a sua revolução Complexo turístico na Caparica "É um autênti des, o abastecimento do seu complexo turístico com frutas, verduras, etc adquiridos . No futuro , um complexo turístico nascerá em Cascais integr arária, dizia respeito a um complexo turístico a implantar na zona centr ccontos na costrução de um complexo turístico em Alhos Vedros que integ o Pereira de Sousa Fotos Um complexo turístico está em vias de ser const complexos turísticos IC:7.493

Nombre de contextes de la pair:5 complexos turísticos (distance entre les formes:1) inanciar a recuperação dos complexos turísticos, cujo património está aval s, quer na recuperação dos complexos turísticos de Vidago e de Pedras Salg mbos os empreendimentos em complexos turísticos que integrarão hotéis de l de hotéis, grandes hotéis, complexos turísticos, transportadores, órgãos o que pode ser apreciado são complexos turísticos pretensiosos a engolir as

Nombre de contextes sélectionnés :13 EXTREMAMENTE <extrêmement> extremamente complexo IC:5.980 Nombre de contextes de la pair:10 extremamente complexo (distance entre les formes:1) uma estrutura ou um conteúdo extremamente complexo. Não falta inclusivamen t O funcionamento cerebral é extremamente complexo. A sua actividade integ ral do planeta - é frágil, é extremamente complexo e inconstante, é divino e Gilbert Sabine - @B" mas é extremamente complexo restringir os meios das e de um problema de educação extremamente complexo. A prevenção do cancro dor entra num ciclo infinito extremamente complexo que pode danificar o mi júnior). «Sabes como eu sou, extremamente complexo, eu sou extremamente co xtremamente complexo, eu sou extremamente complexo, percebes?, como um jog Nombre de contextes sélectionnés :11 INFERIORIDADE <infériorité> complexos inferioridade IC:8.891 Nombre de contextes de la pair: 5 complexos inferioridade (distance entre les formes:2) keys, sofrendo de graves complexos de inferioridade face aos seus cavalos, neira de driblar os seus complexos de inferioridade histórica. Ao assumire de carácter altruísta e complexos de inferioridade perante o bulício cres ceitos nacionalistas nem complexos de inferioridade, porque é decisivo dar g para se libertarem dos complexos de inferioridade. "Temos uma vantagem c complexo inferioridade IC:8.047

53

Page 54: De la Lexicologie à la Lexicographie

Maria Fernanda Bacelar do Nascimento

Nombre de contextes de la pair: 6 complexo inferioridade (distance entre les formes:2) ício, perseguindo-nos até ao complexo de inferioridade, ao tic, à mania da jamais conseguira dominar o complexo de inferioridade causado pela longa nte, Edith Head sofreu de um complexo de inferioridade em relação à sua fi nos cafés e cabeleireiros, o «complexo de inferioridade». O bendito «compl o Sr. Truman, liberto já do complexo de inferioridade que a sombra desmed de inferioridade». O bendito «complexo de inferioridade» que contribuiu em

La présentation de ces quelques exemples a tenté de montrer quels sont les outils développés au Centre de Linguistique de l’ Université de Lisbonne et comment lesquels, dans le cadre d’une collaboration avec des lexicographes, ils pourraient être disponibilisés. Nous croyons que la nécessité de rendre accessible aux utilisateurs des dictionnaires les combinatoires attestées (groupes de mots plus ou moins figés, rections, locutions) est un vieux problème lexicographique auquel le traitement informatique des corpus pourra donner de nouvelles réponses.

Références Bibliographiques

HABERT, B., NAZARENKO, A. & SALEM, A. (1997), Les Linguistiques de Corpus, Paris, Armand Colin.

SINCLAIR, J. (1991), (éd.) Corpus, Concordance, Collocation, Oxford, Oxford University Press.

54

Page 55: De la Lexicologie à la Lexicographie

Lexicography, Lexicology, Linking and the Hub-and-Spoke Model

W. Martin Vrije Universiteit Amsterdam

0. Introduction In the introduction to her article entitled “Lexicology and Lexicography Revisited” S. Nuccorini observes that ‘lexicography has always been closely associated with lexicology, to the extent that, as stated by Wikberg (1983: 213) “it is not unusual, even for linguists, to confuse the two terms”’ (Nuccorini 1993: 127). In the rest of the article the author tries to ‘prove’ that one is dealing with two autonomous disciplines which (should) stand in a bilateral relationship to each other, yet, for all that, should not be confused with each other. In the end the same author comes to the conclusion that ‘it is not just good lexicology which ensures good lexicography’ and that ‘the traditional links going from lexicology to lexicography go also in the opposite direction’. Moreover, it seems to her ‘that lexicography does not fulfil just a practical task, and that it is high time that lexicographers, academics and linguists put lexicography on the professional and on the intellectual map’ (Nuccorini, o.c.: 137).

As a matter of fact, in this article we will start where Nuccorini has left off: the autonomy of lexicography will no longer be under discussion. Instead of that, lexicography, as it is conceived nowadays, will be ‘put on the intellectual map’ and taken as a starting point, reversing the ‘traditional links’, i.e. moving from lexicography towards lexicology and looking for the impact of the former on the latter. Not only will there be a change of perspective, but also one of theme, the main stress, in this article, falling on lexicographical infrastructure, an aspect not being dealt with at all in Nuccorini’s article. More in particular attention will be paid to the infrastructure needed for the construction of bilingual dictionaries and to the role that can be played in this respect by:

∗ data (such as linkable lexical databases); ∗ data manipulation (such as calculi to reverse and infer data from and the tools to

perform these actions); ∗ and data ‘models’ (larger frameworks to specify and situate the data and their

manipulation in, such as the Hub-and-Spoke Model). At the end, we will examine whether, by the advent of new lexicographical infrastructure, a redefinition of the relationship between lexicography and lexicology is necessary. As a consequence, this paper shows the following structure: 1. Lexicography. 2. Lexicographical Infrastructure: the Construction of Bilingual Dictionaries. 3. Linking vs. Translation in Bilingual Dictionary Construction.

Page 56: De la Lexicologie à la Lexicographie

W. Martin

56

4. Linkable Reference Lexicons (LRL’s). 5. Manipulating LRL’s: Linking and Reversing. 6. A Framework for LRL’s: the Hub-and-Spoke Model (HSM). 7. Lexical Infrastructure and the Relationship between Lexicography and Lexicology. 1. Redefining Lexicography In order to define lexicography the following ‘frame’ (1) will be used: Lexicography is-ako activity is-of subtype production

agent lexicographer co-agent metalexicographer goal (scientific) description has-affected-object (parts/aspects of) vocabulary has-form book, CD-ROM, database,... means IT-tool agent IT-developer beneficiary user other-participants publisher, sponsor, data provider,...

Although this definition formally differs from what one finds in most handbooks (see for example Gouws 1989 and Lutzeier 1995), it does not really do so from the point-of-view of contents. Next to the possibilities that a frame offers on the levels of explicitness and consistency (2), perhaps what stands out the most in this definition in comparison with more ‘traditional’ ones, is the fact that lexicology here, as an activity, is not considered to be a stand-alone act of a lexicographer, but much more as a scene on which, next to lexicographers, different players, such as metalexicographers, tool developers, users and publishers play a role. It goes without saying that lexicographers themselves can take up more than one role in this ‘play’. In what follows we will more in particular stress the role of tools and infrastructure on the lexicographical scene (3). 2. ‘On the construction of Bilingual Dictionaries’ At the end of 1996, the European Commission (DGXIII) issued a call for a feasibility study ‘on the construction of bilingual dictionaries’. The study had to design a ‘plan for the creation of bilingual electronic dictionaries serving needs of language processing and human users in the context of the information society’ (Technical Specifications, p. 1). Moreover, it was further specified that ‘the plan should incorporate methods for

Page 57: De la Lexicologie à la Lexicographie

Lexicography, Lexicology, Linking and the Hub-and-Spoke Model

57

harmonising and standardising bilingual dictionary production out of separate monolingual dictionaries, and for promoting best practice among publishers and other data owners, and efficient costing in the field of bilingual dictionary production with a view to obtaining genuine economies of scale’. Against this background, from October 1997 until May 1998, a feasibility study has been carried out by a Consortium consisting of CLVV, IMS and CCL (4), yielding a report entitled ‘On the Construction of Bilingual Dictionaries’ (See Martin-Heid 1998). This report ends up with a series of recommendations in which an adequate infrastructure is proposed and in which it is, among others, stated that a linking-based approach is to be preferred to a directional (=translational) one ‘because linkable dictionaries lend themselves more easily to machine-use and re-use in general’ (Martin-Heid 1998: 84). In what follows we will elaborate upon the concept of infrastructure, starting with linkable dictionaries and their implications for lexicography. 3. Linking versus Translation in Bilingual Dictionary Construction Although every translator knows that it is impossible to translate properly working on the form level only, yet many translation dictionaries act as if this were the case. So it should not strike one as strange to find in a Dutch-French translation dictionary an entry such as: organisatie: organisation instead of (5): organisatie 1 [het organiseren] organisation 2 [het georganiseerd zijn, de wijze] organisation => structure, ordre 3 [vereniging] organisation => groupement, association The difference between the two should not be sought in the difference in size and target group (only), but much more in what is called the distortion of the Source Language (SL) by the pull of the Target Language (TL). Or in the words of Atkins:

‘One of the priorities of the new bilingual dictionary is to avoid the distortion of the source language analysis (...) by the pull of the target language equivalencies to be offered in the entry: the more sense overlap there is in the SL and TL lexical equivalents, then the greater the distortion’ (Atkins 1996; 527-528, my italics)

One could paraphrase bilingual lexicography ‘old style’, as mentioned by Atkins, as a translational approach, substituting SL items by TL items on form level, taking, on the meaning level, the TL as an organising principle. ‘New style’ bilingual lexicography could then be characterised as ‘linking’. This linking, however, involves more than just avoiding the ‘subtle distortion’ (Atkins, o.c.: 523) of the right-hand side on the left-hand side of a bilingual dictionary. An example can clarify what is meant.

Page 58: De la Lexicologie à la Lexicographie

W. Martin

58

Suppose one has an English lexical database containing the item glimmer. Suppose glimmer has got some additional information, both formal (e.g. that it is a verb) and semantic (e.g. that if something glimmers it produces or reflects a faint, often unsteady light). The transla tion of glimmer into Dutch which one finds in most translation dictionaries would imply providing one or more translation equivalents for it, e.g. zwak schijnen, glimmen, zacht schitteren, flikkeren, schemeren (6).

As one will observe, this approach yields one or more translations/equations for the SL item given. Moreover, the translations given are mostly monodirectional in a double respect. First of all the equations glimmer = zwak schijnen = glimmen = zacht schitteren = flikkeren = schemeren are monodirectional in the sense that they hold for the direction English-Dutch, but not necessarily so for the direction Dutch-English. In other words, it is possible that Dutch flikkeren e.g. is an ‘adequate’ translation equivalent for English glimmer, but that it is not, or far less, the case when reversing the equation (7). Furthermore, the information given is monodirectional (and implicit) in a second sense, namely by the fact that the possible differences that hold for the Dutch items among themselves are not given. Of course this ‘monodirectionality’ has to do with the fact that, often, bilingual dictionaries are meant for human users who are supposed to know sufficiently about their mother tongue, in this case Dutch. Monodirectionality here then means directed towards one group of users entailing implicitness.

Opposed to the translational method is the linking method. Linking, in this context, is to be defined as coupling semantic objects (meaning of words/expressions, not their mere form) of a language L1, with compatible objects of another language L2, by means of explicit links or relations, without any bias towards SL or TL. In this approach glimmer is not just put on a par with e.g. zwak schijnen as such, but there are several links, e.g. one from glimmer to schijnen and v.v. stating the hyper-/hyponymic relationship between the two, another one with zwak schijnen stating next to the equivalent relationship on conceptual level, the difference on the lexicalisation level, etc. (8).

The claim then is that linking lexical items from two different languages is much more ‘rewarding’ for bilingual lexicography than merely translating them. Not only because one avoids the distortion of the source language analysis by the pull of the target language equivalencies to be offered in the entry (see Atkins, o.c.: 527-528), but also because this approach leads to greater efficiency in operations such as reversal and derivation as will be illustrated in the sections to follow. 4. Linkable Reference Lexicons (LRL’s) If one accepts that, in bilingual dictionary construction, ‘linking’ outperforms ‘translating’ and so becomes the most basic, the primary, action, replacing translation, then one should not lose sight of the fact that ‘linking’, contrary to ‘translating’, ideally (9) presupposes (at

Page 59: De la Lexicologie à la Lexicographie

Lexicography, Lexicology, Linking and the Hub-and-Spoke Model

59

least) two lexical databases which should function as reference lexicons. These are lexicons that can function both as a SL- and as a TL-reference point. In other words, a RL can serve

• both as a point of departure linked up to one or more other RL’s; • and as a target point to which one can refer from one or more other RL’s.

So, although reference lexicons are created independently for individual languages and thus are monolingual, they must guarantee intercompatibility, which means that they should share some common background principles with regard to size and to semantic and pragmatic granularity. Actually, as a rule, good, descriptively adequate (10) monolingual dictionaries will qualify as useful linkable reference lexicons, provided that, among other things, they contain ‘words’ as objects, not as mere forms (FU’s = form units), but as combinations of form and meaning (LU’s = lexical units) (see preceding section). Otherwise it could be the case that, having linked the English form knight both with the French form chevalier and with the German form Ritter, chevalier and Ritter also would be linked to knight in its meaning as chess piece, which would lead to an incorrect link both for French (where one should find cavalier for the chess piece) and for German (where the correct link is with Springer or Pferd).

In the scheme which follows (fig. 1), therefore, a distinction is made between FU’s (= Form Units)

and LU’s (= Lexical Units or Meaning Units) and use is made of two types of links: attachment and translation links. FU ROS PAARD RIDDER language 1 LU [vlees] [dier] [dier] [schaak] [adel] [heer] LU [animal] [animal] [chess] [chevalier] [gentleman] FU STEED HORSE KNIGHT CAVALIER language 2 = Attachment Links; connect FU’s of one language to LU’s of the same language (11) = Translation Links; link LU’s in different languages (12)

Figure 1: Attachment and Translation Links One of the basic requirements for LRL’s then comes down to the fact that Linkable Reference Lexicons should contain LU’s, i.e. sense indicators (resumes, semantic types, definitions) of FU’s. Contrary to what one may expect, these sense indicators need not be expressed in the same (meta)language as long as one is working within a bilingual

Page 60: De la Lexicologie à la Lexicographie

W. Martin

60

framework. Furthermore, it should be obvious that when these sense indicators would be lacking for the Target Language (L2) reversing would entail quite a lot of post-editing, such as deleting the translation equivalent paard for knight in the meaning of chevalier. In figure 2 below a summary of the requirements for LRL’s is given (13). Task → Linking Required information type ↓ FU ↔ LU + + Explicit sense indicators + + Semantic relations + Pragmatic Constraints + Figure 2: Requirements for LRL’s 5. Manipulating LRL’s: Linking and Reversing 5.1 Links In order for LRL’s to function in bilingual dictionary construction there should not only be the LU’s as proper objects where to hook up translation links (see fig. 2), but also the links themselves should be expressed in an adequate and explicit way. As a rule this can be done by making use of the following four parameters: - conceptual equivalence - pragmatic contrast - variant status - lexicalisation status As we have dealt with these parameters elsewhere (see Martin-Tamm, 1996, 682 ff.), we will only briefly deal here with the most important ones: the pragmatic contrast and the conceptual equivalence. 5.1.1 Pragmatic Contrast As each Lexical Unit should be accompanied by a specification of its pragmatic value, a pragmatic calculus can be carried out while linking two lexical units. So e.g. although from a conceptual point-of-view the English word bed and the Dutch words bed, nest and sponde all refer to the same concept, their pragmatics greatly differ. In both languages bed is the neutral term, Dutch nest being informal, sponde being formal and obsolete. As a rule the pragmatic calculus can be tuned so for it to yield a blocking between items or a

Page 61: De la Lexicologie à la Lexicographie

Lexicography, Lexicology, Linking and the Hub-and-Spoke Model

61

blocking only when going in one particular direction, allowing e.g. the direction marked item → unmarked item, but not vice versa (for more examples see Martin-Tamm, 1996, 684 ff.). 5.1.2 Conceptual Equivalence Given the fact that it is hard ever to find true interlingual synonyms, one could of course argue that this interlingual information [i.e. the difference between items from different languages] could be calculated from the data contained in the monolingual reference lexicons, in particular in the semantic section. However, taking into account on the one hand the fact that an explicit and formal system to represent lexical meaning is not available at present, and, on the other hand, that, when linking two languages to each other, it is very useful to do so in a way which is as economical and powerful as possible, we consider it very useful for explicit links to inform about the so-called degree of conceptual equivalence. Let us take up the case of ombre. In English ombre is to be translated by two hyponyms, viz. shade (focusing on the locative aspect of ombre) and shadow (focusing on the formal aspect). If one has a set of values such as (see Martin-Tamm, 1996, 683):

- complete equivalence (i.e. there is complete equivalence between Source Language LU (SLU) and Target Language LU (TLU))

- hyperonym (i.e. the TLU is the hyperonym of the SLU) - hyponym (i.e. the TLU(’s) is/are (a) hyponym(s) of the SLU) - substitution by near equivalent (e.g. English barrister vs. Dutch advocaat)

- related (e.g. the English series shine, glimmer, glisten, glow, glitter and the Dutch series schijnen, schitteren, flikkeren, glimmen, glinsteren, flonkeren)

then this set of values not only makes the choice between equivalents easier, it also makes the reversal of equivalents much more accurate when moving from the A-B part to the B-A part, a fact which is extremely important in the dictionary making process. Compare the case where the hyponym-link between the English LU inflection and the Dutch verbuiging, vervoeging will be inverted into a hyperonym-link when reversal takes place. Explicitly stating the relationship here implies that the semantic constraints in the hyponym-linking (viz. <w.r.t. nouns and adjectives> and <w.r.t. verbs> respectively) will now be transformed into semantic specifications, thus not yielding Dutch vervoeging = English inflection, D. verbuiging = E. inflection, but D. vervoeging = E. inflection <of verbs> and D. verbuiging = E. inflection <of nouns/adjectives>. 5.2 Reversal of bilingual dictionaries In the preceding sections we have been dealing with data (see LRL’s, section 4) and data manipulation (linking, see section 5.1). It is obvious that in order to manipulate data one needs tools to manipulate them with. One such a tool is OMBI. However, as dealing with OMBI would lead us too far here, see Martin-Tamm, 1996 and Martin-Heid, 1998, for further details, we may suffice here by stating that OMBI (an acronym for OM(keerbare)

Page 62: De la Lexicologie à la Lexicographie

W. Martin

62

BI(linguale) woordenboeken = Reversible Bilingual dictionaries) is an editor for bilingual dictionaries which, as most dictionary editors, is a device to guide, structure and correct input according to a predefined grammar. Moreover, OMBI also has linking and reversing facilities. In other words, with OMBI (or OMBI-like editors) one can • create LRL’s • link them • and automatically and accurately reverse the links The latter is the case because of the fact that • links are typed (meaning that there are links of different types showing different

values, e.g. complete equivalence, interlingual hyperonymy, etc. for the type ‘equivalence’)

• and a calculus defines what can be done with the values of the different types: which links are reversible, which ones are not, under which conditions, etc.

In the rest of this section we will first give an example of an OMBI input (5.2.1), followed by an extract from the reversal calculus (5.2.2), to end up with some illustrative cases (5.2.3). 5.2.1 OMBI-input: Linking river to rivière Following is a screenprint (figure 3) showing the editing (linking) of the FU/LU river in the meaning ‘stream of water’ with the FU/LU rivière in the meaning ‘cours d’eau’. As one can notice the lexicographer has to choose a value for the conceptual equivalence link (specifying the meaning restriction in the case of a hyponym) and the same goes for the variant status (‘non variant’ meaning ‘main translation equivalent’). Pragmatic and lexicalisation contrasts do not have to be filled out here: on the basis of the properties of the FU/LU’s they are calculated and so automatically generated.

Page 63: De la Lexicologie à la Lexicographie

Lexicography, Lexicology, Linking and the Hub-and-Spoke Model

63

Figure 3: Scheme of the OMBI Screenprint of FU/LU river 5.2.2. Reversal Calculus The following table gives the reversal calculus with respect to the conceptual equivalence values. The left-hand side represents the values for the links between L1 and L2 which the lexicographer has to fill out (see 5.2.1). The right-hand side provides the reversal results which are automatically created.

Edit translation

Source river <noun>/stream of water Target rivière <noun>/cours d'eau

Translation Contrast

Conceptual equivalence Target is hyponym of source Meaning hyponym not flowing into sea (use language of hyperonym)

Target ? non-variant is translation of source ? variant

Source ? non-variant is ? variant translation of target ? non-permitted

Contrast there is no pragmatic contrast there is no lexicalisation contrast

v OK X Cancel

Edit translation

Source river <noun>/stream of water Target rivière <noun>/cours d'eau

Translation Contrast

Conceptual equivalence Target is hyponym of source Meaning hyponym not flowing into sea (use language of hyperonym)

Target

x non-variant is translation of source

0 variant

Source

x non-variant

is 0 variant translation of target

0 non-permitted

Contrast there is no pragmatic contrast there is no lexicalisation contrast

v OK X Cancel

Page 64: De la Lexicologie à la Lexicographie

W. Martin

64

L1⇒ L2 L2⇒ L1 complete equivalence ⇒ complete equivalence interlingual hyperonymy ⇒ interlingual hyponymy interlingual hyponymy ⇒ interlingual hyperonymy related equivalence ⇒ related equivalence substitution by explanation ⇒ ∅ substitution by borrowing ⇒ ∅ substitution by near equivalence ⇒ substitution by near equivalence Figure 4: Reversal Calculus for Conceptual Equivalence From the above, one can, among other things, infer that in the case English river French rivière (target = hyponym), the reverse will yield French rivière English river (target = hyperonym). Moreover, in reversing a Translation Equivalence Link that involves hyperonyms and hyponyms, the calculus will also generate the following output: if the unit in the target language, the translation equivalent, is a hyponym of the unit in the source language, the ‘meaning hyponym’ will show up as a constraint on the translation. A (Source) B (Target) river [flowing into sea] fleuve river [not flowing into sea] rivière In the reversed translation link, the unit in the target language, the translation equivalent, will be a hyperonym of the unit in the source language, therefore the ‘meaning hyponym’ will show up as a explicitation of the source language. B (Target) A (Source) fleuve river [flowing into sea] rivière river [not flowing into sea] 5.2.3 Some more reversal examples All examples following are given for illustrative purposes, their output being fully automatically generated by OMBI; notice that also the combinations/collocations are linked up correctly and that the results come in dictionary article lay out. As to the complexity of equivalence types, one could differentiate between • straightforward cases (1-to-1 relations) • more complex cases (1-to-n, divergence; n-to-1, convergence; n-to-n, multivergence)

Page 65: De la Lexicologie à la Lexicographie

Lexicography, Lexicology, Linking and the Hub-and-Spoke Model

65

kaneel cinnamon 1:1-relation card chart map1 divergence

kaart map2 1:n-relation ticket menu kaart bon ticket convergence lot n:1-relation paar1, sense1 pair, sense1 couple, sense1 multivergence paar1, sense 2 couple, sense2 n:n-relation paar2, sense1 couple, sense3 Results of reversal by OMBI with one Dutch LRL (14): INPUT kaneel <noun> <-;de/het; mn> 1. [zoete specerij] cinnamon a. een pijpje kaneel a

cinnamon stick b. een snuifje kaneel a pinch of cinnamon. paar1 <noun> <paren; het; n> 1. [tweetal] pair, couple a. twee paar schoenen two pair

of shoes b. dat is een ander paar mouwen [belg] that’s something different 2. [duo] couple a. zij vormen een mooi paar they make a lovely couple b. het koperen/gouden paar the couple celebrating their copper/golden wedding anniversary c. het jonge paar the young (married).

paar2 <noun> <-; het; n> 1. [kleine hoeveelheid] couple a. een paar keer a couple of

times b. over een paar minuten in a couple of minutes c. zo weet ik er nog wel een paar tell that to the marines.

OUTPUT cinnamon <noun> 1. [spice] kaneel a. a cinnamon stick een pijpje kaneel b. a pinch of

cinnamon een snuifje kaneel. pair <noun> 1. [two things] paar a. two pair of shoes twee paar schoenen. couple <noun> 1. [two things] paar 2. [two people] paar, koppel, stel a. they make a

lovely couple zij vormen een mooi paar b. a nice couple een leuk stel, een

Page 66: De la Lexicologie à la Lexicographie

W. Martin

66

aardig koppel 3. [small number] <informal> paar a. in a couple of minutes over een paar minuten b. a couple of times een paar keer.

It goes without saying that the resulting output is a kind of snapshot: a function of the input at a certain moment of time. Consequently, it is an incremental process: the more input is given, the more output will be yielded. In our case this is what one gets for the entries cinnamon, pair and couple, given as input only the items kaneel, paar1 and paar2 and no other ones which equally well could contain relevant information for cinnamon, pair and couple. The input of more D → E items can, of course, add to what already is generated (15). 6. A framework for LRL’s: combining bilinguals in the Hub-and-Spoke Model 6.1 Introducing the model In the preceding we have seen that by replacing the translation approach by the linking approach bilingual dictionaries can be made in an efficient and, qualitatively speaking, interesting way. Although at first sight there may be an apparent redundancy involved (see the organisatie example, section 3) and more effort is needed in the construction of one volume of a bilingual dictionary, the profits earned certainly outweigh the costs (16). This becomes even more apparent if one moves one step further, going beyond a language pair (A-B) and adding one more common language (C). In that case, one can construct what we have called elsewhere a hub-and-spoke configuration (see Martin 1996 and also Martin-Heid 1998) and fully exploit it by inferring links between the spoke-languages. The steps underneath will clarify what is meant: Step 1: Reversible links between two languages A and B (what has been presented and discussed up till now): A B Figure 5 Step 2: Add one language to the data collection for A ↔ B, for instance in the configuration below: A B C Figure 6

Page 67: De la Lexicologie à la Lexicographie

Lexicography, Lexicology, Linking and the Hub-and-Spoke Model

67

Language A functions now as a common link. It is called the hub-language in analogy with air-traffic organisation where often one does not fly directly from a (spoke) airport to another (spoke) airport, but via a hub, a central airport. B and C are the spoke-languages. Step 3: Infer the links between B and C by means of derivation rules: A B C Figure 7 A couple of observations seems to be appropriate: 1. The Hub-and-Spoke Model is a model with an enormous potential. Its strength lies in the fact that it exploits the intra- and interlingual relations in and between languages and does so via a hub (↔ bidirectionally). It is obvious, however, that the languages to be linked should show a sufficient degree of equivalence (17). 2. The productivity of the Hub-and-Spoke Model increases with the number of languages involved. Five languages, combined bidirectionally in language pairs, give e.g. rise to ten language combinations (fig. 8). The same amount of languages organised with one fixed hub have but to provide for four direct linkages, the six others being generated as spin-offs (see figure 9 (18)). One can imagine that the Hub-and-Spoke Model can offer interesting possibilities particularly in a multilingual environment, think of the EU, but also of the situation in South Africa, where there are also eleven official languages. In such a situation (eleven languages) 55 different pairs (=110 bilingual dictionaries; taking both directions into account) could be derived. In a hub-and-spoke configuration one could suffice with ten direct links (10 spokes to 1 hub), the remaining 45 being generated as indirect spin-offs. Actually, there is a gain in data production form the third language onwards. E F D

Page 68: De la Lexicologie à la Lexicographie

W. Martin

68

I S D = Dutch E = English F = French I = Italian S = Swedish

Figure 8: Five different languages giving rise to ten language combinations B A (Hub) E C D

Figure 9: Situation with one fixed hub 6.2 Illustrating the rules for the model In order for the Hub-and-Spoke Model (HSM) to be operational it should have inferential or derivation rules at its disposal: rules with which links between spoke-languages can be derived, given existing links between the spokes and a common hub. The hub-and-spoke inference calculus as it stands now has been implemented in a database system, but is not yet integrated in OMBI (19). To give an idea of the kind of rules that are at stake now an example follows (figure 10): A LU of L1 may be linked and reversed to a LU of L3 with respect to conceptual equivalence, if the conceptual equivalence value is ‘complete’ for one of the two hub-to-spoke links and the value of the other link is one of those in the first column of the following table: L1 ⇒ L2 or L2 ⇒ L3 L1 ⇒ L3 L3 ⇒ L1

complete ⇒ complete ⇒ complete hyperonym ⇒ hyperonym ⇒ hyponym

Page 69: De la Lexicologie à la Lexicographie

Lexicography, Lexicology, Linking and the Hub-and-Spoke Model

hyponym ⇒ hyponym ⇒ hyperonym related ⇒ related ⇒ related

Figure 10: Example of a derivation rule 6.3 An example of inferencing in the HSM What follows is an extremely simplified exemplification of the HSM taking just five lexical items (one French, two Dutch, two English) into account and looking at the result of linking them in a HSM-configuration. INPUT: three (monolingual) LRL’s containing respectively: • Dutch: huilen, wenen both meaning: tranen storten (shed tears); wenen is more formal (indicated as

↑) • English: cry, weep both meaning: shed tears; weep is more formal • French: pleurer meaning: verser des larmes (shed tears) Desired OUTPUT: 3 bilingual ‘dictionaries’ containing these items PROCEDURE: both French and English need to be linked to Dutch, which functions as a hub. This direct linking can be realised via (a tool such as) OMBI. As a result, two extra results will be generated: the reversal of French-Dutch and English-Dutch into Dutch-French and Dutch-English on the one hand, and, on the other hand, the linking of French to English and vice versa via inferencing. Schematically this looks as in the figures below: French English pleurer cry; weep Dutch huilen; wenen Figure 11: Linking, Reversing and Inferencing via one Hub In figure 12 the same process is schematised in two steps by the following graphical representation:

69

Page 70: De la Lexicologie à la Lexicographie

W. Martin

INPUT DIRECT INTERLINGUAL LINKS F pleurer verser des larmes info D huilen tranen storten info D wenen tranen storten info E cry shed tears info E weep shed tears info OUTPUT by means of direct linking by means of reversal by means of inference F-D D-F F-E pleurer = huilen ⇒ ↑wenen huilen = pleurer pleurer = cry ⇒ ↑weep E-D D-E E-F cry = huilen ⇒ ↑wenen huilen = cry ⇒ ↑weep cry = pleurer weep = wenen ⇒ ↓huilen wenen = weep ⇒ ↓cry weep = ↓ pleurer Figure 12: Results within HSM-framework 7. Conclusion: lexicographical infrastructure and the relationship between lexicography and lexicology In the preceding it has been demonstrated that lexicography in order to come to a good and efficient infrastructure, has to pay much attention to lexical structure. Paradoxically then, it seems that lexicography, while looking for its own tools and implements, shows a rapprochement with lexicology. Or to formulate it otherwise: the search for and the advent of a better lexicographical infrastructure entail both a better lexicography and a better lexicology. This does not lead to fusion, nor should it lead to confusion, instead a synergetic effect is created: ‘good’ lexicography, by constructing and making use of tools such as have been presented here, can offer new insights into the relational structure of the vocabulary, and, lexicology, in its turn, getting a new impetus by the advent of

70

Page 71: De la Lexicologie à la Lexicographie

Lexicography, Lexicology, Linking and the Hub-and-Spoke Model

lexicographical infrastructure, can make the latter profit from its newest insights and results with regard to the overall vocabulary structure.

In this respect one could speak of a cross-fertilisation between the two disciplines. On the one hand, this cross-fertilisation brings the dictionary closer to the lexicon, ‘making it more abstract’: lexicographers exploiting the systematicity and underlying relationships of the vocabulary in order to come to better, more efficient tools. On the other hand, the cross-fertilisation brings the lexicon closer to the dictionary, ‘making it more concrete’: lexicologists being confronted with the concrete data, needs and desiderata of makers of dictionaries. Both disciplines becoming better by this, this cannot but lead for both of them to a better and more identifiable place ‘on the intellectual map’ (Nuccorini, o.c.: 137). Notes 1 I use the term frame here as a knowledge representation scheme in the form of a matrix with slots, general conceptual categories, specified by fillers, (more) specific classes (see e.g. Martin 1994). 2 In Martin 1998 also flexibility is mentioned as one of the advantages of frame-based definitions at the level of representation. 3 Often the lexicographer takes up the role of a metalexicographer as well. He also may play a role in tool development providing linguistic and functional specifications. 4 CLVV stands for Commissie Lexicografische Vertaal Voorzieningen (Committee for Interlingual Language Resources), a Dutch-Flemish Governmental Committee consisting of a group of experts who give advice to both governments and help streamline and co-ordinate their (subsidisation) policy (see Martin 1995 and 1993). The seat of the CLVV is The Hague (The Netherlands). IMS= Institute für maschinelle Sprachverarbeitung, Universität Stuttgart; CCL = Computing Centre, University of Leuven. 5 This is actually a strongly simplified representation of what is found in Van Dale’s Groot Woordenboek Nederlands-Frans, 2nd edition, 1991, Utrecht. It is important to notice that here the source language (Dutch) is kept unbiased. 6 As is to be found in Van Dale’s Groot Woordenboek English-Dutch, 3rd edition, 1998, Utrecht. 7 Flicker and glitter would certainly stand as good, probably, better candidates. 8 Contrary to glimmer in English, zwak schijnen in Dutch is not lexicalised. 9 In theory, linking between two lexical databases can occur when the databases do not pre-exist: the objects of the databases are then created on the spot. However, this is far from ideal. A much more favourable situation occurs when the two or at least one database does exist (see Martin-Heid: 1998). 10 As is well known, description of lexemes can take place at several levels, ranging from form-related (graphemics, phonetics) to meaning and usage-related ones (semantics, pragmatics). In particular, the latter group is important for adequate and efficient linking. 11 The conditions are that one FU must have at least one LU and that LU’s must always be attached to a FU. 12 The fact that in this example more links could be made, e.g. also between ‘ros’ [dier] and ‘horse’ [animal] is not the point at issue here: it is for the lexicographer to decide which concrete items to ‘link’ and which ones not. 13 ‘++’ Indicates features which are indispensable for a LRL in order for it to qualify as such. ‘+’ Indicates dispensable features which, however, greatly facilitate the linking process. 14 This means that OMBI worked with only one database (the Dutch one) given, the English one was created while linking. 15 There always remains a post-editing phase, needed, among other things, to fill out the data bound to language B. These data cannot be generated by reversing A-B to B-A. 16 With OMBI e.g. a conservative estimation of the reduction in workload is to be at least 25% (see Groen, M. in ‘t, 1998: 80).

71

Page 72: De la Lexicologie à la Lexicographie

W. Martin

17 In Martin 1999 an experiment is reported involving Dutch, Afrikaans and Sepedi; Afrikaans acting as a hub, the other two languages as spokes. The derived results for Dutch and Sepedi are convincingly better then what is to be found in comparable dictionaries (Martin 1999: 41-42). 18 These spin-offs need, of course, a post-editing phase. 19 Actually what follows is based on Groot 1998. Bibliography ATKINS, B. (1996). Bilingual Dictionaries: Past, Present and Future, in: M. Gellerstam e.a. (Eds.),

Euralex ’96 Proceedings, I-II, Göteborg University, pp. 515-546. GOUWS, R.H. (1989). Leksikografie. Academia, Pretoria, 287 pgs. GROEN, M. IN ‘T (1998). Le dictionnaire bilingue. Une étude théorique et pratique sur l’opération

d’inversion. MA-Thesis in Lexicology, Vrije Universiteit, Amsterdam, 89 pgs. GROOT, E.N. (1998). The Hub-and-Spoke Model in Practice. MA-thesis in Lexicology. Vrije

Universiteit, Amsterdam, 55 pgs. LUTZEIER, P.R. (1995). Lexikologie: ein Arbeitsbuch, Stauffenburg, Tübingen, 167 pgs. MARTIN, W. (1994). Knowledge-Representation Schemata and Dictionary Definitions, in: Carlon,

K. e.a. (Eds.), Perspectives in English, Peeters, Leuven, 237-256. MARTIN, W. (1995). Government Policy and Bilingual Lexical Databases: the Action Plan for

Dutch, in: Second Language Engineering Convention, London, 1995, pp. 133-144. MARTIN, W. & TAMM, A. (1996). OMBI: an Editor for Constructing Reversible Lexical

Databases, in: M. Gellerstam e.a. (Eds.), Euralex ’96 Proceedings, I-II, Göteborg University, pp. 675-685.

MARTIN, W. (1998). Frames as Definition Models for Terms, in: Manu, A. (Ed.), Proceedings of the 4th Infoterm Symposium, Vienna, pp. 189-221.

MARTIN, W. & HEID, U. (Eds.) (1998). On the Construction of Bilingual Dictionaries, The Hague, 92 pgs.

MARTIN, W., GOUWS, R. & RENDERS, L. (1999). Haalbaarheids- en definitiestudie voor een woordenboek Afrikaans-Nederlands / Nederlands-Afrikaans, Vrije Universiteit, Amsterdam, 1999, 62 pgs.

NUCCORINI, S. (1993). Lexicology and Lexicography Revisited, in: Hart, D. (Ed.), Aspects of English and Italian Lexicology and Lexicography, Bagatto Libri, Rome, 1993, pp. 127-139.

WIKBERG, K. (1983). Methods in Contrastive Lexicology, in: Applied Linguistics, 4, 3.

72

Page 73: De la Lexicologie à la Lexicographie

Le dictionnaire comme outil d'apprentissage

M.Celeste Augusto Université d'Utrecht

1. Introduction Mon exposé s’insère dans le cadre de l’élaboration du dictionnaire bilingue néerlandais–portugais et portugais-néerlandais, actuellement en cours1. Mon but n’est pas de décrire le travail d'élaboration du dictionnaire, mais de présenter l'usage qu’on en peut faire dans l'apprentissage d'une langue. J’aborderai le sujet dans la perspective du lexicographe et dans celle de l’usager. Je commencerai par une caractérisation succincte et globale de ce que l’on appelle dictionnaire d’apprentissage. Je garderai présent à l'esprit le fait que l’emploi du dictionnaire dans l’apprentissage d’une langue, étrangère ou non, dépend de la méthode d’enseignement utilisée et de l’objectif à atteindre. Ensuite je présenterai les notions lexicologiques qui servent de base à ma communication, mais aussi, à la réalisation du dictionnaire mentionné plus haut. Le point suivant aura un caractère tout à fait pratique, car il s’agit d’un commentaire de trois entrées du dictionnaire néerlandais-portugais. Ce commentaire sera suivi de quelques conclusions provisoires. 2. Le dictionnaire d’apprentissage La typologie des dictionnaires est vaste et diversifiée; on peut imaginer des dictionnaires pour tous les domaines. Ceux qui nous intéressent sont naturellement les dictionnaires de langue. Tous les dictionnaires parce qu’ils donnent de l’information sont, a priori, didactiques, cependant certains sont plus didactiques que d’autres, ayant été élaborés dans ce but.

1 Il s’agit de la production d’un dictionnaire bilingue avec presque 48.000 entrées du côté néerlandais et environ 35.000 du côté portugais. Cet écart relatif aux entrées est dû, entre autres, à la façon spécifique des deux langues de travail de construire les noms composés; ainsi par exemple <stoombad> (littéralement bain de vapeur) et <schuimbad> (littéralement bain moussant) auront chacun une entrée et comme équivalents portugais <banho de vapor> et <banho de espuma> respectivement, qui, à leur tour, seront enregistrés sous la même entrée, à savoir <banho>. Quand au dictionnaire, il est élaboré à travers un programme éditeur bilingue dénomé OMBI. OMBI est l’acronyme de la dénomination néerlandaise OM(keerbare) BI(linguale) woordenboeken, littéralement “Dictionnaires Bilingues Reversibles”. OMBI, grâce à une grammaire prédéfinie, permet de lier deux bases de données lexicales et de faire automatiquement la réversion des "links" opérés. Sur ce sujet voir Martin dans ce même volume.

Page 74: De la Lexicologie à la Lexicographie

M. Celeste Augusto

Il y a 20 ou 30 ans, le lexicographe2 qui produisait un dictionnaire monolingue ou bilingue ne considérait pas l’apprenant d’une langue comme un public à atteindre. Même les dictionnaires bilingues de la ligne de production appelée Académicos ou Escolares de la maison d'édition portugaise Porto Editora ne satisfaisaient pas aux principes élémentaires d’apprentissage d’une langue. Je prends au hasard l’entrée <abafado> (étouffé) du dictionnaire Português-Francês de cette ligne; il propose 9 équivalents en français: "étouffé, chaudement vêtu, sourd, bouché, occulte", etc., puis une petite liste d’associations et exemples où le <vinho abafado> (vin doux qui n'a pas été fermenté) est placé entre <quarto abafado> (chambre étouffée) et <voz abafada> (voix étouffée). Plus récemment, en 1982, le dictionnaire Inglês-Português de A. Houaiss, élaboré au Brésil, est paru; il présente, sans information supplémentaire, pas moins de 34 équivalents portugais pour le mot <bank> substantif, et 27 verbes, ce qui effectivement n’aide pas beaucoup l’usager. Cependant, en 1971, dans Introduction à la Lexicographie: le dictionnaire, Dubois disait déjà (p.49), que "Le dictionnaire appartient au genre didactique et, à l'intérieur de ce genre, l’énoncé lexicographique a les caractères principaux du discours pédagogique. Comme tout discours pédagogique, il est un énoncé sur un autre énoncé déjà réalisé [...] il renvoie à un certain type de communication, à un certain rapport entre «je», «tu» et l'objet du discours «il»" et plus loin "Le discours lexicographique est [...] de même nature que l'énoncé pédagogique de l'enseignant, du maître qui s'identifie avec la communauté socio-culturelle et détient le savoir". Et Dubois continue (p. 50): "Le dictionnaire enseigne, ce qui signifie que la réponse qu'il donne n'est pas simplement une information, mais un ordre à exécuter". Ainsi, de plus, par son caractère normatif, il fait loi, il règle la norme linguistique, ce que l'auteur justifie plus bas (p. 50 - 52). Si nous considérons les dictionnaires portugais produits à cette époque-là, années cinquante et soixante, et même plus tard disons entre 1980 et 1990, je me demande s’ils avaient un discours pédagogique. On arrive ainsi à la question de savoir ce qu’est un dictionnaire d’ apprentissage. Une réponse concise mais éclairante sera qu'est un instrument qui aide l’apprenant d’une langue à développer sa capacité de communication, c’est-à-dire, à encoder et à décoder dans cette même langue. Laissons de côté les aspects du type âge, degré de connaissances, but d’apprentissage de l'apprenant, etc.) et type de dictionnaire monolingue ou bilingue et voyons maintenant, d’une façon très générale, les principales caractéristiques d’ un dictionnaire d’apprentissage3. 2 Je me réfère ici surtout aux lexicographes portugais et brésiliens. 3 Pour une analyse détaillée et très éclairante sur le rôle des dictionnaires en tant qu' instruments d’apprentissage par rapport au français et à l’ anglais, cf. P. Bogaards surtout 1990, 1995, 1996 et 1998.

74

Page 75: De la Lexicologie à la Lexicographie

Le dictionnaire comme outil d'apprentissage

En ce qui concerne la macro-structure, celle-ci dépend d’abord de la taille du dictionnaire qu’on décide de faire, mais cela mis à part, elle doit inclure obligatoirement les mots les plus fréquents4, tous les mots grammaticaux et, si possible, les néologismes les plus frappants, et aussi, si sa taille le permet, les noms de lieux ainsi que les adjectifs correspondants et les langues qu'on y parle, car cette nomenclature est souvent une bataille sans issue. C'est dans la micro-structure que toute information est transmise. Celle-ci au point de vue morphologique, syntaxique, sémantique, ou des exemples, doit être utile, compréhensible, accessible ainsi que visible. Bien que lexicologiquement peu importante, une disposition graphique claire est élémentaire au niveau de l’apprentissage. Une liste compacte de mots qui peuvent être des équivalents de ce que l’on cherche, décourage n'importe qui, mais surtout ceux qui ne maîtrisent pas encore très bien une langue. Ainsi, un ordre et une numérotation clairs, systématiques et cohérents de toute l’ information condensée dans la micro-structure sont-ils un desideratum soit du lexicographe soit de l’usager. Les combinatoires les plus fréquentes, les valences des verbes les plus employés et les détails pragmatiques les plus frappants ne peuvent non plus être omis. À cause de la valeur normative (cf. les remarques plus haut) que tous les dictionnaires véhiculent, une insertion contextuelle correcte et précise des exemples est, selon nous, fonctionnellement indispensable. Ils sont les modèles qui guident l’usager dans une production correcte du discours5, qui est comme chacun sait l'un des plus difficiles buts de l'apprentissage de n'importe quelle langue. Non moins importante est la valeur de l’ information culturelle ou civilisationnelle à propos de certains mots6, surtout dans les dictionnaires bilingues. Je reviendrai plus tard sur ce sujet. En somme, dans ce type de dictionnaire et surtout à travers la micro-structure, la langue devra être abordée au moins dans deux de ses fonctions, la référentielle et la communicative. Pour illustrer ce que je viens de dire je présenterai trois entrées du même mot, extraites de trois dictionnaires monolingues du portugais: le mot choisi est le verbe haver (y avoir) et les dictionnaires sont Dicionário da Língua Portuguesa,

4 Aujourd' hui, avec l'informatisation des données linguistiques, on dispose de corpora de référence qui nous donnent la fréquence non seulement des mots mais aussi de toutes les combinatoires où ils entrent. 5Traditionnellement, les exemples étaient soit construits par le lexicographe soit empruntés à des textes littéraires; ce dernier cas se vérifiait surtout dans les dictionnaires monolingues. Aujourd’hui, grâce à l’emploi des corpora dans la production des dictionnaires, on a la possibilité de donner des exemples naturels et authentiques. 6 Cf. J. Tomaszczyk (1983) qui insiste beaucoup sur la question du vocabulaire spécifiquement culturel dans les dictionnaires.

75

Page 76: De la Lexicologie à la Lexicographie

M. Celeste Augusto

de Almeida e Costa, Dicionário Contemporâneo de Português de M. Tereza Biderman e Dicionário do Português Básico de M. Vilela. 2.1 Dicionário da Língua Portuguesa.

haver A. v.tr. ter; possuir; obter; considerar; julgar; conseguir; existir; acontecer; ter decorrido; ter passado B. v. intr. ser possível C. v.refl. portar-se; proceder D. s. m. crédito (na escrituração comercial) E. s.m.pl.. bens; fortuna; ~ às mãos alcançar possuir; ~ de ser obrigado a, ver-se na necessidade de, ter fatalmente de; ~ mister ter necessidade; ~ por bem dignar-se; por bem fazer mal ~ ser pago com ingratidão (Do lat. habere, ”ter; haver”)

C’est un dictionnaire général de la langue, comme nous en informe l’introduction de la 8e édition7. Il présente ici une entrée très simple, je dirai-même pauvre. Les lettres A B C indiquent que le verbe est respectivement transitif, intransitif et réfléchi. D et E concernent l’homonyme «haver» en tant que nom au singulier et au pluriel. Ensuite on trouve l’exemplification de quelques associations ou combinatoires et un dicton ou proverbe; l’entrée se termine par un renseignement étymologique. Il n'y a pas d’information sur les contraintes grammaticales, ou sur l’emploi du verbe ou même sur la fréquence par exemple, par rapport à la combinatoire haver mister, qui représente un usage très ancien et que l’on n’utilise plus aujourd’hui. J’en viens maintenant à examiner les deux autres entrées dans les deux dictionnaires sélectionnés qui se présentent explicitement comme des instruments didactiques. 2.2 Dicionário Contemporâneo do Português.

haver v. haver. A. Verbo de significação plena. t.d. 1. Existir (impessoal indicando que algo existe). Há muitas estrelas no céu. Não havia ninguém na festa. 2. Fazer (indicando tempo). t.d. Havia meses que a gente não se via. 3. Suceder, acontecer. t.d. Parece que houve alguma coisa grave entre eles. B. Verbo auxiliar (acompanhado do infinitivo de outro verbo). 1.

7 Comparée avec les précédentes, cette édition présente, malgré son caractère insuffisant, une micro-structure améliorée, surtout au niveau de la description grammaticale.

76

Page 77: De la Lexicologie à la Lexicographie

Le dictionnaire comme outil d'apprentissage

Indica empenho em alguma coisa, propósito de realizar algo. Eu hei de vencer, se Deus quiser. 2. Indica obrigação, dever. Ele há-de cumprir todos os seus deveres. 3. Indica certeza de que algo acontecerá no futuro. José há-de pagar aquilo que deve. Ele há-de encontrá-la com saúde. C. Verbo auxiliar - indica fato8 passado quando conjugado com um particípio passado de outro verbo. Se eles não houvessem saído cedo, teriam tido a oportunidade de conhecer o artista. / / 2. conj. hei, havia, houve, houvera, haja, houvesse, houver, havendo, havido, haver >> haja o que houver: aconteça o que acontecer > não há meios de...: impossível. Apesar de procurar por toda parte, não há meios de encontrar este produto.

haveres s.m.pl. ha-ve-res [ê]. Todos os bens, propriedades e riquezas de uma pessoa. Nesta família alguns possuem numerosos haveres enquanto outros são quase pobres. Com o passar do tempo o fazendeiro foi-se tornando um homem de muitos haveres. / / cf: haver (v.). bens.

Nous avons ici à faire à un dictionnaire «contextuel» qui suit la variante brésilienne. L’auteur est parfaitement consciente de l’ orientation qu’ elle a voulu imprimer au dictionnaire. Tous les sens sont contextualisés, parfois même avec deux exemples comme dans A 1, car selon l’auteur ceux-ci servent de modèle à la production de l’apprenant9. Les lettres A, B, C donnent de l’information grammaticale; les chifres indiquent les différents sens illustrés par des exemples. À la fin de l’ entrée, nous trouvons la conjugaison du verbe, qui est irrégulière, et encore quelques-unes des locutions les plus fréquentes. L’homonyme «haver» a une entrée séparée, avec un renvoi à «haver» comme verbe et à «bens», qui est un synonyme de «haveres».

2.3 Dicionário do Português Básico

haver [αvér] v. impes., v. aux., n. m. I.[v. impes. ]: (1) - Há quantos dias não vem cá? (2) - Há, na turma dela, alunos surdos-mudos. (3) - Havia muita gente no arraial. ■ haja o que houver: (4) - Eu vou ao baile, haja o que houver. (5) - O que é que houve ali? ■ haver de / que + inf.: (6) - Tanto o vestido como a saia são bonitas. Agora só há que escolher!

8 Nous gardons ici l'orthographe brésilienne, c'est-à-dire, fato et non facto. 9 Cf. Biderman (1992:5-6).

77

Page 78: De la Lexicologie à la Lexicographie

M. Celeste Augusto

II [v. aux.] haver de + inf.: (1) - Eu hei-de conseguir uma boa nota! (2) -Hás-de procurar melhor lá em casa. (3)- Havemos de ir a Viana. (4) - Se ele cá estivesse havias de ver o que é uma voz de anjo! (5) - Espera que ele há-de estar a chegar. (6) - Com o carro avariado, como é que eles haviam de aparecer? III. haver por bem: Ele houve por bem vir visitar a madrinha doente. IV. [v. aux.] haver + part. pass.: Ela já havia feito os deveres quando saiu para o quintal. V. [n. m.]: (I) Estou a conferir a coluna do haver. ■ (pl.): (2) Parece que ele tinha alguns haveres.

G.1. Conj. 47 G.2. Haver, sentido I, é um verbo impessoal, defectivo: conjuga-se apenas na 3ª pessoa do singular; não tem sujeito, daí a inexistência de acordo verbal. G.3. Haver de + inf., sentido II, é a chamada conjugação perifrástica. Na 2ª pessoa (singular e plural) adquire valor de imperativo (frase 2). Na 1ª pessoa (singular e plural), sugere a ideia de propósito (frases 1, 3). No presente (frase 3) e no imperfeito (frase 4) equivale a um futuro ou condicional reforçados. Nas frases interrogativas (frase 6), equivale também a um condicional, mas sugere uma certa incredulidade ou dúvida. G.4. Haver, como auxiliar (v. + part. pass.), sentido IV, equivale a ter e entra na formação dos tempos compostos. É pouco utilizado hoje, sobretudo oralmente. G.5. Haver, sentido V, com o sentido que tem na frase 2, só se usa no plural. S.1..Haver, sentido I, usa-se em expressões de tempo e significa FAZER (frase I). Nas frases 2 e 3, quer dizer EXISTIR.■ Haja o que houver (frase 4) quer dizer OBRIGATORIAMENTE, ACONTEÇA O QUE ACONTECER.■ Na frase 5, é sin. de SUCEDER, ACONTECER, OCORRER (ling. cuidada).■ Haver que + inf. (frase 6) tem o sentido de TER DE, DEVER. S.2. Haver de + inf., sentido II, indica OBRIGAÇÃO (frase 2). Na frase I, expressa apenas PROPÓSITO. Na frase 3, indica a INTENÇÃO relativamente a uma acção futura. Na frase 4, equivale a um condicional. Na frase 5, sugere a ideia de FUTURO PRÓXIMO. Na frase 6, equivale a PODER, TER POSSIBILIDADE. S.3. Haver por bem, sentido III, é uma fraseologia e quer dizer TER POR BEM, RESOLVER, DIGNAR-SE. É pouco usado. S.4. Haver, sentido IV, equivale a TER. Antigamente, era sin. de TER, POSSUIR, mas essa utilização caiu em desuso. S.5. Haver, sentido V quer dizer CRÉDITO na escrita comercial (frase 1).■ Haveres (frase 2) significa BENS, RIQUEZAS, PROPRIEDADES.

78

Page 79: De la Lexicologie à la Lexicographie

Le dictionnaire comme outil d'apprentissage

L’introduction de ce dictionnaire nous informe qu’il a «un caractère informatif et formatif», il a donc un but pédagogique. Chaque entrée présente deux sections, à savoir: 1)- usage avec plusieurs exemples 2)- explications grammaticales et sémantiques Il n’a pas une grande macro-structure, nous pouvons même dire qu'elle est assez petite; cependant, ce dictionnaire inclut les 2217 mots les plus fréquents du portugais10, plus environ 800 considérés aussi fréquents. À l'intérieur de la micro-structure l'information est encadrée par une numérotation romane et par les lettres G et S. La numérotation romane donne l’information sur la forme avec des exemples qui sont bien contextualisés, c’est-à-dire, qu'ils illustrent avec précision l’emploi du mot inséré dans des phrases. De G1 à G5 nous trouvons les renseignements grammaticaux et de S1 à S5 les informations sémantiques avec des synonymes. De plus, nous avons aussi des informations sur la fréquence, en G4, S3, S4 et encore sur le niveau de langue en S1, phrase 5. Cette dernière observation est surtout importante pour ceux qui apprennent le portugais comme langue étrangère, car au contraire des locuteurs natifs qui en principe maîtrisent cette donnée intuitivement, les étrangers eux doivent l'apprendre. Ma dernière remarque porte sur la mise en page qui rend toute l’information très lisible et facile à trouver. Il est évident que l' entrée, que nous venons d'analyser, est pédagogiquement la plus riche pour un apprenant de portugais en L1 ou L211, car le vocabulaire des exemples, comme de tous les niveaux d’information, est clair et accessible à ceux qui ont dépassé le stade de débutants. 3. Principes lexicologiques de base de la micro-structure De l’étude de Cruse (1986) Lexical Semantics sur le sens des mots, nous avons retenu quelques notions, que nous identifions aux principes qui guident l’agencement des données de la base de données lexicales du néerlandais, RBN12, que l’équipe du dictionnaire traduit actuellement en portugais. 10 Cf. Português Fundamental (1984). 11 Vilela (1991,V). 12 Le RBN (Referentiebestand Nederlands = base de données de référence du néerlandais) représente une banque de données lexicales produite dans le cadre des activités de la CLVV (Commissie Lexicografische Vertaal Voorzieningen), qui est une Comission Gouvernamentale Néerlandaise et Flamande. C’est un lexique multifonctionnel avec une macro-structure de presque 48.000 entrées et une micro-structure qui véhicule de l’information distribuée sur 6 niveaux linguistiques (orthographe, prononciation, morphologie, syntaxe, sémantique, pragmatique). Cette base de données est présentée par l’intermédiaire du programme éditeur pour les dictionnaires bilingues OMBI (voir note 1). Celui-ci, basé sur un principe de réversibilité des unités de sens et non des unités de forme, rend la production des dictionnaires bilingues plus facile.

79

Page 80: De la Lexicologie à la Lexicographie

M. Celeste Augusto

La première notion se rapporte aux «relations contextuelles»; selon Cruse (p. 16), "the meaning of a word is fully reflected in its contextual relations". De ceci résulte qu’un mot aura autant de sens que de relations contextuelles. Ce raisonnement justifie la présence dans la micro-structure de plusieurs associations ou combinatoires, soit grammaticales soit lexicales, et d’exemples. Les deux autres notions qui nous intéressent sont «le lexème» et «l’unité lexicale». La première concerne la forme du mot tel qu’il est mis en tête de l’entrée, la deuxième les différents sens qu’il peut réprésenter. Les lexèmes, qui sont ordonnés alphabétiquement dans le dictionnaire, sont pour Cruse (p. 49, 76) «les items de la langue» et ils répresentent une famille d’unités lexicales. Dans la nomenclature du programme utilisé pour la traduction du corpus mentionné, ils correspondent aux Unités de Forme, dorénavant UF. Toujours d’après Cruse, l’unité lexicale, dorénavant UL, est (p.77) "the union of a lexical form and a single sense" et elle doit satisfaire obligatoirement à deux criteria (p.24): 1- "a lexical unit must be at least one semantic constituent" 2- "a lexical unit must be at least one word" Ainsi par exemple, l’élément préfixal du portugais RE- qui a les deux sens de répétition et intensité, peut être considéré comme constituant sémantique, mais comme ce n’est pas un mot nous ne pouvons pas non plus dire que c'est une unité lexicale. Prenons comme exemple le mot PARTIR du portugais auquel on peut assigner au moins deux sens: 1) s’en aller, partir 2) casser, briser. Ceci nous donne le schéma suivant:

PARTIR (=lexème / unité de forme) 1- partir (=unité lexicale)> s’en aller; partir 2- partir (=unité lexicale)> casser; briser

Ceci implique qu’une unité de forme peut avoir plus d’une unité lexicale et que toute unité lexicale doit dépendre forcément d’une unité de forme. Les notions, que nous venons de définir, ont une importance capitale dans le processus de traduction, dans la mesure où ce qui est donné dans la langue cible est un équivalent de l’ unité lexicale et non de l’ unité de forme, comme nous l’avons vu avec l’exemple de PARTIR.

80

Page 81: De la Lexicologie à la Lexicographie

Le dictionnaire comme outil d'apprentissage

4. Apprendre avec un dictionnaire bilingue qui n’est pas un dictionnaire d’apprentissage

Cette partie de mon exposé a comme point de départ quelques entrées du dictionnaire bilingue, encore en élaboration, néerlandais–portugais et portugais-néerlandais. Ce dictionnaire a pour but de servir à l’encodage et au décodage soit du portugais soit du néerlandais. J’ai choisi trois mots: deux noms AANBOD et TREFFEN et un verbe TREFFEN. Je me propose de faire un commentaire en utilisant les notions de «unité de forme», «unité lexicale» et «relations contextuelles» mentionnées plus haut; je tiens aussi à conjuguer le point de vue du lexicographe et du traducteur avec l’intention pédagogique sous-jacente aux entrées.

Aanbod, <:N>

1. {aangebodene} 'oferta', <N>, 'proposta', <N> a. vraag en aanbod, (free) "oferta e procura"; b. een breed aanbod, (free) "uma oferta variada/vasta"; c. een aanbod aannemen/afslaan, (LC) "aceitar/recusar uma proposta"; d. een aanbod krijgen, (LC) "receber uma proposta"; e. op een aanbod ingaan: (LC) "aceitar uma proposta"; f. een aanbod doen, (LC) "fazer uma proposta","propor",

Commençons par une entrée très simple AANBOD, qui a comme équivalents portugais <oferta> (offre) et <proposta> (proposition). Nous avons une UF et simplement une UL, plus des collocations du type lexical indiquées par (LC). J’ai laissé volontairement les indications (free). Ce sont des indications données au traducteur. Celui-ci ou le bureau rédacteur décide de traduire ou non l’exemple. Ici nous avons opté pour la traduction car: exemple a) vraag en aanbod est littéralement (demande et offre) mais comme en portugais l’ordre est inversé <oferta e procura> (offre et demande) nous l’avons enregistré; dans l'exemple b) een breed aanbod breed signifie <larga> (large) mais pas dans ce contexte; combiné avec <oferta> on dira <variada> ou <vasta> mais pas <larga>, raison pour laquelle nous l’avons également enregistré. Ainsi, l’inclusion des exemples a) et b) se justifie en gardant présent à l'esprit le point de vue du locuteur portugais qui veut décoder les segments néerlandais en question, mais surtout le locuteur néerlandais quand il veut les codifier en portugais. Ce dernier, par exemple, sachant que breed signifie <larga> (large) pourrait très bien employer ici *<larga oferta> au lieu de <oferta variada / vasta>, si l’exemple ne lui était pas présenté.

81

Page 82: De la Lexicologie à la Lexicographie

M. Celeste Augusto

Treffen, ¹ <N>

1. {bijeenkomst}, [synoniemen: bijeenkomst, samenkomst] 'encontro', <N>, (gevecht, militair) 'combate', <N> a.het kwam tot een bloedig treffen, (LC) "houve / teve lugar um encontro sangrento"; b. een gewapend treffen, (LC) "um encontro armado";

Treffen,2 <V>, (tr)

1. {raken} 'atingir', <V-trans>, 'alcançar', <V-trans> a. het getroffen gebied, (free) "a zona atingida"; b. getroffen worden door , (free) "ser atingido por", "ser vítima de"; c. de juiste toon treffen, (free) "conseguir a maneira certa de dizer"; a. als door de bliksem getroffen (-> bliksem); 2. {ontroeren} 'comover', <V-trans>, 'tocar', <V-intrans/trans>, 'sensibilizar', <V-trans> a. dat heeft haar diep getroffen, (LC) "isso sensibilizou-a profundamente", "isso tocou no seu íntimo"; b. haar harde woorden troffen hem zeer, (GC) "as palavras duras dela feriram-no profundamente"; 3. {tegenkomen} 'encontrar', <V-trans> a. waar treffen we elkaar?, (free) "onde nos encontramos?", "onde é que combinamos?"; 4. {geluk hebben} "ter sorte", "acertar (em cheio)" a. het getroffen hebben met de nieuwe secretaresse "ter acertado em cheio com a nova secretária"; b. je treft het!, (free) "tens sorte!", "nem de propósito!"; 5. {nemen, uitvoeren} (schikking, akkoord) 'conseguir', <V-trans>, (maatregelen) 'tomar', <V-intrans/trans>, (voorbereidingen) 'fazer', <V-trans> a. een betalingsregeling treffen, (free) "chegar a um acordo quanto ao pagamento de"; @ dat treft! (IU) "vem a propósito", "calha bem!";

82

Page 83: De la Lexicologie à la Lexicographie

Le dictionnaire comme outil d'apprentissage

Nous avons d’abord le nom TREFFEN, qui a comme équivalent en portugais <encontro> (rencontre). Cependant, on ajoute aussi que si la rencontre est militaire l’équivalent portugais plus précis est <combate> (combat). C'est une entrée qui présente une seule unité lexicale et deux collocations. Celles-ci, en règle générale, sont toujours traduites.

Nous avons ensuite la forme verbale, avec une UF et 5 UL dont plusieurs collocations. Celles-ci sont toujours groupées sous le sens duquel elles dépendent. Les différents sens de l’unité sont individualisés et illustrés par des exemples séparément, ce qui va dans le même sens que l'actuelle tendance de l'apprentissage d’une langue, à savoir la maîtrise du vocabulaire en contexte. À part les sens, les différents régimes des verbes sont aussi mentionnés, car même si l’usager, et je me rapporte à l’usager portugais, n’a pas besoin de cette indication pour décoder, par contre, s’il veut produire un texte il lui faudra avoir accès à toutes ces informations.

UL 1 - il y a ici un renvoi à bliksem (foudre), l’expression veut dire stupéfait, étonné au point de ne rien pouvoir dire ou faire. Pour rendre service à l’usager, on enregistre l’expression ici ainsi que sous l’entrée bliksem, bien que, pour éviter des redites, l’équivalent portugais soit présenté seulement une fois, et sous l’entrée bliksem.

UL 2 exemple b) - ici nous ajoutons l’adjectif harde (dur), car il apporte une connotation différente, qui sera traduite par le verbe <ferir> (frapper); disons que <comover> (émouvoir, attendrir) est positif et <ferir> négatif. Il fallait donc le noter.

UL 3 - nous donnons une traduction équivalente de l’exemple néerlandais, qui à son tour a été inclus car il illustre la conjugaison pronominale réciproque de ce verbe.

UL 4 - cet UL signifie «avoir de la chance», «trouver quelque chose», mais aussi «frapper un coup», comme dans l’exemple présenté.

@ dat treft ! : c’est une unité idiomatique qui ne peut être placée précisément dans le sens d’une des unités lexicales mentionnées. Peut être pourrait-elle aller sous le sens de UL4. Le fait que cette expression ne soit pas attachée à une unité lexicale ne veut pas dire qu’elle soit négligée. Dans la partie du dictionnaire portugais-néerlandais elle viendra sous <calhar> et / ou sous <vir a propósito> (venir à propos).

Cette entrée telle qu’elle est présentée servira à l’usager néerlandais et à l’usager portugais, dans l’usage productif du néerlandais et du portugais, autant que dans

83

Page 84: De la Lexicologie à la Lexicographie

M. Celeste Augusto

l’usage réceptif du néerlandais. Les usages contraires seront exposés dans l’ autre partie du dictionnaire, c'est-à-dire, dans le volume portugais-néerlandais. Ainsi, l’organisation globale de la micro-structure des trois entrées analysées remplit du moins quatre des six tâches d’apprentissage13 par rapport au lexique, qu’un apprenant de langue étrangère doit envisager et qui sont:

• apprendre de nouveaux mots (forme et contenu), • apprendre de nouveaux contenus pour des formes qu’ il maîtrise déjà, • apprendre des relations entre les mots au niveau soit de la forme soit du

contenu, • apprendre des usages corrects et justes des mots ou des contenus

spécifiques de mots. 5. Conclusions provisoires

De tout ce que nous venons de dire, nous croyons pouvoir tirer trois types de conclusions:

• La première applique les notions de Cruse (1986) à l’activité lexicographique et au développement de l’apprentissage.

• La deuxième met en opposition le type d’information donnée par les dictionnaires d’apprentissage monolingues avec celles des dictionnaires bilingues “à vocation générale” comme le dit P. Bogaards (1990).

• La troisième enfin se rapporte au caractère bi-directionnel du futur dictionnaire bilingue néerlandais–portugais.

Il paraît évident que les notions trouvées chez Cruse (1986) et appliquées à l’élaboration du dictionnaire, contribuent à une clarification de la tâche du lexicographe / traducteur, qui est de traduire des sens ou des unités lexicales et non la forme des mots. Ceci mène, entre autres, à une individualisation et mise en exemple des sens des mots qui se marie avec la nécessité de l’apprenant d’élargir son vocabulaire et de le faire en contexte.

Nous avons vu des exemples d’entrées de dictionnaires d’apprentissage où toute information sur la langue est explicite (Cf. Dicionário Contemporâneo do Português et Dicionário do Português Básico). Dans le cas des entrées du dictionnaire bilingue, dont j’ai fait le commentaire, nous pouvons dire que l’information est explicite par rapport à l’individualisation des sens et à quelques renseignements grammaticaux, comme les régimes des verbes. Pourtant, elle reste implicite en ce qui concerne certains comportements syntaxiques, informations culturelles et façons de concevoir. Par exemple, quand on donne comme équivalent de veertien dagen (littéralement quatorze jours) 13 Augusto et al. (1995)

84

Page 85: De la Lexicologie à la Lexicographie

Le dictionnaire comme outil d'apprentissage

<uma quinzena> (une quinzaine) on n’explique pas qu’il s’agit d’un trait caractéristique des langues romanes et germaniques. De même, l'exemple du verbe TREFFEN UL3 montre implicitement que nous avons à faire à une conjugaison pronominale réciproque et non à une conjugaison pronominale réfléchie.

La micro-structure des entrées des dictionnaires bilingues bidirectionnels comme celles de AANBOD et de TREFFEN va dans la direction des deux langues. La structure et la composition de ces entrées, au niveau de toute l’ information, servent aux deux types d’usagers qu’il soit néerlandais ou portugais, et ce dans la production comme dans la réception des deux langues.

Bibliographie Dictionnaires et banques de données BIDERMAN, M.T.C. (1992), Dicionário Contemporâneo de Português, Petrópolis: Vozes. CARVALHO, O.C. (s.a.), Dicionário Português - Francês, Porto: Porto Editora. COSTA, J.A. & MELO, A.S. (1998), Dicionário da Língua Portuguesa, 8ª Ed., Porto: Porto Editora. HOUAISS, A. (1982), Dicionário Inglês–Português, Rio de Janeiro: Distribuidora Record de

Serviços de Imprensa. Português Fundamental – vocabulário e gramática (1984), Lisboa: Instituto Nacional de

Investigação Científica, Centro de Linguística da Universidade de Lisboa. RBN = Referentiebestand Nederlands (1998), Den Haag: Commissie Lexicographische Vertaal

Voorzieningen. VILELA, M. (1991), Dicionário do Português Básico, 3ª Ed., Porto: Asa. Autres références AUGUSTO, M.C., BOGAARDS, P., HANNAY, M., MARTIN, W., SLAGTER, P.J., VENANCIO, F.,

WEKKER, H., WIJNE, C. (1995), Towards a database for general Translation Dictionaries and Bilingual Learner Dictionaries with special Reference to Dutch and Portuguese, Den Haag: Commissie Lexicografische Vertaalvoorzieningen.

BOGAARDS, P. (1990), "Deux langues, quatre dictionnaires". Lexicographica, vol.6, pp.162-173. BOGAARDS, P. (1995), "Dictionnaires et compréhension écrite". Cahiers de Lexicologie, vol.

LXVII, 2, pp.37-53. BOGAARDS, P. (1996), "Dictionaries for Learners of English". International Journal of

Lexicography, vol. 9 number 4, pp.277-320. BOGAARDS, P. (1998), "Des dictionnaires au service de l’apprentissage du français langue

étrangère". Cahiers de Lexicologie, vol. LXXII, II, pp.127-167. COWIE, A.P. (1983), "English dictionnaries for the foreign learner" in Lexicography: Principles

and Practice, ed. Hartmann, R.R.K. London: Academic Press, pp.135-144. CRUSE, D.A. (1986), Lexical Semantics, Cambridge: University Press. DEMEERSSEEMAN, H., MAAKS, I., MARTIN, W. et al (1997), Referentiebestand Nederlands –

instructies en documentatie, Den Haag: Commissie Lexicographische Vertaalvoorzieningen. DUBOIS, J. et DUBOIS, CL. (1971), Introduction à la lexicographie: le dictionnaire, Paris: Larrouse. ELSWIJK, M., MAKS, I., MARTIN, W., WIJNE, C. (1997), OMBI4 – user manuel, Den Haag:

Commissie Lexicographische Vertaalvoorzieningen. HARTMANN, R. (1999), ″Lexical Reference books – what are the issues?″. International Journal of

Lexicography, vol.12, n.1, pp.5-11. LAUFER, B. (1993), ″The effect of dictionary definitions and examples on the use and

comprehension of new L2 words″. Cahiers de Lexicologie, vol. LXIII, II, pp.131-142.

85

Page 86: De la Lexicologie à la Lexicographie

M. Celeste Augusto

MARTIN, W. et TAMM, A.. (1996), ″Ombi: An editor for constructing reversible lexical databases″. Gellerstam,M. (ed.), Euralex’96 Preceedings, I – II, Göteborg University, pp.675-688.

SCHMITZ, J.R. (1998), ″A problemática dos dicionários bilingues″, in As ciências do léxico – lexicologia, lexicografia, terminologia, Organizadoras: Oliveira, A.M. & Isquerdo, A.N., Campo Grande: Editora Universidade Federal de Mato Grosso Sul, pp.159-168.

TOMASCZYK, J. (1983), ″On bilingual dictionaries″. Lexicography Principles and Practice, ed.: Hartmann, R.R.K. London: Academic Press, pp.41-52.

86

Page 87: De la Lexicologie à la Lexicographie

Light Verb Constructions in Bilingual Dictionaries

Jan Schroten Utrecht University

Introduction and Outline Light verb constructions such as to take a walk are so common that they tend to be overlooked as interesting constructions. In this contribution, they will be discussed in an informal way, by taking into consideration a number of peculiar facts and their interpretation. The objectives of this contribution are: (1) to show that monolingual and bilingual dictionaries treat light verb constructions in different, partly conflicting ways, and that lexicographers cannot be blamed, since the proper analysis of these constructions is unknown; (2) to try and figure out the reason why the proper analysis of light verb constructions is unknown or at least not understood very well; (3) to sketch the way of overcoming the basic difficulty, which is the lack of understanding of a hidden property of light verb constructions which must be uncovered. In the first section, relevant terminology will be introduced with respect to light verb constructions. In the second section, the question will be asked and discussed whether light verb constructions are interpreted compositionally, or wether they are idiomatic constructions. In the third section, general statements will be given on inconsistencies in monolingual and bilingual dictionaries, and some fundamental reasons why these inconsistencies are found. In the fourth section, some examples of inconstencies found in dictionaries will be discussed. In the fifth section, it will be shown that one specific class of light verb constructions can be treated compositionally, and in the sixth section, another class will be treated in a similar way. In the final section, the epilogue, some additional suggestions will be made on the proper analysis and treatment of light verb constructions. 1. Light Verb Constructions, Light Verbs, Light Verb Nouns and Full Verbs Nouns denoting actions, processes or states can combine with a so-called "light verb" in light verb constructions in which the verb is semantically light and in which the noun carries the main weight of the meaning, as proposed by Grimshaw and Mester (1986), the classic study on light verb constructions. In many cases, a light verb construction is nearly synonymous with a full verb, which is a verb related to the noun of the light verb construction. For example, to give (someone) a kiss is a light verb construction which has nearly the same meaning as the full verb to kiss (someone) The noun that we find in the light verb construction can be called the “light verb noun”. In some cases, the light verb construction has a "passive meaning", as in to get a kiss (from someone), which is comparable to the passive full verb to be kissed (by someone). These observations are summarized in (1):

Page 88: De la Lexicologie à la Lexicographie

Jan Schroten

(1) Full verbs, light verb constructions, light verbs and a light verb noun (a) active full verb: to kiss (someone) (b) active light verb construction: to give (someone) a kiss (c) passive full verb: to be kissed (by someone) (d) passive light verb construction: to get a kiss (from someone) (e) light verbs: to give, to have (f) light verb noun: kiss Comparing English light verb constructions with translation equivalents in other languages, such as Dutch and Spanish, it can be observed that, in a number of cases, different light verbs are used in these languages. For example, the English light verb noun walk combines with the light verb to take in the light verb construction to take a walk, which is nearly synonymous with the full verb to walk. In Dutch, a walk is not “taken”, but it is "made" in the light verb construction een wandeling maken (to make (=take) a walk). In Spanish, a walk is "given" in dar un paseo (to give (=take) a walk). Thus, the light verb which combines with the light verb noun is different in these three languages. These observations are summarized in (2): (2) A light verb noun and its light verb in English, Dutch and Spanish (a) English: to take a walk (b) Dutch: een wandeling maken (literally: to make a walk) (c) Spanish: dar un paseo (literally: to give a walk) Languages can also be different as to the nouns that are found as light verb nouns in a light verb construction and, again, in the choice of the appropriate light verb if the light verb construction is used. For example, the English noun beginning cannot be combined with a light verb, although the nearly synonymous noun start is used in the light verb construction to make a start. In Dutch and in Spanish, the translation equivalents of beginning can be combined with a light verb: the Dutch noun begin combines with the light verb maken (to make) in: een begin maken (to make a beginning) and the Spanish noun comienzo combines with the light verb dar (to give) in: dar comienzo (to give beginning).This situation is summarized in (3): (3) A noun which is not found in a light verb construction in English and which is found with different light verbs in Dutch and Spanish (a) English: noun: beginning: full verb: to begin; light verb construction: --- (b) Dutch: noun: begin; full verb: beginnen; light verb construction: een begin maken (maken (to make)) (c) Spanish: noun: comienzo; full verb: comenzar; light verb construction: dar comienzo (dar (to give))

88

Page 89: De la Lexicologie à la Lexicographie

Light verb constructions in bilingual dictionaries

2. Light Verb Constructions and Compositionality A closer look at light verb nouns and the light verbs with which they are combined in light verb constructions suggests that the choice of the light verb reflects some semantic property of the noun. The null hypothesis is that light verb constructions are interpreted compositionally. If this is true, the use of a different light verb in another language with the same light verb noun, that is, a noun which is taken to be a full translation equivalent, implies that this noun is not a full translation equivalent. It must have a partly different meaning, reflected in the different light verb that is used. Therefore, a closer look at the appropriate choice of the light verb might be rewarding since it permits us to speculate on hidden parts of the meaning of the noun. The answer to the question whether light verb constructions are interpreted compostionally or not is important for (bilingual) lexicographers. If light verb constructions are compositional, language differences in light verb constructions as to the light verb that is used must be related to meaning differences of the noun. In such cases, the translational equivalence of the nouns is “optimal”, and not perfect or total. In short, a different choice of light verb for the best translation equivalent of the light verb noun in another language implies that the nouns are not perfect translation equivalents, that is, that they do not match perfectly. The different choice of light verbs reflects hidden differences of meaning in the light verb nouns. However, many translations of light verb nouns in bilingual dictionaries seem to be treated by the lexicographers as perfect matches, even if they combine with different light verbs. This is the reason why bilingual dictionaries treat light verb constructions in a rather unsystematic way. Let us try to figure out what is going on. If compositional translation of a light verb construction gives a good result in another language, the light verb construction need not be specified in the dictionary. If a different light verb is chosen or preferred, bilingual dictionaries tend to treat these as idioms, but not systematically. The reason is that light verb constructions are not understood by lexicographers, nor by linguists. Even elaborate monolingual dictionaries treat light verb constructions inconsistently. Apart from the meaning differences in light verbs in different languages, there is a much more serious problem for the bilingual lexicographer, which is that a light verb used in one language can be missing in another language.. For example, the Dutch verb krijgen (to get) can be said to be the "passive" variant of "active" geven (to give); see Everaert and Hollebrandse (1995). In Spanish, we find the "active" light verb dar (to give), but there is no "passive" light verb comparable to Dutch krijgen (and English to get). It is evident that the Spanish full verb recibir (to receive) which is the "passive" variant of the full verb dar (to give) is not used as a light verb. Now, if there is a Dutch "passive" light verb construction with the verb krijgen (to get), the bilingual lexicographer has to make a choice, taking one of three options. The first option is to leave out the "passive" variant, since it is taken to reflect a general, syntactic and/or semantic difference between Spanish and Dutch or English. Spanish takes active choices in cases that Dutch can choose an active or

89

Page 90: De la Lexicologie à la Lexicographie

Jan Schroten

a passive construction. A second option is to incorporate only the active light verb, leaving out the passive equivalent. A third option is to incorporate both the active and passive light verb construction, giving an idiomatic or an active translation of the passive light verb construction, since there is no literal translation available. Let us consider some aspects of the properties of light verb constructions that have been mentioned. If light verb constructions are interpreted compositionally, light verb nouns which combine with the same light verb must be assumed to share some semantic property, and if different light verbs are used, this reflects a semantic difference, even between light verb nouns that would seem to belong to the same semantic class. This general thesis is resumed in (4): (4) Light verb constructions are interpreted compositionally Compositional interpretation of light verb constructions is done in the following way: (i) The light verb accesses part of the meaning of the noun; (ii) The light verb and the noun are fused in a composite predicate 3. Why light verb constructions are treated inconsistently in monolingual and in bilingual dictionaries The reasons why monolingual dictionaries give an inconsistent treatment of light verb constructions are sketched in (5): (5) Light verb constructions in monolingual dictionaries Light verb constructions in monolingual dictionaries are treated

inconsistently, due to the two following circumstances: (a) The number of light verbs is unknown. (b) The properties of the light verb nouns which they accompany are unknown. Therefore, light verb constructions cannot get a consistent treatment. The consequences for bilingual dictionaries are sketched in (6): (6) Light verb constructions in bilingual dictionaries Light verb constructions in bilingual dictionaries are treated inconsistently, due to the two following circumstances: (a) The differences in the number of light verbs and their semantic

properties in the two languages are unknown. (b) The differences in the meaning of nouns which are optimal, but not

perfect, translation equivalents, are unknown. Therefore, light verb constructions cannot get a consistent treatment.

90

Page 91: De la Lexicologie à la Lexicographie

Light verb constructions in bilingual dictionaries

4. Inconsistencies in the treatment of light verb constructions in a monolingual dictionary: some examples In this section, some typical cases of inconsistency in the treatment of light verb constructions in a Dutch monolingual dictionary will be shown. The first case is based on the synonymy of zoen ("kiss") and kus ("kiss"), and the different treatment that the nouns are given in the authoritative monolingual dictionary (Van Dale Nederlands): (7) Light-verb constructions with "kiss" in a Dutch monolingual dictionary (i) zoen (kiss): iemand een -- geven (to give someone a --) (ii) kus (kiss): een -- krijgen van iemand (to get a -- from someone) (iii) pakkerd (hug and kiss): iemand een -- geven (to give someone a --) The Dutch nouns given in (7i) and (7ii) are close in meaning. No speaker doubts that the active light verb geven (to give) and the "passive" light verb krijgen (to get) can be used with equal ease with both nouns. Nevertheless, the dictionary has included geven (to give) with one noun and krijgen (to get) with the other noun. A near synonym like colloquial pakkerd (hug and kiss) is given with the "active" light verb geven (to give); the "passive" light verb is not given, although it can be used with equal ease. This different treatment of synonyms or near synonyms reflects the lack of coherence, which is evident as soon as one makes a systematic comparison of other near-synonyms which combine with the same light verb according to the intuitions of the native speaker and how they are treated in the dictionary. In some cases, no light verb constructions is given; in fact, this is the rule, not the exception. In other cases, only one light verb is given if two or more are possible. In still other cases, the light verb construction is suggested to share characteristics of a fixed collocation or an idiomatic expression. The unsystematic way of presenting or omitting light verb constructions which can be used with a noun, the haphazard way of selecting one light verb in cases that different light verbs can be used, and the lack of differentiation with respect to regular light verb constructions and more idiomatic, fixed collocations reflect a lack of understanding of a number of essential properties of light verb constructions. Of course, the analysis of light verb constructions and how they are incorporated in the dictionary is only useful if the results can be used to obtain a better understanding of essential properties. The basic point is that, in many cases, the light verb constructions have not been incorporated for reasons of idiomaticity or to inform the user of specific details of the compositional meaning. Ususally, the light verb construction itself is given, not its meaning, which suggests that a frequent and appropriate way of saying things is given. There is little indication in the definitions of the light verbs that their light verb property has been taken into account, and there is no systematic treatment of the nouns with which they are assumed to combine in a regular fashion. It remains to be seen how light verb constructions can be analyzed in a more

91

Page 92: De la Lexicologie à la Lexicographie

Jan Schroten

systematic and coherent fashion. 5. A class of light verb constructions: light verb nouns denoting bodily activities and processes and the choice of light verb A typical noun of bodily activity is sigh. The light verb which is chosen is to give, in the three languages that are taken into consideration. And more generally, light nouns referring to bodily processes which are conceived as controlled or controllable actions, take the same light verb, in English and in Dutch: (8) Light verb nouns denoting controllable bodily activities and the corresponding light verb (i) English: to give a sigh / a smile / a wink / a sob (ii) Dutch: een zucht / een glimlach / een knipoog / een snik geven (=give) If the process is conceived as taking place as an uncontrollable action, we find the verb to let, as in to let a fart / burp / belch. In Dutch, the light verb used with the equivalents of the nouns fart / burp / belch is laten (to let), a light verb which is regularly used with other nouns denoting an uncontrolled process which cannot be avoided, which one must let go: een wind / scheet / boer laten (=to let a fart / fart / belch): (9) Light verb nouns denoting uncontrolled bodily processes and the corresponding light verb (i) English: to let a fart / a burp / a belch (ii) Dutch: een scheet / een boer/ een boer laten (=let) Thus, there is a clear difference in the choice of light verb dictated by the meaning of the noun: controlled actions take to give and uncontrolled processes take to let. In Spanish, the situation is different, with interesting properties. Although there is a translation equivalent of the verb to let, which is dejar, we do not find convincing uses of this verb as a light verb. The translation equivalent of the noun burp is eructo, but the light verb construction is avoided and the full verb eructar is used. If a light verb is used, it is "optimal", one might say, but it is not perfect: dictionaries signal the use of dar (to give) or hacerse (to make oneself) as variants. The most interesting part is the absence of the light verb construction in many variants of Spanish, which can be one of the effects of the absence of the light verb to let in Spanish. These examples of light verb constructions with nouns denoting bodily actions and processes are intended to show that the light verb has meaning. Nouns denoting controlled bodily actions and processes take the verb to give, and nouns denoting uncontrolled bodily processes take the verb to let, in English and in Dutch. In Spanish, which has no light verb to let, the light verb construction tends to be avoided and the full verb eructar is used or some "optimal" but imperfect solution is chosen: light verbs which come closest: hacerse (to make oneself) and dar (to

92

Page 93: De la Lexicologie à la Lexicographie

Light verb constructions in bilingual dictionaries

give). There is considerable variation. To resume, the light verb dar ("to give") in Spanish takes nouns denoting controlled bodily actions. If the action is uncontrolled, the lack of light verb corresponding to to let makes the light verb construction unavailable, and the full verb is used, or dar (to give) can be used, or hacerse (to make onself). The semantic space which is not taken by the (inexistent) light verb to let is filled up (in some variants) by its complementary light verb to give, which might have acquired a different meaning. Now consider the expression given in (10): (10) Giving winks in Spanish (i) hacer un guiño a alguien (lit.: to make a wink to someone) (ii) guiñar los ojos a alguien (lit.: to wink the eyes to someone) In Spanish, winks are not “given”, winks are “made”; the indirect object is interpreted as the Beneficiary, not the Goal of the action. Intuitively speaking, one would assume that hacer is chosen, and dar (give) avoided, and that Spanish interprets winks as products, not as objects which have some Goal. A quite different kind of example is provided by the noun sneeze, which denotes a typically uncontrolled and, more importantly, irrepressible bodily action. The same thing can be said of hiccups: the light verb construction is infelicitous and the full verb is preferred. Both cases are shown in (11) for English, Dutch and Spanish: (11) Sneezes and hiccups in English, Dutch and Spanish (a) English: ??to give a sneeze -> to sneeze; ??to give a hiccup -> to hiccup (b) Dutch: ??een nies geven -> niezen; ?een hik geven -> hikken (c) Spanish: ?dar un estornudo -> estornudar; ?dar un hipo -> hipar Thus, a more detailed analysis leads to the characterization of light verbs given in (12), in which the uncontrollable processes have been subdivided in repressible processes like a belch and irrepressible processes like a sneeze: (12) Ligt-verbs and nouns denoting bodily activities and processes (a) English: to give [CONTROLLABLE] to let [REPRESSIBLE] -- [IRREPRESSIBLE] (b) Dutch geven [CONTROLLABLE] laten [REPRESSIBLE] -- [IRREPRESSIBLE] (c) Spanish hacer [CONTROLLABLE] -- [REPRESSIBLE] -- [IRREPRESSIBLE] Furthermore, note that the three classes of nouns take possessive pronouns which

93

Page 94: De la Lexicologie à la Lexicographie

Jan Schroten

denote the owner of the body in which the activity or process takes place. The owner of the body is, of course, the "origin" and the "originator" or "producer", so to speak. The interpretation suggested in (13) will give the correct result: (13) Interpretation of possessive pronouns of nouns denoting bodily activities and processes (a) English: his sighs / farts / sneezes [ORIGIN: owner of the body] (b) Dutch: zijn zuchten / scheten / ?niesen [->genies][ORIGIN:owner of the body] (c) Spanish: sus suspiros / pedos / estornudos [ORIGIN: owner of the body] What I have tried to show in this part is that the nouns denoting bodily actions and processes have in common that the owner of the body in which the activity or process takes place is the [ORIGIN] interpretation assigned to the possessive pronouns. Thus, the thematic role [ORIGIN] is part of the semantic contents of these nouns. Another part of the semantic contents of these nouns is that they are conceived as different types of activity or process: controllable, or uncontrollable and repressible or irrepressible. Light verbs are sensitive to these semantic characteristics of nouns denoting bodily activities and processes. This implies that the semantic content of the light verb is real, although it is difficult to describe. For some nouns, no suitable light verb can be found, and the full verb must be used, since the light-verb construction is felt as inappropriate. For other nouns the kind of bodily action or process determines the right choice, or an unusual choice suggests an unusal interpretation, as in the following Dutch examples: (14) Different light verbs giving different interpretation to the light-verb construction in Dutch (i) een boer laten / ??geven / *doen (to let / have / do a belch) (ii) een baby een boer laten doen / ??laten /??geven (to make a baby burp) The difference is that the use of laten (let) implies involuntary activity, whereas the use of geven (give) suggests that there was the intention of belching. The case of doen is special: ususally, the expression een boer(tje) laten doen (to make do a burp) is used to express transitive "to burp". The producer of the burp is a baby, and the father or mother (or whoever) is waiting for the baby to burp, to produce the bodily activity or process. Again, the light verb contributes to the interpretation of the light-verb constructions.

94

Page 95: De la Lexicologie à la Lexicographie

Light verb constructions in bilingual dictionaries

6. Another class of light verb constructions: light verb nouns denoting states of mind and emotions and the choice of the light verb Consider the state of mind denoted by fright: in English, a person can give someone a fright. The person "receiving" a fright is said to have a fright or to take fright. In Spanish, the equivalent noun susto is combined with dar (to give) or tener (to have). In Dutch, both verbs are unusual: ??iemand (een) schrik geven (to give someone (a) fright) and ??(een) schrik krijgen (to get a fright) are unusual, and normally expressed in different ways, with verbal constructions: iemand aan het schrikken maken (to make someone be frightened) and schrikken (to take fright) or iemand laten schrikken (to make someone frighten). The state of mind noun fright can take a possessive pronoun denoting the experiencer, not the cause or originator: her fright refers to the fright she has, not to the fright that she produces. In fact, in the sentence I gave her a fright, we find the typical light-verb phenomenon which Grimshaw and Mester (1988) analyzed for Japanese. The verb to give makes it possible to use the "shifted" dative her, that is, the indirect object loses its typical preposition to while shifting to the position before the direct object. The experiencer interpretation of the shifted indirect object, however, depends on the noun fright, and is not dependent on the verb. This is easy to see by taking into account the unacceptability of *I gave her a sigh. Sighs do not imply experiencers but they involve an originator, as in I gave a sigh. Examples such as these show that the noun can only combine with light verbs which have a suitable semantic representation. Thus, nouns involving originators take a light verb whose subject has a source role. Nouns involving experiencers take a light verb with a different property, a subject with locative or goal interpretation. The use of to give with the experiencer noun fright gives a causative interpretation, the experiencer subject of to have a fright corresponds to the indirect object of causative to give: to give someone a fright. This typical pattern is somewhat awkward in the three languages under consideration: (15) Experiencer and causative light-verb constructions with nouns denoting states of mind in English, Dutch and Spanish (a) English: I had a fright / I got fright -> he gave me a fright (b) Dutch: ?ik had schrik / ?ik kreeg schrik-> ?hij gaf me schrik (c) Spanish: ?yo tuve un susto -> ?me dio un susto The usual way of expressing how a person is feeling is by using the noun feeling and by specifying the kind of feeling as its complement, as in he had a feeling of uncertainty or by using the verb to feel. The same expressions are found in Dutch and Spanish, as can be seen in (16): (16) Feelings in English, Spanish and Dutch (a) English: he had a feeling of uncertainty / uneasiness / tenderness

95

Page 96: De la Lexicologie à la Lexicographie

Jan Schroten

to feel uncertainty / uneasiness / tenderness (b) Dutch: hij had een gevoel van onzekerheid / ongerustheid / tederheid hij voelde onzekerheid / ongerustheid / tederheid (c) Spanish: tenía un sentimiento de inseguridad / inquietud / ternura sentía inseguridad / inquietud / ternura With these nouns, the use of the light verb to have gives awkward results in the three languages: (English) ??to have uncertainty /?? uneasiness / ??tenderness; (Dutch) ??onzekerheid / ??ongerustheid / ??tederheid hebben; (Spanish) tener ??inseguridad / ??inquietud / ??ternura. Note that these awkward light-verb constructions contain nouns which have no full-verb variant. Verbs like *to uncertain / * to unease / *to tender in English, *onzekeren / *ongerusten / *tederen in Dutch and *insegurar / *tern(ur)ar in Spanish are verbs which do not sound as even remotely possible, and inquietar has only transitive “cause” meaning (to worry), not the intended “feel” meaning. There is a clear difference with doubt, which is not treated as a noun of feeling; the typical light verb with doubt is to have: (English) to have doubt; (Dutch) twijfel hebben; (Spanish) tener duda(s). The same goes for thoughts and suspicions. The corresponding verb is available as well: English to doubt, Dutch betwijfelen and Spanish dudar are full verbs with a meaning similar to the light verb construction. Pursuing our attempt at characterizing aspects of light verb constructions, consider two central emotions and how they behave: love and hate. The verb with which they are construed easily is to feel, and the light verb to have is awkward. Of course, one can have a feeling of love or hate, and the possessive pronoun is used to indicate the “possessor”, the person feeling love or hate. In this case, however, the full verb is used more than the light verb construction: to love and to hate. Similar observations can be made with respect to Dutch and Spanish. Thus, nouns denoting feelings take possessive pronouns expressing the experiencer, the person who has the feeling. They can be the complement of the noun feeling and be combined with the light verb to feel ; in many cases, no full verb related to the noun is available. It is somewhat surprising that the light verb construction which is part of a relative clause is usually acceptable, as shown in (17): (17) Some characteristics of nouns denoting feelings Typical noun denoting feeling: uneasiness (i) Use of possessive pronoun: his uneasiness / John’s uneasiness / the uneasiness of the citizens (ii) Use of light verb to feel uneasiness / ??to have uneasiness (iii) Use of a relative clause containing the experiencer the uneasiness that he feels / has This suggests that the verb to feel is like a light verb which collocates, not surprisingly, with nouns denoting feelings. Nominalization of to feel gives the

96

Page 97: De la Lexicologie à la Lexicographie

Light verb constructions in bilingual dictionaries

noun feeling which takes the kind of feeling, the feeling which is felt, as its complement. The noun feeling itself takes the light verb to have. Looking at this picture from the lexicographic point of view, it implies that the ideal dictionary would benefit from the lexical specification that uneasiness, uncertainty, tenderness, love and hate are kinds of feelings. In fact, I want to suggest that the genus that has always been one of the building blocks of lexicographic definitions, is essential. If the lexicon specifies the genus [FEELING] for all nouns denoting feeling, the use of the verb to feel follows, and can be used as a test. Now consider the use of the light verb to have in expressions like to have courage / patience in which the noun can be said to denote a property: they are not conceptualized as feelings, but as characteristic properties, which are temporal or permanent. Properties can be lost, of course, which is why one can lose one’s courage or patience, whereas feelings like uneasiness cannot be lost. It follows that doubts, like suspicions and thoughts are not feelings; they are in the mind, and not in the heart, as are feelings and emotions. They can be characterized as states of mind, or ideas, which one has but not feels. Thus, if the genus of doubts, suspicions and thoughts is given as [IDEA], it must be added that ideas can be “had”. The dictionary must provide the user with the information that all nouns which have the genus [IDEA] can collocate with to have. A similar decision, that each noun which can be collocated with a light verb, must be specified as to the genus it belongs to, can be taken for other light verb constructions. Furthermore, each genus must be characterized as collocated with one or more light verbs. If monolingual dictionaries are built up this way, bilingual dictionaries can be construed in much the same way, by stating the genus and the light verb or verbs it collocates with. Consider the following simplified way of how to treat the nouns uneasiness and suspicion in a monolingual dictionary of English: (18) Uneasiness and doubt in a monolingual dictionary of English (i) uneasiness: genus = [FEELING] genus = [FEELING] > light verb: to feel (ii) doubt: genus = [IDEA] genus = [IDEA] >light verb: to have Only in this way will it be possible to clearly distinguish the more idiomatic and metaphorical uses, and to compare languages in such a way that bilingual lexicography.will benefit. 7. Epilogue The main objectives of this contribution have been: (i) to show why light verb constructions should be treated as compositionally

97

Page 98: De la Lexicologie à la Lexicographie

Jan Schroten

interpretable constructions; (ii) to show how a systematic treatment of light verb constructions can be given. If one takes into account proposals such as Giry-Schneider (1987) (on French “support verb” constructions which are like light verb constructions), Solé (1966) (a study on Spanish constructions with hacer (to make)), Cattell (1984) and Kearns (1989), one might conclude that light verb constructions are idiomatic and permit lexical treatment only. Other studies, however, show that regular semantic patterns can be found: Everaert and Hollebrands (1996) show that the light verb must have some semantic content, and this is shown also in Hollebrandse and Van Hout (1999), a study on child language and the use of light verb constructions. In this contribution, the “semantic approach” has been taken, and the lead given by Everaert and Hollebrands (1996) has been followed. The semantic analysis of light verb constructions is not only difficult, but it involves aspects of meaning that are not well understood. This is the reason why dictionaries are unsystematic and give unsatisfactory results. Light verbs seem to have access to hidden properties of light verb nouns, which are not understood. In order to discover which semantic properties are at stake, two kinds of (light verb) nouns have been selected and their behavior in light verb constructions has been investigated: one involving nouns denoting bodily actions and processes, and one involving nouns denoting feelings and thoughts. The analysis has been tentative, and it has given some provisional, but interesting results. The most promising lead is given by the sketch of how to characterize the hidden semantic property to which the light verb has access and which determines its choice and interpretation. The characterization of nouns that has been sketched suggests that the most promising route to follow has been sketched in Wierzbicka (1982) and Pustejovsky (1995). It is evident that a much more detailed investigation on light verb constructions in different languages is needed. If the approach that has been suggested is on the right track, the results will be benificial to lexicographers, permitting a more systematic treatment of light verb constructions in monolingual and bilingual dictionaries. Bibliography CATTELL, R. (1984), Composite Predicates in English. Sydney: Academic Press (= Syntax and

Semantics, 17). [Collins English=] Collins Dictionary of the English Language (1986). Editors: P. Hanks, W.T.

McLeod, L.Urdang, 2nd ed. London: Collins. EVERAERT, M; HOLLEBRANDSE, B. (1996), `The Lexical Representation of Light Verb

Constructions’, Berkeley Linguistic Society, 21. GIRY-SCHNEIDER, J. (1987), Les prédicats nominaux en français : les phrase simples à verbe

support. Genève : Droz, GRIMSHAW, J. & MESTER, A. (1988), `Light Verbs and Theta Marking’, Linguistic Inquiry, 19,

205-232. HOLLEBRANDSE, B. & VAN HOUT, A. (1999), `Light Verb Learning in Dutch’. In: Verrips. M.; WIJNEN, M. (eds). Proceedings of the Dutch –German Colloquium on Language Acquisition.

98

Page 99: De la Lexicologie à la Lexicographie

Light verb constructions in bilingual dictionaries

Amsterdam Series in Child Language Development, 3. KEARNS, K. (1989), `Predicate Nominals in Complex Predicates’. In: Laka, I; Mahajan, A. (eds)

MIT Working Papers, 10: Functional Heads and Clause Structure, 123-134. PUSTEJOVSKY, J. (1995), The Generative Lexicon. Cambridge, Mass.: MIT Press. SOLE. Y. (1966), HACER: Verbo funcional y lexical. Washington D.C.: Georgetown Univ. Press. [Van Dale Nederlands =] Van Dale Groot Woordenboek der Nederlandse Taal. (1984). Editors:

G. Geerts; H. Heestermans; C.K. Kruyskamp. 11th. rev. ed. 3 vols. Utrecht / Antwerp: Van Dale Lexicografie.

[Van Dale Engels=] (1984) Van Dale Groot Woordenboek Engels-Nederlands.(1984). Editors: W. Martin; G.A.J.Tops. Utrecht / Antwerpen: Van Dale Lexicogafie

WIERZBICKA, A. (1982), `Why can you have a drink when you can’t *have an eat’, Language 58, 753-798.

99

Page 100: De la Lexicologie à la Lexicographie

La création morphologique dans le dictionnaire

Francine Melka Université d'Utrecht

0. Introduction Le point de départ de cet article est une constatation double. La première, c'est qu'on a souvent présenté le français comme une langue morphologiquement pauvre. Ullman (1975: 127-8) constate "la défaillance de la dérivation et de la composition [française]"; plus loin, il remarque que "l'appauvrissement de la composition et de la dérivation en français moderne constitue l'un des traits les plus remarquables de la morphologie". La comparaison entre le français et les langues germaniques, qui connaissent une productivité maximale (nombreux composés correspondant à des mots simples en français, verbes à particules en anglais, en allemand traduits par des verbes simples ou des verbes plus une préposition en français, etc.) et même avec des langues romanes comme l'italien dont la suffixation est très productive (suffixes augmentatifs, diminutifs, etc.) pourrait donc faire croire au statisme du français en matière de morphologie. La deuxième constatation, c'est que la lecture des journaux actuels, de la publicité et le parler des locuteurs jeunes et des moins jeunes, d'ailleurs, semblent contredire la première constatation. Il est significatif, par exemple, que dans le collectage de néologismes fait dans un séminaire par un groupe d'étudiants de troisième année1, c'est la catégorie "néologismes morphologiques" qui était de loin la plus importante. En voici quelques-uns relevés parmi tant d'autres dans des journaux récents: (1) le technostress wintériser (les camps de réfugiés) une vidéoconférence l'hypoallergénicité la serbophilie les ultra-orthodoxes en Israël les post-sionistes, etc. Il ne s'agit ici nullement de démontrer que le français est une langue "riche" morphologiquement (statistiquement parlant par rapport aux langues germaniques ou d'autres langues romanes), mais de montrer que, vue à travers un dictionnaire comme Le Nouveau Petit Robert, la production dérivationnelle et compositionnelle, la troncation, la siglaison sont relativement importantes, en d'autres termes, que la création morphologique en français ne stagne pas. Je le ferai en comparant deux 1 Séminaire de troisième année, Ecole Normale de Tilburg: les étudiants ont compté qu'entre 40% et 60% des néologismes trouvés étaient des néologismes morphologiques.

Page 101: De la Lexicologie à la Lexicographie

La création morphologique dans le dictionnaire

éditions du Petit Robert éditées à quelque 20 ans d'écart2. Mon but est essentiellement d'examiner la richesse de la dérivation et de la composition: la productivité (ou la non productivité) d'anciens et de nouveaux affixes. En ce qui concerne la composition, il faudra examiner les composés français (savants et non savants), et se demander, comme certaines études le soulignent, s'ils obéissent à certaines règles de formation, tête à gauche ou tête à droite, et ce que nous pourrions en conclure. Pourrait-on ou non, par exemple, conclure à une influence grandissante de l'anglais? Tout d'abord, j'examinerai rapidement deux thèses qui traitent des règles de dérivation et de composition. Ensuite, je présenterai le corpus et l'analyserai. 1. Deux études sur la dérivation et la composition Deux thèses présentent sur la dérivation et la composition en français des interprétations contradictoires. C'est dans Syntax of Words, publié en 1982, que Selkirk reprend l'idée que, en ce qui concerne l'anglais, la grande majorité des composés ont la tête à droite ; la tête est le noyau du composé; elle détermine la catégorie, la pluralité: (2) living room living rooms apple pie apple pies La tête se situe rarement à gauche en anglais, mais cela se passe dans le cas des verbes à particules: (3) step out, throw up, come in, run away. Il y a aussi un petit nombre de composés anglais qui sont exocentriques, c.-à-d. qui n'ont pas de tête à proprement parler:

(4) pickpocket, scarecrow Dans l'exemple de PICKPOCKET, ni le verbe "pick" ni l'argument "pocket" ne peuvent être la tête, puisque le "pickpocket" signifie la personne qui fait les poches,

2 Ce travail ressemble, en partie seulement, à l’entreprise de Dubois, Guilbert, Mitterand et Pignon (1971), où les auteurs étudient le mouvement du vocabulaire français en comparant deux éditions du Petit Larousse, celle de 1949 et de 1960. Je reviendrai tout au long de cet article sur leurs résultats. Mais, dès maintenant, on peut dire que leurs objectifs et les miens diffèrent grandement: ces auteurs étudient tout le vocabulaire et non pas seulement l'aspect morphologique; de plus, leur étude ne porte pas sur les composés, bien qu'ils analysent très brièvement les "dérivés" à affixes grecs et latins.

101

Page 102: De la Lexicologie à la Lexicographie

Francine Melka

qui vole. Selkirk présente brièvement le cas du français: elle propose que la tête est à gauche. Comme preuve elle avance que TIMBRES prend la marque du pluriel et détermine la catégorie du composé: (5) timbres-poste (m), chefs d'oeuvre (m) Di Sciullo et Williams (On the Definition of Word, 1987) défendent une autre thèse sur le français: la tête en français est à droite, comme en anglais, et la preuve en est que dans le cas de la dérivation, l'affixe détermine la tête; ainsi dans CHANT-EUR, -EUR désigne l'agent et donne sa catégorie à la formation V + N. -EUR est considéré comme un nom (1987:25) aussi longtemps qu'il est accolé à un autre élément. Quant aux formations comme: (6) essuie-glace, couche-tôt, gagne-petit, etc. (que d'ailleurs Selkirk considérerait comme exocentriques), Di Sciullo et Williams en font des formations syntaxiques qui obéissent à des règles syntaxiques où, par exemple, ESSUIE est le prédicat et GLACE le thème (V + argument); ils les appellent d'ailleurs "syntactic words". Quant aux formations comme TIMBRE-POSTE, ils en font aussi des idiomes, des expressions syntaxiques fixes. Ainsi, selon eux, mots syntaxiques et idiomes mis à part, il ne reste que des composés avec tête à droite: "... with the listed syntactic phrases and the phrases reanalyzed as words removed, French morphology can be seen as strictly right-headed" (1987:83). On peut retenir de ces deux thèses que, d'une part, pour Selkirk les composés français ont généralement la tête à gauche, mais pas tous, et que, d'autre part, pour Di Sciullo et Williams, la tête est à droite en français, la preuve en est le cas des dérivations. Quant aux nombreuses compositions nouvelles, les composés savants, ils ont tous la tête à droite, ce qui leur permet d'ajouter un affixe, ce que la composition non savante, tête à gauche ne permet pas (cf. notamment Zwanenburg, 1992): (7) [strong-mind]-ed [video-conférenc]-ier Le composé non savant anglais ainsi que le composé savant français (7) ont tous deux la tête à droite ce qui permet l'affixation, alors que la tête à gauche du composé non savant français ne permet pas l'affixation (8): (8) * [amour-propre]-eux. C'est à la lumière de ces deux thèses que j'examinerai donc deux points principaux, la productivité des affixes et la formation des composés, i.e., leur tendance à se former

102

Page 103: De la Lexicologie à la Lexicographie

La création morphologique dans le dictionnaire

avec la tête à droite ou à gauche ou, éventuellement, leur tendance à l'exocentricité. 2. La méthode et le corpus: La méthode que j'ai adoptée est la suivante: j'ai comparé deux éditions du Petit Robert, celle de 1970 et celle de 1993 (dernière édition remaniée, à ma connaissance): l'édition de 1970 étant réellement celle de 1967, l'écart entre les deux éditions est donc de 25 ans. Renouvellement des dictionnaires et correction des dictionnaires (cf. D. Corbin, 1987:34) sont naturellement des façons de rendre compte de l'évolution d'un lexique. L'édition de 1993 a été renouvelée et/ou "corrigée" de diverses manières, notamment en comblant des lacunes morphologiques accidentelles, en combinant des mots virtuels, possibles 3. Dans chacune des deux éditions, j'ai choisi la lettre C et cela pour deux raisons. D'abord pour le nombre d'entrées, la lettre C représente à peu près 10% du nombre total des entrées dans les deux dictionnaires, ensuite, parce que la lettre C comporte toutes sortes de suffixes savants ou non:

(9) -ALGIE, -CULTURE, -GENÈSE, -GRAPHIE, -ITE, -LOGUE, -PHOBE, -SCOPIE, -VORE, etc.

et aussi des préfixes savants et non savants: (10) CARDIO-, CHIR(O)-, CHOL(E)-, CHROME-, CHRONOS-, CHRYO-,

COM-, CO-, CONTRE, etc. L'édition de 1970 compte sous C circa 5.600 entrées; de ce total environ 200 mots ont disparu, dont 100 formations morphologiques. L'édition de 1993 comporte sous C environ 6.200 entrées dont environ 775 nouvelles. De ces 775 mots nouveaux, 580 sont des nouvelles formations morphologiques, c.-à-d. environ 75% du total des nouvelles entrées. Si mon échantillon (la lettre C) est représentatif, on peut dire que la création morphologique en français moderne reste relativement vivante4. 3 D. Corbin donne l'exemple de DÉGOUDRONNER qui est ajouté à l'édition du PR (Petit Robert) de 1977, alors que DEGOUDRONNAGE ne l'est pas (bien qu'il soit attesté dans le Lexis de la même date). Quant à mon corpus, j'ai noté que certaines lacunes de composés savants commençant pas ANTI- ont été comblées dans l'édition de 1993: 101 items ont été ajoutés (Le Petit Robert de 1993 comprend 180 entrées commençant par ANTI-l'édition de 1970 n'en a que 79). Ainsi faudra-t-il garder en tête que la création morphologique est ici restreinte à ce qu'un seul dictionnaire (en l'occurrence le PR) propose. La création virtuelle de mots possibles est certainement bien plus importante.

4 Dubois et alii (1971) s'occupent, eux, du vocabulaire en général, et aussi des nouvelles acceptions d'un mot (polysème: métaphores, métonymies); ceci n'est, bien entendu, pas entré en ligne de compte dans mon calcul. Je n'ai compté que les entrées morphologiques nouvelles.

103

Page 104: De la Lexicologie à la Lexicographie

Francine Melka

Sous entrées morphologiques, j'ai donc compté: 1. les sigles/acronymes C.B., C.D., C.E.D.E.X., etc. 2. les troncations CRADE de CRADINGUE, etc. 3. les dérivations CASTAGNER (verbe) de CASTAGNE Pour le décompte des dérivés, j'ai procédé de la façon suivante: CASTAGNER est un nouveau verbe dérivé de CASTAGNE que j'ai compté. Par contre, CASTAGNE n'est pas compté comme un dérivé, bien qu'il vienne de CHATAIGNE; j'ai considéré que le rapport était trop lointain entre les deux mots et peu compréhensible pour le locuteur natif moyen. CANNER de « to can » (angl. "mettre en boîte"), COLAPSER (de l'angl. « to collapse »), CANNABISME, CANNABIQUE (de CANNABIS) ont été comptés pour la même raison que celle invoquée plus haut. Mais CANNABIS venant de CHANVRE n'a pas été compté, le rapport n'étant pas évident, à mon avis. J'ai inclus aussi des unités telles que CARCÉR-AL (le radical est savant et sert à former un mot bien connu du vocabulaire commun INCARCÉRER; -AL donne sa catégorie au mot et est reconnaissable comme affixe adjectival par le locuteur natif moyen. Par contre j'ai omis un mot comme CANADAIR, bien que le mot soit formé sur CANADA: le rapport sémantique "Canada" et le sens du mot (avion muni de réservoir d'eau) n'est pas évident. Mon choix pourrait donc paraître arbitraire quelquefois et pourrait être matière à discussion. 4. les compositions non savantes et savantes: CAMPING-CAR, COTON-TIGE, CARRÉ-ÉPONGE, CAPILLICULTURE, CERVICALGIE, etc. Ici aussi, j'ai considéré que CAPILLI- et CERVI-, grâce à "capillaire" et "cervical", expressions connues des locuteurs, étaient compréhensibles et ont été adoptés. Pour les exemples de termes techniques, il est vrai que je me suis basée sur mon intuition de locuteur natif, ce qui pourra sembler arbitraire. 3. Analyse et résultats Le nombre total des nouvelles entrées morphologiques s'élève à 580. De ce nombre total 5,5% des entrées sont des troncations et siglaisons, soit 31 items; 59% sont des

104

Page 105: De la Lexicologie à la Lexicographie

La création morphologique dans le dictionnaire

dérivés, soit 342 items et, enfin, 36% sont des compositions, soit 208 items. Je présenterai d'abord les résultats bruts, puis analyserai un certain nombre de phénomènes qui me paraissent intéressants. (Les listes en appendices ne proposent qu'une partie du corpus.) Pour les dérivations, la question est de savoir si l'on peut déceler de nouvelles distributions: suffixes qui tendent à disparaître, d'autres qui tendent à être plus productifs et à supplanter d'autres formations. C'est à cette question que je tenterai de répondre en examinant les résultats. 3.1. Troncations et siglaisons (appendice 1) Les troncations nouvelles sont au nombre de 12 (soit 2% du total des nouveautés morphologiques); les mots tronqués sont des mots du vocabulaire courant; la troncation s'est faite soit à droite soit à gauche et pas toujours à la syllabation (cf. CLANDÉ, COKE): (11) cipal, clandé (clandestin), coke (cocaïne), coca, croque... J'ai compté 19 siglaisons, soit 3.5% du total5: (12) CD, CD ROM, CRS, CB, CEDEX, CCP... 3.2. Les dérivations: Elles sont très nombreuses (près de 60% du total) et concernent surtout la catégorie des substantifs, assez peu celle des adjectifs et verbes. Je commencerai par (A) les noms de machines, engins, etc., puis je continuerai (B) par les noms d'agents dont le renouvellement (disparition et productivité de certains affixes) est spectaculaire. Sous noms d'agents, j'examinerai aussi les nouveaux féminins et masculins (formés sur des racines de féminins). Ensuite, je listerai (C) d'autres substantifs indiquant l'action, l'état, la qualité, l'attitude, etc., puis (D) les verbes, (E) les adjectifs. A) Les noms de machines (appendice 2) Les dérivés en -EUR ou -EUSE indiquant des noms de machines, d'appareils, d'engins, de logiciel, etc.: je compte 20 entrées nouvelles (3.6% du total) et pas de sorties. Ce résultat est impressionnant car je n'examine qu'un dixième de tout le corpus (la lettre C):

(13) chargeuse, chouleur, conteneur, cutteur... Dubois et al. (1971) dans leur étude ne relèvent pour la totalité du dictionnaire examiné, Le Petit Larousse, que 65 nouveaux cas de noms de machines, engins, etc.! Mes résultats montrent donc combien la technique s'est développée et combien elle

5 "3.5% du total" signifie du total des créations morphologiques, c'est-à-dire 580.

105

Page 106: De la Lexicologie à la Lexicographie

Francine Melka

influence la structure du vocabulaire. B) Les noms d'agents (appendice 3) ♦ Les noms d'agents (métier ou valeur générale) en -EUR/ -EUSE, -EUR/-TRICE sont relativement peu nombreux, 11 en tout pour la lettre C (5 noms de métier et 6 noms d'agent à valeur générale), soit environ 2% du corpus total ( appendice 3): (14) cadreur, coréalisateur, castrateur, contamineur, etc. Presqu'autant d'entrées, 10, disparaissent entre 1970 et 1993. Il s'agit de 6 noms de métiers et 4 noms d'agent à valeur générale: (15) Noms d'agent disparus: confectionneur, cylindreur, corrigeur, cornemuseur, cambreur, coltineur, convoiteur, chuchoteur, chipeur, clabaudeur ♦ Le nombre de noms d'agent, de métier en -IER/-IÈRE et en -EUX sont aussi assez peu nombreux ( appendice 3). On en compte 5 (moins de 1%):

(16) carlinguier, carpettier, chaussonnier, colzatier, etc. et: coqueleux Ces suffixes en -EUR/-IER/-EUX ne sont pas très productifs, mais ils continuent à vivoter, semble-t-il. Ils sont probablement actuellement supplantés par -ISTE, comme on le verra plus bas. ♦ Les noms d'agents en -IEN/NE forment 1% du corpus, soit 6 items; ils sont formés sur des noms (propres) et des sigles: COPERNICIEN, CAPÉSIEN, ( appendice 3) ♦ Les noms d'agents indiquant un nouveau féminin sont au nombre de 10 (soit 1.75% du total). Ce sont des noms de métier (7) peu prestigieux en général (sauf CHIRURGIENNE) ou des noms indiquant un état ou une attitude négatifs: CAVALEUSE, CONNE, COUILLONNE. Je n'ai relevé qu'un seul nouveau masculin formé sur le nom d'agent féminin, CHAISIER formé sur le modèle déjà attesté de CHAISIÈRE. ♦ Le suffixe en -ISTE, indiquant un nom d'agent, avec un peu plus de 4% du total, soit 23 entrées, est très productif. (Il faut tout de même noter 3 sorties, CRIMINOLOGISTE6, CITHARISTE, CYCLOMOTORISTE). En voici un

6 CRIMINOLOGISTE a été remplacé par CRIMINOLOGUE pour une raison qui n'est pas

106

Page 107: De la Lexicologie à la Lexicographie

La création morphologique dans le dictionnaire

échantillon, le reste de la liste se trouve en appendice 3:

(17) cabliste, coloriste-conseil, clubiste, cuisiniste, etc. Il est à noter que le développement de ce suffixe, depuis la Révolution déjà, reste considérable; mais une nouvelle tendance se dessine: le nom d'agent en -ISTE continue à signifier "adepte d'une doctrine, d'un mouvement politique", mais sert aussi maintenant à former, et c'est là la nouveauté, des noms de métiers (CHAUFFAGISTE, CARISTE...). Ainsi ce suffixe est bien vivant et évolue vers d'autres domaines. Il est, d'autre part, intéressant de noter que Dubois et al. (1971) avaient prédit que ce suffixe en -ISTE n'avait que peu d'avenir. C) D'autres suffixes nominaux: ♦ Parallèlement au suffixe en -ISTE, le suffixe en -ISME est productif. Certaines formations sont toutes nouvelles CULTURISTE/CULTURISME ou CATASTROPHISTE/CATASTROPHISME; certaines comblent des lacunes: CENTRISME. Les créations sont au nombre de 18, soit plus de 3% du total des formations morphologiques. Elles indiquent, dans mon corpus, parallèlement à une doctrine philosophique ou politique (cf. Dubois et al.), aussi une attitude, une qualité, un état, par exemple: CANNABISME signifie l'intoxication par le cannabis: (18) castrisme, centrisme, catastrophisme, culturisme, clanisme (appendice 3). Une seule entrée a disparu CÉNOBISME. ♦ Le suffixe en -ITÉ se retrouve dans 11 entrées (soit environ 2% du total); on compte une seule sortie CONVENTUALITÉ ( appendice 4). Les noms sont formés sur une racine adjectivale en -EL, -AL, -ABLE/-IBLE, -AIRE, -IF ou -IQUE:

(19) confidentialité, collégialité, communicabilité, comestibilité, circularité, compétitivité, criticité

Cette formation en -ITÉ était, semble-t-il, autrefois réservée aux mots du domaine de la philosophie et du droit; aujourd'hui, c'est plus le vocabulaire général qui est touché. Enfin, il y a eu autrefois une certaine concurrence entre les suffixes -ITÉ et -ISTE au profit de -ISTE, mais nous constatons que le suffixe en -ITÉ reste productif.

claire, puisque le suffixe -ISTE est tellement productif actuellement et que -OGUE est en perte de vitesse.

107

Page 108: De la Lexicologie à la Lexicographie

Francine Melka

♦ Les suffixes nominaux en -AGE (on compte 18 nouvelles entrées en -AGE, soit plus de 3% du total, et 3 sorties, CHARRUAGE, CREUSAGE, CALQUAGE), en -MENT (8 nouvelles entrées, environ 1.5% du total et 2 sorties, CAILLEMENT, CONVERTISSEMENT) et en -UDE (1 entrée) seront traités ensemble (voir l'appendice 5), bien qu'au point de vue des pourcentages ils diffèrent grandement; la raison en est qu'il existe de nombreux (nouveaux) doublets, par exemple: CAILLAGE vs. CAILLEMENT, qui disparaît, ou CLIQUÈTEMENT vs. CLIQUETIS, ou encore COMPLÈTEMENT vs. COMPLÉTUDE, qui sont tous deux nouveaux. Cependant, il est difficile d'établir si le nouveau doublet a une valeur différente: une nouvelle distribution par rapport à l'ancienne entrée. Grosso modo, il n'est pas aisé de trouver des régularités dans les doublets. Pourtant, j'ai noté que CALAGE (nouvelle entrée) indique un sens général et abstrait par rapport à CALAISON, plus technique, qui s'emploie exclusivement pour un bâteau; la même différence vaut pour CHARPENTAGE (abstrait) versus CHARPENTERIE (pour un chantier); COPINAGE semble être plus abstrait que COPINERIE. J'ai relevé quelques doublets intéressants avec distribution différente qui indique que la concurrence entre les suffixes -AGE et -EMENT ou -UDE est encore vraie (voir aussi Dubois et al., 1971). Mais encore une fois il est impossible de trouver des régularités, à en juger par les exemples suivants: (20) CLIQUÈTEMENT (sens général) CLIQUETIS (bruit sec, en particulier de clefs, de chaînes); CAMBREMENT (sens général) CAMBRAGE (sens technique, réservé aux tiges de chaussures); CAQUÈTEMENT (de poules) CAQUETAGE (sens métaphorique de "bavardage"; COMPLÈTEMENT (action de compléter un dessin, un test) et COMPLÉTUDE (abstrait, état de ce qui est achevé); COLLATIONNEMENT/COLLATION (même sens de "repas"). Dubois et al. présentent les deux suffixes -AGE et -EMENT comme des distributions ayant chacune leur caractéristique: -AGE indiquerait une action technique, concrète et -EMENT une action abstraite ou le résultat d'une action. Au contraire mon corpus indique dans le cas de doublets nouveaux que le suffixe en -AGE marquerait un sens abstrait (cf. COPINAGE, CAQUETAGE, CHARPENTAGE) ou général. ♦ Pour le suffixe en -TION ( appendice 6), les entrées sont au nombre de 9 (1.5% environ) et les sorties au nombre de 1 (CONGLUTINATION). ♦ Les suffixes en -OT et en -ET/-ETTE indiquant des diminutifs sont au nombre de 11 (3 en -OT et 8 en -ETTE, entre autres CALCULETTE,

108

Page 109: De la Lexicologie à la Lexicographie

La création morphologique dans le dictionnaire

CHOUQUETTE, CLOPINETTE), soit 2% du total des formations morphologiques ( appendice 7). ♦ Ce suffixe en -ERIE est peu formateur. Il est lié à des noms de petite industrie, de commerce artisanal qui disparaissent en même temps que le suffixe lui-même. J'ai compté 2 entrées, CRÊPERIE, CARTERIE. L'autre suffixe en -ERIE désignent des noms du vocabulaire commun dans un emploi péjoratif qui est probablement concurrencé par d'autres suffixes. Mon corpus n'en contient que deux: CHIERIE, CULCUTERIE. ♦ Les suffixes familiers en -OCHE/-OQUE et surtout en -ARD sont plus productifs que -ERIE, respectivement 2 et 8: (21) caldoche, chintoque (22) connard, cyrard, corpsard, crobard, camisard, chiard, clébard, combinard ♦ Deux noms d'arbres exotiques en -IER sont mentionnés dans le corpus, COLATIER, CENELLIER, ainsi que trois noms désignant un terrain ou une forêt plantés d'arbres en -AIE et en -IÈRE : CÉDRAIE, CÉDRIÈRE, COCOTERAIE. ♦ la formation nominale en -IQUE, sur le modèle de informatique, indique un ensemble de technologies, de techniques et leur étude. On ne compte que 4 entrées (moins de 1% du total) seulement, mais on peut penser que cette formation (qui n'est pas mentionné chez Dubois et al.) prendra de l'ampleur: (23) connectique, confortique, créatique, criminalistique ♦ Le suffixe nominal en -IS-ATION sera traité en même temps que le suffixe verbal en -IS-ER ( appendice 8 et voir D). D) Les suffixes verbaux: ♦ Le suffixe en -IS-ER et le suffixe nominal en -IS-ATION sont des suffixes très formateurs avec 20 entrées (13 verbes et 7 noms) et aucune sortie, soit 3.50% du total. Dubois et alii en avaient relevé 48 pour l'ensemble du dictionnaire et 52 sorties. Dans mon corpus, quatre items (verbes + noms) sont nouveaux; il s'agit de COLORISER, CLOCHARDISER, CULPABILISER, CONCEPTUALISER; les autres créations comblent des lacunes. Dubois et alii (1971) remarquent que ces nouveautés appartiennent au vocabulaire politique et économique. Dans mon corpus, cette tendance est de moindre mesure, les termes font plutôt partie du vocabualre général. Si mon corpus est représentatif, on peut dire que ce suffixe passe d'un registre technique à un registre général.

109

Page 110: De la Lexicologie à la Lexicographie

Francine Melka

Enfin, il faut noter que le suffixe nominal -IS-ATION semble remplacer des suffixes en perte de vitesse comme les suffixes en -AISON, -ON et -ION, -TION (voir l'appendice 8). ♦ Le suffixe verbal en -ER avec ces 20 nouveautés, soit 3.50% du total, confirme sa productivité déjà connue ( appendice 9). On constate qu’on ne trouve aucune formation verbale en -IR, -RE, -OIR, par exemple. Les nouveaux verbes sont formés sur un radical anglais, ou bien sont de nouvelles formations argotiques, ou encore des verbes techniques: (24) canner, cliquer, se crasher, calancher, calotter, chlorer, claveter, compresser7 ♦ Le corpus ne contient que trois créations de verbes à suffixe péjoratif , qui indique aussi la répétition en -AILLER: COUPAILLER, COUCHAILLER, CRACHOUILLER.

E) Les suffixes adjectivaux: ♦ La formation adjectivale en -IQUE, qui n'apparaît pas chez Dubois et alii en 1971, est productive: elle comprend 15 entrées, soit environ 3 % du total; il n'y a aucune sortie. Elle désigne presqu'entièrement des entités scientifiques ou techniques ( appendice 10), et aussi deux entrées du langage courant ou populaire : (25) calorique, cannabique, capitalistique, cataclysmique, cellulitique, cénoroïque, et : charismatique, chiatique ♦ Le suffixe en -ABLE et -IBLE touche 8 entrées, soit plus de 1.5% du total; les sorties, au nombre de 7, comme CIVILISABLE, CONDENSABLE, CONGELABLE, CONDUCTIBLE, ne signifient pas que ces adjectifs ont disparu du lexique, mais peut-être que ces formes sont à considérer comme des allomorphes du verbe encore disponibles.

(26) captable, commercialisable, commutable, compensable, comprimable, constructible, corrigeable, crédible.

♦ Dans mon corpus, j'ai relevé 8 formes verbales en -ANT (circa 1.5% du total), mais apparaissant de façon autonome (du verbe) dans le dictionnaire. Dubois et al. (1971) prédisaient que ce suffixe disparaîtrait. Ce n'est pas vraiment le cas. Dans mon corpus, sur un total de 8 items, 3 formes sont aussi employés comme substantifs, ce qui est à considérer comme une étape dans l'acquisition d'un statut à

7 COMPRESSER concurrence "comprimer".

110

Page 111: De la Lexicologie à la Lexicographie

La création morphologique dans le dictionnaire

part: COAGULANT, CONTESTANT, COOPÉRANT. Les autres formes restent adjectivales.

(27) caquetant, cariant (de carie), circulant, cliquetant, coagulant, codant, contestant, coopérant

♦ Les suffixes en -IF sont aussi au nombre 8, soit environ 1.5% du total. Je considère ce suffixe comme assez productif contra Dubois et al., qui l'estiment moribond en 1971: Dubois n'avait dénombré que 13 entrées dans la totalité du dictionnaire et avait enregistré 57 sorties. (28) captatif, caritatif, conatif, conclusif, contragestif, contreproductif,

connotatif, créatif ♦ Le suffixe adjectival en -AL se retrouve dans 5 entrées, soit moins de 1% du total. Dubois et al. ne le mentionnent pas dans leur étude. C'est un suffixe technique ici: (29) carcéral, colorectal, comportemental, conjonctival, consortial. ♦ J'ai regroupé ici un certain nombre de suffixes adjectivaux peu productifs (moins de 1% chacun): -EL ou -IEL, 4 entrées: ce suffixe était très productif chez Dubois et al. (qui en avaient dénombré 30 entrées pour 1 sortie). Les entrées font partie du vocabulaire scientifique: économique, politique, philosophique et informatique dans mon corpus. (30) catégoriel, communicationnel, conversationnel, contextuel -EUX, 4 entrées et une sortie CÉRUMINEUX: ce suffixe a eu et a une double fonction de suffixe péjoratif et scientifique. Cette double fonction concurrencielle n'est probablement pas étrangère à sa disparition: il a été concurrencé par -ARD, suffixe péjoratif, et -IQUE, suffixe scientifique. (31) carieux, cespiteux, chloreux, crapoteux -OIRE, 4 entrées: (32) classificatoire, compromissoire, confiscatoire, consommatoire -IDE, 2 entrées: cardioïde, caroténoïde. -AIS, 2 entrées du domaine géographique: charolais, charentais.

111

Page 112: De la Lexicologie à la Lexicographie

Francine Melka

3.3 Les composés savants et non savants (appendice 11): Ils forment 36% du total des créations morphologiques, soit 208 items. Les critères de la place du déterminé (tête à droite ou tête à gauche) ou de l'exocentricité ont permis de dégager cinq catégories différentes. Les résultats en pourcentage sont les suivants: - Les composés non savants tête à gauche sont au nombre de cinq, soit 4.50% du total des composés et moins de 1% du total des créations morphologiques:

(33) carte-réponse, carte-vue, cradingue (crasseux+dingue), check up, ciné-parc.

- On compte 45 composés non savants tête à droite, soit 21.50% du total des composés et 9% du total des entrées morphologiques: (34) camping-car, club-house, court-métrage, check-list, contre-culture,

cinétir... - On dénombre seulement 2 composés savants tête à gauche, ce qui est l'équivalent de 1% du total des composés: (35) calciurie (calcium dans l'urine), cétonémie (substance cétonémique dans

le sang). - Les composés savants tête à droite forme la catégorie la plus vaste avec 130 items, soit 62.50% des composés et 23% du total des entrées morphologiques: (36) caméscope, carboglace, claustrophobe, colopathie, crudivore,

cytosquelette, etc. - La dernière catégorie est celle des composés exocentriques; elle comprend 23 items, soit 11% des composés et 4.50% du total des entrées: (37) casse-cul, cul-bénit, couche-tard, cyclo-pousse, carré-éponge, etc. Enfin, j'ai mis à part un item comme CAFÉ-THÉATRE, dont le déterminé pourrait être aussi bien à droite qu'à gauche (cf. Zwanenburg, 1992). Plusieurs remarques s'imposent à propos de ces résultats: 1) On constate que les composés savants sont les plus nombreux, ce qui montre un développement ample du vocabulaire technique ces vingt dernières années, mais aussi l'intégration de ce vocabulaire technique dans la langue commune.

112

Page 113: De la Lexicologie à la Lexicographie

La création morphologique dans le dictionnaire

2) Les composés savants ont le déterminé à droite: l'élément savant (ou l'un des éléments savants), grec ou latin, qui se situe à gauche, semble se comporter comme un préfixe. 3) dans les résultats des composés non savants, ce qui frappe c'est le petit nombre de composés tête à gauche (5) et le nombre important de composés tête à droite (45). On s'attendrait à l'inverse en français. On pourrait interpréter ce résultat en invoquant l'influence syntaxique de l'anglais (les composés savants et non savants anglais, en règle générale, ont la tête à droite): les emprunts lexicaux que le français fait à l'anglais est considérable; ce serait donc par ce biais que le Français aurait tendance à construire les nouveaux mots sur le modèle anglais, tête à droite. Cette interprétation est, selon moi, plausible, mais demande à être vérifiée sur un corpus plus important. Une autre interprétation est possible. Si l'on examine les 45 composés tête à droite, on note que 9 des items sont des emprunts (sans changement) à l'anglais et que pour 27 items l'élément de gauche est CO-, CONTRE- ou COURT-. Si l'on considère que ces derniers items (27) se comportent comme des composés savants du type CANCÉROLOGUE dont le premier élément peut être vu comme un préfixe, il ne reste, alors, que 5 composés tête à droite: CINÉSHOP et CINÉTIR, dont on pourrait aussi admettre que l'élément CINÉ- est un préfixe, CABLODISTRIBUTION, formé apparemment sur TÉLÉDISTRIBUTION, lui aussi un composé savant tête à droite, et enfin deux items CRÉDIT-BAIL et CUBITAINER. Ces explications changeraient l'interprétation des faits: des 45 composés non savants tête à droite, en fait, seuls deux ou trois items seraient à considérer comme déviants. 4) Deux composés savants ont le déterminé à gauche: CALCIURIE et CÉTONÉMIE. Ceci est surprenant puisqu'on s'attend à une place à droite en français. 5) La catégorie des exocentriques est importante dans mon corpus (4.50% du total des entrées morphologiques). Selkirk (1982) mentionne que cette catégorie n'est pas significative en anglais. Si mon échantillon est représentatif, cette catégorie est significative en français. 4. Conclusion La comparaison d'une petite partie de l'édition du Petit Robert de 1970 et de celle du Nouveau Petit Robert de 1993 montre que le mouvement morphologique entre ces deux périodes est important: en ce qui concerne les entrées de la lettre C (qui forment un dixième du nombre d'entrées totales du dictionnaire), 75% des additions sont morphologiques. La variété des formes morphologiques nous fait penser que la potientialité morphologique du français existe bien et que, si le dictionnaire reflète les dires des locuteurs, cette compétence morphologique est utilisée par les locuteurs.

113

Page 114: De la Lexicologie à la Lexicographie

Francine Melka

Pour ce qui est de la dérivation, la fécondité de certains affixes est évidente: les suffixes en -EUR pour les noms de machines, en -ISME qui indiquent comme originalement des noms abstraits de tendance politique, philosophique, mais qui, en plus actuellement, expriment des états, des qualités , en -ISTE qui désignent des noms de métiers (tout en continuant à désigner des personnes adeptes d'une doctrine philosophique, religieuse ou politique) et tend à remplacer le suffixe en -EUR. Pour ces deux derniers suffixes on assiste à un passage de la langue technique à la langue commune. Les suffixes en -AGE et -ISATION semblent remplacer de vieux suffixes comme -AISON et -SON, qui sont nettement en perte de vitesse. Quant à -IQUE (suffixe adjectival) et -IQUE (suffixe nominal), ils se portent bien et on peut prédire qu'ils se développeront dans les domaines techniques surtout. La formation des féminins (noms de professions et noms désignant un état, une attitude) est très restreinte dans mon corpus. Le résultat est peut-être décevant, mais reflète probablement l'attitude des Français et Françaises, un certain conservatisme socio-linguistique. En ce qui concerne les composés, le corpus offre quelques surprises: le petit nombre de composés non savants tête à gauche (5 seulement) et l'abondance de composés non savants tête à droite (45). Pour rendre compte de ce dernier phénomène, j'ai proposé deux explications, soit que certains composés non savants se comporteraient comme des composés savants (tête à droite), soit que ces résultats seraient l'effet de l'influence grandissante de l'anglais et de sa syntaxe sur le français. Après tout cela ne serait pas la première fois que les langues germaniques influenceraient la syntaxe française (cf. la syntaxe du français du XIIe siècle)! Enfin, l'abondance des composés savants et dérivés savants est frappante dans mon corpus. Les lexiques techniques, scientifiques en général se sont enrichis. Il est intéressant de constater que le vocabulaire technique, surtout celui de la médecine, passe dans le vocabulaire courant; ceci reflète peut-être nos actuelles préoccupations, nos angoisses en matière de santé.

114

Page 115: De la Lexicologie à la Lexicographie

La création morphologique dans le dictionnaire

Bibliographie Dictionnaires Le Petit Robert (1970), sous la direction de Josette Rey-Debove et Alain Ray, Robert: Paris Le Nouveau Petit Robert (1993), sous la direction de Josette Rey-Debove et Alain Ray, Robert: Paris Autre références CORBIN, D. (1987), Morphologie dérivationnelle et structuration du lexique, Niemeyer: Tübingen, 2

volumes DARMESTETER, A. (1877), De la création actuelle de mots nouveaux dans la langue française et des

lois qui la régissent, Vieweg: Paris; Slatkine Reprints: Genève, 1972 DI SCIULLO, A.-M. & WILLIAMS E. (1987), On the Definition of Word, MIT Press: Cambridge, Mass. DUBOIS, J., GUILBERT, L., MITTERAND, H. ET PIGNON, J. (1971), Le mouvement général du

vocabulaire français de 1949 à 1960, d'après un dictionnaire, In Introduction à la Lexicographie, J. Dubois & Cl. Dubois, réd., Larousse: Paris, 111-132

KAMPERS-MANHE, B. (1993), La composition comme processus de formation de néologismes, In: Du lexique à la morphologie: du côté de chez Zwaan, A. Hulk, F. Melka et J. Schroten, réd., Rodopi: Amsterdam/Atlanta

SELKIRK, E.O. (1982), The Syntax of Words, MIT Press: Cambridge, Mass. ZWANENBURG, W. (1987), Le statut de la formation des mots savants en français et en anglais, Meta,

XXXII, 3, 223-229 ZWANENBURG, W. (1992), French Compounds, Rivista di Linguistica, 4, 1-21

115

Page 116: De la Lexicologie à la Lexicographie

Francine Melka

Appendice 1 Siglaisons et troncations La troncation entrées: 12 1. cipal 2. clandé 3. clodo (clochard + crado) 4. coke 5. cracra 6. croque La siglaison entrées: 19 1. CD 2. CB 3. CRS 4. CEDEX Appendice 2 La dérivation Noms de machines entrées : 20 -eur, -euse (nom de machine, instrument, engin, appareil, logiciel) 4. calculateur 5. capteur 6. carotteuse 7. chargeuse 8. chouleur 9. clignoteur 10. climatiseur 11. cloueuse 12. codeur 13. collisionneur 14. compacteur 15. comparateur 16. composeuse 17. conjugateur 18. conteneur 19. convecteur 20. coprocesseur 21. cuiseur 22. curseur 23. cutteur

116

Page 117: De la Lexicologie à la Lexicographie

La création morphologique dans le dictionnaire

Appendice 3 Noms d'agents entrées : 5 sorties : 6 -eur, -euse (nom d'agent, métier) 1. cadreur 2. conserveur 3. coordinateur 4. coréalisateur 5. crawleur entrées : 6 sorties : 3 -eur, euse -eur/trice (valeur générale) 1. cafardeur 2. castrateur 3. chialeur 4. chieur 5. contaminateur 6. crâneur entrées : 4 sortie : 1 -ier, ière (nom d'agent, de métier) 1. carlinguier 2. carpettier 3. chaussonnier 4. colzatier - eux nom d'agent, de métier entrée: 1 1. coqueleux [éleveur de coqs de combat]

117

Page 118: De la Lexicologie à la Lexicographie

Francine Melka

entrées: 6 -ien/nne 1. capésien 2. capétien 3. centralien 4. cogniticien 5. connecticien 6. copernicien entrées: 10 nouveaux féminins (dont 7 noms de métiers) entrée: 1 nouveau masculin 1. camionneuse 2. canetière 3. cavaleuse 4. cheminote 5. chemisière 6. chiffreuse 7. chirurgienne 8. conne 9. couillonne 10. contre-maîtresse 1. chaisier entrées: 23 sortie: 1 -iste (agent) entrées: 18 sorties: 3 -isme (tendance) 1. cabliste 1. cannabisme 2. cariste 2. carriérisme 3. cédétiste 3. castrisme 4. catastrophiste 4. catastrophisme 5. comportementaliste 5. centralisme 6. concouriste 6. centrisme 7. conjoncturiste 7. clanisme 8. convivialiste 8. clientélisme 9. consumériste 9. climatisme 10. coloriste-conseil 10. comparatisme

118

Page 119: De la Lexicologie à la Lexicographie

La création morphologique dans le dictionnaire

11. collaborationniste 11. confessionnalisme 12. constructiviste 12. connexionnisme 13. croisiériste 13. constructivisme 14. claviste 14. consumérisme 15. clubiste 15. créationnisme 16. chambriste 16. culturalisme 17. chauffagiste 17. culturisme 18. corporatiste 18. clyclotourisme 19. crématiste 20. cébiste/cibiste 21. cuisiniste 22. culturiste 23. cytologiste Appendice 4 entrées: 10 noms en -ité 1. circularité 2. collégialité 3. comestibilité 4. communicabilité 5. commutativité 6. comparabilité 7. compétitivité 8. confidentialité 9. continentalité 10. convivialité Appendice 5 entrées: 18 sorties: 3 noms en -age entrées: 8 sorties: 2 -ement 1. cabrage 1. cambrement 2. caillage 2. caquètement

119

Page 120: De la Lexicologie à la Lexicographie

Francine Melka

3. calage 3. carillonnement 4. canetage 4. chamboulement 5. carossage 5. complètement 6. cassage 6. collationnement 7. catalogage 7. cliquètement 8. centilage 8. croupissement 9. charpentage 10. ciblage 11. clonage 12. coiffage 13. copinage 14. couponnage 16. court-circuitage 15. crabotage 17. court-métrage 18. cryptage entrée : 1 -ude 1. complétude Appendice 6 entrées: 9 sortie: 1 -tion 1. capacitation 2. carbonatation 3. caséification 4. chloration 5. chosification 6. cimentation 7. complémentation 8. concertation 9. contraception

120

Page 121: De la Lexicologie à la Lexicographie

La création morphologique dans le dictionnaire

Appendice 7 entrées: 2 -ot (diminutif) 1. charlot 2. colinot entrées: 11 -et/ette 1. caget 2. cagette 3. calculette 4. cartelette 5. castorette 6. chevillette 7. chouquette (petit chou) 8. clopinette 9. clayette 10. cuisinette 11. cuissette(s) Appendice 8 entrées: 20 -iser -isation 1. cancériser 2. coloriser 3. clochardiser 4. culpabiliser 5. conceptualiser 6. chartériser 7. césariser 8. cannibaliser 9. convivialiser 10. contractualiser 11. conscientiser 12. créoliser 13. crédibiliser

121

Page 122: De la Lexicologie à la Lexicographie

Francine Melka

1. clochardisation 2. collectivisation 3. colorisation 4. conceptualisation 5. concrétisation 6. culpabilisation 7. curarisation Appendice 9 entrées: 20 -er 1. cafter 2. calancher 3. se camer 4. se canner 5. canner 6. castagner 7. châtaigner 8. chinoiser 9. chlorer 10. chosifier 11. cibler 12. cloner 13. claveter 14. cliquer 15. cocotter 16. compacter 17. cranter 18. (se) crasher 19. complexer 20. compresser

122

Page 123: De la Lexicologie à la Lexicographie

La création morphologique dans le dictionnaire

Appendice 10 entrées: 15 formation adjectivale en -ique 1. calorique (calorie) 2. cannabique 3. capitalistique 4. caproïque 5. cataclysmique 6. cathartique 7. cellulitique 8. cénoroïque 9. charismatique 10. chiatique 11. cholique 12. christique 13. cryptique 14. cytologique

15. cosmologique Appendice 11 Les composés entrées: 5 composés non savants tête à gauche 1. carte-réponse f. 2. check-up m. 3. ciné-parc m. 4. carte-vue f. 5. cradingue (crasseux+dingue) entrées: 2 composés savants tête à gauche 1. calciurie f. 2. cétonémie f.

123

Page 124: De la Lexicologie à la Lexicographie

Francine Melka

entrées: 130 composés savants tête à droite 1. cinémomètre m. 2. cancérologue m/f 3. capiculture f. 4. carboglace f. 5. cytosquelette m. 6. clitoridectomie f. 7. cervicalgie f. 8. criminologue m/f 9. colopathie f. 10. cholécystotomie f. 11. caméscope m. 12. carpiculture f. entrées: 45 composés non savants tête à gauche 1. club-house m. 2. cash-flow m. 3. camping-car m. 4. check-list f. 5. clapman m. 6. crédit-bail m. 7. court-métrage m. 8. cinétir m. 9. cubitainer m. 10. cinéshop m. 11. câblodistribution f. 12. coproduire 13. contre-publicité f. 14. contre-culture f. entrées: 23 composés exocentriques 1. camping-gaz m. 2. carré-éponge m. 3. coton-tige m. 4. capital-risque m. 5. croque-madame m.

124

Page 125: De la Lexicologie à la Lexicographie

La création morphologique dans le dictionnaire

6. contre-la-montre m. 7. casse-cul m. 8. coupe-ongles m. 9. chien-assis 10. contre-emploi m. 11. chausse-pisse f. 12. cyclo-pousse m. 13. cul-bénit m. 14. contre-transfert 15. couche-tard m/f. 16. couche-tôt m/f. entrée: 1 composé non savant tête à droite ou à gauche 1. café-théâtre

125

Page 126: De la Lexicologie à la Lexicographie

DE LA LEXICOLOGIE A LA LEXICOGRAPHIE/ FROM LEXICOLOGY TO LEXICOGRAPHY Francine Melka & M. Celeste Augusto (eds.) LISTE DES AUTEURS/ AUTHORS’ LIST M. Celeste AUGUSTO Affiliation: UiL OTS Utrecht University/ IVT Portuguese Department e-mail address: [email protected] Maria Fernanda BACELAR DO NASCIMENTO Affiliation: Universidade de Lisboa – Centro de Linguística

e-mail address: [email protected] Pierre CORBIN Affiliation: Université Charles de Gaulle – Lille III e-mail address: [email protected] Willy MARTIN Affiliation: Vrije Universiteit Amsterdam e-mail address: [email protected] Francine MELKA Affiliation: UiL OTS Utrecht University/ IVT French Department e-mail adress: [email protected] Jan Schroten Affiliation: UiL OTS Utrecht University/ IVT Spanish Department e-mail adress: [email protected]

126