18
Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada [email protected]

Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada [email protected]

Embed Size (px)

Citation preview

Page 1: Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada bsc@ugr.es

Module lexicographie II

Beatriz Sánchez CárdenasUniversidad de [email protected]

Page 2: Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada bsc@ugr.es

Évaluation finale

50% note finale:•En groupes de deux: constitution d’un prototype

de ressource lexicographique (à finir pour le 14 février)

50% note finale:•Examen final: des questions courtes sur le

contenu du cours (14 février)

2

Page 3: Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada bsc@ugr.es

Objectifs partie II

•Constitution d’un corpus•Comment dégager les information

sémantiques, syntaxiques et pragmatiques nécessaires à partir des corpus ?

• Analyse du corpus avec WordSmith tools

3

Page 4: Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada bsc@ugr.es

Des dictionnaires au corpus et inversement

• Première étape : étude des dictionnaires existants

▫Les dictionnaires témoignent d’une connaissance linguistique qu’il serait imprudent d’ignorer.

▫Certaines définitions des dictionnaires, comme le TLFi, se basent sur des corpus (même si exclusivement littéraires).

▫Ne pas tomber dans la caricature du « linguiste de corpus » vs. le « linguiste de fauteuil » (Fillmore 2006)

4

Page 5: Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada bsc@ugr.es

« Armchair linguist »

« Corpus linguist »

- Armchair linguist: Why should I think that what you tell me is interesting ?

- Corpus linguist: Why should I think that what you tell me is true?

5

Page 6: Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada bsc@ugr.es

1. Définir le profil de l’usager

Décrivez a)le type de ressource que vous envisagez de

créer (typologie des dictionnaires),b) b) les besoin de l’usager auquel il est destiné

-> Un dictionnaire bilingue FR-AN des verbes des Sciences de l’environnement (volcanologie)

6

Page 7: Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada bsc@ugr.es

2. Constitution et analyse du corpus

« A corpus is a collection of pieces of language that are selected according to explicit linguistic criteria in order to be used as a sample of the language. » (Sinclair 1996 : 4)

• Constitué selon des critères visant à délimiter la langue définie par les limites temporelles, le registre et le milieu social:

« The texts are selected according to explicit criteria in order to capture the regularities of a language, a language variety or a sub-language. » (Tognini Bonelli 2001: 55)

7

Page 8: Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada bsc@ugr.es

2.a. Avantages de l’utilisation des corpus dans la lexicographieRapidité, efficacité, gain de tempsPermet de mieux définir la combinatoire des mots Permet de différencier les nuances sémantiques des mots

grâce à leurs contextesReflète la langue utilisée par les locuteurs (et pas

l’idiolecte du linguiste)Fournit des données quantitativesPermet d’appréhender le « linguistic behaviour » (Hanks)

des UL, l’ « usage syntagmatique réel »

La linguistique des corpus: une théorie ou une méthode ?

8

Page 9: Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada bsc@ugr.es

2.b. Corpus based vs. Corpus drivenApproche « corpus based »

Les exemples de corpus servent à illustrer la théorie.Approche « corpus driven »

Le corpus a une suprématie absolue.Il n’existe pas de modélisation théorique préalable. Les découvertes réalisées dans le corpus conduisent à

la constructiondes connaissances linguistiques. Les affirmations théoriques sont dérivées de

l’accumulation dephénomènes linguistiques.

! Mais toute analyse linguistique comporte des postulats théoriques

L’analyse de corpus ne peut pas remplacer la réflexion linguistique.

Attention à ne pas tomber dans l’un ou l’autre des extrêmes.

Il est fécond d’associer les deux démarches.

9

Page 10: Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada bsc@ugr.es

« On peut donc reprendre, sans risque d’être démenti, l’affirmation qu’il n’existe aucun dictionnaire neutre, en ce sens que tout dictionnaire est nécessairement conditionné par des théories linguistiques, sociales, économiques ou même parfois politiques, même s’il tente de rester représentatif. » (André Clas 1996 : 201)

10

Page 11: Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada bsc@ugr.es

2.c. Délimitation du corpus

Unités lexicales choisies:langue générale / langue de spécialité

(domaine-sous domaine)catégorie grammaticale : nom, verbe,

adjectif, adverbePériodeRegistreLangue orale/écriteMonolingue, bilingue, plurilingue ?Langue générale ou spécialisée

11

Page 12: Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada bsc@ugr.es

2.e. Constitution du corpus: ressourcesDélimitez le corpus. Faites l’inventaire des

ressources que vous allez utiliser pour le constituer.

▫Textes parallèles : thèses, mémoires, revues scientifiques, articles

! Tous les textes doivent être convertis au format .txt

12

Page 13: Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada bsc@ugr.es

2.f. Mesurer la fiabilité des textes parallèles

13

• notoriété de l’auteur, entité qui finance, maison d’édition…

• date de publication ou dernière mise à jour• public auquel l’ouvrage est destiné• objectifs de l’ouvrage (pédagogique, informatif, normatif,

…)• langue dans laquelle il a été rédigé (s’agit-il d’une

traduction?)• origine géographique (un jargon local?)• information sur la terminologie employée (définitions,

équivalents dans d’autres langues, contextes, images,…)• niveau d’usage et reconnaissance de l’ouvrage• accès à l’information (qualité de la présentation,

organisation…)• bibliographie éventuellement utilisée

Page 14: Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada bsc@ugr.es

Constitution du corpus

1. En groupes de deux, constituez un corpus avec des textes du domaine de la volcanologie

Assurez-vous qu’ils remplissent les conditions de qualité.Consigne de base : plus le corpus est large, plus il est représentatif.

2. N’oubliez pas de convertir les documents au format .txt

Domaine général:Sciences de l’environnement

Sous-domaine:volcanologie

Page 15: Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada bsc@ugr.es

C. Pré-analyse du corpus

15

Page 16: Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada bsc@ugr.es

Pre-analyse a) Sketch engine 16

Page 17: Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada bsc@ugr.es

Pre-analyse b) Analyse des diccionaires•Avec Sketch engine, faites une première

ébauche:▫Verbes liés au termes volcan (FR) et volcano

(AN)▫Axe paradigmatique: verbes liés à ces termes

dans les deux langues▫Axe syntagmatique: structures syntaxique et

sémantique (types de compléments, types de N des copléments, structures syntaxiques).

17

Page 18: Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada bsc@ugr.es

Axe paradigmatique

•Faites une analyse de la description des verbes sélectionnés dans les dictionnaires généraux pour une première ébauche de leur comportement et en vue d’une future description dans le domaine de la volcanologie

• http://www.upf.edu/bibtic/es/traduc/trad1.html

Construire un corpus (AN ou FR) dans le domaine de la volcanologie pour demain, mardi 7.

18