Enseigner la terminologie pour quoi faire ? 1- Enseigner à qui ? Des spécialistes du traitement de...

Preview:

Citation preview

Enseigner la terminologie

pour quoi faire ?

1- Enseigner à qui ?

Des spécialistes du traitement de la chaîne documentaire :

• traducteurs,

• rédacteurs,

qui ne sont pas en principe des spécialistes des domaines dans lesquelles vont s’exercer leurs activités.

• Quel est l’état du métier et quels outils informatiques sont actuellement disponibles ?

• Quelles sont les évolutions possibles du métier, quels nouveaux métiers sont en germe ?

• Donc quelles compétences souhaitons nous développer ?

2 - Une terminologie : pour en faire quoi et avec quels outils.

La pratique de la terminologie est liée

aux applications auxquelles on la destine (traduction, thesaurus…)

et aux outils dont elle dispose pour gérer la description de la langue et pour diffuser ses données

Une terminologie ad hoc

• « Dans tous les cas, le but du dictionnaire, c’est d’être utile »  Monique Slodzian.

Le but n’est pas la description et l’analyse des phénomènes de langue dans les langues de spécialité

Il faut se poser les problèmes d’application et de gestion en termes

• de résultats,

• et de gestion du temps et des coûts.

• d’efficacité,

• Qui va utiliser cette terminologie ?

3 - Une terminologie : pour qui ?

Une entreprise qui croit qu’un glossaire va résoudre ses problèmes de communications entre les différentes filiales ou les conflits hiérarchiques ?

• Une entreprise qui s’est rendu compte que ses ressources documentaires étaient inexistantes et qu’elle avait un besoin d’outils de formation ou d’information d’intervenants ponctuels et de consultants ?

• Une entreprise ayant entrepris une structuration sémantique de ses documents concernant la fabrication ou la maintenance dans des domaines « sensibles » (nucléaire, aéronautique, pharmacie…) ?

• Une entreprise ayant besoin de localiser ses produits (logiciels…), de faire des documents qui seront ensuite traduits automatiquement ou par des équipes de traducteurs dont on peut espérer qu’ils respecteront la cohérence terminologique.

• Ou bien le traducteur free lance veut se constituer une mémoire de la terminologie qu’il utilise régulièrement et la coupler avec son outil de traduction assistée (ou éventuellement automatique) de stockage et d’alignement des traductions ?

• Ou encore le rédacteur qui souhaite contrôler la cohérence terminologique des documents qu’il produit ou qui désire se constituer une « banque terminologique et phraséologique »  pour rédiger en anglais

ou le chercheur qui veut une assistance pour la rédaction d’articles en anglais….

Tous ces utilisateurs ont des besoins spécifiques qui justifient la création d’un dictionnaire spécialement adapté à leurs besoins.

Donc il faut savoir évaluer

- les besoins (explicites et implicites)

- les coûts en temps, en matériel, les investissements à court terme, les coûts cachés,

- la rentabilité : les économies à long terme.

3- Comment faire ?

FAIRE une terminologie, c’est s’approprier un domaine

mais aussi c’est représenter de manière explicite des connaissances plus ou moins implicites, plus ou moins partagées.

donc

• se donner un outil de représentation d’un domaine de connaissances

• et établir une carte des concepts du domaine et des relations multiples entre ces concepts.

L’exigence de cohérence dans la description des concepts et de leurs relations oblige à une appropriation du domaine

qui suppose la consultation d’ouvrages de vulgarisation,

puis d’ouvrages spécialisés

et le dialogue avec des experts du domaine.

Cette représentation du domaine va nécessairement faire apparaître les différences de structuration notionnelle entre les experts. S’étonner ou regretter ces différences de catégorisations des concepts serait tomber dans le piège de l’objectivisme et croire que le concept flotte au dessus du langage, indépendamment des langues, indépendamment des locuteurs et des situations d’énonciation.

Par le biais de la construction du sens des termes à partir des textes, on va faire apparaître sur le terrain que l’utopie terminologique de l’objectivisme, de l’existence du concept hors langue est une utopie impossible.

pour cela, il faut savoir :

• 1 - chercher la documentation, la trier, l’organiser, pouvoir faire une typologie des textes et évaluer la fiabilité des sources (forme/fond),

• 2 - chercher les experts, les contacter, les interroger (et comment ?), diapo 21../termino/cours1.htm#expert

- avec quelles stratégies pour obtenir les résultats escomptés ?

- en profiter pour diffuser une information sur la spécificité du travail du traducteur ou du rédacteur, ses compétences de linguiste, sa capacité à synthétiser l’information, sa capacité à faire affiner la formulation par l’expert,

ET DONC sensibiliser les experts aux incohérences, imprécisions, différences d’approches et de point de vue et les sensibiliser à la polysémie des termes.

L’expert, le spécialiste, est partagé entre des attitudes contradictoires

• Condescendance et méfiance,• Intérêt,• Méconnaissance du métier de traducteur et des « risques du métier », • Sentiment d’insécurité linguistique,• Inquiétude devant le jargon terminologique,• Il apprécie d’exposer ses connaissances en essayant de les organiser,• S’il rencontre un autre expert, s’il relit ses remarques, la situation peut devenir passionnante et donner lieu à des échanges et des confrontations de théories ou d’expériences, … ou bien se transformer en guerre des chefs.

Donc il faut l’aborder avec douceur, respect pour son savoir

• et savoir se faire respecter en tant que spécialiste langagier en donnant des preuves de ce qu’on avance et de l’utilité des questions qu’on pose.

• Il faut savoir aussi faire parler l’expert,

lui faire produire de la langue, l’écouter parler, noter ce qu’il dit spontanément en situation, lorsqu’il n’a pas l’impression qu’on lui demande ce qu’il FAUT dire mais seulement comment ça marche.

Exemple N…

Interaction université entreprise

• S’abriter derrière l’usager

• Lui faire valide r le choix des termes

Conduite d’entretien non directif,

Résumons nous :

Maîtrise des deux langues de travail et de la traduction technique,

Maîtrise d’outils qui ne sont pas a priori les outils du traducteur :

Powerpoint, Access, Dreamweaver, VBA, php, phpMyAdmin, Linux, expressions régulières Perl…

Formation à la recherche documentaire (papier, électronique, Web),

Analyse de la demande et de la situation des acteurs dans l’entreprise,

4 - La terminologie était dans le texte et regardait le traducteur.

• Avoir accès aux textes, cela veut dire voir comment cette modélisation des concepts du domaine se réalise dans la langue, pas a priori mais « pour de vrai », telle qu’elle est mise en œuvre dans le discours.

• Un langagier travaille sur la production de discours et analyse les textes.

• L’évolution de l’outil informatique fait que l’on a de plus en plus accès à des textes numérisés.

Comment procéder ?

• 1 - Analyser la source :Savoir qui parle, pour qui et pour quoi faire, toute la dimension pragmatique des textes qui nous renvoie à des besoins de description des sources dont nous avons déjà parlé.

• 2 - Stocker : se constituer de grosses bases de ressources de corpus (monolingues, multilingues selon l’objet du travail, comparables ou alignés).

Analyser le texte de ces corpus avec des outils plus ou moins performants existant sur le marché…

• savoir choisir les outils en fonction des besoins,

• les améliorer ( ?),

• les fabriquer ( ?).

• Extraire à la volée des candidats – termes,

• Recueillir des fichiers de concordances,

• Travailler sur du texte étiqueté (étiqueté comment, avec quelles incertitudes),

• Travailler avec des expressions régulières (analyser les résultats, développer des stratégies de recherche)…

• Savoir demander à des informaticiens de développer les outils dont on a besoin.

DONC constituer un corpus et l’analyser

Quel type de corpus ?

Comparables ?

Alignés ?

Sur supports électroniques

Étiquetés ou non

Exemples :

White balance, 256 segment…, Addon, README

Traduction spécialisée called "White Balance" (WB, for short), which simply means the camera tries to keep white objects fairly white,

White balance: function that allows you to have natural colors by adapting the whites to the light.

Candidats-termes: white balance mode, …control, …compensation, …system,…department, …thing

when you take the pictures because your brain will automatically white balance it.

« White balance »EN: balance => FR: équilibre

Pas dans le corpus appareil numérique

EN: white => FR: blanc

=> Balance des blancs

Validation d'un candidat terme

Recherche d’un équivalent bien que l’attestation de l’équivalent ne soit pas dans le corpus.

Personnalisation d’un dictionnaire machine

« Readme » « addon »TE: non mots: README, addon

Catégorie syntaxique: N

Links which Linux describes in the README are set up correctly

EN: addon => FR: ????

The FWTK does not proxy SSL web documents but there is an addon for it written by Jean

Le fwtk ne route pas les documents web SSL, mais il existe un module complémentaire

Où en sommes-nous, lorsque toutes ces procédures sont en place ?

• À ce stade, le domaine a été exploré, le corpus recueilli, les experts contactés,

• une base documentaire qui donne accès aux corpus a été créée (reste à savoir où et comment).

on s’est peut-être aussi rendu compte que, dans certains cas,

- la documentation n’existe pas, - les supports sont multiples, dispersés, non disponibles.

Dans la vraie vie, parfois, souvent, (toujours ?) - l’information ne circule pas, - la communication est erratique, - la terminologie incohérente, - les experts pas d’accord sans même le savoir.

MAIS

Il va falloir rechercher l’information,

convertir des fichiers, convaincre,

user de diplomatie, être pédagogue sans condescendance ni

dogmatisme…

• C’est pourquoi il nous paraît nécessaire de donner une formation à une utilisation astucieuse et « bricoleuse »  de l’informatique,

• et de la compléter par une formation à la conduite d’entretien, à l’analyse des besoins, à l’écoute.

5-De la théorie à l’outil et… vice versa

• Cette étude des termes tels qu’ils sont, et non tels qu’ils devraient être, se revendique d’une approche terminologique dans la ligne des travaux de Jennifer Pearson, de Rita Temmerman.

• Cette approche va orienter des choix de représentation des termes et donc avoir une influence directe sur la structure des bases de données.

• L’usage qu’on se propose de faire du dictionnaire va également influencer le choix de l’outil informatique, la structure de la description.

Nous avons maintenant les matériaux, il faut maintenant constituer la base terminologique proprement dite.

Construire la base,

définir sa structure

Première possibilité

• on apprend à utiliser Trados couplé avec Multiterm (ou SDLX, ou DéjàVu, ou autre avatar des outils d’aide à la traduction).

• Pour un traducteur, il est évident qu’il faut absolument qu’il sache utiliser n’importe quel outil de cette gamme.

mais

(Mais la mémoire de traduction, c’est bien s’il y a une mémoire. C’est à dire si déjà de nombreux textes en langue source ont été alignés avec des textes en langue cible, révisés, fiables. Au début de la mémoire était le premier texte à traduire. Et pour le traduire, il fallait bien passer par toutes les étapes précédentes.)

mais encore

L’outil de mémoire de traduction a ses avantages incontestables et incontournables désormais dans certains domaines et dans certaines conditions de travail,

Il a aussi ses limites et ses aspects pervers qu’il faut savoir repérer, analyser et contourner.

Nous avons à notre disposition des outils dédiés à la gestion de la terminologie, des outils qui permettent de stocker des termes, de les décrire (bien ou mal), et de travailler en même temps dans le texte de la traduction en y insérant la terminologie ou en prélevant des termes pour les stocker dans le dictionnaire.

Résumons nous

Il n’est pas question de faire l’impasse sur ces outils. Ils sont d’autant plus importants qu’ils permettent de stocker ce qui est aussi important que la terminologie dans une activité d’écriture dans une langue de spécialité, c’est-à-dire :

la phraséologie, la capacité rhétorique, argumentative de la langue.

Deuxième possibilité

• Deux types de raisons nous ont amenés à choisir aussi d’autres outils pour faire de la terminologie

Raisons pédagogiques

• ces outils dédiés au stockage de la terminologie couplé à la mémoire de traduction ne sont pas « exigeants »  sur la structure : on peut y mettre tout et n’importe quoi, à la volée, au feeling. Ils risquent d’éluder une réflexion sur la structure.

Raisons pratiques

• Première raison : ces outils dédiés ne sont pas toujours disponibles, ils coûtent cher, changent souvent, les utilisateurs ne maîtrisent pas leurs principes de fonctionnement et ont du mal à les faire communiquer avec d’autres systèmes (comment récupérer des données stockées sous Multiterm dans une base Oracle, comment réinjecter des données venues de Word…).

donc

• Il faut savoir bricoler selon les besoins des petits outils avec les ressources bureautiques disponibles partoutmais aussi savoir récupérer ces données pour les reverser dans les outils dédiés, donc comprendre comment ils fonctionnent, les principes de leur structuration.

Deuxième raison pratique

   L’apprentissage des bases de données relationnelles et de la représentation et structuration des données dans des tables oblige à se poser des questions de fond :

• quels tris,

• Qu’est-ce que je veux obtenir de ces données,

• quelles extractions, • pour quoi faire,

• pour qui ?

• Cet apprentissage de la modélisation, même simple, est une introduction à la structuration des connaissances, à l’explicitation des relations.

Troisième raison pratique

• C’est aussi une introduction aux langages de structuration sémantique de l’information. Quand on a compris comment fonctionne une base de données relationnelle, on comprend vite l’intérêt du balisage XML, de la rédaction structurée, du single sourcing. C’est toute la problématique de la relation entre le sens et la structure qui est posée.

Le choix pédagogique est donc :

• Faire sa base de données soi-même pour apprendre à structurer l’information et justifier ses choix.

Cette décision pose un gros problème : elle est en contradiction avec la nécessité de parvenir à des formats d’échange de terminologie.

Il faut choisir entre deux approches

• Imposer une structure normée et ainsi communiquer et fusionner les ressources avec d’autres terminologues/institutions et donc montrer aux apprentis terminologues que la terminologie est un travail de groupe et d’échange (ce qui est formateur)

Ou bien

• Enseigner la manipulation des bases de données couplée pas à pas avec l’enseignement de la terminologie pour amener l’étudiant à faire des choix, prendre des décisions, faire des compromis qu’il devra défendre, prévoir comment il va gérer la synonymie, la polysémie, aligner les collocations, faire de son dictionnaire un vrai outil intelligent.

 Nous avons essayé de concilier les deux démarches.

• En faisant construire une base de données (sous ACCESS ou sous MySQL ou autre) par chaque étudiant puis

• en leur demandant à tous de « verser une extraction de leurs données » dans un moule commun répondant aux exigences des formats d’échange.

• Pour cela nous avons élaboré une formation partiellement à distance, sur le Web, avec suivi individuel de projet, où les choix à faire sont à chaque fois l’objet de discussions, de justifications.

• Quelques exemples de ces pages :

http://www.ens.eila.jussieu.fr/~juilliard

Notre but

• Préparer nos étudiants à être autre chose que des exécutants liés à un outil dont le but est d’accélérer leur production pour accroître leur rentabilité.

Nous souhaitons qu’ils puissent évoluer dans leur vie professionnelle, suivre les mutations des nouveaux marchés liés au développement de la société de l’information, se présenter comme des experts de traitement de la chaîne documentaire, des consultants, des interlocuteurs respectés.

écran1

• Le but de l’écran d’accueil est de montrer les liens entre les différents cours qui convergent tous vers un même but, comprendre, analyser les textes pour pouvoir écrire et traduire avec précision et naturel.

écran 2

écran 3

• Le cours de terminologie est couplé avec l’outil informatique : l’outil base de données va évoluer en répondant aux besoins que l’on va formuler au fur et à mesure de la progression du cours

écran 4

écran 5

L’outil va obliger à répondre à un certain nombre de questions de fond :

• faut-il, prévoir de mettre plusieurs hyperonymes ?

• si oui cela veut dire que les catégorisations peuvent être plurielles.

Ou bien

• faut-il les mettre dans une table à part ou faut il les ranger dans la table terme ;

• et alors faut-il décider quel est le terme vedette ? (dans quelles conditions, pour quoi faire…).

Les synonymes sont-ils des termes comme les autres ?

La réponse à la question

  « ça dépend ».

Ou bien

• Les liens indirects entre les termes sont-ils plus éclairants que les relations logiques ou ontologiques ?

• et dans ce cas comment faut-il les représenter, comment veut-on les exploiter ultérieurement ?

écran 6

Ou encore

• Les fichiers de concordance que nous avons extraits de corpus vont nous servir à faire les collocations, l’environnement privilégié du terme, qui va nous fournir la phraséologie du domaine et nous permettre de fabriquer un vrai outil de rédaction et de traduction.

Aide à la rédaction

• Tenir compte de la situation de communication: anglais pour francophones

• Base de données bilingues dans un domaine spécifique

• Typologie dans le but d’automatiser

• Baser sur des corpus

Langue spécialisée: STU

LP events to be more likely to develop into an energetic swarm in explosive systems supporting strong pressurization, than

activity soon evolved into an intense swarm that lasted 23 hours and terminated

manifest itself in an energetic LP swarm , whereas a leaky system the source of the LP swarm . Petrological data provide to indicate in the swarm sequence, the outstanding features of the swarm were recognized [2], as the sequence the

initiation of the swarm may be interpreted as and the 1982 eruptions of El Intense swarms of LP

Precursory LP swarms were recognized per day over a two-week period Examples of weak LP swarms were those Two outstanding examples of

precursory swarms of long-period events Japan [14-16]. Swarms of long-period events also preceded the

Collocations du verbe

Précision pour l’extraction des noms– Meilleure identification des constituants de phrase dans

un corpus– Illustration :

(a) to boot [a Linux kernel] on [a CD ROM] * Linux kernel on a CD ROM    to boot on a CD ROM / Linux kernel (b) to give [the compiler] [hints] about how to optimize *compiler hints to give hints / compiler

Extraction automatique

• Contexte ambigu to run programs in virtual terminals => program? run?

•  Contexte non ambigu: un seul gouverneurDosemu has to be run in another terminalcompile and run in double precision modewhy not run in a Linux box your NIS slaves

=> Productivité: (run, in {terminal, mode, box}) : occurrences dans le corpus

(run, in) : productivité = 3 to run different programs in virtual terminals

Quelle structure de tables pour les collocations

Comment faut-il les ranger, selon quels critères ?

S’il y en a beaucoup, le champ risque de devenir illisible,

comment range-t-on les exemples dans un dictionnaire unilingue ?

et dans un dictionnaire bilingue ?

qu’est-ce qui va faciliter la lecture du futur utilisateur de ce dictionnaire ?

Ce ne sont que quelques exemples. Il y en a bien d’autres.

Le principe est que chaque champ est l’occasion d’une réflexion sur toutes les

questions que nous avons évoquées.

Recommended