30
Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue générale. Mais la linguistique de corpus s’applique toutefois également aux langues de spécialité, parfois appelées langues spécialisées ou sous-langages .

Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

Embed Size (px)

Citation preview

Page 1: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

Les langues de spécialité

Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue générale.

Mais la linguistique de corpus s’applique toutefois également aux langues de spécialité, parfois appelées langues spécialisées ou sous-langages.

Page 2: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

LERAT, P. (1995) : Les langues spécialisées, Paris, P.U.F.

Il préfère le terme langue spécialisée, car il conçoit la langue de spécialité non pas comme une « sous-langue » mais comme une forme d’usage particulière de la langue.

L’anglais language for special purposes (LSP) dit bien cette particularité […]. « langue spécialisée » renvoie au système linguistique pour l’expression et aux professions pour les savoirs.

Page 3: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

Sublanguage (les sous-langages)

« Sublanguage », employé par Z. Harris, sous-entend, au delà d’une particularité du lexique, un fonctionnement langagier spécifique

Le terme englobe non seulement les langages des disciplines scientifiques et techniques, mais également les méta-langages comme celui de la linguistique.

Page 4: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

L’hypothèse de Harris veut que les sous-langages aient un lexique limité et un nombre fini de schémas de phrases, qui seraient des combinaisons de sous-classes de mots propres à ces sous-langages.

Cette finitude rend l’utilisation des corpus particulièrement propice à l’étude des sous-langages.

Page 5: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

McEnery & Wilson (1996)

One key feature that has been hypothesised for a sublanguage is that it will show a high degree of closure at various levels of description. […] In short, a corpus should be an exceptionally good tool for identifying and describing a sublanguage, because they both have an important feature in common – a finite nature.

Page 6: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

HABERT, B., NAZARENKO, A. & SALEM A. (1997) : Les linguistiques de corpus, Paris, Armand Colin / Masson.

Les sous-langages ne sont pas forcément des sous-ensembles de la langue générale. Certains traits de la langue générale s’y retrouvent, d’autres leur sont propres.

Inversement, les sous-langages peuvent recourir à des patrons syntaxiques particuliers qu’il serait difficile d’intégrer tels quels à une grammaire « de langue ». C’est le cas de certains motifs dénominatifs qui forment de véritables « grammaires locales ».

Page 7: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

Exemple cité par Habert : The system will be unable to vary

on the device. Mais cette tournure est une simple

variation lexicale sur le verbe à particule adverbiale to turn on, et non pas un patron syntaxique typique de la langue de spécialité.

Page 8: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

Il y a dissociation partielle des lexiques de la langue générale et des langues de

spécialité des langues de spécialité entre elles

Mais leur syntaxe est fondamentalement identique.

Page 9: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

Notion de langue commune (CABRÉ, M. T. (1998). La Terminologie-

Théorie, méthode et applications.)

« La langue générale (…) peut être considérée comme un ensemble d’ensembles, imbriqués et reliés entre eux selon de nombreux points de vue. Le lien entre tous ces ensembles est la langue commune. Chacun de ces sous-ensembles peut être une langue de spécialité. » (1998 : 115) 

Page 10: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue
Page 11: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

Critères de dissociation des lexiques

Anglais de spécialité : absence de lexèmes d’origine dialectale (bodacious) appartenant au registre familier

(groovy) exprimant un jugement selon des

critères affectifs (loathsome)

Page 12: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

Inversement, les technolectes sont absents des corpus de langue générale : cervicothoracic-lumbosacral orthosis hypothalamic-pituitary-gonadal

Mais une partie du lexique de la langue générale est investie d’un sens spécifique en langue de spécialité (cf. sensibilité)

Page 13: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

Ces blocages contextuels ne s’appliquent pas uniquement au sens des mots polysémiques, mais aussi à la catégorie grammaticale de certains homographes (l’adjectif novel en anglais scientifique)

Page 14: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

Existe-t-il une spécificité syntaxique des langues de spécialité ?

Cette spécificité est inhérente aux hypothèses de Harris.

Selon N. Sager, elle est démontrée par la démarche suivante :

SAGER N., FRIEDMAN C. (eds) (1987): Medical Language Processing : Computer Management of Narrative Data, Addison-Wesley, Reading, p. 198

Page 15: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

Si l’on applique à un corpus de textes d’un secteur scientifique des méthodes de linguistique descriptive similaires à celles utilisées pour le développement d’une grammaire d’une langue dans son ensemble, on obtient : des motifs précis de cooccurrences de mots à

partir desquels on peut définir des sous-classes de mots

des séquences de ces sous-classes qui sont caractéristiques (c’est-à-dire une grammaire).

Page 16: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

Exemple de syntaxe d’une langue de spécialité : l’anglais médical

The ability of [PET] to [detect cancer] is based on [the altered substrate requirements of malignant cells], which result from [increased nucleic acid and protein synthesis and glycolysis].

D C C A peut B

Page 17: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

Quelques patrons syntaxiques typiques de l’anglais scientifique

674 000 pour "ability of * to detect".

48 200pour "the ability * is based on".

12 700 pour "altered * result from".

27 600 pour "altered substrate". 493 000 pour "altered *

requirements".

Page 18: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

La grammaire des langues de spécialité diffère-t-elle fondamentalement de celle de la

langue générale ?

Sens premier : oui. (American Heritage Dictionary  : the study of how words and their component parts combine to form sentences)

Sens dérivé : ? (The system of rules implicit in a language, viewed as a mechanism for generating all sentences possible in that language).

Page 19: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

Certaines structures syntaxiques de la langue générale (les structures inversives des subordonnées hypothétiques notamment) sont absentes des textes de certaines langues spécialisées.

En revanche, les schémas typiques des langues spécialisées peuvent presque toujours se réduire à des phénomènes de variation lexicale (cf. vary on)

Page 20: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

La présence fréquente de certains vocables à l’intérieur de constructions syntaxiques figées ne signifie pas pour autant que l’on a affaire à un patron syntaxique qui se présente exclusivement en langue de spécialité.

Page 21: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

Exemple : « lost to follow-up » (G> 1M)

Treatment of subjects lost to follow-up in the analysis of mortality studies.

La structure est susceptible de connaître des variantes :

The trial lost 25% of subjects at follow-up (during / from / because of poor)

In this group, 8 of the primary allografts were lost to recurrent disease.

Some U.S. aircraft would be lost to Iraq’s enormous ground-defense system.

Page 22: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

Pas d’exclusivité de certains schémas syntaxiques, mais des différences de

fréquence

Chris Gledhill confirme certaines des assertions de Biber (1998) concernant le rôle des diverses parties d’un article de recherche scientifique (les structures syntaxiques saillantes peuvent différer en fonction des diverses subdivisions des articles).

GLEDHILL, C., (2000) : "The Discourse Function of Collocation in Research Article Introductions". In English for Specific Purposes. Volume 19/2:115-135.

Page 23: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

les introductions contiennent un plus grand nombre de formes passives suivies d’une proposition infinitive :

TNF alpha has been shown to deliver the toxicity of ricin A

CsA therapy has been reported to cause immunological changes in the thymus)

Page 24: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

haute fréquence de certains patrons formalisables sous la forme X has received Y attention / investigation, dans lesquels X symbolise une approche ou une

technique thérapeutique Y symbolise un quantificateur tel que

much ou little.

Page 25: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

Les régularités syntaxiques sont démontrables dans le cadre d’une approche purement lexicale qui se fonde sur l’utilisation d’un concordancier.

formes passives : fréquence supérieure des verbes à forte valeur assertive (show, report, find, document, demonstrate, recognize) par rapport aux verbes liés à la supposition (estimate, hypothesize, propose, argue, suggest).

Page 26: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

Constitution d’un corpus en langue de spécialité : l’exemple de la langue

médicale

Possibilité de constituer un corpus représentant l’usage d’un sous-langage à partir de ressources en ligne, grâce à l’utilisation fine des moteurs de recherche

Un grand nombre de revues scientifiques, proposent à leurs lecteurs un abonnement sous forme de cédéroms, bases de données dont la taille dépasse celle de la première version du BNC.

Page 27: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

Représentativité en termes de présence des divers genres?

Les données représentant la langue orale sont difficiles à rassembler : temps nécessaire à la transcription et à la

vérification des données problèmes de confidentialité.

Elles sont quasi-inexistantes sur la Toile, où l’on trouve principalement : articles de recherche médicale textes de nature didactique (polycopiés des

Facultés de médecine).

Page 28: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

Quel type de données inclure dans un corpus de langue spécialisée ?

Articles de recherche (facilement disponibles) Textes de nature didactique ? HABERT et al. (1997) « Le discours didactique

n’est pas forcément le meilleur « observatoire » des régularités de ce domaine : par souci de généralisation, il utilise des hyperonymes qui ne se rencontrent pas dans les comptes rendus d’hospitalisation. On y trouve peut-être des régularités propres à tout discours didactique (pluriels génériques, présent de vérité générale, etc.) qui « parasitent » la perception du sous-langage proprement dit. » (p. 151).

Page 29: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

Une même publication peut renfermer des genres d’articles très divers

Journal of the American Medical Association : Clinical Observation Commentary Consensus Conference Correspondance and Brief

Communications Original Article Paper

Page 30: Les langues de spécialité Les grands corpus de références comme le TLF ou le BNC ont pour but principal de représenter le plus fidèlement possible la langue

La constitution du corpus est tributaire du phénomène linguistique à étudier.

On peut choisir de se restreindre à un type d’article particulier ou de viser une représentation aussi large que possible en fonction du but recherché.