32
7 th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014 La base de données terminologique BABELIRIS : une modélisation sociale dans le respect des normes ISO Ward Van de Velde TERMISTI (Haute École de Bruxelles)

La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

7th Terminology Seminar in Brussels

Vrije Universiteit Brussel – 25 avril 2014

La base de données terminologique BABELIRIS : une modélisation sociale

dans le respect des normes ISO

Ward Van de Velde TERMISTI (Haute École de Bruxelles)

Page 2: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Plan de communication

1 La trame de la base de données terminologique (BDT) : la recherche BABELIRIS

2 Les spécificités des catégories de données intégrées à la BDT BABELIRIS

2.1 Une BDT intégrant des unités terminologiques et phraséologiques

2.2 Une BDT traitant de terminologies administratives et médicales

2.3 Une BDT investie d’une « mission sociale »

2.4 Des champs de fiche « traditionnels » conservés ou mis au rebut

3 La microstructure de la fiche terminologique BABELIRIS

4 Conclusion et perspectives

Page 3: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

La trame de la BDT : la recherche BABELIRIS

— SECTION 1 —

Page 4: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Au plan juridique

• Constitution belge (1994, art. 23) :

Tout citoyen du Royaume a le « droit de mener une vie conforme à la dignité humaine […]. Ces droits comprennent notamment […] le droit à la sécurité sociale, à la protection de la santé et à l’aide sociale, médicale et juridique […] ».

• Loi relative aux droits du patient (2002, chap. 3, art. 7) :

§ 1er Le patient a droit, de la part du praticien professionnel, à toutes les informations qui le concernent et peuvent lui être nécessaires pour comprendre son état de santé et son évolution probable.

§ 2 La communication avec le patient se déroule dans une langue claire. Le patient peut demander que les informations soient confirmées par écrit […].

• Notion de langue claire (Remans et De Roeck 2002) :

« Dans sa communication avec le patient, le praticien professionnel doit se servir du langage ordinaire. Le patient moyen doit donc le comprendre. La “langue claire” se distingue ainsi du jargon technique que les médecins utilisent dans les contacts qu’ils ont entre eux. »

Page 5: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Au plan pragmatique

• Langue claire concerne :

1 Langues officielles de la Région de Bruxelles-Capitale : français et néerlandais ;

2 Langues des médiateurs interculturels ; du personnel hospitalier ; des sociétés d’interprétation (SETIS et S.I.S.-B.A.)

PATIENTÈLE « INSTRUITE » DE LANGUE FRANÇAISE (OU NÉERLANDAISE)

Initiatives propres au réseau IRIS : Plan Langues

Recherche-action menée par le CVC et TERMISTI : BABELIRIS

Page 6: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Les spécificités des catégories de données

intégrées à la BDT BABELIRIS

— SECTION 2 —

Page 7: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Traits particuliers de la BDT

1 Intégration d’unités terminologiques et phraséologiques

2 Traitement de terminologies médicales et administratives

3 Accomplissement d’une « mission sociale » :

Rédaction de termes, de phraséologismes et de définitions « simples » ;

Prise en compte des langues les plus représentées au sein du réseau IRIS ;

Prononciation de ces expressions simplifiées dans les langues retenues

PÉRENNITÉ, COMPATIBILITÉ, COHÉRENCE ET INTEROPÉRABILITÉ de la BDT

ISO 12620 (1999 et 2009) ISOcat (2014)

Data category : result of the specification of a given data field (ISO 1087-2 2000 : 21).

Page 8: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Une BDT intégrant des termes et des phraséologismes (1)

Exemples :

Termes : allocations familiales ; Croix-Rouge ; glucagon ; hCG ; maladie de Ménière ; mutualité ; réinsertion sociale ; …

Phraséologismes : De quelle couleur sont vos urines ? ; Avez-vous un médecin traitant ? ; Êtes-vous allé(e) travailler aujourd’hui ? ; Allongez-vous. Remontez encore un petit peu. Encore un peu. Maintenant, retournez-vous ; …

Termes :

Définition : verbal designation of a general concept in a specific subject field (ISO 1087-1 2000 : 14).

Issus du corpus BABELIRIS « écrit » de langue française :

- textes médicaux et administratifs toujours en usage ; - rédigés ou traduits par les membres du réseau IRIS ; - adressés aux patients dudit réseau ; - édités sur divers supports : pages Web, dépliants, formulaires, affiches, etc. ; - représentés in extenso dans le corpus et codés en TEI-P5 (Bauman et Burnard 2012).

Page 9: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Une BDT intégrant des termes et des phraséologismes (2)

Phraséologismes :

Définition : suite fixe d’un minimum de deux mots, formées autour d’un verbe (Abrudeanu 2001 : 2)

Énoncé : événement de parole concret et individuel (Gardes Tamine 2010 : 10).

Issus du corpus BABELIRIS « oral » :

- transcriptions d’échanges oraux ; - produits au service des urgences entre prestataires de soins et patients (allophones) ; - avec intervention fréquente d’un médiateur interculturel ou d’un interprète social ; - entrecoupés de notes définissant le contexte d’énonciation.

Différence marquée au niveau de la catégorie grammaticale :

Part of speech (A.2.2.1, DC 396) : category assigned to a word based on its grammatical and semantic properties (ISOcat 2014).

Page 10: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Une BDT intégrant des termes et des phraséologismes (3)

Termes :

Noun (A.2.2.1a, DC 1333) : part of speech assigned to words that designate a person, place, action, property or thing etc. that may have morphosyntactic properties like number or case and syntactic combination like modification by an adjective or determination by a determiner (ISOcat 2014) ;

Verb (A.2.2.1b, DC 1424) : element which, singly or in combination with other verbs, is used as the minimal predicate of a sentence, co-occurring with a subject (ibid.) ;

Adjective (A.2.2.1c, DC 1230) : part of speech related to attributes of a noun (ibid.) ;

Adverb (―, DC 1232) : part of speech used to refer to a heterogeneous group of words whose most frequent function is to specify the mode of action of the verb (ibid.).

Phraséologismes :

Other part of speech (―, DC 4336) : one of the many parts of speech not normally included in the value domain for part of speech in terminological resources (ibid.).

Page 11: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Une BDT intégrant des termes et des phraséologismes (4)

Noms (noun, A.2.2.1a, DC 1333) :

Genre (grammatical gender : A.2.2.2, DC 245) : masculin (masculine : A.2.2.2a, DC 246), féminin (feminine : A.2.2.2b, DC 247), neutre (neuter : A.2.2.2c, DC 248) ;

Nombre (grammatical number : A.2.2.3, DC 251) : singulier (singular : A.2.2.3a, DC 252), pluriel (plural : A.2.2.3b, DC 253), duel (dual : A.2.2.3c, DC 254).

Présence d’un lien idiomatique au sein du terme :

Term (A.1, DC 508) : verbal designation of a general concept in a specific subject field (ISOcat 2014) ;

Entry identifier (A.10.15, DC 206) : alphanumeric string that serves as the unique identifier of a language resource entry (ibid.) ;

Cross reference (A.10.18.2, DC 164) : pointer field or record used in a data collection to direct the user to another related location, e.g., another record (ibid).

Page 12: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Une BDT traitant de terminologie médico-administrative (1)

Terminologie articulée autour de 4 grands axes hospitaliers :

Caractère transdisciplinaire :

« Les catégories ne s’excluent pas forcément [et parfois] semblent être en intersection. » (Habert 2000.)

Page 13: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Une BDT traitant de terminologie médico-administrative (2)

Terminologie articulée autour d’unités hospitalières :

Page 14: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Une BDT traitant de terminologie médico-administrative (3)

Catégories de données domaine et sous-domaine :

Subject field (A.4, DC 489) : field of special knowledge (ISOcat 2014).

Hiérarchisation des domaines sur plusieurs niveaux :

« More than one subject field can be indicated for a given concept, and subject fields can be designated hierarchically as subfields by indicating a level index. Three levels are typical, although additional levels up to nine are practically possible. » (ibid.)

Exemple pour le concept carte SIS :

Niveau 1 : domaine

Niveau 2 : sous-domaine

1.

1. 2. 3.

administratif et logistique

accueil – admission – consultation archivage médical – bibliothèque informatique – pages Web

Page 15: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Une BDT investie d’une « mission sociale » (1)

Terme simplifié termes techniques (FR-NL)

Définiton simplifiée (FR-NL) définition technique (FR-NL)

Exemple FR pour le concept atrichie :

Termes techniques :

Terme simplifié :

Définition technique :

Définition simplifiée :

alopécie, atrichose, calvitie, décalvation, folliculite décalvante, folliculite épilante de Quinquaud, pelade, pseudopelade de Brocq, psilose, porrigo

chute de cheveux

chute de cheveux ou de poils, aigüe ou progressive, congénitale ou acquise, localisée ou diffuse.

Source : KERNBAUM (S.), 2001 : Dictionnaire de médecine, préfacé par GRÜNFELD (J.-P.), coll. Médecines-Sciences, Paris, Flammarion, 7e éd., p. 39.

perte temporaire, partielle ou totale, des cheveux ou des poils.

Source : d’après MILLIÈS-LACROIX (D.), 2006 : Le Petit Décodeur de la médecine. Les mots de la médecine en clair, coll. Le Robert, Tours, Mame, p. 10.

Page 16: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Une BDT investie d’une « mission sociale » (2)

Catégories de données registre (technique pratique) :

Register (A.2.3.3, DC 423) : classification indicating the relative level of language individually assigned to a lexeme or term or to a text type (ISOcat 2014) ;

Technical register (A.2.3.3b, DC 425) : register appropriate to scientific texts or special languages (ibid.) ;

Bench-level register (A.2.3.3d, DC 427) : register of terms used in applications-oriented as opposed to theoretical or academic levels of language (ibid.).

Définitions « techniques » inspirées de la classification SNOMED-CT

Identification unique par concept

catégorie de données notation :

Classification code (A.4.2, DC 128) : set of symbols, with rules for their application, used to represent classes and their interrelations (ibid.).

Page 17: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Une BDT investie d’une « mission sociale » (3)

Intégration du « nombre de langues très diverses parlées par les patients des hôpitaux bruxellois » (COCOM 2009 : 20) :

Page 18: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Une BDT investie d’une « mission sociale » (4)

Catégorie de données indicatif de langue :

Language identifier (A.10.7, DC 279) : unique identifier in a language resource entry that indicates the name of a language (ISOcat 2014).

Prononciation des termes et des définitions du « registre pratique »

Catégorie de données audio :

Audio (A.5.5.2 , DC 90) : sound, spoken words, music, or other audible representation used to illustrate or explain terms or concepts (ibid).

Page 19: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Champs de fiche « traditionnels »

Mise au rebut de certaines catégories de données :

Contexte (context : A.5.3, DC 149), forme intégrale (full form : A.2.1.7, DC 321), forme abrégée (abbreviated form : A.2.1.8, DC 329), synonyme (synonym : A.2.1.2, DC 317) et explication (explanation : A.5.2, DC 223).

Maintien de certains champs :

Page 20: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

La microstructure de la fiche terminologique

BABELIRIS

— SECTION 3 —

Page 21: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Architecture générique

Méta-modèle proposé par TMF (Terminological Markup Framework) :

ISO 16642 (2003 : 12)

Page 22: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Document type definition (DTD) (1)

Caractère obligatoire ou optionnel et itération des catégories de données :

Caractère obligatoire : absence d’indication, « + », « #FIXED », « #REQUIRED » ;

Caractère optionnel : « ? », « * », « #IMPLIED » ;

Itération : « + », « * ».

Syntaxe de la fiche terminologique BABELIRIS :

Page 23: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Document type definition (DTD) (2)

Page 24: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Document type definition (DTD) (3) et fiche XML (1)

Exemple de fiche terminologique, codée en XML :

Page 25: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Fiche XML (2)

Page 26: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Fiche XML (3)

Page 27: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Fiche XML (4)

Page 28: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Conclusion et perspectives

— SECTION 4 —

« Ce n’est pas au patient à parler la langue du médecin, mais bien l’inverse. »

(Cilevičs 2002 : 25.)

Page 29: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Aperçu bibliographique (1)

• ABRUDEANU (C.), 2001 : « La détermination dans la phraséologie. Étude comparée du français et du roumain », dans BLANCO (X.), BUVET (P.-A.) et GAVRIILIDOU (Z.), éd., Détermination et Formalisation, coll. Lingvisticæ Investigationes, vol. 23, Amsterdam, John Benjamins, pp. 1-12.

• ACADÉMIE FRANÇAISE DE MÉDECINE, 2013 : Dictionnaire médical en ligne, 48 525 entrées, disponible gratuitement en ligne sur http://dictionnaire.academie-medecine.fr/.

• BAUMAN (S.) et BURNARD (L.), 2012 : TEI-P5: Guidelines for Electronic Text Encoding, Charlottesville (Virginia, États-Unis), Text Encoding Initiative Consortium, texte original de 2011, version révisée 2.0.2., 1587 pp., disponible gratuitement en ligne sur http://www.tei-c.org/release/doc/tei-p5-doc/en/Guidelines.pdf.

• CILEVIČS (M.), 2002 : Droit des néerlandophones aux soins médicaux à Bruxelles et dans les municipalités néerlandophones environnantes, rapport commandité par le Conseil de l’Europe, doc. 10 009.

• COCOM (Commission communautaire commune), 2009 : Les priorités de la Commission communautaire commune pour les années 2009 à 2014, disponible gratuitement en ligne, format PDF, 24 pp.

• GARDES TAMINE (J.), 2010 : La grammaire. Syntaxe, tome 2, 5e éd., Paris, Armand Colin, 243 pp.

• HABERT (B.), 2000 : « Des corpus représentatifs : de quoi, pour quoi, comment ? » dans BILGER (M.), Linguistique sur corpus. Études et réflexions, Perpignan, Presses Universitaires de Perpignan, pp. 11-58.

• ISO 1087-1, 2000 : Terminology work ― Vocabulary ― Part 1: Theory and application, Genève, Organisation internationale de normalisation, 52 pp.

• ISO 1087-2, 2000 : Terminology work ― Vocabulary ― Part 2: Computer applications, Genève, Organisation internationale de normalisation, 36 pp.

Page 30: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Aperçu bibliographique (2)

• ISO 12620, 1999 : Terminology and other language and content resources ― Specification of data categories and management of a Data Category Registry for language resources, Genève, Organisation internationale de normalisation, 78 pp.

• ISO 16642, 2003 : Computer applications in terminology. Terminological markup framework, Genève, Organisation internationale de normalisation, 49 pp.

• ISOcat, 2014 : Data Category Registry. Defining widely accepted linguistic concepts, mises à jour régulières, disponible gratuitement en ligne sur http://www.isocat.org/index.html.

• KERNBAUM (S.), 2001 : Dictionnaire de médecine, préfacé par GRÜNFELD (J.-P.), coll. Médecines-Sciences, Paris, Flammarion, 7e éd., 1035 pp.

• MILLIÈS-LACROIX (D.), 2006 : Le Petit Décodeur de la médecine. Les mots de la médecine en clair, coll. Le Robert, Tours, Mame, 280 pp.

• MINISTÈRE DES AFFAIRES SOCIALES, DE LA SANTÉ PUBLIQUE ET DE L’ENVIRONNEMENT, 2002 : Loi relative aux droits du patient, publiée au Moniteur belge le 26 septembre 2002, entrée en vigueur le 6 octobre 2002, n° 2002022737, pp. 43 719 – 43 724.

• PORTAEL (V.), ANDRIES (C.) en PONJAERT-KRISTOFFERSEN (I.), 2001 : De kinderschoenen ontgroeid? Hedendaagse ontwikkelingen in de zorg voor probleemkinderen, Leuven / Apeldoorn, Garant, 253 pp.

• REMANS (J.) et DE ROECK (J.), 2002 : Projet de loi relatif aux droits du patient, Rapport fait au nom de la Commission des affaires sociales, Sénat de Belgique, 18 juillet 2002, doc. 2-1250/3.

Page 31: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Aperçu bibliographique (3)

• SÉNAT DE BELGIQUE, 1994 : Constitution belge, texte coordonné du 17 février 1994, disponible gratuitement en ligne sur http://www.senate.be/doc/const_fr.html.

• ZELISSEN (P. M. J.), 2001 : Obesitas en overgewicht. Oorzaken, gevolgen en behandeling, coll. Spreekuur Thuis, Wormer, Inmerc b.v., 100 pp.

Page 32: La base de données terminologique - Vrije …research.vub.ac.be/sites/default/files/uploads/TTK/CVC...7th Terminology Seminar in Brussels Vrije Universiteit Brussel – 25 avril 2014

Merci pour votre attention

Contacts :

Ward Van de Velde : [email protected]

TERMISTI (Haute École de Bruxelles) : http://www.termisti.org/

Projet Babeliris : http://babeliris.be/

7th Terminology Seminar in Brussels

Vrije Universiteit Brussel – 25 avril 2014