Transcript
Page 1: UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de

M2 IST-IE thésaurus : n° 6

UE303.c : cours n°6

Conception de système d’information multimédia

Promo. Master (M2) IST-IE 05/06

Par :

Sahbi SIDHOMMCF. Université Nancy 2

Equipe de recherche SITE – [email protected]

Conception de thésaurus : Terme - Concept - Relations sémantiques

Page 2: UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de

M2 IST-IE thésaurus : n° 6 2

Thésaurus : définitions

(Michel Hudon, 1995)  « une liste de mots simples ou d’expression ayant une valeur de terme dans un

domaine limité de connaissance, le terme ayant définit comme la représentation linguistique (symbolique) d’un concept unique ».

(Van Slype, 1987) « une liste structurée de concepts, destinée à représenter d’une manière univoque

le contenu des documents et des questions dans un système documentaire déterminé, et à assister l’utilisateur dans l’indexation des document et des questions ».

(AFNOR, 1981) « une liste d’autorité organisée de descripteurs et de non descripteurs obéissant à

des règles terminologiques propres et reliés entre eux par des relations sémantiques (hiérarchiques, associatives, ou d’équivalence). Cette liste sert à traduire en un langage artificiel dépourvu d’ambiguïté des notion exprimé en langage naturel ».

Page 3: UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de

M2 IST-IE thésaurus : n° 6 3

Composants d’un thésaurus

Un lexique (ou vocabulaires d’entrée, ensemble de mots d’une langue) descripteurs et non descripteurs

Un sous ensemble de définitions et de notes d’application Notes historiques et notes d’application pratique

Une structure classificatoire exprimée par des relations sémantiques entre les termes du lexique, et parfois traduits par une notation symboliques

relation d’équivalence intra linguistique relation d’équivalence inter linguistique relation hiérarchique relation d’association

Page 4: UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de

M2 IST-IE thésaurus : n° 6 4

Rôle et fonction d’un thésaurus

Faciliter la recherche documentaire et d’en augmenter l’efficacité

Permettre un repérage exhaustif en liant les concepts et les termes proches

Réduire l’impact des problèmes causés par la synonymie présente dans le langage naturel

Page 5: UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de

M2 IST-IE thésaurus : n° 6 5

Thésaurus et autre sources « terminologiques »

Thésaurus de description et dictionnaire différence d’acception: concepts / Mots

Thésaurus de description et thésaurus littéraire différence dans le rôle: définition / référence Thésaurus de description et banque terminologique différence d’interprétation: relations sémantiques Thésaurus de description et vedette-matière

différence d’organisation: structure / hiérarchie

Page 6: UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de

M2 IST-IE thésaurus : n° 6 6

La structure sémantique d’un thésaurus

Relation d’équivalence intra-linguistiqueentre des synonymes qui expriment la même idée, on distingue le mono-équivalent et le pluri-équivalent. On utilise la notation EM et le EP

Relation hiérarchique relation d’inclusion et de supériorité, on distingue entre terme spécifique

et terme générique. On utilise la notation TS/ TG Relation d’association analogie et lien de signification entre descripteurs. Moins définit et

subjective. On utilise la notation TA Relation inter-linguistique

relation symétrique entre deux descripteurs de deux ou plusieurs langues.

on distingue entre équivalence complète et équivalence partielle. On utilise le notation An/ FR/ ES

Page 7: UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de

M2 IST-IE thésaurus : n° 6 7

Création d’un nouveau thésaurus

Pour créer un nouveau thésaurus, il faut une: Évaluation des vocabulaires disponibles Analyse des besoins particuliers à

l’environnement Domaine à couvrir, type et nombre de documents à traiter, besoin des usagers, …

Évaluation des ressources Sélection des caractéristiques essentielles du

thésaurus Profondeur et structure du thésaurus, …

Page 8: UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de

M2 IST-IE thésaurus : n° 6 8

Processus de construction d’un thésaurus :

la collecte du vocabulaire

Diverses sources terminologiques peuvent contribuer à l’exploitation : Un langage documentaire existant Un thésaurus extérieur au service Une Banque de données

terminologiques Une indexation intellectuelle Une indexation automatique …

Page 9: UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de

M2 IST-IE thésaurus : n° 6 9

Processus de construction d’un thésaurus : listage des micro-disciplines

établir une liste provisoire des grands thèmes. Le nombre de groupes à retenir est fonction du volume thésaurial

la liste de micro-disciplines a pour objet de faciliter la manipulation et la prise de décision

le groupement se fait par thème ou par facette

Page 10: UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de

M2 IST-IE thésaurus : n° 6 10

Processus de construction d’un thésaurus :réduction du langage documentaire

Cette phase comporte les étapes suivantes établissement de la structure d’équivalence sémantique établissement de la structure hiérarchique traitement des doubles emplois recherche des équivalents inter-linguistiques établissement des relations associatives

Élaboration de la structure d’équivalence sémantique Établir la liste des termes synonymes ou quasi-synonymes Choisir dans chaque liste les termes qui auront le statut de

non descripteur et les rattacher au descripteur/ on choisi le plus neutre, le plus utilisé dans la profession

Page 11: UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de

M2 IST-IE thésaurus : n° 6 11

synonymie véritable

La forme complète d’un nom et son abréviation Ex: IMA (institut de monde Arabe)

Le nom populaire et le nom scientifiqueEx: Vitamine C (Acide Ascorbique)

Le nom scientifique et le nom commercial Ex: Acide Acétylsalicylique (Asprine)

Les variantes orthographiques d’un même motEx: clef (clé)

L’appellation ancienne et l’appellation moderne d’un même concept

Ex: pays sous développé (pays en développement) Les termes d’origine linguistique différents

Ex: Marketing (mercatique) Les termes d’origine culturelle différents

Ex : Parking (stationnement)

Page 12: UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de

M2 IST-IE thésaurus : n° 6 12

Élaboration de la structure hiérarchique

Construire des chaînes hiérarchiques par micro-discipline. Toutes les hiérarchies ne possèdent pas un nombre égal de niveaux. Mais il y a une logique comparable entre concepts qu’il faut respecter.

On identifie les relations hiérarchiques par plusieurs moyens comme l’emploie des énoncés suivants:

Certain A sont des B. Tous les B sont A (relation d’inclusion) . Ex: animaux / Rongeurs #animaux familiers / Rongeurs

X (spécifique) est toujours et nécessairement un Y (générique)

Ex: la discrimination religieuse est toujours et nécessairement un type de discrimination (TG)

Page 13: UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de

M2 IST-IE thésaurus : n° 6 13

Traitement des doubles emplois

Traitement de la poly-hiérarchies: le même concepts exprimés dans deux ou plusieurs micro-thésaurus

Traitement des anomalies Descripteurs identiques désignant des concepts différents:

ajouter un qualificateurs Non descripteurs identiques liés à des descripteurs

différents: Ajouter un qualificateur Termes retenus à la fois comme descripteurs dans un

champs et non descripteurs dans un autre: élimination dans l’un ou l’autre champs

Relation hiérarchique entre descripteurs et non descripteurs : à exclure

Page 14: UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de

M2 IST-IE thésaurus : n° 6 14

Recherche des équivalents inter-linguistiques

La recherche des équivalents linguistiques ne peut se faire qu’à partir du moment où le contenu sémantique des descripteurs de la langue de base est fixé, grâce à des relations d’appartenance et d’équivalence.

on trouve les situations suivantes: Équivalence certaine. Ex: route / Road Léger décalage de sens. Ex: services de documentation/

special library Pas d’équivalence de tout. Utilisation d’une périphrase

ou adoption de terme étrangers

Page 15: UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de

M2 IST-IE thésaurus : n° 6 15

Établissement des relations associatives

Seuls les termes qui ont été choisis comme descripteurs peuvent être associés. L’association se fait à un niveau inter-hiérarchique

Plusieurs types d’association possibles : la cause et l’effet: ex: infection et Maladie le tout et sa partie ex: livre et reliure l’action et son agent . Ex: économie et économiste l’action et le lieu d’action. Ex: enseignement et école la science et son objet. EX: documentation et document l’objet et sa propriété. Ex : Poison et Toxicité l’objet et son application . Ex : Ordinateur et traitement de

données

Page 16: UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de

M2 IST-IE thésaurus : n° 6 16

Derniers étapes de construction

Réalisation de l’édition expérimentale Formation des « indexeurs » Tester le thésaurus

ajout de descripteurs modification des structures explication des descripteurs (encore

ambigus) Révision finale et réalisation de l’édition

opérationnelle

Page 17: UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de

M2 IST-IE thésaurus : n° 6 17

Liens utiles http://fr.thesaurus.gc.ca/

intro_f.html

Page 18: UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de

M2 IST-IE thésaurus : n° 6 18

INAthèque : thésaurus Descripteurs :

Collège de France; science; chercheur (scientifique); recherche scientifique; société; culture-savoir

Descripteurs secondaires :sciences humaines; enseignement

Page 19: UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de

M2 IST-IE thésaurus : n° 6 19

Explications : relations

Page 20: UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de

M2 IST-IE thésaurus : n° 6 20

Relations d’équivalence : EM, EP(élimine la synonymie)

EM : Employer

Déf. : non DES ----------- DES

Ex. : Calculateur ------------ Ordinateur

EP : Employer Pour

Déf. : DES ----------- non DES

Ex. : Ecologie ------------ Étude du milieu/ environnement

A B

EM

EP

Page 21: UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de

M2 IST-IE thésaurus : n° 6 21

Relations hiérarchiques : TS, TG(rapports de supériorité / subordination)

TS : (terme spécifique)

Déf. : relation qui va du générique au spécifique

Ex. : Oiseau ------------- Rapace ------------- Aigle

TG : (terme générique)

Déf. : relation qui va du spécifique au générique

Ex. : Aigle ------------- Rapace diurne

Chouette ------------- Rapace nocturne

A B

TS

TG

Page 22: UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de

M2 IST-IE thésaurus : n° 6 22

Relations associatives : TA(pour exprimer des analogie de significations)

1. Antonymie (sens contraire)

Ex. : imperméabilité ------------- perméabilité

2. Cause et effet

Ex. : enseignement ------------- instruction

3. Rapport instrumental

Ex. : écriture ------------- crayon

A B

TA

TA

Page 23: UE303.c : cours n°6 Conception de système dinformation multimédia Promo. Master (M2) IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de

M2 IST-IE thésaurus : n° 6 23

Notes d’application : NA

• Brèves explications, définitions, ce qui explique les modalités d’emploi d’un terme DES (descripteur)

• pour éviter les ambiguïtés (la polysémie)

• Exemple :

mémoire ------------ informatique

------- psychologie

------- études

A B

NA

C

NA


Recommended