Représentation du Thésaurus MeSH et de la Terminologie CISMeF en OWL
Lina Soualmia
Laboratoire PSI – CNRS 2645 – INSA & Université de Rouen
Equipe CISMeF CHU de Rouen & L@STICS
Journée Web Sémantique Médical - Rouen - Mars 2004 2
PlanPlan
Introduction CISMeF Prototype KnowQuE Choix de modélisation en OWL Travaux en cours
Journée Web Sémantique Médical - Rouen - Mars 2004 3
Introduction Introduction
http://www.chu-rouen.fr/cismef/ 13 227 ressources Utilisation de standards pour la modélisation :
Métadonnées : ajoutent de la sémantique aux données.
Terminologie structurée: même rôle qu’une ontologie de domaine.
Améliorer la recherche d’information
Journée Web Sémantique Médical - Rouen - Mars 2004 4
La Terminologie CISMeFLa Terminologie CISMeF Mots Clés (22 012) et Qualificatifs (84) du MeSH
hépatite, diabète .. diagnostic, complications, prévention et contrôle.. hépatite/diagnostic
Métatermes (104) : Spécialités médicales ou Sciences biologiques Cardiologie, Pédiatrie… Liens sémantiques avec les Mots Clés/Qualifs, Type
de ressource. Types de ressources (144):
Renseignent la nature de la ressource Cours, base de données, information patient...
Journée Web Sémantique Médical - Rouen - Mars 2004 5
Journée Web Sémantique Médical - Rouen - Mars 2004 6
KnowQuEKnowQuE
Knowledge-based Query Expansion System [AIME03; FQAS 04; IPMU 04] Base Morphologique
Flexions : {Cœur, Cœurs} , Dérivations : { Cœur, Cardiaque} Base de Règles d’Association
hépatite B / prévention et contrôle vaccin anti-hépatite B Terminologie CISMeF en OWL-DL
Journée Web Sémantique Médical - Rouen - Mars 2004 7
Journée Web Sémantique Médical - Rouen - Mars 2004 8
Choix de ModélisationChoix de Modélisation Passage base de données à une Ontologie
Formelle en OWL-DL Représentation des concepts et relations :
connaissances taxinomiques Intérêt:
mécanismes de raisonnement puissants consistance classification automatique
Structure de l’ontologie Concepts : Métatermes,Mots clés et Types de
Ressources. Relations : Qualificatifs; domaine restreint par des
contraintes. Les ressources sont des instances de concepts.
Journée Web Sémantique Médical - Rouen - Mars 2004 9
Traduction AutomatiqueTraduction Automatique
Java/SQL Top-Down Distinction des relations Is-a et Part-Of
(anatomie et régions géographiques) Désaccentuation Caractères illégaux (‘-’ ‘,’ ‘:’ ) et espaces Noms préfixés par un nombre
11-hydroxycorticostéroïdes _11_hydroxycorticosteroides
Journée Web Sémantique Médical - Rouen - Mars 2004 10
Concepts (Classes)Concepts (Classes) <owl:Class rdf:ID="mt_cardiologie" /> <owl:Class rdf:ID="histoire_medecine">
<rdfs:subClassOf><owl:Class rdf:about="#histoire" />
</rdfs:subClassOf></owl:Class>
<owl:Class rdf:ID="hepatite_c_chronique"><rdfs:subClassOf>
<owl:Class><owl:intersectionOf
rdf:parseType="Collection"> <owl:Class rdf:about="#hepatite_c" /> <owl:Class
rdf:about="#hepatite_chronique" /> </owl:intersectionOf>
</owl:Class></rdfs:subClassOf>
</owl:Class>
Journée Web Sémantique Médical - Rouen - Mars 2004 11
Rôles (Relations)Rôles (Relations) <owl:ObjectProperty rdf:ID="qu_contre_indications"> <rdfs:domain rdf:resource="#domain_qu_contre_indications" /> <rdfs:subPropertyOf>
<owl:intersectionOf rdf:parseType="Collection"> <owl:ObjectProperty rdf:resource="#qu_pharmacologie" />
<owl:ObjectProperty rdf:resource="#qu_usage_therapeutique" /> </owl:intersectionOf>
</rdfs:subPropertyOf> </owl:ObjectProperty> <owl:Class rdf:ID="abdomen"> <rdfs:subClassOf> <owl:Restriction> <owl:onProperty rdf:resource="#partOf" /> <owl:someValuesFrom rdf:resource="#region_corps" /> </owl:Restriction> </rdfs:subClassOf> </owl:Class>
Journée Web Sémantique Médical - Rouen - Mars 2004 12
DomainesDomaines<owl:Class rdf:ID="domain_qu_contre_indications">
<owl:unionOf rdf:parseType="Collection"> <owl:Class rdf:about="#produits_chimiques_inorganiques" /> <owl:Class rdf:about="#composes_chimiques_organiques" /> <owl:Class rdf:about="#composes_heterocycliques" /> <owl:Class rdf:about="#hydrocarbures_polycycliques" /> …. <owl:Class
rdf:about="#pesticides__noxa__polluants_environnement" /> <owl:Class rdf:about="#agents_regulateurs_reproduction" /> <owl:Class rdf:about="#antiinfectieux" /> <owl:Class rdf:about="#anesthesie_et_analgesie" /> <owl:Class rdf:about="#intervention_chirurgicale" /> </owl:unionOf> </owl:Class>
Journée Web Sémantique Médical - Rouen - Mars 2004 13
RessourcesRessources
<owl:Class rdf:ID="R_00064"> <owl:intersectionOf rdf:parseType="Collection"> <owl:Class rdf:about="#adulte" /> <owl:Class rdf:about="#enfant" /> <owl:Class rdf:about="#soins_ambulatoires" /> <owl:Restriction> <owl:onProperty
rdf:resource="#qu_therapeutique" /> <owl:someValuesFrom rdf:resource="#asthme" /> </owl:Restriction> </owl:intersectionOf> </owl:Class>
Journée Web Sémantique Médical - Rouen - Mars 2004 14
Fichier OWL résultat 23 420 concepts
9 861 Mots clés 104 Spécialités 144 Types de Ressources 13 227 Ressources
85 rôles 84 Qualificatifs 1 relation PartOf
25 MB Import sous Protégé
Réduction à 3000 Ressources Import : 30 minutes
Journée Web Sémantique Médical - Rouen - Mars 2004 15
Journée Web Sémantique Médical - Rouen - Mars 2004 16
Journée Web Sémantique Médical - Rouen - Mars 2004 17
Journée Web Sémantique Médical - Rouen - Mars 2004 18
Vérification de la Vérification de la ConsistanceConsistance
~ 4 heures Prétraitement des fichiers MeSH : BD
structurée Distinction des notions Utilisation de l’opérateur d’intersection Ressources et Domaines ont des descriptions Indexation des Ressources manuelle
Journée Web Sémantique Médical - Rouen - Mars 2004 19
Journée Web Sémantique Médical - Rouen - Mars 2004 20
Travaux en coursTravaux en cours Arborescence anatomie prendre en
compte les cas particuliers: [A11 ] Cellules, [A12] Liquides et
sécrétions biologiques, [A15] Systèmes sanguins et immunitaires: cellule sanguine est une cellule
Améliorer les descriptions Utiliser UMLS
les relations du réseau sémantique : is_treated_by; is_complicated_by
Projet ATONANT À partir des note scope