23
Construction automatique d’ontologie Construction automatique d’ontologie à partir de bases de données à partir de bases de données relationnelles : relationnelles : application au médicament dans le application au médicament dans le domaine de la pharmacovigilance domaine de la pharmacovigilance S.Krivine 1 , J.Nobécourt 1 , L.Soualmia 1 , F.Cerbah 2 , Catherine Duclos 1 1 Laboratoire d’informatique médicale & Bioinformatique, Université Paris 13 2 Dassault Aviation, Département des Etudes Scientifiques Conférence IC’2009 – Plateforme AFIA - Hammamet – 25-29 Mai

Construction automatique d’ontologies à partir d’une base de données relationnelles : application au médicament dans le domaine de la pharmacovigilance

Embed Size (px)

DESCRIPTION

Présentation de Sonia Krivine, Jérôme Nobécourt, Lina Soualmia, Farid Cerbah et Catherine Duclos à IC 2009

Citation preview

  • 1. Construction automatique dontologie partir de bases de donnes relationnelles :application au mdicament dans le domaine de la pharmacovigilance S.Krivine 1 , J.Nobcourt 1 , L.Soualmia 1 , F.Cerbah 2 ,Catherine Duclos 1 1 Laboratoire dinformatique mdicale & Bioinformatique, Universit Paris 13 2 Dassault Aviation, Dpartement des Etudes Scientifiques Confrence IC2009 Plateforme AFIA - Hammamet 25-29 Mai

2. Plan

  • Contexte et problmatique de la pharmacovigilance
  • Iatrognie du mdicament : modle et sources de donnes
  • Etude des outils de rtro-ingnierie
  • Adaptation de RDBtoOnto
  • Rsultats
  • Discussion

3. Contexte de la pharmacovigilance

  • Leseffets indsirables= risquemdicamenteux
      • Risque d ulcre gastriqueetaspirine
  • Pharmacovigilance = tablir le lien entre mdicament et survenue deffet indsirable
    • Augmentation de lincidence desdcsdes patients sousIsomride Retrait du march
  • Ncessit doutiller la pharmacovigilance :principe de dtection du signal

4. Amliorer la dtection du signal 10 Rhabdomyolyse Lipanthyl 4 Rhabdomyolyse Zocor Nb doccurrences Effet Indsirable Mdicament 14 Rhabdomyolyse Hypolipmiants Nb doccurrences Effet Indsirable Mdicament Zocor Lipanthyl Hypolipmiant Statine Simvastatine Fnofibrate 5. Objectif

  • Projet Vigitermes (ANR-TECSAN)
  • Classer automatiquement les mdicaments selon leur risque deffets indsirables pour regrouper les cas de pharmacovigilance
    • Ncessit de constituer une ressource ontologique sur le mdicament

6. Les ressources existantes

  • Ontologies sur le mdicament
    • Drug ontology, NDF-RT, SNOMED CT
    • Nintgrent pas les mdicaments franais
    • Problme de leur mise jour
  • Bases de donnes sur le mdicament
    • Mises jour assures
    • Mdicaments franais
    • Totalit des proprits
    • Classement fig

7. Modle de la iatrognie

  • Proprits dumdicamentayant un lien avec la survenue d effets indsirables
    • sa composition
        • amoxicilline dyschromie dentaire
    • son appartenance une classe chimique
        • amidinopenicillines diarrhe
    • son appartenance une classe pharmacologique
        • antihypertenseurs centraux hypotension orthostatique
    • ses classes dinteractions
        • lesaminosidesetamphotricine B augmentation du risque denephrotoxicit
    • son dosage, sa forme, sa voie dadministration

8. Substance active Classe Pharmacologique Classe Chimique A pour Ctx Expo A pour Ctx dadm A Pour CC A pour CP A pour Ctx dose A pour SA A pour SAux A Pour Ctx Patient Effet Indsirable A pour Prop Pcin Contexte patient Spcialit Substance auxiliaire Contexte de dose Contexte dexposition Contexte dadministration Proprit Pharmacocintique Proprit Pharmacodynamique A pour Prop Pdyn A pour EI Classe dinteraction Cas connu de pharmacovigilance A pour Spcialit prescrite A Pour CI Substance active Ayant CPH Substance active Ayant CCH 9. Ressources utilises

  • Thsorimed
      • Banque publique avec licence
      • Tous les mdicaments commercialiss en France
      • Indexation de toutes leurs proprits
      • Hirarchies propres Thsorimed
  • ATC
      • ClassificationA natomique,T hrapeutique etC himique
      • Description pharmacothrapeutique
      • Standard international recommand par lOMS
      • Disponible dans Thsorimed
  • MeSH
      • Me dicalS ubjectH eadings
      • Thsaurus des termes mdicaux (NLM, Inserm VF)
      • Termes mdicaux organiss en hirarchies
      • Branche D : produits chimiques et mdicaments
      • Non disponible dans Thsorimed

10. 11. Principes de transition

  • Lesconcepts
    • Les tablesconcepts de haut niveau
    • La table des substancestous ses enregistrements sont des concepts de substances( 3-Amoxicilline)
    • les tables de hirarchiestous leurs enregistrements sont des concepts dont la hirarchie est dduite des codes
    • Dans ATC:C01A -Glucoside _ de_la _ digitale est une sorte deC01 -Mdicaments _ en _ cardiologie
    • Dans MesH: D04.615.638.8451-Naphtalamine est une sorte deD04.615.638Naphtalnes
  • Lesrles
    • ce sont les tables de relations:la table de relation entre la table des substances et la table de codes ATC donne le rle hasATCClasse
  • Lesdomainesetco-domainesdes rles
    • Ce sont les concepts de plus haut niveau associs aux tables impliques dans une relation ( Substance, ClasseATC, ...)

12. Principes de transition

  • Descriptions associes aux concepts de substances
    • Lesconcepts primitifs(conditions ncessaires)
      • Un concept desubstancegnr partir de latable des substances
      • Cette substance est implique dans unerelationavec une table de hirarchie (rle utiliser)
      • Restriction du rle
      • 12-DigoxinehasATCClassesome C01AA05-Digoxine
    • Lesconcepts dfinis(conditions ncessaires et suffisantes)
      • Ce sont denouveaux conceptsde regroupements de substances
      • Chaque enregistrement dune table hirarchique gnre un nouveau concepts de regroupementde substance( Substance_Ayant_ATCClasse_C01AA05-Digoxine)
      • Dfinition systmatique par restriction des rles
    • Substance_Ayant_ATCClasse_C01AA05-DigoxinehasATCClassesome C01AA05-Digoxine

13. Etude des outils de transformation

  • Passage dune BD un format ontologique
  • Des outils DataMaster, KAON2, RDBToOnto
  • Rcupre le schma de la BD pour dcrire lontologie
      • concepts :Substance, ClasseATC
  • Le contenu de la base de donnes est reprsent par les instances de lontologie
      • instances:12-Digoxine, C01AA05-Digoxine
  • Hirarchies limites 2 de profondeur
  • Ne rpondent pas compltement nos besoins

14. Enrichissement RDBToOnto

  • Rutilisation du module dacquisition du schma relationnel
  • Intgre la possibilit de construire des hirarchies (de 2 niveaux)
  • Outil prvu pour tre modifi (java, guide dveloppeur)
  • Dveloppement de modules spcifiques nos besoins

15. Traitement de type ATC

  • Construire des hirarchies deprofondeur fixe ou variable, sans multihritage
    • Paramtrage
      • Dterminer la table hirarchique
      • Dterminer lattribut portant le code
      • Dterminer lattribut portant le terme
    • Traitement
      • Concept dnot par Code Terme
      • Rcursivit sur le code

16. Gnration du fichier owl Visualisation dans Protg 4 17. Traitement de type MeSH

  • Construire des hirarchiesavec multihritage
    • Paramtrage
      • Dterminer la table hirarchique avec hritage multiple
      • Dterminer lattribut portant le code
      • Dterminer lattribut portant le terme
    • Traitement
      • Concept dnot par Terme
      • Rcursivit sur le code et multihritage sur le terme

18. Gnration du fichier owl Visualisation dans Protg 4 19. Traitement de type Thesorimed

  • Cration deconcepts de substance primitifs et dfinis
    • Paramtrage
      • Dterminer la table de jointure et les tables relies (substance et table de hirarchie)
      • Dterminer lattribut portant le Domaine
      • Dterminer lattribut portant le Co-domaine
    • Traitement
      • Cration du rle, domaine, co-domaine
      • Traitement type ATC sur la table de classification
      • Gnration des concepts dfinis (table hirarchique)
        • Concept dnot par Code_Terme_Suffixe
        • Dfinition systmatique(rle some Code_Terme)
      • Gnration des concepts primitifs
        • Une description est associe chaque concept de substance en utilisant la table de jointure

20. Visualisation dans Protg 4 dans la hirarchie infre par le raisonneur Fact ++ Gnration du fichier OWL 21. Discussion et Conclusion

  • Approche satisfaisante pour rpondre aux problmatiques
    • de modlisation :
      • Concepts = ce qui est connu (BDM)
      • Instances = cas de pharmacovigilance
    • de raisonnement :
      • exploiter de multiples hirarchies existantes pour classer des substances
    • de maintenance:
      • automatisation de tous les traitements

22. Discussion et Conclusion

  • Limites lies
    • la taille de lontologie
      • choix doutils (Protg 4, raisonneur Fact++)
    • la validation de lontologie
      • compltude, cohrence, consistance
    • aux volutions de RDBtoOnto
      • diffrentes versions mises jour
    • la spcialisation dun outil se voulant gnrique

23. Perspectives

  • Outil ddi lexploitation des BD sur le mdicament par rtro-ingnierie
  • Problmatique gnrale des modalits de classement des mdicaments pour un utilisateur non averti