27
Zurich Research Laboratory 21 Juillet 2005 | Systèmes d’information et décisions en santé www.ibm.com L'intégration des données , le data mining (fouille de données) et le support à la décision André Elisseeff IBM Research Lab - Zurich

Zurich Research Laboratory - lertim.timone.univ-mrs.fr

  • Upload
    others

  • View
    9

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

Zurich Research Laboratory

21 Juillet 2005 | Systèmes d’information et décisions en santé www.ibm.com

L'intégration des données , le data mining (fouille de données) et le support à la décision

André ElisseeffIBM Research Lab - Zurich

Page 2: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

2

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

Plan

Source de données : du texte écrit au “lab on a chip”

Accès aux données : intégration et fédération

Data Mining : exemple des systèmes experts et des systèmes a base de règles

Vers de nouvelles techniques statistiques

Page 3: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

3

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

L’information médicale évolue

L’information disponible sur un patient est très heterogene:

Les nouvelles technologies engendrent de plus en plus d’information (but : aller vers une médecine “ciblée/individuelle”) :

– Mobile health (suivi médical a distance)– Lab on a chip (acquisition d’information individuelle)– Smart implantable device (récupérer l’information alors que le patient

suit une activité normale)

Image Sériestemporelles

Protein/Geneexpressions DNA Test lab Notes

cliniques

Interactionmédecin

Page 4: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

4

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

Mobile health – suivi du patient à distance

injection registration

inhalationregistration

peakflow

body weight

activity

heart rate

blood pressure

auscultation

tablet dispensingECG monitor

glucose

Page 5: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

5

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

Lab-on-a-chip

Collaboration entre le CEA-Leti avec ST MicroelectronicsSystème d’analyse « Point of Care »

Utilise pour la détection de pathogènes (PCR)Volume de l’échantillon entre 2-8 µlTemps total requis ~1min Apprentissage facile pour les techniciens

Page 6: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

6

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

Smart implantable devices – PillCamTM de GivenLa capsule PillCam™ SB Endoscope est naturellement avalée afin d’être utilisée dans le conduit gastro-intestinal. Les contractions naturelles font avancer la capsule PillCam™ SB doucement et sans douleurs dans le conduit gastro-intestinal, transmettant des images en couleurs au cours de son cheminement. La procédure est ambulatoire et permet au patient de continuer à vivre normalement pendant l’examen endoscopique.

20 min

8 hours

Page 7: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

7

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

Comment gérer l’information?Stockage : demande croissance

Sécurisation : données anonymes ou contrôle d’accès doit être instauréÉchanges de données complexes : standardisation des donnéesAccès aux données : comment répondre a la requête suivante ?“Quels protocoles ont été utilisés pour des tumeurs similaires à celle de mon patient et qui concernent des patients du même groupe d’age et avec le même polymorphisme X dans leurs gènes?"

0

5000

10000

15000

20000

25000

30000

2003 2004 2005 2006 2007

TByt

es(W

W)

Page 8: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

8

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

Plan

Source de données : du texte écrit au “lab on a chip”

Accès aux données : intégration et fédération

Data Mining : exemple des systèmes experts et des systèmes a base de règles

Vers de nouvelles techniques statistiques

Page 9: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

9

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

Intégration : processus de combinaison de l’information. Pour intégrer ensemble les données médicales, on utilise une technique de fédération : regroupement de différentes entités chacune gardant sa propre organisation.

Integration et Federation

Données rigides,Nombreux formats, dont textes écrits a

la main

fatherID Mother ID Gender AGE2 3 1 454 1 1 34

forme canoniquee.g.

HL7's Clinical Document

Architecture XML

listes, bio-sequences,

tableaux

Données cliniques et biomédicales

GATTACGATTAC

Données semi-structurées:

collections d’objets

but in practice,right now

Page 10: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

10

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

Secured Health and Medical Access NetworkSHAMAN

• Les données sont annotées et traduite dans un format XML

• Ces données XML sont indexées (données structurées et texte écrits) en utilisant un système spécialisé pour les documents XML

• Une interface est alors construite afin d’accéder de façon sécurisée aux données électroniques des patients. Ces dernières sont rassemblées dans un unique document.

• Le format actuel des documents XML utilise le standard HL7

Page 11: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

11

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

Intégration des données médicales - SHAMAN

SHAMAN-IMRIntegrated Medical Records

DiscoveryL

ink

HôpitalProactive Clinical-Genomics Repository

Index XML de données médicales standardisées

Web Services: • Transforme & indexe• Récupère des données structurées et non structurées

1

2

DiscoveryLink (outil de fédération des données) regroupent ensemble des données de différentes sources médicales.IMR traduit les données cliniques dans un standard bio-médicale(xml), e.g. HL7, BSML, MAGE-ML

Autres hôpitaux

Sources de données

génomiques

Système d’analyse

, data mining,

etc.

Système d’information de l’hôpital

1 2 3

3

Système d’information clinique

Systèmes annexes (e.g., Lab)

Server de terminologie

Outils statistiques et/ou d’aide a la décision utilisent les données.

Page 12: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

12

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

Exemple : Mayo Clinic

IBM et la clinique Mayo ont développé une collaboration pour réaliser une vision commune de “l’information-based medicine”. Ils ont construit une infrastructure pour intégrer l’information génomique clinique contenant des données démographiques, diagnostiques, physiologiques et génomiques dont la sécurité atteint les niveaux établis par la HIPAA sur la confidentialité des données patients.

Software •IBM WebSphere® Application Server •IBM DB2® Universal Database™ - Enterprise Server Edition

Serveurs•IBM eServer™ pSeries® 650 •IBM eServer pSeries 690 •IBM TotalStorage® Enterprise Storage Server®

Services•IBM Healthcare and Life Sciences •IBM Systems Group

Page 13: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

13

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

Plan

Source de données : du texte écrit au “lab on a chip”

Accès aux données : intégration et fédération

Data Mining : exemple des systèmes experts et des systèmes a base de règles

Vers de nouvelles techniques statistiques

Page 14: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

14

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

Data (Health) mining est utilisé pour…

Diagnosis

Prognosis

Traitement (médecine personnalisée)

Suivi de patient

Recherche et enseignement en médecine

Recherche Pharmaceutique

Épidémiologies et programmes de vigilance

Etc…

Page 15: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

15

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

Exemples de systèmes d’aide à la décision1968 : système de diagnostic des douleurs abdominales a l’hôpital de Leeds, UK (Prof. Tim de Dombal)

Années 1970’s: système expert a base de regles MYCIN, USA (Prof. Edward H. Shortliffe)

Années 1980’s: base de connaissance médicale. INTERNIST-I, Quick MedicalReference, USA (Dr. Pople and Dr. Myers) – grande influence sur DxPlain.

Années 1990’s: réseaux bayesiens Iliad, USA (Dr. Homer R. Warner)

Autres systèmes: boites noires (arbres de décisions), systèmes d’aide a l’analyse de radiographies, etc.

Motivation des systèmes experts: 1) fournir une consultation médicale lorsque le spécialiste n’est pas disponible (urgences, environnement militaire) 2) comprendre comment le diagnostique est dérive pour améliorer l’enseignement.

Pour plus d’infos : www.openclinical.org

Page 16: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

16

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

Difficulté de construire un système à base de règles Une règle simple du système MYCIN

Si:Le site de la culture est la gorge

L’identité de l’organisme est streptococcusALORS:

Il y a une indication forte (.8) que le sous type de l’organisme ne soit pas group D.

“Feigenbaum bottleneck” : difficulté de traduire une connaissance ou une décision sous forme de règles.Nombre moyen de règles écrits dans un système expert par des spécialistes est 2-7 par jour.MYCIN contient plus de 600 règles juste pour le diagnostique et le traitement bactériologique. INTERNIST (Pople et al.) a de l’ordre de 100,000 règlesLes règles peuvent être créées automatiquement mais il est nécessaire d’effectuer un “nettoyage” (rule curation).

Page 17: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

17

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

Barrières à l’utilisation de systèmes informatises

Systèmes expert sont difficiles a maintenir (par exemple: explosion du nombre de règles, difficile de corriger une règle, etc.)

Performances sont-elles meilleures avec un ordinateur?

Rentrer des connaissances « incertaines » est difficile a effectuer

Page 18: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

18

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

Le language de l’incertitude

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

Probable

Likely

Unlikely

High probability

Low probability

Bryant G.D., Norman, G.R. “Expressions of probability: Words and numbers”.New England Journal of Medicine, 302:411.

Page 19: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

19

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

Acceptation des outils d’aide à la décision“Do physicians value decision support? A look at the effect of decisionsupport systems on physician opinion” S. Dreiseitl, M. Binder, AI in Medicine, 2005.

“Les résultats indiquent que les médecins sont susceptible d’accepter les recommandations d’un système d’aide à la décision médicale”

“Effects of computerized clinical decision support systems on practitionerperformance and patient outcomes” A.X. Garg et al., JAMA, 2005.

“Plusieurs systèmes d’aide à la décision médicale améliore les performances du praticien. Jusqu’ à aujourd’hui, les conséquences sur l’amélioration des soins au patient sont sous étudiées et, lorsqu’elles sont analyses, sont contradictoires.”

“Role of computerized physician order entry systems in facilitatingmedication errors”, R. Koppel et al., JAMA, 2005

“Dans cette étude, nous avons observé qu’un système CPOE augmente le risque d’erreurs médicales”.

Page 20: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

20

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

Plan

Source de données : du texte écrit au “lab on a chip”

Accès aux données : intégration et fédération

Data Mining : exemple des systèmes experts et des systèmes a base de règles

Vers de nouvelles techniques statistiques

Page 21: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

21

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

Défis statistiques

Hétérogénéité des données

Information temporelles

Modèles explicatifs

Nouvelles techniques sont nécessaires…

Page 22: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

22

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

Exemple :

Arbre de décision simple : (age, sex, glucose level, …, disease_yes, disease_no)

Comment utiliser cette approche lorsque le problème est plus compliqué?

(age, sex, glucose level, …, date1)

(age, sex, glucose level, …, date2)

(age, sex, glucose level, …, date3)

Sex=M?

yesNo

Age>=60?

tem

ps

Sortie à prédire/expliquer

Page 23: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

23

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

Calculs de similaritésDe nombreuses techniques de prédictions et d’analyses statistiques peuvent se formuler en utilisant uniquement des mesures de similarités : il n’est pas nécessaire de représenter les objets, il suffit de savoir calculer leur distance entre eux.

Exemple: comment comparer ces deux séquences?ACCTTGACCACG…ATTGAACG…

Utiliser des méthodes d’alignement (type SW, BLAST ou autres) et calculer le score de similarité.ACCTTGACCACG…A - -TTGA - - ACG…

Ces méthodes de calculs existent pour presque tous les types de données:Texte, graphes, vecteurs, images, séries temporelles, etc.

0.75

Page 24: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

24

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

Hétérogénéité des données Lorsque différents types de données sont disponibles pour un même objet, il est toujours possible de calculer des similarités combinées:

Similarité image S1

S2

S3

Similarité séquence ADN

Similarité série temporelle

Objet 1 Objet 2Similarité totale : S1+S2+S3

Page 25: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

25

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

Modèles explicatifsGénéraliser l’arbre de décision pour des données complexes :

Exemple (fictionnel) de problèmes:

Patients ont rempli un questionnaire contenant une série d’information sur leur mode de vie, leur façon de manger, etc.

En plus de ce questionnaire, le médecin dispose de nombreuses informations sur le patient (historique médical avec plusieurs biomarkers suivis dans le temps)

Si un nouveau patient remplit le même questionnaire, quel est son profil médical?

Dans la construction de l’arbre de décision, on choisit la décision qui fournit des noeuds les plus compacts possible (au sens de la similarité).

Page 26: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

26

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

Résumé

données Intégration Analyse des données Utilisation des systèmes

Hétérogènes

Diverses sources

Anciens systèmes

Quantité croissante

Personnalisation

Complexité croissante

Techniques temporelles

Modèles explicatifs

Utilisation des similarités

Temps de calcul?

Fédération

XML

Indexation

Utilisation non courante

Effets non déterminés

Influence dans certains cas les décisions des médecins

Mise en place difficile

Technologie développée Technologie en développement

Page 27: Zurich Research Laboratory - lertim.timone.univ-mrs.fr

27

Zurich Research Laboratory

Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation

ConclusionDévelopper un système d’aide a la décision et l’intégrer dans les opérations d’un hôpital?

"In short, rather than framing the problem as 'not developing the systemsright,' these failures demonstrate 'not developing the right systems' due to widespread but misleading theories about both technology and clinicalwork. […] This implies that any IT acquisition or implementation trajectoryshould, first and foremost, be an organizational change trajectory." Robert L. Wears and Marc Berg, M.A., JAMA 2005.