Click here to load reader

Reseau bayésien

  • View
    17

  • Download
    0

Embed Size (px)

DESCRIPTION

article sur les resaus bayesiens

Text of Reseau bayésien

  • Rseaux Baysiens pour la ClassificationMthodologie et Illustration dans le cadre duDiagnostic Mdical

    Philippe Leray Olivier Franois

    INSA Rouen / PSI, FRE CNRS 2645BP 08 - Av. de lUniversit76801 St-Etienne du Rouvray Cedex

    Philippe.Leray@insa-rouen.fr,Olivier.Francois@insa-rouen.fr

    RSUM. Les rseaux baysiens sont des outils privilgis pour les problmes de diagnostic.Nous dressons dans cet article un panorama des algorithmes utiliss classiquement pour lamise en uvre des rseaux baysiens dans le cadre du diagnostic, et plus particulirement dudiagnostic mdical. Pour cela, nous passons en revue un certain nombre de questions mthodo-logiques concernant le choix de la reprsentation des densits de probabilit (faut-il discrtiserles variables continues ? utiliser un modle gaussien ?) et surtout la dtermination de la struc-ture du rseau baysien (faut-il utiliser un rseau naf ou essayer dapprendre une meilleurestructure laide dun expert ou de donnes ?). Une tude de cas concernant le diagnostic decancer de la thyrode nous permettra dillustrer une partie de ces interrogations et des solutionsproposes.

    ABSTRACT. Bayesian networks are well suited tools for diagnosis tasks. In this paper, we focuson classical algorithms used to build diagnosis systems based on bayesian networks, and moreparticularly, medical diagnosis systems. We review some methodological questions concerningthe representation of probability densities (discretization ? use of gaussian models ?) andthe choice of the adequate structure (naive Bayes structure ? learning the structure with thehelp of an expert or from data ?). A case study, thyroid cancer diagnosis, will illustrate thoseconsiderations and some implemented algorithms

    MOTS-CLS : diagnostic mdical, apprentissage de paramtres, apprentissage de structure

    KEYWORDS: medical diagnosis, parameter learning, structure learning

    RIA 15/2002. Rseaux Baysiens, pages 1 25

  • 2 RIA 15/2002. Rseaux Baysiens

    1. Introduction

    Un diagnostic mdical est le rsultat du raisonnement dun mdecin, dcision trssouvent prise partir dinformations incertaines et/ou incompltes. De nombreusestechniques dintelligence artificielle ont t appliques pour essayer de modliser ceraisonnement [LAV 97, LAV 99]. Ainsi, [SZO 82] prsente lutilisation dtaille deplusieurs systmes experts en mdecine. Citons, par exemple, des systmes basede rgles comme MYCIN [SHO 74, BUC 84] et Internist-1/QMR (Quick MedicalReference) [MIL 82].

    En amont de ce raisonnement, il faut aussi tre capable de modliser ces informa-tions incertaines et/ou incompltes. Certaines approches ont utilis des formalismescomme la logique floue ([STE 97]) ou les fonctions de croyance de Dempster-Shafer.Une autre consiste se placer dans le cadre de la thorie des probabilits, ce qui nousamne tout naturellement aux rseaux baysiens (RB) proposs par Pearl [PEA 88]dans les annes 80, retrouvs parfois sous le nom de systmes experts probabilistes.

    Lutilisation des rseaux baysiens pose un certain nombre de questions mthodo-logiques :

    comment choisir la structure du RB ? comment reprsenter les densits de probabilits des variables continues ? comment estimer les densits de probabilits ? comment prendre en compte les donnes incompltes ou les variables latentes ? comment faire de linfrence, i.e. calculer la probabilit de telle ou telle maladie

    sachant certains symptmes ? , ...

    Le but de cet article nest pas dexposer une mthode "rvolutionnaire" daide audiagnostic mdical, ni de rpondre de manire exhaustive toutes ces questions. Nousnous proposons de passer en revue la plupart des solutions quil est possible de mettreen uvre, en illustrant certaines de ces techniques sur une tude de cas, un problmede diagnostic de cancer de la thyrode.

    2. Rseaux Baysiens et Diagnostic Mdical

    2.1. Quelques questions mthodologiques

    Les rseaux baysiens possdent de nombreux avantages (modlisation probabi-liste de lincertitude, possibilit de raisonnement aussi bien dans le sens symptmes-diagnostic que dans le sens diagnostic-symptmes, ...) qui font deux des outils pri-vilgis dans le cadre du diagnostic, notamment pour des problmes de diagnosticmdical o ils ont t utiliss ds les annes 80 (cf. [KAP 00, SIE 00] pour une pr-sentation de quelques applications de RB dans le domaine mdical).

    La mise en uvre dun RB pour modliser un tel problme est assez immdiatelorsque celui-ci est simple (peu de variables, suffisamment de donnes et/ou dispo-

  • Rseaux Baysiens pour la Classification 3

    nibilit dun expert pour lapprentissage des probabilits). Ainsi, le classifieur nafde Bayes, utilis depuis longtemps en reconnaissance des formes statistiques, peuttre vu comme un rseau baysien trs simple dont toutes les variables sont discrtes,avec lhypothse que tous les symptmes sont indpendants conditionnellement audiagnostic. Mais se pose alors une question classique dans la communaut MachineLearning : comment discrtiser les variables continues ?

    Ce RB naf peut bnficier des apports de la communaut "rseaux baysiens" pourcontourner cette difficult, en faisant lhypothse que la densit de probabilit condi-tionnelle (CPD) est une gaussienne (RB naf mixte), ou un mlange de gaussiennes.

    Un des inconvnients des RB nafs est le nombre lev de paramtres estimeralors que, dans la plupart des cas, le nombre de donnes disponibles est faible. Poury faire face,il est possible de modliser les CPD par une fonction de type OU bruit.Cest ainsi que QMR/DT, une des premires applications de ce type de modlisation un problme de diagnostic mdical, a donn son nom par extension ce type de RB(souvent appel directement QMR)

    Les RB nafs ou de type QMR ont tous deux une structure simple deux niveauxavec dun ct les symptmes, et de lautre les diagnostics. Dans la plupart des cas,le problme rsoudre est plus complexe modliser et la connaissance de certainesrelations de causalit permet de construire un RB moins "naf". Cette structure peuttre obtenue grce un expert du domaine, ou partir de donnes grce des mthodesdapprentissage de structure.

    Pour finir, il est aussi possible de modliser des tches de diagnostic encore pluscomplexes, en utilisant des architectures mixtes (rseaux de neurones, arbres de dci-sion, rseaux baysiens, ...), les RB tant utiliss au mme niveau que les autres m-thodes de classification, ou pour combiner efficacement les rsultats des classifieurs.Nous ne dcrirons pas ces mthodes ici, mais nous conseillons la lecture de [SIE 01]pour lutilisation dun RB pour la fusion de classifieurs pour le diagnostic mdical, etde [LER 98] pour une illustration dun systme de diagnostic complexe (non mdi-cal), utilisant des rseaux de neurones (pour la reconnaissance de symptmes partirde donnes brutes et pour la prise en compte de lvolution temporelle) puis un rseaubaysien (pour le diagnostic final).

    Aprs la phase de dfinition de la structure et du type des variables (discrtes,continues CPD gaussiennes), il reste encore deux problmes rsoudre. Tout dabord,comment estimer les probabilits conditionnelles correspondant la structure du RB(si ce nest pas effectu en mme temps que lapprentissage de structure) ? Ensuite,la dernire question linfrence, i.e. le calcul de la probabilit dun (ou plusieurs)nud(s) du RB (gnralement, la variable diagnostic) conditionnellement un en-semble dobservations. Un certain nombre dalgorithmes dinfrence "exacte" fonc-tionnent efficacement pour la plupart des RB. Par contre, dans certains cas, le rseauest trop complexe pour ces algorithmes, et il faudra utiliser des algorithmes dinfrence"approche".

  • 4 RIA 15/2002. Rseaux Baysiens

    2.2. Choix de la structure du RB

    2.2.1. RB Naf

    Le classifieur de Bayes naf est directement issu de lapplication de la rgle dedcision de Bayes en rajoutant lhypothse dindpendance conditionnelle des symp-tmes (X) conditionnellement au diagnostic (Diag) :

    do(X) = argmaxDiag p(Diag|X) = argmaxDiag p(X|Diag)p(Diag)

    = argmaxDiag

    i

    p(Xi|Diag)p(Diag) [1]

    Cela nous permet de rcrire la loi jointe de la faon suivante, ce qui correspondgraphiquement la structure de la figure 2 p.13, applique un problme de dtectionde cancer de la thyrode.

    p(X, Diag) = p(Diag)

    i

    p(Xi|Diag) [2]

    Les implmentations classiques du classifieur de Bayes naf considrent que toutesles variables sont discrtes. Si certaines variables sont continues, il faut alors passerpar une premire tape de discrtisation. Cette tape, classique dans bon nombre dal-gorithmes de Machine Learning, a t aborde de nombreuses fois, en utilisant descritres bass sur des tests statistiques ou sur la thorie de linformation [DOU 95].Parmi ces mthodes, citons celles bases sur le critre dAkake utilises par [El- 00]pour la dtection de mlanomes par un rseau baysien naf discret.

    Une autre solution consiste utiliser la modlisation CG (Conditional Gaussian)[LAU 92]. Sous certaines conditions, il est possible de reprsenter les densits de pro-babilits conditionnelles (CPD) continues par des gaussiennes. Il est alors possible deremplacer ltape de discrtisation du RB naf discret par une hypothse de normalitdes probabilits des symptmes conditionnellement au diagnostic pour obtenir ce quenous appellerons un RB naf mixte. Cette hypothse assez forte permet cependant derduire le nombre de paramtres estimer ensuite (une moyenne et une variance laplace dun histogramme).

    De mme,on peut relcher lhypothse de normalit en remplaant la CPD gaus-sienne par un mlange de gaussiennes. Cela se fait trs facilement en rajoutant unevariable latente (i.e. jamais mesure) discrte entre le diagnostic et chaque symptme.

    2.2.2. Modlisation OU bruit

    Dans les problmes de diagnostic, la CPD importante estimer est :

    P = p(Diag|X) = p(Diag|X1, X2, ..., Xn) [3]

    Supposons que la variable Diag et les symptmes Xi soient binaires