18
Modéliser un critère par un réseau bayésien : V-structure et observations probabilistes fixes Véronique Delcroix 1 , Ali Ben Mrad 2 1. LAMIH UMR 8201, UVHC Valenciennes, France [email protected] 2. CES université de Sfax, Tinisie [email protected] RÉSUMÉ. Cet article propose un système à base de réseaux bayésiens pour fournir des recom- mandations dans le cadre des problèmes récurrents d’aide à la décision multicritères. Chaque critère de choix est modélisé par une V-structure dans le graphe du RB. Les auteurs mettent en évidence l’intérêt de découper le RB et d’utiliser des observations probabilistes fixes afin de produire le raisonnement attendu. ABSTRACT. This paper proposes a system composed of Bayesian networks in order to provide recommendations in recurrent multicriteria decision problems. Each criterion is modeled by a V-structure in the graph of the BN. The authors highlight the interest of cutting the BN and using fixed probabilistic evidence to produce the waited reasoning MOTS-CLÉS : observation probabiliste, réseau bayésien, observation de vraisemblance, aide à la décision multicritères KEYWORDS: probabilistic evidence, bayesian network, likelihood evidence, soft evidence,MCDA DOI:10.3166/RIA.-.1-18 c 2016 Lavoisier Revue d’intelligence artificielle – n o -/2016, 1-18

Modéliser un critère par un réseau bayésien : V-structure et

Embed Size (px)

Citation preview

Page 1: Modéliser un critère par un réseau bayésien : V-structure et

Modéliser un critère par un réseaubayésien : V-structure et observationsprobabilistes fixes

Véronique Delcroix 1, Ali Ben Mrad 2

1. LAMIH UMR 8201,UVHC Valenciennes, France

[email protected]

2. CESuniversité de Sfax, Tinisie

[email protected]

RÉSUMÉ. Cet article propose un système à base de réseaux bayésiens pour fournir des recom-mandations dans le cadre des problèmes récurrents d’aide à la décision multicritères. Chaquecritère de choix est modélisé par une V-structure dans le graphe du RB. Les auteurs mettenten évidence l’intérêt de découper le RB et d’utiliser des observations probabilistes fixes afin deproduire le raisonnement attendu.

ABSTRACT. This paper proposes a system composed of Bayesian networks in order to providerecommendations in recurrent multicriteria decision problems. Each criterion is modeled bya V-structure in the graph of the BN. The authors highlight the interest of cutting the BN andusing fixed probabilistic evidence to produce the waited reasoning

MOTS-CLÉS : observation probabiliste, réseau bayésien, observation de vraisemblance, aide à ladécision multicritères

KEYWORDS: probabilistic evidence, bayesian network, likelihood evidence, soft evidence,MCDA

DOI:10.3166/RIA.-.1-18 c© 2016 Lavoisier

Revue d’intelligence artificielle – no -/2016, 1-18

veronique
Rectangle
veronique
Rectangle
veronique
Rectangle
Page 2: Modéliser un critère par un réseau bayésien : V-structure et

2 RIA. Volume - – no -/2016

1. Introduction

La modélisation d’un critère est utile dans les problèmes de décision où un ou plu-sieurs critères de choix doivent être pris en compte. Chaque critère oriente la décisionsuivant une direction. Dans cet article; nous considérons un critère comme une qualitépositive que l’on cherche systématiquement à optimiser. Par exemple, lors du choixd’une voiture, le critère associé au prix est l’adéquation entre le prix de la voiture etle montant disponible, et cette adéquation doit toujours être la meilleure possible. Uncritère peut aussi être associé à un risque ou un niveau de gravité.

Nous considérons ici les problèmes de décision récurrents et multicritères . Laspécificité de ces problèmes est qu’ils concernent tout type de décideurs (Monsieur"tout le monde"). Nous considérons une étape très amont du processus de décisionqui vise à aider le décideur à cibler un ensemble d’alternatives potentielles à l’aided’un système de recommandations sur les caractéristiques les plus pertinentes desalternatives en fonction de son cas de décision. Ce système de recommandation basésur des réseaux bayésiens est présenté dans (Delcroix et al., 2013).

Dans cet article, nous proposons de modéliser chacun des critères de choix à l’aidede trois noeuds formant une V-structure dans un réseau bayésien. Cette structure peutêtre utilisée pour évaluer une alternative sur un critère dans un cas de décision spéci-fique, mais aussi pour fournir des recommandations adaptées au cas considéré en vuede satisfaire le critère.

Nous expliquons pourquoi l’utilisation de ce type de réseau bayésien en vue defournir des recommandations sur les alternatives nécessite quelques précautions. Eneffet, il est nécessaire de limiter la propagation vers les noeuds susceptibles de fairel’objet de recommandation. Pour cela, nous proposons d’utiliser des observations pro-babilistes afin de fixer les distributions de probabilités des variables non observées quine doivent pas faire l’objet d’une recommandation. Ce type d’observation est spécifiépar une distribution locale de probabilités sur une variable qui reflète la croyance surcette variable après propagation de l’information dans le réseau. Le fait d’imposer unedistribution de probabilités fixe revient à modifier temporairement le modèle, puisqueles a priori sur les variables concernées par les observations probabilistes fixes sonttemporairement remplacés. D’un coté, ce type d’observations soulève des critiquesdans la communauté des modèles graphiques probabilistes car il ne s’agit pas d’unévénement e que l’on peut propager en calculant P (. | e); d’un autre coté, il existeune réelle demande pour ce type d’observations (Bloemeke, 1998 ; Valtorta et al.,2002 ; Baldwin, Tomaso, 2003 ; Arsene et al., 2015).

Dans la partie suivante, nous introduisons les problèmes récurrents d’aide à la dé-cision multicritères, et nous expliquons leur spécificité. Puis dans la partie 3, nous pré-sentons la modélisation d’un critère à l’aide d’une V-structure et son utilisation pourévaluer et pour recommander. Nous expliquons et illustrons les problèmes rencontréspour fournir des recommandations sur les alternatives en utilisant le RB de façon clas-sique. La partie 4 concerne la solution proposée avec des observations probabilistesfixes et les résultats obtenus sur un exemple jouet d’aide à la décision multicritère.

veronique
Rectangle
veronique
Rectangle
Page 3: Modéliser un critère par un réseau bayésien : V-structure et

Modèle d’un critère dans un RB 3

2. Problème récurrent d’aide à la décision multi-critères

2.1. Présentation

Un problème de décision récurrent est un problème de décision qui est répétéplusieurs fois dans des contextes différents et avec différents acteurs, mais toujoursavec le même type d’alternatives et les mêmes critères de choix. Les problèmes dedécision récurrents sont caractérisés par le fait qu’ils concernent tout type de décideur.En effet, chaque occurrence de la décision implique un ensemble d’acteurs différentsavec leur contraintes propres, et dans un contexte spécifique. L’importance de chaquecritère et l’évaluation d’une alternative en fonction d’un critère donné dépendent dechaque cas de décision. Ces problèmes sont aussi caractérisés par l’absence possibled’un expert, capable d’évaluer une alternative sur un critère ainsi que l’importance descritères qui dépend de chaque cas de décision, ce qui rend plus utile encore d’apporterde l’aide au décideur(s). Nous considérons les problèmes multi-attributs dans lesquelsles alternatives sont caractérisées par un ensemble d’attributs fixes.

FIGURE 1. Exemples de paramètres intervenant dans le choix d’un véhicule

La figure 1 montre quelques uns des paramètres qui entrent en jeu lorsqu’une per-sonne choisit une voiture. Les réseaux bayésiens sont bien adaptés pour la modéli-sation des problèmes récurrents de décision car ils permettent de représenter et deraisonner avec l’incertitude et d’apporter au décideur une information et des recom-mandations adaptées à son cas.

2.2. Spécificité des problèmes récurrents d’aide à la décision multicritère

Les problèmes et les méthodes d’aide à la décision multicritère (ADMC) repré-sentent un champs de recherche déjà bien étudié. Nous expliquons ci-dessous pour-quoi ces méthodes ne sont pas adaptées aux problèmes récurrents d’ADMC que nousabordons, de même que d’autres outils d’aide à la décision comme les diagrammesd’influences.

Un premier élément à considérer concerne le décideur. Dans les problèmes de dé-cision récurrents, le décideur est parfois "ignorant" et n’est pas toujours accompagné

Page 4: Modéliser un critère par un réseau bayésien : V-structure et

4 RIA. Volume - – no -/2016

d’un spécialiste. De ce fait, il ne peut être sollicité de façon importante et systéma-tique sur des questions qui requièrent de l’expertise. Au contraire, les méthodes multi-critères reposent sur l’idée d’utiliser les préférences du décideur pour différencier lessolutions et l’aider dans le processus de décision. Dans notre approche, le décideurn’est sollicité que pour fournir des informations sur les éléments concernant son casde décision et qui peuvent entrer en jeu dans la décision : ses caractéristiques, sescontraintes, ses besoins, le contexte, etc.; en revanche il n’a pas à donner ses préfé-rences en termes de comparaison d’alternatives relativement à des critères, ce qui peutdemander une certaine expertise. Dans notre exemple très simplifié sur le choix d’unevoiture, tous les acheteurs ne sont pas capables de classer deux voitures données entermes de satisfaction relativement à l’accélération, ou sur d’autres critères comme parexemple ceux qui impactent sur le type de carburant.

Deuxièmement, la plupart des méthodes d’ADMC supposent que l’on dispose apriori d’une liste de solutions potentielles de taille "raisonnable". Notre proposition sesitue plus en amont dans le processus de choix et ne nécessite pas que le décideur aitdès le départ une liste d’alternatives. Au contraire, les recommandations sur les carac-téristiques des alternatives fournies par notre approche peuvent constituer un point dedépart pour établir une telle liste d’alternatives. Concrètement dans notre exemple, unepersonne désireuse de choisir une voiture pourrait dans un premier temps obtenir desrecommandations sur les caractéristiques d’un véhicule adapté à ses besoins grâce ànotre proposition; puis tirer parti de ces recommandations pour établir une liste de vé-hicules pertinents pour son cas; et enfin, exploiter une méthode d’ADMC pour classerces véhicules, ou sélectionner le ou les meilleurs.

D’autres modèles graphiques probabilistes, dont les diagrammes d’influence sontdédiés à l’aide à la décision. Ces modèles permettent de traiter des problèmes de dé-cision séquentiels, dans lesquels chaque décision comporte un nombre limité d’al-ternatives. Dans les problèmes de décision récurrents que nous traitons, la liste desalternatives n’est pas connue a priori. Dans notre exemple sur le problème récurrentde l’aide au choix d’une voiture, un noeud de décision d’un diagramme d’influencepourrait comporter une liste de voitures réelles, dont toutes les caractéristiques seraientconnues (options, etc). S’il s’agit d’une liste commune à tous les cas de décision, sataille est immense; et si elle est spécifique à chaque cas de décision, c’est un travailpréalable qui est demandé au décideur, or notre proposition vise au contraire à aider àobtenir une telle liste restreinte et spécifique.

Une autre approche pourrait considérer le choix des valeurs des caractéristiquesdes alternatives comme autant d’étapes dans la décision. Cependant, les diagrammesd’influence imposent de déterminer un ordre fixe sur les décisions, ce qui n’est pas per-tinent pour le choix des caractéristiques des alternatives (par exemple le type de voi-ture, puis la marque, etc.). La comparaison des réseaux bayésiens et des diagrammesd’influence pour les problèmes récurrents d’ADMC a été discutée dans (Sedki, Del-croix, 2012).

En résumé, notre approche se situe à une phase très amont du processus de décisionpour des problèmes d’ADMC récurrents, en vue de fournir des recommandations sur

veronique
Rectangle
Page 5: Modéliser un critère par un réseau bayésien : V-structure et

Modèle d’un critère dans un RB 5

les caractéristiques des alternatives qui soient adaptés à la spécificité de chaque cas dedécision. Cet ensemble de recommandations peut ensuite être utilisé pour sélectionnerun sous-ensemble d’alternatives de taille raisonnable qui constitue le point de départde l’étape suivante du processus de décision.

3. Principe du réseau bayésien pour les problèmes récurrents d’aide à ladécision multicritères : structure du graphe et utilisation

L’idée d’utiliser une V-structure pour modéliser un critère dans un réseau bayésien(RB) n’est pas nouvelle (Fenton, Neil, 2001 ; Leicester et al., 2013), mais elle n’estpas clairement formalisée.

3.1. Modélisation d’un critère de décision par une V-structure dans un RB

Le principe de la V-structure pour représenter un critère est représenté sur la fi-gure 2 : un noeud sans enfants représente l’indice de satisfaction du critère. Il peutaussi représenter un degré d’adéquation entre une contrainte liée au cas de décisionet une caractéristique (directe ou dérivée) de l’alternative. Cet indice est une valeurentre 0 et 1 où 1 représente une satisfaction maximale du critère. Pour des raisons defacilité, nous représentons cet indice dans pyAgrum par une variable “quasi continue”,c’est à dire une variable entière variant dans un intervalle. Nous avons choisi l’inter-valle [1,10] car il faut faire un compromis entre précision et taille du modèle. De cefait, les variables satAcceleration et adeqPrix de notre exemple représentent l’indicede satisfaction multiplié par 10.

Le degré de satisfaction d’un critère dépend d’une part des caractéristiques de l’al-ternative, et d’autre part de l’importance de ce critère ou de contraintes spécifiques àchaque cas de décision. Ces facteurs sont représentés par les deux noeuds parents dela V-structure. Le parent représenté à gauche concerne le cas de décision et nous l’ap-pellerons parfois le parent gauche. Ces deux noeuds parents peuvent être des indices,comme ci-dessous pour le critère accélération, ou l’importance et l’indice sont desvaleurs dans [0,10], ou bien des grandeurs de même unité, comme le prix du véhiculeet le montant disponible.

FIGURE 2. V-structure pour modéliser un critère dans le graphe du réseau bayésien

Page 6: Modéliser un critère par un réseau bayésien : V-structure et

6 RIA. Volume - – no -/2016

FIGURE 3. Exemple jouet : RB modélisant les critères d’adéquation du prix et desatisfaction en terme d’accélération lors du choix d’un véhicule

La figure 3 illustre la modélisation de deux critères dans le problème du choixd’une voiture: d’une part l’adéquation entre le prix de la voiture et le montant dispo-nible pour l’acheteur, d’autre part, la satisfaction en termes d’accélération de la voi-ture. Ce RB jouet est utilisé pour illustrer cet article mais il est entièrement imaginé,et ne reflète pas des données réelles.

A ce stade, notons une remarque importante sur le vocabulaire : il est fréquentde confondre les caractéristiques des alternatives et les critères. Par exemple, on ditparfois que le prix est un critère de choix. Dans cet article, nous distinguons claire-ment ces deux notions : d’un coté le prix, qui est une caractéristique d’une voiture; del’autre le critère de choix associé au prix, qui représente le niveau d’adéquation entrele montant disponible pour l’acheteur et le prix du véhicule. Un même prix est plusou moins satisfaisant selon l’acheteur, et il est faux de dire que le prix le plus bas esttoujours le plus satisfaisant. Ainsi, lors d’une décision, l’objectif est de satisfaire aumieux chacun des critères. Cela se traduit dans la V-structure par le fait que le niveaud’adéquation (ou de satisfaction) d’un critère doit être le plus élevé possible, mêmepour un critère peu important.

Voici la présentation rapide des 6 noeuds qui constituent les deux V-structures desdeux critères:

Critère associé au prix : le montant disponible pour acheter une voiture dépend del’age et du niveau de vie de l’acheteur; le prix du véhicule dépend du rapportpoids/puissance (en kg/cv); l’adéquation en termes de prix est maximale lorsquele prix du véhicule et le montant disponible sont égaux, et nulle si la valeurabsolue de la différence entre le prix de la voiture et le montant disponibledépasse les deux tiers du montant disponible. Ce noeud n’est pas déterministe.

Critère associé à l’accélération de la voiture : l’importance que le véhicule ait uneforte accélération dépend uniquement du sexe de l’acheteur; l’indice d’accélé-

veronique
Rectangle
Page 7: Modéliser un critère par un réseau bayésien : V-structure et

Modèle d’un critère dans un RB 7

ration dépend uniquement (et de façon déterministe) du rapport poids/puissancedu véhicule; la satisfaction en termes d’accélération dépend de l’importance ducritère (imp) pour l’acheteur et de son évaluation pour une alternative (g). Nousdéfinissons la satisfaction (sat), par sat = gimp, où les trois variables sat, g etimp sont des indices entre 0 et 1. Cette définition donne une satisfaction maxi-male lorsque l’importance du critère est nulle (dans certains cas, l’accélérationn’est pas un critère de choix); à l’inverse, le niveau de safisfaction est égal à l’in-dice d’évaluation du critère lorsque l’importance est maximale (égale à 1). Dansnotre exemple, nous utilisons des variables entières dans [0,10] qui représententdix fois l’indice.

Cet exemple a été implémenté avec la bibliothèque pyAgrum 1; l’ensemble destests a été réalisé via les notebook de pythonXY 2

3.2. Première utilisation du RB : évaluation des critères

Il s’agit d’évaluer une alternative (ou un sous-ensemble d’alternatives) sur un cri-tère, pour un cas de décision (ou un type d’acheteur). Voici les entrées/sorties du réseaubayésien pour évaluer chacun des critères :

Entrées (observation) : le cas de décision et l’alternative, chacun étant décrits par unsous-ensemble de caractéristiques observées.

Sorties (variable cible) : le degré de satisfaction ou d’adéquation du critère.

Dans la suite de cet article, nous considérons deux acheteurs potentiels pour nostests :

Lucas : jeune homme de 20 ans, d’un faible niveau de vie (trait plein).

Lili : dame de 60 ans, au niveau de vie moyen (trait pointillé).

Nous considérons aussi trois sous-ensembles de voitures, définis suivant une seulecaractéristique : le rapport entre le poids de la voiture en kg et sa puissance en cv.Ce rapport poids/puissance est un indicateur direct de la capacité d’accélération d’unevoiture : un rapport faible indique une excellente reprise (par exemple un rapport de 4kg/ch pour la porshe 911 GT3) alors qu’un rapport plus élevé indique une accélérationmoins rapide (par exemple un rapport de 40 kg/ch pour la 2cv). Ce rapport est aussifortement lié au prix du véhicule (globalement, plus le rapport poids/puissance estpetit, plus la voiture est chère).

La figure 4 montre l’évaluation du critère lié à l’accélération pour trois type de vé-hicules et nos deux personnes. Les courbes de gauche montre l’évaluation du niveaud’importance de l’accélération pour deux personnages à partir des observations sur lesvariables âge, sexe et niveau de vie. Ce critère est (probablement) important ou très

1. https://forge.lip6.fr/projects/pyagrum2. avec l’aide de Pierre-Henri Wuillemin, que nous remercions chaleureusement!

Page 8: Modéliser un critère par un réseau bayésien : V-structure et

8 RIA. Volume - – no -/2016

FIGURE 4. Evaluation de trois types de véhicules pour deux personnes sur le critèrede l’accélération. Cas 1 : observations directes sur le décideur (âge, sexe, niveau de

vie)

FIGURE 5. Evaluation de trois types de véhicules pour deux personnes sur le critèrede l’accélération. Cas 2 : observation supplémentaire sur l’importance de

l’accélération (obs. de vraisemblance)

important pour Lucas, alors qu’il l’est (probablement) moins pour Lili. Les courbesde droite représentent les distributions de probabilités a posteriori de l’indice d’accé-lération et du niveau de satisfaction en termes d’accélération pour six configurationspossibles (3 voitures et 2 personnes).

Globalement, le niveau de satisfaction est plus élevé pour Lili, puisque ce critèreest moins important pour elle. La voiture avec le rapport poids/puissance = 4 procureun niveau de satisfaction excellent quel que soit l’acheteur.

La figure 5 montre l’évaluation du critère lié à l’accélération avec les observationsutilisées pour la figure 4 et des observations supplémentaires sur le montant disponiblepour l’achat de la voiture et l’importance du critère accélération. Pour cette dernière,on utilise ici une observation de vraissemblance. Rappelons que cette variable est unindice entre 0 et 10; pour Lucas par exemple, l’observation est décrite par le vecteur

veronique
Rectangle
Page 9: Modéliser un critère par un réseau bayésien : V-structure et

Modèle d’un critère dans un RB 9

[0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1] qui traduit le fait que l’importance du critère accélérationest "importante ou très importante".

Du fait qu’il y a moins d’incertitude sur le niveau d’importance, on constate surles courbes de droite que l’évaluation du niveau de satisfaction est aussi plus précis.

FIGURE 6. Evaluation en termes de prix pour trois types de véhicules et deuxpersonnes. Cas 1 : obsrvations directes sur la personne (âge, sexe, niveau de vie)

Les figures 6 et 7 montrent l’évaluation du critère associé au prix pour trois typede voiture et deux personnes. Dans le premier cas (figure 7), les observations portentsur l’age, le sexe et le niveau de vie pour les acheteur, et sur le rapport poids/puissancepour les voitures. Dans le second cas (figure 6), les observations sont identiques, avecen plus une précision sur le montant disponible.

Dans les deux figures, les courbes en haut à gauche et à droite indiquent respective-ment les distributions de probabilités sur le montant disponible et le prix des voitures;et les courbes du bas montrent les distributions de probabilités a posteriori du niveaud’adéquation du prix pour nos deux personnes, Lucas et Lili, pour chaque type devoiture considéré.

Pour Lucas, une voiture avec un rapport poids/puissance = 12 a plus de chanced’être satisfaisant en termes de prix qu’une voiture de rapport 8; et une voiture avecun rapport poids puissance de 4 n’a aucune chance d’être satisfaisante en termes deprix pour ce jeune homme. En revanche, pour Lili, c’est une voiture avec un rapportpoids puissance de 8 qui offre le plus de chances d’une bonne satisfaction en termesde prix, devant les voitures avec un rapport de 12. Par ailleurs, certaines des voituresavec un rapport poids/puissance = 4 peuvent offrir une satisfaction moyenne en termesde prix pour Lili.

Page 10: Modéliser un critère par un réseau bayésien : V-structure et

10 RIA. Volume - – no -/2016

FIGURE 7. Evaluation en termes de prix pour trois types de véhicules et deuxpersonnes. Cas 2 : observation supplémentaire sur le montant disponible

3.3. Seconde utilisation : la recommandation

Le contexte est celui d’une personne donnée (connue) qui souhaite choisir unevoiture de façon à satisfaire un ensemble de critères (ici deux). L’objectif est de fournirà cette personne des recommandations ciblées sur les caractéristiques d’une voiturequi lui permettra le plus probablement de satisfaire tous les critères.

L’idée est de se projeter dans une situation idéale, où la personne serait effecti-vement satisfaite sur tous les critères et de voir, grâce à l’inférence, quelles sont lescaractéristiques de cette voiture qui "expliquent" cette satisfaction. Dans cet objectif,on propage dans le RB une satisfaction maximale sur les deux criteres de choix, ainsique les observations sur la personne, et on regarde les probabilités a posteriori sur lescaractéristiques de la voiture.

Voici les entrées/sorties du réseau bayésien pour obtenir des recommandations afinde satisfaire un critère :

Entrées (observation) : le cas de décision décrit par un sous-ensemble de caractéris-tiques observées et un niveau de satisfaction élevé des critères.

Sorties (variable cible) : caractéristiques d’une alternative.

Cependant, nous allons voir ci-dessous que ce mécanisme ne suffit pas pour effec-tivement produire des recommandations pertinentes sur les alternatives.

veronique
Rectangle
Page 11: Modéliser un critère par un réseau bayésien : V-structure et

Modèle d’un critère dans un RB 11

FIGURE 8. Distributions de probabilité a posteriori sur deux caractéristiques duvéhicule après propagation d’un niveau de satisfaction élevé des deux critères et desobservations sur l’acheteur. En haut : les observations sur le décideur sont l’age, lesexe et le niveau de vie. En bas : deux observations supplémentaires sur le montant

disponible et l’importance de l’accélération.

3.4. Le problème des recommandations avec des observations incomplètes

Considérons l’exemple de la figure 8 pour illustrer le fait qu’il ne suffit pas depropager une exigence de satisfaction sur les critères et les observations sur l’acheteurpour obtenir des recommandations pertinentes sur un véhicule en vue de l’acheter.

Dans l’exemple de la figure 8, on propage les observations directes sur l’acheteur(age, sexe et niveau de vie) et un niveau de satisfaction maximal pour les deux cri-tères (adeqPrix = 10 et satAcceleration = 10). Ces observations forment le premier cas(partie haute du graphe). Dans le second cas (partie basse du graphe), on ajoute deuxobservations supplémentaires sur le montant disponible et l’importance du critère ac-célération, c’est à dire sur le parent direct de chaque critère coté décideur.

Observons les probabilités a posteriori sur les caractéristiques de la voiture : ladistribution de probabilité a posteriori est très différente dans les deux configurations(en haut et en bas). Pourquoi cette explication est-elle si différente avec et sans obser-vation sur le parent direct du critère coté décideur (montant disponible et importancede l’accélération) ? Alors que les observations ajoutées sur le montant disponible etl’importance du critère accélération ne font que préciser des variables qui dépendentdes observations directes de l’acheteur.

Dans les deux cas, le résultat de l’inférence correspond à l’explication la plus pro-bable d’une situation où une personne connue est très satisfaite par un type de voituresur les deux critères du prix et de l’accélération. Mais cette explication ne correspondpas au raisonnement souhaité, qui vise à donner des recommandations sur le véhicule,sans remettre en cause les caractéristiques non observées de l’acheteur.

Page 12: Modéliser un critère par un réseau bayésien : V-structure et

12 RIA. Volume - – no -/2016

Le raisonnement souhaité est une sorte de projection dans laquelle :– on a un ensemble d’observations concernant un cas de décision : le décideur (et

son contexte, environnement, ...)– on a un niveau élevé de satisfaction des critères– on s’interdit de modifier les variables concernant la personne, son environne-

ment, contexte etc.– on cherche quelles valeurs des caractéristiques de l’alternative expliquent le

mieux ce bon degré de satisfaction.

Ce modèle de raisonnement ne peut être obtenu par un RB tel que celui ci-dessusavec des observations classiques (ou des observations de vraisemblance). En effet,dans ce cas, nous avons vu que l’inférence conduit à faire des "recommandations" surles caractéristiques non observées de la personne, ce qui n’est pas le but.

4. Solution proposée : utiliser des observations probabilistes

La première intuition consiste à découper le RB au niveau des noeuds des critèreset à procéder comme suit: (1) évaluer les parents directs de chaque critère coté déci-deur (2) ne conserver qu’une seule valeur (la plus probable), au lieu de conserver ladistribution de probabilité obtenue (3) propager l’exigence de satisfaction des critèresavec les valeurs obtenues dans le reste du RB.

Lors de l’étape (2), il faut noter qu’on ne peut pas utiliser une observation de vrai-semblance pour les noeuds d’importance des critères car elle serait ensuite modifiéepar la propagation de la satisfaction max du critère, ce qui n’est pas le but puisque larecommandation ne doit porter que sur les alternatives, et non sur le décideur (ou lecas de décision).

Afin d’éviter la perte d’information qui consiste à ne retenir qu’une seule valeur,nous proposons d’utiliser des observations probabilistes fixes qui permettent de main-tenir fixes un ensemble de distributions de probabilités locales lors de la propagation.

4.1. Les observations probabilistes

La question des observations incertaines dans les RBs a déjà été abordé sou-vent dans la littérature, et on identifie deux ou trois types d’observations incertaines(Dubois et al., 1998 ; Valtorta et al., 2002 ; Vomlel, 2004 ; Chan, Darwiche, 2005 ;Benferhat, Tabia, 2012). Cependant, le sujet n’est pas consensuel comme en témoignela diversité du vocabulaire, et le fait que nombre de logiciels et bibliothèques sur lesRB ne proposent qu’un seul type d’observations incertaines (Mrad et al., 2015). Lesobservations incertaines les plus connues sont les observations de vraisemblance (li-kelihood evidence, ou virtual evidence) introduites par Pearl. Ces dernières sont pro-pagées en modifiant temporairement le graphe du RB par l’ajout d’un noeud qui repré-sente l’observation faite. L’observation est spécifiée par sa vraisemblance en fonctiondu noeud parent.

veronique
Rectangle
Page 13: Modéliser un critère par un réseau bayésien : V-structure et

Modèle d’un critère dans un RB 13

Nous utilisons un autre type d’observation incertaine, identifié dès 1998 (Duboiset al., 1998 ; Bloemeke, 1998), et que nous appelons observations probabilistes (nom-mées soft evidence par Valtorta et ses co-auteurs).

Une observation probabiliste sur une variable X dans un réseau bayésien est spé-cifiée par une distribution locale de probabilités R(X) qui définit l’état des croyancessur la variable X après que cette information ait été propagée. Une observation proba-biliste est fixe lorsque la distribution de probabilités R(X) ne peut pas être modifiéepar la propagation d’autres observations. Elle est dite non fixe dans le cas contraire.

La différence entre les observations probabilistes fixes et non fixes apparait lors-qu’on propage successivement plusieurs observations probabilistes.

La propagation d’une seule observation probabiliste R(X) sur une variable X sefait facilement en convertissant l’observation en un rapport de vraisemblance L(X) =R(X)/P (X) où P (X) est la distribution de probabilité a priori de X , puis en propa-geant L(X) comme une observation de vraisemblance par la méthode de l’observationvirtuelle de Pearl. cette méthode ne peut être utilisée pour propager plusieurs observa-tions probabilistes fixes car alors elles ne restent pas fixes (Chan, Darwiche, 2005).

Plusieurs algorithmes ont été proposés pour propager un ensemble d’observationsprobabilistes dans un RB(Peng et al., 2010 ; 2012 ; Mrad, 2015 ; Mrad et al., 2015).

Nous avons implémenté l’algorithme BN-IPFP1 (Pan et al., 2006) qui permetde propager dans un réseau bayésien un ensemble d’observations probabilistes noncontradictoires 3 4. Cet algorithme propage à tour de rôle chaque observations en laconvertissant en observations de vraisemblance, et ce jusqu’à obtenir une distributionqui satisfasse toutes les observations probabilistes demandées.

On peut noter que les observations classiques sont des cas particuliers d’observa-tions probabilistes, alors que les observations de vraisemblance ne le sont pas.

4.2. Recommandations à l’aide d’observations probabilistes

L’objectif est de fournir des recommandations sur les caractéristiques des alter-natives afin de satisfaire au mieux un ensemble de critères pour un cas de décisiondonné par un ensemble d’observations. Pour cela, on fixe la satisfaction des critèresdans un intervalle élevé (par exemple entre 7 et 10), et on empêche que la propagationde ces exigences ne modifie les variables non observées du cas de décision. Cela est

3. Notons X l’ensemble des variables d’un RB (G,P ), X l’ensemble des variables associées aux noeudsdu RB et R(Y1), . . . , R(Yr) un ensemble d’observations probabilistes avec {Y1, . . . , Yr} ⊂ X; on ditque ces observations probabilistes sont cohérentes, ou non contradictoires (consistent en anglais) s’il existeune distribution de probabilités Q(X) dont les probabilités marginales sur Yi coïncident avec R(Yi), c’està dire Q(Yi) = R(Yi) pour i = 1, . . . , r (Peng et al., 2010, p. 543).4. si de plus, chaque distribution locale R(Yi) domine P (Yi) (P (Yi) << R(Yi)), alors l’algorithme BN-IPFP1 converge (Peng et al., 2010, p. 543). Par définition, P (Y ) << R(Y ) si {y | P (y) > 0} ⊂ {y |R(y) > 0}.

Page 14: Modéliser un critère par un réseau bayésien : V-structure et

14 RIA. Volume - – no -/2016

assuré en propageant une observation probabiliste pour le parent gauche (coté cas dedécision) de chaque critère. Ainsi, dans notre exemple, on impose que la distributionde probabilités du montant disponible et celle de l’importance du critère accélérationrestent fixes lorsqu’on propage l’exigence de satisfaction des deux critères.

FIGURE 9. Distributions de probabilités du montant disponible et de l’importance ducritère accélération que l’on veut garder fixe lors de la propagation de l’exigence de

satisfaction des critères en vue de fournir des recommandations sur le véhicule

La figure 9 montre les distributions des observations probabilistes sur les parentsdirects des deux critères. Ces distributions ont été obtenues en propageant les obser-vations (âge, sexe et niveau de vie). Cette méthode permet aussi de pallier les cas oùon ne dispose pas de toutes les caractéristiques directes du cas de décision, ce qui estfréquent.

FIGURE 10. Comparaison du montant disponible et de l’importance du critèreaccélération a priori et après propagation de la satisfaction des critères et des

observations directes sur le décideur (âge, sexe, niveau de vie).

La figure 10 correspond à la propagation d’une satisfaction élevée pour les deuxcritères pour deux personnes connue (age, sex, niveau de vie) avec des observationsclassiques (on ne fixe aucune distribution de probabilité). Le montant disponible etl’importance du critère accélération sont fortement modifié par rapport à leur valeur apriori (traits gris).

veronique
Rectangle
Page 15: Modéliser un critère par un réseau bayésien : V-structure et

Modèle d’un critère dans un RB 15

Considérons par exemple les courbes en traits plein sur la partie gauche de la fi-gure : la courbe en gris représente l’estimation du montant disponible pour Lucas(jeune homme de 20 ans avec un faible niveau de vie); la propagation d’une satisfac-tion maximale des deux critères pour cette personne conduit à une explication biennaturelle : le montant disponible de Lucas est en fait plus élevé et l’importance ducritère accélération est plus faible que celle estimée a priori.

C’est pour éviter cela que les distributions de probabilité de ces deux variablesdoivent être maintenues fixes en les définissant comme des observations probabilistesfixes.

FIGURE 11. Recommandations sur les caractéristiques d’un véhicule en maintenantfixe le montant disponible et l’importance de l’accélération (traits noirs) et

comparaison avec le cas ou ces distributions ne sont pas fixes (trait gris). Cas 1 : leniveau de satisfaction des critères est 10 (sur 10)

FIGURE 12. Recommandations sur les caractéristiques d’un véhicule en maintenantfixe le montant disponible et l’importance de l’accélération (traits noirs) et

comparaison avec le cas ou ces distributions ne sont pas fixes (trait gris). Cas 2 : leniveau de satisfaction des critères est entre 7 et 10 (sur 10)

Les figures 11 et 12 montrent les recommandations sur le rapport poids/puissanceet sur le prix pour nos deux personnages en utilisant des observations probabilistes

Page 16: Modéliser un critère par un réseau bayésien : V-structure et

16 RIA. Volume - – no -/2016

fixes pour le montant disponible et l’importance du critère accélération lors de la pro-pagation d’une satisfaction élevée pour les deux critères. Dans la figure 11, l’exi-gence de satisfaction est traduite par la valeur maximale 10 pour chacun des critères.Dans la figure 12, l’exigence de satisfaction est traduite par une observation proba-biliste donnée par le vecteur [0, 0, 0, 0, 0, 0, 0, 0.5, 0.5, 1, 1] (avant normalisation), cequi traduit une satisfaction bonne ou très bonne. Ce second test figure 12 conduit àune recommandation plus réaliste. Les recommandations pour Lucas (traits plein etnoir) donnent une fourchette de prix précis (8000 à 9000 euros, mais éventuellementplus) et un rapport poids/puissance entre 4 et 9, en excluant toute voiture avec unrapport poids/puissance supérieur à 10. Il est clair que Lucas n’a que peu de choix,car ses exigences sont contradictoires. Ces deux seuls critères réduisent considérable-ment l’ensemble des voitures possibles. Les recommandations pour Lili (trait poin-tillés et noirs) donne une large fourchette de prix, autour de 20 K euros et un rapportpoids/puissancce de préférence entre 6 et 8. Les recommandations pour Lili sont beau-coup plus larges, et laissent la place à l’ajout de nombreux autres critères pour affinerson choix ! Les courbes en gris correspondent au résultat de l’inférence avec des ob-servations classiques et ne constituent pas des recommandations!

5. Conclusion et perspectives

Dans cet article, nous avons utilisé un exemple jouet pour illustrer la modélisationd’un problème récurrent d’aide à la décision multicritère à l’aide d’un réseau bayésien.Nous avons expliqué comment modéliser chaque critère de choix à l’aide de troisnoeuds : (1) le parent gauche représente la synthèse des facteurs du cas de décisionimpliqués dans ce critère, (2) le parent droit représente l’évaluation d’une alternativepour ce critère, et (3) le noeud fils de la V-structure représente le niveau de satisfactiondu critère ou degré d’adéquation dans le cas d’une contrainte.

Nous avons illustré comment ce modèle permet d’évaluer chacun des critères dansun cas donné. Enfin, nous avons expliqué et illustré le fait que l’inférence avec desobservations classiques ne permet pas de produire des recommandations sur les al-ternatives pertinentes pour un cas de décision donné. En effet, la propagation d’uneexigence de satisfaction des critères fourni une explication qui inclut les noeuds nonobservés du coté du cas de décision, alors que la recommandation ne doit concernerque les caractéristiques des alternatives.

Nous avons proposé une solution à l’aide d’observations probabilistes fixes qui in-terdit la modification des distributions de probabilités des variables ainsi "observées".La définition d’observation probabilistes fixes sur les parents gauche de chaque critèrepermet de cibler la propagation vers le parent droit (coté alternative). Notons qu’il estnécessaire de définir des observations probabilistes fixes sur les parents directs dechaque critère, coté décideur, et non pas seulement sur les variables non observées.En effet, l’ensemble des noeuds non observés est susceptible d’être impacté par lapropagation de la satisfaction des critères, modifiant ainsi l’impact sur les variablespour lesquelles on attend la recommandation.

veronique
Rectangle
Page 17: Modéliser un critère par un réseau bayésien : V-structure et

Modèle d’un critère dans un RB 17

A l’avenir, de nombreuses questions concernant les observations probabilistes etle systèmes de recommandations restent à creuser. En particulier, les observationsprobabilistes fixes sont parfois qualifiées de "non bayésiennes", dans la mesure où lemodèle de base est remis en cause. Nous espérons que cet article aide à convaincrede la pertinence et de l’interet de cette technique! Il faut cependant rendre plus clairesles hypothèses qui sont remises en cause par l’utilisation d’observations probabilistesfixes.

Une étude plus complète sur les observations probabilistes reste à mener, en par-ticulier sur les algorithmes de propagation de ces observations (convergence, com-plexité, observations contradictoires, mais aussi sur la d-séparation, sur la cohabitationde différents types d’observations incertaines, etc.).

A court terme, une perspective directe de cet article concerne la question du dé-coupage du réseau en plusieurs entités. Le modèle distribué correspondant a été pro-posé (Bloemeke, 1998) sous le terme d’"Agent Encapsulated Bayesian Network". Lemodèle que nous proposons pour l’aide à la décision multicritères contient plusieursentités naturelles : le décideur, le contexte, les alternatives, et les modules (ou agents)au centre correspondant aux critères. Ce modèle distribué doit maintenant être implé-menté, testé et comparé à d’autres.

RemerciementsNous remercions pour ce travail les auteurs de la bibliothèque pyAgrum, et en parti-culier Pierre-Henri Wuillemin, pour son aide toujours rapide et efficace concernantle développement.

Bibliographie

Arsene O., Dumitrache I., Mihu I. (2015). Expert system for medicine diagnosis using softwareagents. Expert Syst. Appl., vol. 42, no 4, p. 1825–1834.

Baldwin J. F., Tomaso E. D. (2003). Inference and learning in fuzzy bayesian networks. In The12th IEEE international conference on fuzzy systems, FUZZ-IEEE 2003, st. louis, missouri,usa, 25-28 may 2003, p. 630–635.

Benferhat S., Tabia K. (2012). Inference in possibilistic network classifiers under uncertainobservations. Annals of Mathematics and Artificial Intelligence, vol. 64, no 2-3, p. 269-309.

Bloemeke M. (1998). Agent encapsulated Bayesian networks. Ph.d. thesis, Department ofComputer Science, University of South Carolina.

Chan H., Darwiche A. (2005). On the revision of probabilistic beliefs using uncertain evidence.Artificial Intelligence, vol. 163, no 1, p. 67-90.

Delcroix V., Sedki K., Lepoutre F. X. (2013). A Bayesian network for recurrent multi-criteriaand multi-attribute decision problems: Choosing a manual wheelchair. Expert Systems withApplications, vol. 40, no 7, p. 2541-2551.

Dubois D., Moral S., Prade H. (1998). Belief change rules in ordinal and numerical uncertaintytheories. In D. Gabbay, P. Smets (Eds.), Belief change, (d. dubois, h. prade, eds.), vol. 3

Page 18: Modéliser un critère par un réseau bayésien : V-structure et

18 RIA. Volume - – no -/2016

of the handbook of defeasible reasoning and uncertainty management systems, p. 311-392.Dordrecht, Kluwer Academic Publishers.

Fenton N., Neil M. (2001). Making decisions: Bayesian nets and mcda. Knowledge-BasedSystems, vol. 14, no 7, p. 307–325.

Leicester P. A., Goodier C. I., Rowley P. (2013). Using a Bayesian network to evaluate thesocial, economic and environmental impacts of community renewable energy. In Cleantechnology for smart cities and buildings (cisbat).

Mrad A. B. (2015). Observations probabilistes dans les réseaux bayésiens. Ph.d. thesis,LAMIH, Université de Valenciennes et du hainaut-cambresis, France.

Mrad A. B., Delcroix V., Piechowiak S., Leicester P., Abid M. (2015). An explication ofuncertain evidence in bayesian networks: likelihood evidence and probabilistic evidence -uncertain evidence in bayesian networks. Appl. Intell., vol. 43, no 4, p. 802–824.

Pan R., Peng Y., Ding Z. (2006). Belief update in Bayesian networks using uncertain evidence.In Ictai, p. 441-444.

Peng Y., Ding Z., Zhang S., Pan R. (2012). Bayesian network revision with probabilisticconstraints. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems,vol. 20, no 3, p. 317-337.

Peng Y., Zhang S., Pan R. (2010). Bayesian network reasoning with uncertain evidences.International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, vol. 18,no 5, p. 539–564.

Sedki K., Delcroix V. (2012). A model based on influence diagrams for multi-criteria decision-making. International Journal on Artificial Intelligence Tools, vol. 21, no 4.

Valtorta M., Kim Y.-G., Vomlel J. (2002). Soft evidential update for probabilistic multiagentsystems. International Journal of Approximate Reasoning, vol. 29, no 1, p. 71-106.

Vomlel J. (2004). Probabilistic reasoning with uncertain evidence. Neural Network World,International Journal on Neural and Mass-Parallel Computing and Information Systems,vol. 14, no 5, p. 453–465.

veronique
Rectangle