Upload
amandine-thery
View
105
Download
2
Embed Size (px)
Citation preview
Exposé DATAMINING
METHODE DESCPIPTIVE :
ASSOCIATION
Les régles d’association :
OBJECTIF : Approche automatique pour découvrir des relations / corrélations intéressantes entre des objets. Transcrire la connaissance sous forme de règles d’association
Applications:–Utilisé pour analyser le panier de la ménagère–Détection des fraudes–Gestion des stocks
Tableau de transactions tableau binaire 0/1
Contenu du caddie trans-action
s
confiture fromage pain clt1
fromage pain clt2
pain Lait clt3
fromage confiture Lait clt4
pain lait confiture formage clt5
fromage clt6
lait confiture fromage pain
0 1 1 1 Clt1
0 0 1 1 Clt2
1 0 0 1 clt3
1 1 1 0 Clt4
1 1 1 1 Clt5
0 0 1 0 Clt6
L’analyse du panier de la Ménagère:
Mettre en évidence les produits achetés ensemble, pour avoir une régle sous forme:
Par exemple : Si pain alors lait;
Si antécédent Alors conséquent
Critères d’évaluation des règles d’association :
Ces règles d’association seront sous forme :(R) : Si conditions Alors resultants
Si pain alors lait
SUPPORT : Un indicateur de « fiabilité » de la règle ,recherche des ensemble de produits fréquents,
c’est le nombre de transactions d’apparition simultanée des produits
le nombre d’apparition (ex. sup{pain et lait} = 2)
CONFIANCE : Un indicateur de « précision » de la règle, c’est à partir des ensemble de produit fréquents, produire les
règles,
(Conf = sup{pain,lait} / sup( pain ) = 2/4 = 50%
Bonne règle = règle avec un support et une confiance élevée
SUP (condition et résultat) .
CONF= sup (condition et résultat) / sup (condition).
Extraction des règles d’association :
Paramètres : Fixer un degré d’exigence sur les règles à extraire
>> Support-min. <.ex 2 transactions) >> Confiance-min < ex. 75%)
l’idée est surtout de contrôler (limiter) le nombre de
règles produites
Recheche des fréquence et production desrégles:
>> recherche des ensemble produit fréquents (support >= support min.)
>> à partir des ensemble produit fréquents, produire les règles (conf. >= conf. min.), {p;f} p f conf: ¾= 0,75 (accepter) f p conf : 3/5= 0,6 ( refuser)
{ p;f{ }p;c{ }p;l{ }f;c{ }f;l{ }c;l } 2 3 2123
Card }p,f{= 2
• Lift d’une règle : mesure son intérêt
LIFT : L’amélioration apportée par une règle, par rapport à une réponse au hasard est appelée
« lift » et vaut
(EX = conf (pain et lait) /p (lait) = 0,5/(3/6)= 1)
• Quand le lift est < 1, la règle n’apporte rien.• Exemples :• lift (C ⇒ B) = 5/6 < 1(règle inutile)• lift (B ⇒ E) = 5/4 (règle utile).
lift (règle) = confiance (règle) / p (résultat)
Cas pratique
Avec le logiciel TANAGRA:Cas d’une base de donnée d’un
banque (population), Construire des règles d’association à
partir d’un fichier EXCEL« individus x variables ».
qui recense les caractéristiques d’un ensemble de clients ayant déposé un dossier de demande de crédits.
Charger le fichier BANQUE.BDM
On a 9 attributte, ayant tous
Des variables discréts
• Insérer le composant « Define Status»
• Sélectionne les attributs
On glissa,le composant
A PRIORI dans la filière
Ces paramètres sont donné Par Défaut, et
dès lors possible de lancer
les calculs , et voir les resultats
• Le nombre d’items •Le nombre d’items ayant un support
supérieur à SUPPORT_MIN; •Le nombre d’itemsets
de cardinal égal à 2, 3… ,
Les resultats sont triées par ordre décroissant selon le
LIFT
Pour chaque règle ,
Affichera son antécédent ,
son conséquent ,le lift ,
le supportet
la confiance associés.
Merci pour votre attention