13
Exposé DATAMINING METHODE DESCPIPTIVE : ASSOCIATION

Exposé DATAMINING METHODE DESCPIPTIVE : ASSOCIATION

Embed Size (px)

Citation preview

Page 1: Exposé DATAMINING METHODE DESCPIPTIVE : ASSOCIATION

Exposé DATAMINING

METHODE DESCPIPTIVE :

ASSOCIATION

Page 2: Exposé DATAMINING METHODE DESCPIPTIVE : ASSOCIATION

Les régles d’association :

OBJECTIF : Approche automatique pour découvrir des relations / corrélations intéressantes entre des objets. Transcrire la connaissance sous forme de règles d’association

Applications:–Utilisé pour analyser le panier de la ménagère–Détection des fraudes–Gestion des stocks

Page 3: Exposé DATAMINING METHODE DESCPIPTIVE : ASSOCIATION

Tableau de transactions tableau binaire 0/1

Contenu du caddie trans-action

s

confiture fromage pain clt1

fromage pain clt2

pain Lait clt3

fromage confiture Lait clt4

pain lait confiture formage clt5

fromage clt6

lait confiture fromage pain

0 1 1 1 Clt1

0 0 1 1 Clt2

1 0 0 1 clt3

1 1 1 0 Clt4

1 1 1 1 Clt5

0 0 1 0 Clt6

L’analyse du panier de la Ménagère:

Mettre en évidence les produits achetés ensemble, pour avoir une régle sous forme:

Par exemple : Si pain alors lait;

Si antécédent Alors conséquent

Page 4: Exposé DATAMINING METHODE DESCPIPTIVE : ASSOCIATION

Critères d’évaluation des règles d’association :

Ces règles d’association seront sous forme :(R) : Si conditions Alors resultants

Si pain alors lait

SUPPORT : Un indicateur de « fiabilité » de la règle ,recherche des ensemble de produits fréquents,

c’est le nombre de transactions d’apparition simultanée des produits

le nombre d’apparition (ex. sup{pain et lait} = 2)

CONFIANCE : Un indicateur de « précision » de la règle, c’est à partir des ensemble de produit fréquents, produire les

règles,

(Conf = sup{pain,lait} / sup( pain ) = 2/4 = 50%

Bonne règle = règle avec un support et une confiance élevée

SUP (condition et résultat) .

CONF= sup (condition et résultat) / sup (condition).

Page 5: Exposé DATAMINING METHODE DESCPIPTIVE : ASSOCIATION

Extraction des règles d’association :

Paramètres : Fixer un degré d’exigence sur les règles à extraire

>> Support-min. <.ex 2 transactions) >> Confiance-min < ex. 75%)

l’idée est surtout de contrôler (limiter) le nombre de

règles produites

Page 6: Exposé DATAMINING METHODE DESCPIPTIVE : ASSOCIATION

Recheche des fréquence et production desrégles:

>> recherche des ensemble produit fréquents (support >= support min.)

>> à partir des ensemble produit fréquents, produire les règles (conf. >= conf. min.), {p;f} p f conf: ¾= 0,75 (accepter) f p conf : 3/5= 0,6 ( refuser)

{ p;f{ }p;c{ }p;l{ }f;c{ }f;l{ }c;l } 2 3 2123

Card }p,f{= 2

Page 7: Exposé DATAMINING METHODE DESCPIPTIVE : ASSOCIATION

• Lift d’une règle : mesure son intérêt

LIFT : L’amélioration apportée par une règle, par rapport à une réponse au hasard est appelée

« lift » et vaut

(EX = conf (pain et lait) /p (lait) = 0,5/(3/6)= 1)

• Quand le lift est < 1, la règle n’apporte rien.• Exemples :• lift (C ⇒ B) = 5/6 < 1(règle inutile)• lift (B ⇒ E) = 5/4 (règle utile).

lift (règle) = confiance (règle) / p (résultat)

Page 8: Exposé DATAMINING METHODE DESCPIPTIVE : ASSOCIATION

Cas pratique

Avec le logiciel TANAGRA:Cas d’une base de donnée d’un

banque (population), Construire des règles d’association à

partir d’un fichier EXCEL« individus x variables ».

qui recense les caractéristiques d’un ensemble de clients ayant déposé un dossier de demande de crédits.

Page 9: Exposé DATAMINING METHODE DESCPIPTIVE : ASSOCIATION

Charger le fichier BANQUE.BDM

On a 9 attributte, ayant tous

Des variables discréts

Page 10: Exposé DATAMINING METHODE DESCPIPTIVE : ASSOCIATION

• Insérer le composant « Define Status»

• Sélectionne les attributs

Page 11: Exposé DATAMINING METHODE DESCPIPTIVE : ASSOCIATION

On glissa,le composant

A PRIORI dans la filière

Ces paramètres sont donné Par Défaut, et

dès lors possible de lancer

les calculs , et voir les resultats

• Le nombre d’items •Le nombre d’items ayant un support

supérieur à SUPPORT_MIN; •Le nombre d’itemsets

de cardinal égal à 2, 3… ,

Page 12: Exposé DATAMINING METHODE DESCPIPTIVE : ASSOCIATION

Les resultats sont triées par ordre décroissant selon le

LIFT

Pour chaque règle ,

Affichera son antécédent ,

son conséquent ,le lift ,

le supportet

la confiance associés.

Page 13: Exposé DATAMINING METHODE DESCPIPTIVE : ASSOCIATION

Merci pour votre attention