29
BOUSSAIDI Abdellah CHAÏB Ismaïl ESI, 06/04/2009 Introduction au Datamining Concepts et techniques

Introduction au datamining, concepts et techniques

Embed Size (px)

DESCRIPTION

Face à l’importance grandissante que prend l’information, le datamining offre une solution pour maitriser la complexité et synthétiser les amas de données pour faire jaillir de la connaissance. Cet exposé introduit la notion de datamining dans son ensemble à travers ses concepts et ses principes, et survole quelques techniques utilisées lors de ce processus.

Citation preview

Page 1: Introduction au datamining, concepts et techniques

BOUSSAIDI AbdellahCHAÏB IsmaïlESI, 06/04/2009

Introduction au

Datamining Concepts et techniques

Page 2: Introduction au datamining, concepts et techniques

Problème?

Montagne de données

connaissances

??

???

Page 3: Introduction au datamining, concepts et techniques

Datamining

Page 4: Introduction au datamining, concepts et techniques

Quoi Comment Jusqu’ou

?

Page 5: Introduction au datamining, concepts et techniques

Le datamining est un processus de découverte de connaissances

Bases de données et Datawarehouses

Datamining

connaissances

Quoi?

Page 6: Introduction au datamining, concepts et techniques

Pourquoi?

• Description

•Prédiction

Page 7: Introduction au datamining, concepts et techniques

Exemples d’application

• Segmentation des clients • Déterminer le panier de la ménagère • Détection de Fraude

Page 8: Introduction au datamining, concepts et techniques

Champs d’application

Page 9: Introduction au datamining, concepts et techniques

Avantages

Meilleure prise de décision

Renforcer la positioncompétitive de l’entreprise Transformer des masses de

données en information utile

Identifier les facteurs qui déterminent le comportement du client ;

Identifier les investissements les plus profitables et les moins couteux.

Page 10: Introduction au datamining, concepts et techniques

Quoi Comment Jusqu’ou

?

Page 11: Introduction au datamining, concepts et techniques

Le datamining est un processus itératif

Formaliser le

problème

Collecter les

données

Prétraitement des

données

Estimer le modèle

Interpréter le modèle

Page 12: Introduction au datamining, concepts et techniques

Application du processus de datamining : Les Télécoms

Page 13: Introduction au datamining, concepts et techniques

Formaliser le problème

Problématique:

• Segmentation des clients

• Taux de turn-over

Page 14: Introduction au datamining, concepts et techniques

Collecte de données

• Informations clients (nom, prénom, âge, profession..etc.);

• Durée d’appel par client;

• Heures d’appels;

• Appels non aboutis;

• …etc.

Page 15: Introduction au datamining, concepts et techniques

Prétraitement des données

• Atténuer le bruit Enlever les informations non pertinentes

• Sélectionner les données utiles Mieux vaut tout prendre !

• ACP…etc.

Page 16: Introduction au datamining, concepts et techniques

16Google Confidential

Estimer le modèleSélectionner le modèle adéquat

Réseaux De Neurones

RéseauxBayésiens

LogiqueFloue

SVM

ArbresDe décision

Metaheuristique

MéthodesStatistique

régression

Page 17: Introduction au datamining, concepts et techniques

17Google Confidential

Estimer le modèle

Vérification

Validation

MéthodesD’apprentissage

Réechan

• Implémenter la technique approprié

RéseauxBayésiens

LogiqueFloue

SVM

Réseaux De Neurones

Page 18: Introduction au datamining, concepts et techniques

18Google Confidential

Estimer le modèle

TechniquesDe datamining

Estimation

De l’erreur

Implémentation

logiciel

Page 19: Introduction au datamining, concepts et techniques

19Google Confidential

Interpréter le modèle et tirer les conclusions

Résultats

Page 20: Introduction au datamining, concepts et techniques

Interpréter le modèle et tirer les conclusions

Page 21: Introduction au datamining, concepts et techniques

Quoi Comment Jusqu’ou?

Le text mining

Page 22: Introduction au datamining, concepts et techniques

Le Text Mining

Text MiningProcess

Page 23: Introduction au datamining, concepts et techniques

Pourquoi?

80% de l’information enregistrée,

l’est sous forme textuelle

Page 24: Introduction au datamining, concepts et techniques

Quoi Comment Jusqu’ou?

Page 25: Introduction au datamining, concepts et techniques

Logiciels de datamining

Poids lourds• SAS• SPSS Clementine• Weka (Open-source)

Tendance : datamining dans la base de données

• Oracle Darwin Suite• SQL Server Analysis Services

Page 26: Introduction au datamining, concepts et techniques

Limites du datamining

• Effort considérable de développement.

• Etat inapproprié des données.

Page 27: Introduction au datamining, concepts et techniques

Perspectives

• Analyse de plus de données dans un minimum

de temps

• Exploration plus approfondie des données

• Datamining pour les PMEs.

• Datamining « domestique »

Page 28: Introduction au datamining, concepts et techniques

Conclusion

Données

Informations

Connaissances

Datamining

Page 29: Introduction au datamining, concepts et techniques

Merci pour votre

attention