Introduction au datamining, concepts et techniques

Preview:

DESCRIPTION

Face à l’importance grandissante que prend l’information, le datamining offre une solution pour maitriser la complexité et synthétiser les amas de données pour faire jaillir de la connaissance. Cet exposé introduit la notion de datamining dans son ensemble à travers ses concepts et ses principes, et survole quelques techniques utilisées lors de ce processus.

Citation preview

BOUSSAIDI AbdellahCHAÏB IsmaïlESI, 06/04/2009

Introduction au

Datamining Concepts et techniques

Problème?

Montagne de données

connaissances

??

???

Datamining

Quoi Comment Jusqu’ou

?

Le datamining est un processus de découverte de connaissances

Bases de données et Datawarehouses

Datamining

connaissances

Quoi?

Pourquoi?

• Description

•Prédiction

Exemples d’application

• Segmentation des clients • Déterminer le panier de la ménagère • Détection de Fraude

Champs d’application

Avantages

Meilleure prise de décision

Renforcer la positioncompétitive de l’entreprise Transformer des masses de

données en information utile

Identifier les facteurs qui déterminent le comportement du client ;

Identifier les investissements les plus profitables et les moins couteux.

Quoi Comment Jusqu’ou

?

Le datamining est un processus itératif

Formaliser le

problème

Collecter les

données

Prétraitement des

données

Estimer le modèle

Interpréter le modèle

Application du processus de datamining : Les Télécoms

Formaliser le problème

Problématique:

• Segmentation des clients

• Taux de turn-over

Collecte de données

• Informations clients (nom, prénom, âge, profession..etc.);

• Durée d’appel par client;

• Heures d’appels;

• Appels non aboutis;

• …etc.

Prétraitement des données

• Atténuer le bruit Enlever les informations non pertinentes

• Sélectionner les données utiles Mieux vaut tout prendre !

• ACP…etc.

16Google Confidential

Estimer le modèleSélectionner le modèle adéquat

Réseaux De Neurones

RéseauxBayésiens

LogiqueFloue

SVM

ArbresDe décision

Metaheuristique

MéthodesStatistique

régression

17Google Confidential

Estimer le modèle

Vérification

Validation

MéthodesD’apprentissage

Réechan

• Implémenter la technique approprié

RéseauxBayésiens

LogiqueFloue

SVM

Réseaux De Neurones

18Google Confidential

Estimer le modèle

TechniquesDe datamining

Estimation

De l’erreur

Implémentation

logiciel

19Google Confidential

Interpréter le modèle et tirer les conclusions

Résultats

Interpréter le modèle et tirer les conclusions

Quoi Comment Jusqu’ou?

Le text mining

Le Text Mining

Text MiningProcess

Pourquoi?

80% de l’information enregistrée,

l’est sous forme textuelle

Quoi Comment Jusqu’ou?

Logiciels de datamining

Poids lourds• SAS• SPSS Clementine• Weka (Open-source)

Tendance : datamining dans la base de données

• Oracle Darwin Suite• SQL Server Analysis Services

Limites du datamining

• Effort considérable de développement.

• Etat inapproprié des données.

Perspectives

• Analyse de plus de données dans un minimum

de temps

• Exploration plus approfondie des données

• Datamining pour les PMEs.

• Datamining « domestique »

Conclusion

Données

Informations

Connaissances

Datamining

Merci pour votre

attention

Recommended