Du Data WareHouse au WebHouse : le croisement des réseaux et des bases de données Du Data...

Preview:

Citation preview

Du Data WareHouse au Du Data WareHouse au WebHouse : WebHouse :

le croisement des réseaux et le croisement des réseaux et des bases de donnéesdes bases de données

Du Data WareHouse au Du Data WareHouse au WebHouse : WebHouse :

le croisement des réseaux et le croisement des réseaux et des bases de donnéesdes bases de données

Samira Silhadi-HacidSamira Silhadi-HacidMalika TarafiMalika Tarafi

SommaireSommaire

1. Des Bases de Données au Data Warehouse2. Du Data Warehouse au Data Webhouse

Aide à la décison en ligne

Evolution des systèmes d’aide à la décisionEvolution des systèmes d’aide à la décision

1960

- Fichiers- Programmes (Cobol)- Rapports

1965

- ComplexitéMaintenanceDéveloppement

- Synchronisation des données- Matériel

Beaucoup de fichiers

SSADSGBD

Base de données – ’’Source unique pour tous les traitements’’

1970

OLTP1975

OLTP

1980

SAD

PCs, Technologie 4GL

OLTP

1985

ExtracteurExtracteur

Pourquoi l’extraction ?- Performance- Contrôle

1990

’’Attitude laissez-faire’’

- Crédibilité des données- Productivité- Difficulté à transformer les données en information

Problèmes :Problèmes :

ProductivitéProductivité

Ex: Produire un rapport consolidé => Localiser les données

Localiser les données : 9-12 moisLocaliser les données : 9-12 mois

Obtenir les données : 15-24 moisObtenir les données : 15-24 mois

=> explorer de nombreux fichiers

Solution!Solution!

Changement dans l’approcheChangement dans l’approche

Fichier BD

Donnéesexternes

EntrepôtEntrepôtde Donnéesde Données

EntrepôtEntrepôtde Donnéesde Données

DM DM

SIG OLAP

SAD

MétaDonnées

MétaDonnées

Administrateur

SourcesSources

ChargeursChargeurs

ClientsClients

Entrepôts de Entrepôts de donnéesdonnées

Un entrepôt est défini comme un ensemble de données intégrées, variables dans le temps qui sont utilisées dansle processus d’aide à la décision. C’est une grosse base de données qui organise les données opérationnelles pour faciliter l’analyse.

-Marché estimé à plus de $20 Milliards avec une

progression de 10 à 20% par année.- 95% des 1000 grandes entreprises américaines équipées

d’un ED.

Il y a dix ans : Le DW est une sorte de ressource pour la gestion. Il est interrogé de façon non urgente.

Aujourd’hui :

-Volume de données généré par le Web important ex.: Pages Microsoft analysées => plus de 1 Milliard

d’événements

-Temps de réponse : le Web rend critique ’’ les temps de réponse aux requêtes’’

Ces considérations vont changer la façon de concevoir et d’implanter les entrepôts de données.

- Tout entrepôt de données doit être visible à partir des interfaces de navigation du Web- Il est demandé à l’entrepôt de données d’enregistrer les requêtes (manipulations) des clients et de les rendre disponibles pour l’analyse

Le E-commerce :

- Collection de données propres (récupérées électroniquement)

Yahoo! 1 milliard de pages visitées par jour

Le Web est un laboratoire expérimental pour les entrepôts de données

Quelques applicationsQuelques applications

’’Business Intelligence’’

Proposé par IBM, Microsoft, Oracle, …

’’Consolider la quantité gigantesque de données atomiques que les entreprises génèrent en information que les gens peuvent accéder, comprendre et utiliser’’

- Data Mining

’’Business Intelligence’’: présenter l’information dans des formats plus utiles, en utilisant des outils de visualisation avancés et des techniques d’IA

Marché : $3.5M (2002) $8.8M (2004)

Vente de livres par amazon

ED TraditionnelED Traditionnel

Achats Achats précédentsprécédents

Achats Achats précédentsprécédents

RecommandationsRecommandationsRecommandationsRecommandationsEDED ComportementsComportements

EDTREDTR

Achats Achats actuelsactuelsAchats Achats actuelsactuels

RecommandationsRecommandationsRecommandationsRecommandationsEDED ComportementsComportements

Exemple d’application : offres ciblées – offres personnalisées en temps réel.

FichiersFichiersLogsLogs

Transfor-Transfor-mateurmateur

WebhouseWebhouse

AutreBD

DataMining

AnalyseurAnalyseurGénérateurGénérateurde rapportsde rapports

RapportsRapports

Possibilités pour le traitement de gros volumes de données

Taille Fichiers Logs

Temps de traitementFichiers Logs sur réseau

Temps de traitementFichiers Logs sur Même machine

100 Mo 8 min 4 min1 Go 44 min 23 min2.5 Go 1h12min 48 min5 Go 2h8min 1h32min

Pentium III700 MHz1 Go RAM100 Mbit Ethernet

Système ’’Peer-to-Peer’’

ApplicationApplication ServeurServeurServeurServeur

PC

PC

PC

PC

PC

DWDW

DonnéesDonnéesMarchéMarché

(Application Wall Street)

Internet : - Faciliter la gestion de la chaîne d’approvisionnement

(Just-in-Time)

ConclusionConclusion

- Recherche de l’emploi

- Achats, …

- Faire passer l’OLAP du domaine de l’analyste au domaine du consommateur => aide à la décision sur Internet

Prochaine grande étape pour les entrepôts de données

« Support des fonctions de planification collaborative »

Unifier marketing, finance et opérations prévisionsprévisions

BibliographieBibliographie

http://www.cs.toronto.edu/~mendel/dwbib.html

http://www.dwinfocenter.org/

http://www.datawarehousingonline.com/

http://www.cio.com/research/data/

http://www.intelligententerprise.com/

Recommended