Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles...

Preview:

Citation preview

DatawarehouseModèles

Gestion des données - Entrepôt de données

Olivier Schwander <olivier.schwander@lip6.fr>

UPMC

20 février 2017

1 / 24

DatawarehouseModèles Définition

Retour sur le business intelligence

2 / 24

DatawarehouseModèles Définition

Retour sur le datawarehouse

DatawarehouseI Stockage pour le BII Archivage sur toute l’histoire de l’entrepriseI Format stable dans le temps

DéfinitionLe terme entrepôt de données (ou base de données décisionnelle, ouencore data warehouse) désigne une base de données utilisée pourcollecter, ordonner, journaliser et stocker des informationsprovenant de base de données opérationnelles et fournir ainsi unsocle à l’aide à la décision en entreprise.

3 / 24

DatawarehouseModèles Définition

Objectifs

Stockage de toute l’information de l’entreprise

I Collecter : récupérer l’informationI Ordonner : structurer l’informationI Journaliser : conserver l’historique de l’information

4 / 24

DatawarehouseModèles Définition

Comparaison

Base opérationnelle Entrepôt de donnéeRôle Fonctionnement quotidien Prise de décision

Contenu Information utile à un mo-ment précis

Historique des données

Utilisateurs Techniciens, vendeurs Gestionnaires, analystes

Usage Requêtes simples, prévi-sibles

Requêtes complexes, spéci-fiques

Conception Performances et disponibi-lité

Flexibilité et facilité d’accès

Requêtes Mise à jour fréquentes, surpeu de lignes

Mise à jour périodiques, re-quêtes sur toute la base

5 / 24

DatawarehouseModèles Définition

Données orientées sujets

ProductionI Données organisées par processus fonctionnels

Aide à la décisionI Données organisées par thèmeI À travers plusieurs fonctions, services, départements, etc

6 / 24

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Modèle relationnel

Avantages

I Normalisé, garanties de sûretéI Requêtes efficaces

InconvénientsI Requêtes peu adaptées pour le BII Beaucoup de relationsI Trop complexe pour les utilisateurs de BI

7 / 24

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Modèle relationnel

8 / 24

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Modèle dimensionnel

Analyse du besoin

I Que veut l’utilisateur ?I Sur quoi l’analyse porte-t-elle ?I Quels sont les objets à étudier ? Selon quels critères ?

Contenu de l’entrepôt

I Faits : évènements élémentairesI Dimensions : critères utilisés

9 / 24

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Modèle dimensionnel

Modèle en étoile10 / 24

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Example : contexte

Plusieurs magasins qui vendent des produits

ProduitI Nom, marque, couleur, taille, fabricant

ClientI Nom, prenom, adresseI Achète un produit dans une certaine quantité pour un certain

montant

Magasin

I Responsable, région

11 / 24

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Example : questions

Questions posées par le service marketing

I Ventes globales dans le tempsI Ventes par magasinI Ventes par produit et par magasin

ExerciceI Dessiner le schéma de l’entrepôt de données, en suivant le

modèle dimensionnelI Avec un exemple

12 / 24

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Example : schéma

Modèle en étoile 13 / 24

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Exemple : plus de questions

I Ventes par joursI Ventes par moisI Ventes par saisonsI Ventes par couleurI Ventes par catégories de produitsI Ventes par régions

ExerciceI Comment adapter le schéma ?

14 / 24

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Exemple : schéma

Modèle en flocon

15 / 24

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Dimensions hiérarchiques

Fait de venteI DateI Autres informations

Une date ?I Jour, mois, annéeI Jour de la semaineI Week-end, pas week-endI Vacances pas vacancesI Année civile, scolaire, fiscale

16 / 24

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Dimensions hiérarchiques

17 / 24

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Stabilité et flexibilité dans le temps

Objectif de l’entrepôt

I Stocker toutes les données sur toutes l’histoire de l’entrepriseI De façon organisée

Un produit change de nom

I On veut se souvenir que ça reste le même produit

18 / 24

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Dimensions à évolution lente

DéfinitionChangement de la description d’un objet dans la base

Exemples

I Nom d’un produitI Adresse d’un clientI Fournisseur d’un produit

19 / 24

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Solutions

Type 0

I Ne rien faire : l’application au-dessus s’en chargeI Dangereux

Type 1

I Écraser l’ancienne valeurI Perte d’une partie de l’historique

Type 2

I Numéros de version ou dates de début et de finI Changements dans le passé délicats

20 / 24

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Solutions

Type 3

I Colonnes supplémentaires pour stocker les anciennes valeursI Historique limité

Type 4

I Tables supplémentaires pour stocker les anciennes versionsI Plus de tables

21 / 24

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Exemples

Donnée de base

Key Code Name State123 ABC Acme Supply Co CA

Changement de l’origine du produit

Type 1

Key Code Name State123 ABC Acme Supply Co IL

22 / 24

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Exemples

Type 2Versions :

Key Code Name State Version.123 ABC Acme Supply Co CA 0124 ABC Acme Supply Co IL 1

Dates :

Key Code Name State StartDate EndDate

123 ABC Acme Supply Co CA 01-Jan-2000 21-Dec-2004124 ABC Acme Supply Co IL 22-Dec-2004 NULL

23 / 24

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

ExemplesType 3

Key Code Name OriginalState CurrentState EffectiveDate

123 ABC Acme Supply Co CA IL 22-Dec-2004

Type 4Supplier :

Key Code Name State124 ABC Acme Supply Co IL

History :

Key Code Name State CreateDate

123 ABC Acme Supply Co CA 14-June-2003124 ABC Acme Supply Co IL 22-Dec-2004

24 / 24

Recommended