24
Datawarehouse Modèles Gestion des données - Entrepôt de données Olivier Schwander <[email protected]> UPMC 20 février 2017 1 / 24

Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

Embed Size (px)

Citation preview

Page 1: Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

DatawarehouseModèles

Gestion des données - Entrepôt de données

Olivier Schwander <[email protected]>

UPMC

20 février 2017

1 / 24

Page 2: Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

DatawarehouseModèles Définition

Retour sur le business intelligence

2 / 24

Page 3: Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

DatawarehouseModèles Définition

Retour sur le datawarehouse

DatawarehouseI Stockage pour le BII Archivage sur toute l’histoire de l’entrepriseI Format stable dans le temps

DéfinitionLe terme entrepôt de données (ou base de données décisionnelle, ouencore data warehouse) désigne une base de données utilisée pourcollecter, ordonner, journaliser et stocker des informationsprovenant de base de données opérationnelles et fournir ainsi unsocle à l’aide à la décision en entreprise.

3 / 24

Page 4: Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

DatawarehouseModèles Définition

Objectifs

Stockage de toute l’information de l’entreprise

I Collecter : récupérer l’informationI Ordonner : structurer l’informationI Journaliser : conserver l’historique de l’information

4 / 24

Page 5: Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

DatawarehouseModèles Définition

Comparaison

Base opérationnelle Entrepôt de donnéeRôle Fonctionnement quotidien Prise de décision

Contenu Information utile à un mo-ment précis

Historique des données

Utilisateurs Techniciens, vendeurs Gestionnaires, analystes

Usage Requêtes simples, prévi-sibles

Requêtes complexes, spéci-fiques

Conception Performances et disponibi-lité

Flexibilité et facilité d’accès

Requêtes Mise à jour fréquentes, surpeu de lignes

Mise à jour périodiques, re-quêtes sur toute la base

5 / 24

Page 6: Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

DatawarehouseModèles Définition

Données orientées sujets

ProductionI Données organisées par processus fonctionnels

Aide à la décisionI Données organisées par thèmeI À travers plusieurs fonctions, services, départements, etc

6 / 24

Page 7: Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Modèle relationnel

Avantages

I Normalisé, garanties de sûretéI Requêtes efficaces

InconvénientsI Requêtes peu adaptées pour le BII Beaucoup de relationsI Trop complexe pour les utilisateurs de BI

7 / 24

Page 8: Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Modèle relationnel

8 / 24

Page 9: Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Modèle dimensionnel

Analyse du besoin

I Que veut l’utilisateur ?I Sur quoi l’analyse porte-t-elle ?I Quels sont les objets à étudier ? Selon quels critères ?

Contenu de l’entrepôt

I Faits : évènements élémentairesI Dimensions : critères utilisés

9 / 24

Page 10: Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Modèle dimensionnel

Modèle en étoile10 / 24

Page 11: Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Example : contexte

Plusieurs magasins qui vendent des produits

ProduitI Nom, marque, couleur, taille, fabricant

ClientI Nom, prenom, adresseI Achète un produit dans une certaine quantité pour un certain

montant

Magasin

I Responsable, région

11 / 24

Page 12: Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Example : questions

Questions posées par le service marketing

I Ventes globales dans le tempsI Ventes par magasinI Ventes par produit et par magasin

ExerciceI Dessiner le schéma de l’entrepôt de données, en suivant le

modèle dimensionnelI Avec un exemple

12 / 24

Page 13: Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Example : schéma

Modèle en étoile 13 / 24

Page 14: Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Exemple : plus de questions

I Ventes par joursI Ventes par moisI Ventes par saisonsI Ventes par couleurI Ventes par catégories de produitsI Ventes par régions

ExerciceI Comment adapter le schéma ?

14 / 24

Page 15: Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Exemple : schéma

Modèle en flocon

15 / 24

Page 16: Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Dimensions hiérarchiques

Fait de venteI DateI Autres informations

Une date ?I Jour, mois, annéeI Jour de la semaineI Week-end, pas week-endI Vacances pas vacancesI Année civile, scolaire, fiscale

16 / 24

Page 17: Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Dimensions hiérarchiques

17 / 24

Page 18: Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Stabilité et flexibilité dans le temps

Objectif de l’entrepôt

I Stocker toutes les données sur toutes l’histoire de l’entrepriseI De façon organisée

Un produit change de nom

I On veut se souvenir que ça reste le même produit

18 / 24

Page 19: Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Dimensions à évolution lente

DéfinitionChangement de la description d’un objet dans la base

Exemples

I Nom d’un produitI Adresse d’un clientI Fournisseur d’un produit

19 / 24

Page 20: Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Solutions

Type 0

I Ne rien faire : l’application au-dessus s’en chargeI Dangereux

Type 1

I Écraser l’ancienne valeurI Perte d’une partie de l’historique

Type 2

I Numéros de version ou dates de début et de finI Changements dans le passé délicats

20 / 24

Page 21: Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Solutions

Type 3

I Colonnes supplémentaires pour stocker les anciennes valeursI Historique limité

Type 4

I Tables supplémentaires pour stocker les anciennes versionsI Plus de tables

21 / 24

Page 22: Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Exemples

Donnée de base

Key Code Name State123 ABC Acme Supply Co CA

Changement de l’origine du produit

Type 1

Key Code Name State123 ABC Acme Supply Co IL

22 / 24

Page 23: Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

Exemples

Type 2Versions :

Key Code Name State Version.123 ABC Acme Supply Co CA 0124 ABC Acme Supply Co IL 1

Dates :

Key Code Name State StartDate EndDate

123 ABC Acme Supply Co CA 01-Jan-2000 21-Dec-2004124 ABC Acme Supply Co IL 22-Dec-2004 NULL

23 / 24

Page 24: Gestion des données - Entrepôt de données - IA · Datawarehouse Modèles Gestiondesdonnées-Entrepôtdedonnées OlivierSchwander UPMC 20février2017

DatawarehouseModèles

Modèle relationnelModèle dimensionnelRaffinement du modèle

ExemplesType 3

Key Code Name OriginalState CurrentState EffectiveDate

123 ABC Acme Supply Co CA IL 22-Dec-2004

Type 4Supplier :

Key Code Name State124 ABC Acme Supply Co IL

History :

Key Code Name State CreateDate

123 ABC Acme Supply Co CA 14-June-2003124 ABC Acme Supply Co IL 22-Dec-2004

24 / 24