Upload
allard-tisserand
View
120
Download
7
Embed Size (px)
Citation preview
22 INF7115INF7115
PlanPlan
IntroductionIntroduction
Entrepôts de donnéesEntrepôts de données
OLAP OLAP
ConclusionConclusion
33 INF7115INF7115
IntroductionIntroduction
Entrepôts de donnéesEntrepôts de données DéfinitionDéfinition Les structuresLes structures Les architecturesLes architectures
OLAPOLAP DéfinitionDéfinition Nouveaux opérateursNouveaux opérateurs
DIFFDIFFRELAXERELAXE
Outils OLAPOutils OLAP
44 INF7115INF7115
Entrepôts de donnéesEntrepôts de données
DéfinitionDéfinition
Un entrepôt de données est une collection Un entrepôt de données est une collection de données orientées sujet, intégrées, non de données orientées sujet, intégrées, non volatiles et comportant un historique, volatiles et comportant un historique, organisées pour le support d’un processus organisées pour le support d’un processus d’aide à la décision. d’aide à la décision.
55 INF7115INF7115
Entrepôts de données (suite)Entrepôts de données (suite)
Les structuresLes structures Les données détailléesLes données détaillées Les données agrégéesLes données agrégées Les méta-donnéesLes méta-données Les données historiquesLes données historiques
77 INF7115INF7115
Entrepôts de données (suite)Entrepôts de données (suite)
Les architecturesLes architectures L’architecture réelleL’architecture réelle L’architecture virtuelleL’architecture virtuelle L’architecture remoteL’architecture remote
88 INF7115INF7115
OLAPOLAP
On Line Analytical Process On Line Analytical Process Permet à des compagnies d'analyser Permet à des compagnies d'analyser (résumer, consolider, visionner, (résumer, consolider, visionner, d’appliquer des formules, de synthétiser d’appliquer des formules, de synthétiser des données selon des dimensions des données selon des dimensions multiples) les bases de données globales multiples) les bases de données globales établies dans leurs entrepôts de données. établies dans leurs entrepôts de données. Est l'infrastructure pour des applications Est l'infrastructure pour des applications de soutien à la décision. de soutien à la décision.
99 INF7115INF7115
OLAP (suite)OLAP (suite)
Permet de restructurer et de stocker dans un Permet de restructurer et de stocker dans un format multidimensionnel les données issues de format multidimensionnel les données issues de fichiers ou de bases relationnelles.fichiers ou de bases relationnelles.Comporte des opérateurs simples et rapides qui Comporte des opérateurs simples et rapides qui peuvent être combinés.peuvent être combinés. Pilage (Roll-up)Pilage (Roll-up) Dépliage (Roll-down)Dépliage (Roll-down) PivotPivot
Résultat dépend beaucoup de l’intuition de Résultat dépend beaucoup de l’intuition de l’analyste.l’analyste.
1010 INF7115INF7115
But des nouveaux opérateursBut des nouveaux opérateurs
Permettre une analyse interactive. Permettre une analyse interactive.
Automatiser une grande partie de l’effort Automatiser une grande partie de l’effort manuel.manuel.
Permettre de combiner la perspicacité du Permettre de combiner la perspicacité du monde externe de l’analyste et les monde externe de l’analyste et les découvertes obtenues à partir des découvertes obtenues à partir des données. données.
1212 INF7115INF7115
Mise en situationMise en situation
Produit Plateforme Géographie Année
Nom_Produit(67) Nom_Plateforme(43) Géographie (4) Année (5)
Catégorie_Produit(14) Type_Plateforme(6)
Groupe_Produit(3) Usager_Plateforme(2)
Figure 1 : Dimensions et hiérarchies des données des revenues des logiciels. Le nombre entre parenthèse indique le format du niveau de la dimension.
1313 INF7115INF7115
Opérateur DIFFOpérateur DIFF
Remplace le dépliage (roll-down) manuel.Remplace le dépliage (roll-down) manuel.
Permet de rapporter une différence Permet de rapporter une différence sommaire entre deux valeurs observées à sommaire entre deux valeurs observées à des niveaux agrégés. des niveaux agrégés.
1414 INF7115INF7115
ProblématiqueProblématique
Plateforme (Tous)
Produit (Tous)
Somme des revenues Année
Géographie 1990 1991 1992 1993 1994
Asie/PacifiqueReste du mondeEtats-UnisEurope de l’ouest
1440.24 1946.82 3453.56 5576.35 6309.88
2170.02 2154.14 4557.42 5203.84 5510.09
6545.49 7524.29 10946.87 13545.42 15817.18
4551.90 6061.23 10053.19 12577.50 13501.03
Figure 2 : Revenue total par géographie et année de la vente de logiciel.
1515 INF7115INF7115
Exemple opérateur DIFFExemple opérateur DIFFProduit Usager_Plat Type_Plat Plateforme Année_1990 Année_1991 Ratio Erreur
(Tous)- (Tous)- (Tous)- (Tous) 1620.02 1820.05 1.12 34.07
Systèmed’exploitation
Multi (Tous)- (Tous) 253.52 197.86 0.78 23.35
Systèmed’exploitation
Multi Autre Multi Mainframe IBM
97.76 1.54 0.02 0.00
Système d’exploitation
Mono Win16 (Tous) 94.26 10.73 0.11 0.00
Middleware & autre
Multi Autre Multi Mainframe IBM
101.45 9.55 0.09 0.00
EDA Multi Unix Multi (Tous) 0.36 76.44 211.74 0.00
EDA Mono Unix mono (Tous) 0.06 13.49 210.78 0.00
EDA Mono Win16 (Tous) 1.80 10.89 60.4 0.00
Figure 3 : Raison de la baisse des revenues indiquée par la figure 2
1616 INF7115INF7115
Opérateur RELAXOpérateur RELAX
Met en valeur un ensemble de régions Met en valeur un ensemble de régions maximales autour du problème où un maximales autour du problème où un changement similaire a été observé. changement similaire a été observé.
Effectue une série de pliages et une Effectue une série de pliages et une succession d’étapes de sélection, de succession d’étapes de sélection, de dépliage et de pivot. dépliage et de pivot.
1717 INF7115INF7115
ProblématiqueProblématiqueType_Plateforme Autre Système
Plateforme Mono usager autre
Géographie Etats-Unis
Catégorie_Prod Applications financières
Produit HRM/Paie
Somme des revenus
Année
1990 1991 1992 1993 1994
Total 0.03 0.07 0.46 5.03 3.87
Figure 4 : La problématique de la baisse de revenue de 1993 à 1994 observée pour le produit ‘HRM/Paie’, Géographie=’États-Unis’ et Plateforme = ‘Mono usager autre’.
1818 INF7115INF7115
Exemple opérateur RELAXExemple opérateur RELAX
No
Catégorie_Prod Produit Géographie Type_Plat Plateforme
Applications financières
HRM/Paie Etats-Unis Autres Syst. Mono usager autre
1 (Chaque) (Chaque)
Autres app.bureautique
Reste du monde
HRM/Paie Asie/Pacifique
Figure 5 : Application de l’opérateur RELAX au problème de la figure 4
1919 INF7115INF7115
Outils OLAPOutils OLAP
MOLAP (Multidimensional OLAP)MOLAP (Multidimensional OLAP)
ROLAP (Relational OLAP)ROLAP (Relational OLAP)
HOLAP (Hybride OLAP)HOLAP (Hybride OLAP)
DOLAP, VOLAP, etc.DOLAP, VOLAP, etc.