Approche semi-automatis©e de conception de sch©mas multidimensionnels valides Laboratoire Article pr©sent©e par : Ahlem SOUSSI Ing©nieur en informatique

  • View
    105

  • Download
    2

Embed Size (px)

Text of Approche semi-automatis©e de conception de sch©mas multidimensionnels valides Laboratoire...

  • Page 1
  • Approche semi-automatise de conception de schmas multidimensionnels valides Laboratoire Article prsente par : Ahlem SOUSSI Ingnieur en informatique & tudiante en 2me anne mastre F.S.T. Tunisie Directeurs de Mastre M.A. Jamel FEKI M.C. Faiez GARGOURI 10 Juin 2005
  • Page 2
  • 2 Plan Introduction tat de lart Approche propose Architecture fonctionnelle Modules Conclusion et perspectives
  • Page 3
  • 3 Systmes dcisionnels Deux espaces de stockage : lentrept de donnes (ED) les magasins de donnes (MD) Systmes transactionnels => production Systme dcisionnel => pilotage ED MD SOURCES DE DONNEES
  • Page 4
  • 4 Modles Multidimensionnels
  • Page 5
  • 5 Plan Introduction tat de lart Approche propose Architecture fonctionnelle Modules Conclusion et perspectives
  • Page 6
  • 6 Etat de lart Guide par les besoins Guide par la source Mixte Base sur requtes dcisionnels Source de donnes requtes et source Participation des utilisateurs dans la conception de lED fortelimiteforte Structuration de lapproche nonoui Automatisation manuellesemi-automatique Adopt par Kimball Golfarelli, Cabibbo, Moody, Hsemann Bonifati, Phipps Types dapproche Proprit
  • Page 7
  • 7 Plan Introduction tat de lart Approche propose Architecture fonctionnelle Modules Conclusion et perspectives
  • Page 8
  • 8 Approche propose Limite des approche mixtes : Gnrer et grer un grand nombre de schmas candidats inutiles Approche propose : Mixte Privilgie les besoins OLAP / aux besoins offerts par les sources
  • Page 9
  • 9 Architecture fonctionnelle Gnration de schmas en constellation Gnration de schmas en toile Correspondance et validation des schmas en toile Dictionnaire Schmas des Sources de Donnes Schmas en toile idaux des MD Schmas en toile valides des MD Acquisition graphique des besoins OLAP Gnration de schmas de MD Gnration dun schma dED Besoins OLAP semi-structurs Schma de lED Besoins OLAP exprims BD de spcification des besoins dcisionnels Schmas valides des MD Gnration de schmas de MD
  • Page 10
  • 10 Structure des besoins OLAP
  • Page 11
  • 11 Gnration des toiles Enrichissement des tableaux de besoins Tableaux spcifis => Tableaux enrichis Construction des toiles Tableaux enrichis ===> schmas en toiles GEN E T O I L E DOM 1DOM 2 DOM 3 f1 f2 f3
  • Page 12
  • 12 Sch : Schma en toile quivalent au tableau T 1 T1T1 Exemple T2T2 Sch 1 : Schma en toile rsultant de lajout de T 2 Sch
  • Page 13
  • 13 Correspondance toiles/Source Correspondance des : Faits, Mesures, Dimensions, Hirarchies Deux tapes : Extraction des termes potentiels sources Correspondance Correspondance toile idale / source (E/R) Validation des correspondances effectues
  • Page 14
  • 14 Exemple dune source E/R
  • Page 15
  • 15 faits potentiels ? Entits ou associations n-aires contenant au moins un attribut numrique non-cl. Correspondance du fait DIM 1 DIM 2 fait mesures Identifiant H1_DIM1H2_DIM1 Param 1 Param N Enseignement
  • Page 16
  • 16 Mesures potentielles d1 fait F ? Si F-ass est une association n-aire : Les attributs numriques non-cls appartenant au(x) : Fait F-ass Associations parallles F-ass Entits directement lies par F-ass Si F-ass est une entit : Les attributs numriques non-cls appartenant au(x) : F-ass Entits ou association porteuse de donnes (Ent ou Apd) lies F-ass par un lien (1,1) Entits lies F-ass par un lien (1,n) Correspondance des mesures DIM 1 DIM 2 Identifiant H1_DIM1H2_DIM1 Param 1 Param N fait mesures Nbre_ groupe_ enseigns, Enseignement
  • Page 17
  • 17 Identifiant H1_DIM1H2_DIM1 DIM 2 DIM 1 Param 1 Param N fait mesures Correspondance des dimensions (1) identifiants potentiels de dimensions ? Les attributs appartenant au(x) : Fait F-ass Ent ou Apd appartenant la fermeture transitive de F-ass ( c. d. directement ou transitivement lies F-ass par un lien (1,1) ou (1,n)) Nbre_ groupe_ enseigns, Enseignement MATIERE Code_Matire
  • Page 18
  • 18 Attributs faibles potentiels de ldentifiant dune dimension ? Les attributs appartenant au(x) : Fait F-ass Ent ou Apd lies F-ass par un lien (1,1) Correspondance des dimensions (2) Libell_Matire Identifiant H1_Matire DIM 2 DIM 1 Cycle fait mesures Nbre_ groupe_ enseigns, Enseignement MATIERE Code_Matire Code_Auditoire Attributs_faibles
  • Page 19
  • 19 Libell_Section Code Section Code Matire Code Auditoire Libell Matire Volume horaire MATIERE Libell_Auditoire H1_Matire Correspondance des hirarchies (1) identifiants potentiels de dimensions ? Les attributs appartenant au(x) : Fait F-ass Ent ou Apd appartenant la fermeture transitive de F-ass ( c. d. directement ou transitivement lies F- ass par un lien (1,1) ou (1,n))
  • Page 20
  • 20 Correspondance des hirarchies (2) Matire Libell_Auditoire Code_Auditoire Code_Matire Code_Section Libell_Matire Volume_horaire Extraction des attributs faibles potentiels de P ? Les attributs non-cls appartenant : Llment E contenant P-ass Ent ou Apd lies E par un lien (1,1)
  • Page 21
  • 21 Validation des correspondances Ajustement des correspondances effectues corriger/supprimer les correspondances incorrectes Complter les correspondance manquantes Choix de la correspondance la plus approprie Amlioration de la correspondance retenue liminer les lments sans correspondant ajouter des mesures calculables valides ajouter des dimensions et des attributs supplmentaires
  • Page 22
  • 22 Mtrique des : Mesures Dimensions Hirarchies Paramtres Calculs pour chaque solution de correspondance Comptent le nombre de mesures, dimensions, hirarchies et paramtres (dun schma en toile) ayant un correspondant dans la source Cas de plusieurs solutions de correspondance Fp 1 : Fp i : Fp n Sol n Sol i Sol 1 Corresp. des mesures Corresp. des dimensions Corresp. des hirarchies Corresp. des mesures Corresp. des dimensions Corresp. des hirarchies Corresp. des mesures Corresp. des dimensions Corresp. des hirarchies Comparer les n solutions de corresp Sol j choisie fait F Faits potentiels associs F Fait Fp j associ F
  • Page 23
  • 23 Gnration des constellations Entre : des toiles valides Sortie : des toiles + des constellations Ide de base : similitude entre schmas multidimensionnels CritreSim(Si,Sj) si p=0 0 si p=n=m 1 si p=1 1/5 si p=n et n=m/2 et n
  • Page 24
  • 24 Algorithme de principe : Calculer MS et son maximum Max Consteller les schmas les plus similaires Mettre jour la matrice MS Ritrer Gnration des constellations (2) Arrt : - Taille(MS) =1, - valeurs de similitude faibles - sur demande. MSS1S1. SiSi SkSk S1S1 - ???? :- ??? SiSi - ?? :- ? SkSk -
  • Page 25
  • 25 Plan Introduction tat de lart Approche propose Architecture fonctionnelle Modules Conclusion et perspectives
  • Page 26
  • 26 Conclusion et perspectives Approche de construction de MD en 3 tapes : Gnration des toiles Correspondance et validation des toiles Gnration des constellations Perspectives Implmentation de la mthode de correspondance avec des sources de donnes relationnelles. Intgration des schmas de MD schma de lED.
  • Page 27
  • Page 28
  • 28 Modles Multidimensionnels Fait : activit analys Dimension : axe danalyse Modle en toile 1 fait central dimensions Modle en constellation ++ faits ayant des dimensions communes Fusion de ++ schmas en toile
  • Page 29
  • 29
  • Page 30
  • 30 ED & MD Entrept de donnes ("data warehouse") lieu de stockage centralis d'un extrait des sources pertinent pour les dcideurs, dat, historis organis selon un modle informatique facilitant la gestion des donnes. Magasin de donnes ("data mart") extrait de l'entrept adapt une classe de dcideurs (ou un usage particulier) organis selon un modle appropri aux outils d'analyse.