Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
Faculté des Sciences et Techniques Fès
Master Systèmes Intelligents et Réseaux
2014/2015
Les entrepôts de données
Compte rendu
TP 2
Réalisé par :
AZDAD NABILA
HAFIDHOU IBRAHIM AHMED SAID
RHAZ YASSINE
SMIRI SAFAE
www.etdsir15.wordpress.com
Encadré par :
Pr L.Lamrini
1
Contenu :
Introduction générale : .............................................................................................................. 2
BIRT(Business Intelligence and Reporting Tool) : .................................................................... 2
SpagoBI : .................................................................................................................................... 5
Jasper Intelligence : ................................................................................................................... 9
Pentaho Reporting: ................................................................................................................. 11
Impressions générales : ........................................................................................................... 16
Conclusion :.............................................................................................................................. 17
Ressources : .............................................................................................................................. 17
2
Introduction générale :
Les logiciels Open Source sont aujourd’hui présents dans presque tous les domaines, tout
utilisateur informatique a déjà été confronté consciemment ou inconsciemment à un
logiciel faisant partie de la communauté Open Source. Le domaine de la Business
Intelligence ne fait pas exception. Il existe une offre importante d’outils dans les domaines
tels que l’ETL (Extraction Transformation Load), le Reporting, l’analyse OLAP, le Data
Mining, les tableaux de bord, ainsi qu’au niveau des activités de planification et
budgétisation.
Et parmi les différents logiciels, nous allons aborder quatre parmi eux dont on va
déterminer les différentes fonctionnalités offerte par ces
logiciels.
BIRT(Business Intelligence and Reporting Tool) :
C’est un outil OS de création de rapports opérationnels ou multidimensionnels de la
communauté Eclipse. Il permet une exploitation plus agréable, plus pratique, plus lisible,
plus présentable des données.
Il faut noter qu’il existe d’autres outils comme Jasper, Pentaho, Business Object, crystal
reports,…, qui permettent de générer facilement des rapports.
Quant à BIRT, il permet non seulement de concevoir des rapports, mais aussi d’ajouter
des graphiques, d’accéder aux données et d’ajouter de la richesse fonctionnelle à travers
le langage de script (SQL).
� Fonctionnalités Etant un outil graphique, BIRT dispose d’une palette permettant de sélectionner
l'élément que nous voulons placer sur notre rapport :
Ensuite, nous avons la possibilité de connecter le
rapport avec une base de données. Ceci nous
permettra d’afficher le résultat d'une requête SQL
comme nous le souhaitons le long de notre de projet.
Pour cela, nous devons ajouter une "Data Sources" qui
permet de nous connecter à une base de données.
3
� Data Source Data Source permet de se connecter à une base de données. Sans cela, le rapport
et ses données resteront statiques.
Il est possible de charger n'importe quel driver SQL (MySQL JDBS…). Pour se connecter à
une base de données, il suffit de donner l'URL vers celle-ci via le driver. Dans l'exemple
ci-dessous, l'URL est notée comme " jdbc:mysql://localhost :3306/test " où " jdbc:mysql
" évoque le type de connexion à la base de données (ici, une connexion java avec
MySQL), " localhost " représente l'adresse (pour nous c’est l'adresse locale), " 3306 " le
port et " test " indique le nom de la base de données. Ensuite il suffit de donner le nom
d'utilisateur et le mot de passe. Il est possible avant de valider de tester la connexion via
le bouton
"Test Connection…".
� Data Set
Un Data Set contient une requête SQL. Cette requête peut être dynamique
(avec paramètre) ou statique. Lorsque nous éditons notre requête via la console du
Data Set, nous avons accès à toutes les tables et champs des Data Source dans la
partie " Query > Available Items ". Ceci permet de faciliter l'écriture de nos requêtes.
Dans l'onglet " Output Column ", nous pouvons voir l'ensemble des colonnes que la
requête renvoie et ainsi, nous pouvons modifier leurs noms en leurs donnant un
alias. L'onglet "Computed column", permet d'ajouter des colonnes calculables via
d'autres colonnes.
Si nous voulons générer des requêtes dynamiques dépendant de variables passées
en paramètre au rapport, il suffit d'ajouter nos paramètres existant dans la partie
"Parameters". Ainsi, lors de l'écriture de la requête, si nous voulons en utiliser un, il
suffit de placer un point d'interrogation à sa place et le Data Set ira le chercher
4
automatiquement. Dans le cas où il y a plusieurs paramètres, le Data Set prend les
entrées dans l'ordre.
1. Par exemple si il y a deux points d'interrogations, le 1er correspond au 1er
paramètre et le 2eme au 2e paramètre.
La console contient un onglet "Filters". Celui-ci donne l'occasion de filtrer nos
champs. Par exemple, si nous récupérons une date, nous pouvons l'encadrer. Ceci
revient à faire une condition dans le " where " de la requête.
La partie "Property Binding" permet d'écrire notre requête en utilisant les
fonctionnalités du JavaScript.
Il est possible de voir un aperçu du résultat avec l'onglet "Preview result".
� Points forts de BIRT
1. Son architecture est à la fois portable et extensible.
2. Environnement graphique.
3. Interface intuitive.
4. La gestion de paramètres est intégrée à BIRT.
5. Publication de plusieurs livres.
6. Support de multiples sources de données dans un même rapport.
7. Communauté très active qui compte sur l’appui des sociétés Actuate et IBM.
8. Composante de prévisualisation des rapports dans Eclipse.
9. Support de sous rapports ainsi que de tableaux croisés.
10. Possibilité de contrôler le formatage en temps d’exécution.
11. Support de l’internationalisation et de la localisation.
12. Support de bibliothèques et gabarits.
5
� Points faibles de BIRT
1. BIRT vise principalement les environnements J2EE
2. La taille de téléchargement de l’exécutable est presque prohibitive pour des
déploiements du côté client.
3. Les utilisateurs doivent être capables de créer des jeux de données en utilisant
des requêtes SQL.
4. Les utilisateurs doivent avoir des connaissances techniques en :
• Connexion aux bases de données.
• Langage Java pour affiner la conception.
• Langage SQL pour construire les jeux de données.
• Langage XML pour comprendre le fichier de conception « rptdesign ».
SpagoBI :
� Présentation :
SpagoBI est une suite décisionnelle développée par la société italienne
Engineering (Engineering Ingegneria Informatica www.eng.it ). Ce projet a été initié en
2005. Elle a comme particularité d'être la seule solution open source 100 % free, une
seule version stable avec 100 % des fonctionnalités disponibles.
SpagoBI est une suite complète couvrant l'ensemble des besoins de Business
Intelligence. Sa force est d'offrir à ses utilisateurs un important panel de solutions
analytiques et aux développeurs, testeurs et administrateurs un large éventail d'outils
dans leur travail quotidien. Afin de couvrir les différents besoins fonctionnels propre au
décisionnel SpagoBI s'appuie sur un ensemble de projet Open Source connexes. Plus
qu’une simple solution agrégative, la suite permet de puissantes synergies notamment
via son modèle comportemental poussé.
� Fonctionnalités :
SpagoBI permet d’exécuter les rapports JasperReports (réalisés avec iReport) et
BIRT. SpagoBI permet également l'analyse de données avec Mondrian/JPivot.
SpagoBI comporte un composant d’aide à la création de requêtes (Query By
Example, QbE) qui permet à l’utilisateur de sélectionner graphiquement les données à
afficher de la base de production (pas obligatoirement d’un entrepôt de données) puis
d’effectuer des tris, groupements, sélections et d’exporter le résultat.
SpagoBI intègre la gestion du cycle de création, tests et validation des documents
décisionnels (rapports, cubes multi-dimensionnels,..). Toutes ces opérations sont
réalisées directement depuis l'interface d'administration.
6
Il est possible de créer des états « brouillons » que seuls les développeurs pourront voir
et tester, sans qu’ils apparaissent dans l’environnement des utilisateurs.
Les différentes versions de chaque état et des fichiers attachés (gabarits, images,...) sont
enregistrées et il est possible
de revenir à une ancienne version à tout moment.
Cette fonctionnalité permet de mettre à jour les documents décisionnels, sans avoir
accès au serveur lui-même et de les tester dans des conditions réelles avant leur mise en
production.
� Composants utilisés :
SpagoBI utilise plusieurs composants décisionnels open source :
• Rapports : JasperReports/iReport, BIRT
• Analyse : Mondrian, JPivot, JPalo
• Data-mining : Weka
• ETL : Talend Open Studio
� Interface utilisateur :
7
La fonctionnalité de création de requêtes SQL (Query By Example) est développée
spécifiquement par SpagoBI, de même que le moteur d’affichage de KPI.
� SpagoBI Studio :
Fin 2009, les équipes de SpagoBI ont livré une version de SpagoBI Studio, disponible
aujourd'hui en version 2.6.5. Il s'agit d'un environnement de développement de rapports
et de paramétrage des différents moteurs disponibles dans SpagoBI.
8
Intégré à Eclipse, le Studio permet de créer un rapport avec BIRT ou JasperReports, puis
de le déployer sur la plateforme web SpagoBI d’un simple clic, quand auparavant il
fallait uploader le fichier généré sur la plateforme web puis créer les listes de valeurs.
Le Studio permet aussi de créer plus simplement des tableaux de bord composites, des
cartes géographiques, des cubes…
C’est indéniablement une brique importante qui vient d’être livrée, qui va
considérablement alléger le travail de création/paramétrage des documents
décisionnels dans SpagoBI.
9
Jasper Intelligence :
Plate-forme Open Source de Business Intelligence permettant de déployer aussi bien des
outils de reporting, d'analyse et d'intégration de données utilisant le langage J2EE.
� Fiche d'identité :
� Fonctionnalités : La couverture des fonctionnalités de restitution est complète car Jasper Intelligence
permet d'utiliser l'intégralité des fonctionnalités de JasperReport et Jpivot/Mondrian. De
plus, outre cette couverture optimale, la planification possible des rapports, la
possibilité de les recevoir par mail, ainsi que celle de les stocker dans un répertoire
référentiel permet un choix total de diffusion d'une part, mais également un historique
et un suivi d'autre part. La gestion des droit d'accès, des profils a également été prise en
compte afin de pouvoir définir certains niveaux de sécurité, mais également de
permettre une personnalisation des interfaces.
Caractéristiques générales de la solution
Projet âgé de 2 ans.
Bonne documentation.
Distribué sous Licence GPL et commerciale.
Communauté
Sponsorisé par JasperSoft, 3 administrateur et 31 développeurs ont
clairement étaient identifiés.
Taille de la communauté et visibilité Internet assez bonne.
Taux de fréquentation difficile à déterminer, pas de fréquentation
propre à la suite mais aux composants.
Niveau d'accessibilité
Interface graphique.
Faible niveau de packaging.
Pas de traduction Française.
OS Indépendant.
Taux d'activité Assez bon.
12 mai 2008
10
La spécificité de cette suite décisionnelle vient principalement du fait que, à contrario
des
Autres solutions existantes, l'interface n'est pas conçue sous forme de portail. En effet,
une application Web a été développée spécifiquement.
Jasper Intelligence comprend également son propre concepteur de Cube OLAP, sous le
nom de JasperWorkbench, que l'on peut considérer comme une surcouche par rapport à
l'édition manuelle des fichiers XML.
Nous pouvons cependant regretter le fait que deux licences existant, l'une GPL et l'autre
commerciale, la solution disponible sous licence Open Source ne comprenant pas
l'intégralité des fonctionnalités disponibles sous licence commerciale.
Cette solution de suite décisionnelle s'avère être assez simple de prise en main, dont
toutes les fonctions principales sont présentes. La navigation somme toute assez basique
se trouve ainsi être assez allégée.
Deux grands inconvénients sont cependant à noter :
• D'une part, l'outil de reporting de BIRT est absent de cette suite, ce qui est assez
dommageable.
• D'autre part, au vu des composants présents, force est de penser que JasperSoft
souhaite mettre en avant ces propres produits au détriment des solutions les plus
pertinentes. Il est donc peu probable que d'autres outils de reporting soient
intégrés à cette solution.
11
Pentaho Reporting :
� Définition :
Pentaho est le leader des applications BI open source. Des milliers d'organisations
internationales se fient à Pentaho pour prendre plus rapidement des décisions
informées qui favoriseront leurs résultats financiers.
Ainsi qu’elle sont des outils de reporting open source pour la création de rapports
relationnels et d’anayse d’une variété de données sources. offre une suite de l’Open
source business intelligence (BI) qui fournissent des produits d’intégration de données,
les services Olap reporting , tableau de bord l’exploration des donnés .
Pentaho BI propose une large gamme de fonctionnalités d'intégration de données et
décisionnelles (BI), notamment ETL, OLAP, requêtes et création de rapports, analyses
interactives, tableaux de bord, Data Mining et une plate-forme BI qui est maintenant la
BI Suite open source la plus populaire dans le monde.
� Les fonctionnalités principales de Pentaho Reporting : � Support de sources de données multiples dans les mêmes rapports o Support de
sous rapports
� Support multi langues o Possibilité de définir des rapports complexes avec un
formatage au pixel près
� Possibilité de contrôler le formatage au moment de l’exécution du rapport
� Large gamme de graphiques à disposition o Production de différents types de
format de sortie (pdf, html,xml,…)
� Support de Pentaho BI Metadata.
� Les composants de Pentaho: Pentaho BI Suite permet de couvrir les domaines principaux d’un projet de Business
Intelligence et ceci au travers de différents logiciels appartenant à Pentaho ou
intégrables dans l’offre de l’éditeur.
Le tableau ci-dessous liste les différents composants par type d’activité :
Type d’activité : Solution Pentaho : Extraction, Transformation, Load Pentaho Data Integraor(anciennement Kettle)
Reporting Standard PentahoReporting(JFreeReport),Jasper
Report,BIRT
Reporting Ad’hoc Pentaho BI’s Metadata, Pentaho Reporting
Analyse OLAP Pentaho Analysis,Excel addins
Tableau de bord Pentaho Dashboard
Data Mining Weka
12
� les caractéristiques de pentaho : Une couverture globale des fonctionnalités de la Business Intelligence :
� ETL (intégration de données).
� Reporting.
� tableaux de bord ("Dashboards").
� analyse ad hoc (requêtes à la demande)
� analyse multidimensionnelle (OLAP)
Pentaho permet d'adresser deux typologies d'utilisateurs :
� Les «one-clic users », utilisateurs de base, consommateurs
d'indicateurs prédéfinis. � Les utilisateurs avancés, qui ont besoin d'outils d'analyse et
d'exploration avancés .
13
� Pentaho Report Designer : C’est l’outil nécessaire et suffisant pour concevoir, publier et modifier des rapports
existants, ceci grâce à un mécanisme de publication/récupération des fichiers *.prpt
vers/depuis le serveur (seul le « publish » était possible en v3.0)
PRD possède un plugin qui permet d'effectuer des rapports à la manière d'Ireport.
Contrairement aux autres bases (Cassandra et Hbase), il n’est pas nécessaire d’utiliser
au préalable l'ETL PDI .
Pentaho-Report-Designer est un outil simple à manipuler, bien intégré à la suite
décisionnelle Pentaho pour la gestion des paramètres ou la publication sur la plateforme
web.
� Les bénéfices de Pentaho-Report-Designer Avec le Pentaho-Report-Designer, On peut créer un rapport dans un environnement
graphique. Les rapports sont généralement publiés à la plate-forme Pentaho, qui vous
permet de gérer, d'exécuter et de planifier les rapports que vous avez créés. Si vous êtes
nouveau à Pentaho-rapports, vous voulez probablement commencer avec le Pentaho
Report Designer.
14
En outre, les rapports sont exécutés par le Pentaho rapports classique moteur. Pentaho
rapports englobe plus de deux douzaines de projets de logiciels qui facilitent la création
et la publication de rapports d'activité orientées données.
Pentaho a l’avantage d’être performant, simple d’utilisation, entièrement open source.
� L'alternative BI intelligente et sécurisée: Le modèle open source de Pentaho élimine le coût élevé des licences logicielles et réduit
considérablement le coût total de possession des solutions BI d'entreprise par rapport
aux solutions BI propriétaires traditionnelles.
Le décisionnel à bas prix avec assistance complète:
Pour le prix d'un abonnement annuel de la version sur site via l'abonnement mensuel de
la version à la demande, les produits Pentaho Enterprise Edition sont assortis d'une
assistance technique complète, d'une maintenance logicielle, de fonctionnalités
améliorées et bien plus. Les produits Pentaho Enterprise Edition aident les entreprises
à garantir le succès de leurs projets BI et à limiter les risques tout en réduisant les délais,
les coûts et les ressources.
Facile à déployer, facile à maintenir, facile à utiliser: L'architecture de la technologie Pentaho a été étudiée pour offrir une plate-forme de BI
moderne et entièrement intégrée, articulée sur les normes ouvertes. Autrement dit, elle
s'intègre facilement à toutes les infrastructures IT, prêtes à l'emploi ou intégrées dans
une application personnalisée.
Pour les utilisateurs professionnels, une interface Web simplifiée offre un accès
centralisé à toutes les informations de BI et permet de créer de nouveaux rapports, des
vues d'analyses et des tableaux de bord en deux clics.
� Avantages du Report Designer Pentaho :
• PRD permet de développer des rapports complexes et, en association avec la
plateforme Pentaho, de les publier directement sur le serveur décisionnel. Au moment
où nous écrivons ces lignes.
• Pentaho Report Designer est un outil simple à manipuler, bien intégré à la suite
décisionnelle Pentaho pour la gestion des paramètres ou la publication sur la plateforme
web. Il permet la génération de rapports aux formats PDF, HTML, XML, CSV, RTF, XLS et
supporte les sources de données multiples.
• Convivial.
• Visuel des documents de meilleure qualité.
15
• Souple et ne nécessite aucune programmation.
• Représente une solution la plus simple et la plus complète actuellement pour la
conception de rapports dans OpenERP.
• Pentaho est facilement le plus visuellement attrayante des trois outils de
conception. Pentaho a clairement mis davantage l'accent sur l'expérience utilisateur,
la facilité d'utilisation, et l'aspect que les autres projets. Lorsque vous utilisez les
outils Pentaho, ils se sentent tout simplement bien.
• Pentaho Designer a le meilleur assistant intégré de conception de
rapports.
• Avec Pentaho, on peut créer des rapports "de rangée-bandes", avec des couleurs en
alternance pour chaque ligne du rapport, en cochant simplement une case. Beaucoup plus facile que soit BIRT ou Jasper.
• Pentaho n’exige pas que les rapports soient compilées avant d'exécuter
(contrairement Jasper mais comme BIRT). • Pentaho rapports sont au format XML, et donc peuvent être efficacement mis sous
contrôle de révision. • Excel-comme la langue d'expression de Pentaho est plus facile pour les non-
programmeurs de comprendre où Jaspersoft et BIRT expressions exigent la
connaissance de Javascript.
� Inconvénients :
• Connaissance du SQL pour les non-programmeurs .
• Ne s'adapte pas pour des rapports complexes (Comme openOffice/LibreOffice)
• Tableaux croisés sont encore «expérimental» et ont été depuis maintenant cinq
ans. Pentaho semble avoir consacré un temps considérable à la composante
croisé, mais il ne est pas encore entièrement fonctionnel, qui pourrait se avérer
frustrant si vous utilisez beaucoup d'évaluations de tableau croisé. Vous devez
activer les fonctionnalités expérimentales (Edition -> Préférences -> Général)
pour activer la fonction dans le rapport Pentaho Designer.
• Il est difficile de créer des graphiques (voir la section précédente). Le processus a
des problèmes d'utilisabilité et Pentaho Report Designer n’offre pas autant de
leviers pour personnaliser le contenu du rapport regardé et de comportement
que les autres outils.
• Pentaho exige que la requête de rapport faire le «gros» pour le regroupement, le
filtrage, le tri et agrégats. Si les données ne arrive pas dans le rapport de la bonne
façon, Pentaho a moins de capacité à manipuler davantage les données de BIRT.
16
Le développeur de rapport est responsable de s’assurer que les groupes dans la
conception de rapport sont dans le même ordre que les groupes de données
renvoyées par la requête.
• Pentaho ne supporte pas les "mises en page de journaux" avec plusieurs colonnes
(BIRT ne est pas, Jasper fait), et ne supporte pas encore le texte vertical.
Impressions générales :
Parmi les différents logiciels cités ci_dessus ,nous avons trouvé Pentaho être le
plus facile à apprendre pour la création de la liste des rapports de base et regroupées
inscription rapports avec agrégations. Son interface ne était pas trop encombré de
fonctionnalité sophistiquée, moins couramment utilisé, et l'outil est facile à apprendre et
bien réalisée. En bref, l'interface utilisateur est attrayant et la fonctionnalité est
judicieusement aménagé.
L'objectif de Pentaho est de fournir une solution complète pour l'intégration de
données et de Business Analytics. Anisi qu’elle représente une solution d’informatique
décisionnelle open source entièrement développée en Java. Elle porte sur toute la chaîne
décisionnelle et utilise différents outils et composants :
� Pour la collecte et l’intégration : les outils d’ETL Kettle ou Mondaria., � Pour la diffusion : un serveur d’application JBoss ou TOMCAT. � Pour la présentation : JFreeReport, BIRT ou encore JasperReport.
Conclusion :
Pour conclure, la maturité des outils Open Source dans le domaine de la Business
Intelligence permet de les considérer comme une réelle alternative aux solutions
commerciales. Pentaho a montré l'amélioration constante dans son outil de reporting
open source.
Pentaho est un excellent choix pour les rapports qui sont de simple à modérer la
complexité et ne nécessitent pas de tableaux croisés ou des tableaux. Nous croyons
toujours que BIRT et Jaspersoft sont meilleurs pour des rapports plus
complexes. Pentaho pourrait aussi être un bon choix si les rapports imprimés sont une
exigence importante.
17
Ressources :
http://diethardsteiner.blogspot.com/2009/11/using-parameters-in-pentaho-report.html
http://wiki.pentaho.com/display/Reporting/Pentaho+Reporting+Community+Documentation
http://files.meetup.com/4625132/20130313_OpenERPMeetup_conception%20de%20rapports.pdf
http://www-igm.univ-mlv.fr/~dr/XPOSE2006/DELTIL_PEREIRA/pentaho.html
http://www.predictiveanalyticstoday.com/open-source-free-business-intelligence-solutions/
http://www.osbi.fr/pentaho-3-5-ga/
http://www.innoventsolutions.com/pentaho-review.html#designer
http://decisionnel-open-source.smile.fr/Les-suites-decisionnelles
http://www.predictiveanalyticstoday.com/open-source-free-business-intelligence-solutions/