Presentation Suite a Power Center

Embed Size (px)

Citation preview

Prsentation de la suite Informatica Power Centerpar DARGES Jean-Sbastien (Accueil)Date de publication : 05/11/2009 Dernire mise jour : 04/12/2009

Ce tutoriel va vous prsenter de faon rapide la suite Informatica PowerCenter le leader du march des ETL.

Prsentation de la suite Informatica Power Center par DARGES Jean-Sbastien (Accueil)

I - Introduction..............................................................................................................................................................3 II - L'architecture Informatica....................................................................................................................................... 3 III - Repository Manager..............................................................................................................................................3 IV - Repository Server Application Console................................................................................................................6 V - Designer.................................................................................................................................................................7 VI - Workflow Manager................................................................................................................................................ 8 VII - Workflow Monitor............................................................................................................................................... 12 VIII - Conclusion........................................................................................................................................................ 13 IX - Remerciements................................................................................................................................................... 13

http://jsdarges.developpez.com/tutoriels/presentation-suite-informatica-power-center/

-2-

Prsentation de la suite Informatica Power Center par DARGES Jean-Sbastien (Accueil)

I - IntroductionInformatica PowerCenter est un ETL (Extract Transform Load) qui permet de centraliser des donnes provenant de sources varies en y appliquant plus ou moins de transformations. Il est effectivement possible d'extraire des donnes de fichiers plats (dlimits, XML, positionals), ou de bases de donnes comme Oracle, IBM DB2, Informix, MSSQL, d'y appliquer des transformations, suivant des rgles mtiers, et de charger le tout dans un entrept de donnes (datawarehouse) ou mme dans des fichiers plats. Ce tutoriel va donc vous prsenter les diffrentes applications faisant partie de la suite Informatica PowerCenter. Une connaissance mme minimale des conceptes ETL suffiront pour une bonne comprhension de cette prsentation.

II - L'architecture InformaticaL'architecture Informatica PowerCenter se prsente de la manire suivante : PowerCenter Repository : l'installation d'Informatica PowerCenter cre des tables dans une base de donnes permettant la gestion des rfrentiels, des utilisateurs, des serveurs... qui seront ainsi accessibles distance pour les applications et outils PowerCenter. PowerCenter Repository Server : permet la gestion des connexions aux rfrentiels depuis les applications clientes et permet ainsi de garantir la cohrence des objets. PowerCenter Client : ce terme dfinit tout simplement les applications clientes disponibles l'installation d'Informatica PowerCenter savoir : Repository Manager : gestion des rfrentiels, des rpertoires propres aux rfrentiels, des utilisateurs, des droits... Repository Server Application console : gestion des connexions, des verrous sur les objets, des logs, des sauvegardes... Designer : application permettant de dvelopper des mappings afin d'extraire, transformer et charger des donnes dans une base de donnes par exemple Workflow Manager : ordonnancement et configuration des mappings Workflow Monitor : suivi de l'excution des workflows Ce tutoriel va prsenter les 5 applications clientes prcdemment cites.

III - Repository Manager

Cette application permet d'accder aux rfrentiels afin de grer les dossiers, les utilisateurs, les droits d'accs, les versions...-3-

http://jsdarges.developpez.com/tutoriels/presentation-suite-informatica-power-center/

Prsentation de la suite Informatica Power Center par DARGES Jean-Sbastien (Accueil)

1 : liste des rfrentiels de travail disponibles. On peut voir ici que j'ai cr un projet PAT en 3 versions : - PAT_DEV : rfrentiel de dveloppement qui permettra de dvelopper de nouveaux mappings - PAT_REC : rfrentiel qui sera disponible pour la phase de recette de mon projet - PAT_PROD : rfrentiel qui sera utilis en production Ainsi les dveloppeurs auront accs au rfrentiel PAT_DEV pour dvelopper de nouvelles volutions, de nouveaux mappings, le rfrentiel PAT_REC permettra aux dveloppeurs, une fois les dveloppements finis, de mettre la disposition des personnes oprant sur la recette de faire des tests sur les dveloppements raliss. Une fois ces tests termins il sera ainsi possible de modifier les mappings ne correspondant pas la demande en DEV puis de les rimporter en recette pour tre enfin chargs en production (PAT_PROD), une fois la recette OK. On aurait pu galement ajouter un autre rfrentiel, par exemple PAT_PERF, pour tester les dveloppements avec un nombre important de donnes pour ne pas gner les autres environnements. 2 : raccourcis de la barre de menus 3 : barre de menus permettant entre autres de : Se connecter un rfrentiel Modifier, supprimer diter un rfrentiel Accder aux diffrentes vues de la fentre Ajouter des dossiers au rfrentiel Grer les versions des dossiers Grer les privilges utilisateurs Analyser le contenu des rfrentiels Importer / exporter un rfrentiel et/ou ses dpendances Accder aux autres applications de la suite PowerCenter

4 : la 4me vue permet d'accder au contenu du rfrentiel afin d'organiser un projet - organisation des dossiers

http://jsdarges.developpez.com/tutoriels/presentation-suite-informatica-power-center/

-4-

Prsentation de la suite Informatica Power Center par DARGES Jean-Sbastien (Accueil)

En se connectant un rfrentiel on peut accder aux dossiers lui appartenant. Ces dossiers constituent des sousespaces de travail ou des versions de ces sous-espaces. Ce qui est pratique pour revenir sur une version antrieure par exemple. On peut, bien sr, affecter des commentaires ces dossiers pour plus de comprhension lors des livraisons ou copies de dossiers. - contenu des dossiers

Une fois un dossier dvelopp, on peut accder son contenu savoir : les sources de donnes les cibles les transformations les mappings les workflows les diffrentes configurations associes

Il est ainsi possible d'avoir une vue dtaille du contenu de chaque dossier et d'accder plus spcifiquement chaque objet.

http://jsdarges.developpez.com/tutoriels/presentation-suite-informatica-power-center/

-5-

Prsentation de la suite Informatica Power Center par DARGES Jean-Sbastien (Accueil)

IV - Repository Server Application Console

Cette application permet d'afficher chaque serveur o est installe la suite PowerCenter ainsi que les informations relatives un rfrentiel telles que : - les connexions courantes telle ou telle application de la suite PowerCenter

- les verrous des objets du rfrentiel (mappings, sources, cibles)

- les logs - les backups planifis - ... Pour simplifier, cette application permet de savoir qui fait quoi sur tel objet un moment donn pour pouvoir librer des ressources si ncessaire.

http://jsdarges.developpez.com/tutoriels/presentation-suite-informatica-power-center/

-6-

Prsentation de la suite Informatica Power Center par DARGES Jean-Sbastien (Accueil)

V - Designer

Le designer sert dfinir les sources de donnes, les cibles, dvelopper les mappings, les transformations, les mapplets et bien d'autres choses

1 : comme toutes les applications de la suite PowerCenter, vous avez gauche l'arborescence des diffrents rfrentiels et dossiers que vous avez crs. Chaque dossier contenant les dfinitions des donnes sources, cibles, mappings 2 : raccourcis pour accder aux applications de la suite PowerCenter 3 : permet d'accder aux dossiers du rfrentiel ouverts ainsi que de montrer / cacher certaines vues. 4 : barre de menus du Designer 5 : raccourcis pour accder aux transformations possibles savoir : Update Strategy Transformation : dfini le comportement de sortie vers une base de donnes (insertion, mise jour...) Expression Transformation : permet entre autres, de faire des calculs, d'affecter de nouvelles valeurs des champs Filter Transformation : permet de filtrer un flux d'entre Aggregator Transformation : permet d'agrger un flux Lookup Transformation : permet de faire un lookup sur une source / cible de donnes Sequence Generator : permet de gnrer une squence de nombres internes Informatica. Cela permet de ne plus passer par une squence Oracle, par exemple, qui ralentirait une insertion en masse. Stored Procedure Transformation : fait appel une procdure externe Custom Transformation : transformation personnalise-7-

http://jsdarges.developpez.com/tutoriels/presentation-suite-informatica-power-center/

Prsentation de la suite Informatica Power Center par DARGES Jean-Sbastien (Accueil)

Joiner Transformation : permet de joindre plusieurs sources de donnes Normalizer Transformation : permet de normaliser un flux Mapplet : fait appel un mappet (sorte de " mapping fonction " pouvant tre utilis dans plusieurs mappings distincts) Router Transformation : permet d'cater un flux d'entre en groupe de donnes afin de les diriger vers d'autres transformation Sorter Transformation : ordonne les colonnes d'un flux de donnes par ordre croissant ou dcroissant Transaction Control Transformation : contrle une transaction Source Qualifier Transformation : spcifie les champs slectionner d'aprs le schma d'une ou plusieurs tables d'une base de donnes XML Source Qualifier Transformation : spcifie les champs utiliser parmis un flux de donnes XML

6 : l'espace de travail o vous pourrez dfinir vos sources / cibles et dvelopper vos mappings. 7 : accs aux diffrents logs et informations relatives au dveloppement 8 : ces 5 icnes sont trs importantes. Ils vous permettront d'accder aux espaces de travail suivants : Source Designer : vous pourrez y dfinir vos sources de donnes (fichier dlimit, positionnel, XML, Cobol, WSDL et base de donnes Oracle, Informix, IBM DB2...) Wharehouse Designer : ici vous pourrez dfinir vos cibles Transformation Developer : permet de dfinir des transformations personnalises Mapplet designer : permet de dvelopper des sortes de mappings pouvant tre utiliss dans plusieurs autres mappings afin de ne pas avoir redvelopper une suite de composants identiques plusieurs mappings. En gros une sorte de fonction. Mapping Designer : c'est ici que vous dvelopperez vos mappings en y ajoutant les sources dfinies dans la vue Source Designer, les cibles dfinies dans Warehouse Designer et d'y apporter des transformations.

VI - Workflow Manager

Le Workflow Manager permet d'organiser l'excution des mappings suivant un ordre prcis. Vous pourrez ainsi excuter vos mappings en parallle.

http://jsdarges.developpez.com/tutoriels/presentation-suite-informatica-power-center/

-8-

Prsentation de la suite Informatica Power Center par DARGES Jean-Sbastien (Accueil)

1 : arborescence du Workflow manager qui vous permet d'accder aux tches, aux sessions, aux worklets et aux workflows 2 : ces icnes permettent d'ajouter / diter des connexions des serveurs locaux ou distants 3 : affiche les vues mise disposition et permet galement de planifier un workflow et de lancer son excution en accdant directement au Workflow Monitor. 4 : barre de menus permettant d'accder tous les raccourcis de l'application (import / export, planificateur, sessions, tches...) 5 : composants pouvant tre dposs sur l'espace de travail du Workflow Manager. On peut ainsi paramtrer une session, une commande externe, un envoi de mail, un chronomtre, un capteur d'erreur... 6 : - Task Developer : permet de crer des tches accomplir dans le workflow - Worklet Designer : permet de dvelopper des worklets. Un worklet est un regroupement de tches / sessions pouvant tre utilis dans plusieurs workflows. - Workflow Designer : permet de dvelopper les workflows proprement parler (l'orchestration des tches, sessions et worklets) 7 : espace de travail du Workflow Manager. Comme on peut le voir sur l'image, un worklfow commence toujours par le composant "Start" ajout par dfaut la cration d'un nouveau workflow. On peut ensuite orchestrer les sessions, worklets et tches comme on le veut, en parallle ou non. 8 : accs aux autres applications de la suite PowerCenter. Si vous double-cliquez sur une session, vous pourrez dfinir les paramtres tels que le nom des fichiers d'entre / sortie, les connexions aux bases de donnes, les fichiers de logs, le fichier d'erreur... Voici les vues disponibles :

http://jsdarges.developpez.com/tutoriels/presentation-suite-informatica-power-center/

-9-

Prsentation de la suite Informatica Power Center par DARGES Jean-Sbastien (Accueil)

General

Properties

http://jsdarges.developpez.com/tutoriels/presentation-suite-informatica-power-center/

- 10 -

Prsentation de la suite Informatica Power Center par DARGES Jean-Sbastien (Accueil)

Config Object

Mapping

http://jsdarges.developpez.com/tutoriels/presentation-suite-informatica-power-center/

- 11 -

Prsentation de la suite Informatica Power Center par DARGES Jean-Sbastien (Accueil)

VII - Workflow Monitor

Le Workflow Monitor permet de visualiser l'excution des workflows. Vous pourrez ainsi lancer un traitement, l'arrter, accder ses proprits pour voir combien de donnes ont t traites. C'est aussi ici que vous pourrez accder aux logs de traitement.

1 : barre de menus o vous retrouverez tous les raccourcis 2 : barre des tches permettant entre autres de changer de vue, de filtrer l'affichage des workflows, d'afficher les proprits des workflows... Si vous cliquez sur le bouton de proprit d'une session voici ce que vous pourrez visualiser : tout d'abord dans l'onglet "Properties" vous pourrez voir les proprits de la session savoir son nom, son type, le serveur d'excution, le dbut du traitement, la fin du traitement, son statut, le message d'erreur (s'il y a lieu)... Dans l'onglet "Transformation statistics" c'est ici que vous verrez combien de donnes ont t traites, combien on t rejetes, combien sont alles dans telle ou telle cible...

3 : barre d'excution des workflows permettant de dmarrer, d'arrter un traitement 4 : affichage en temps rel de l'excution des workflows et de leur tat. Sur l'image ci-dessus vous pouvez voir comment sont lancs les traitements, s'ils sont en cours d'excution (couleur verte avec les secondes dfilantes), s'ils sont en erreur (couleur orange), s'ils ont t dsactivs (couleur rouge), s'ils ont t arrts (couleur jaune) ou s'ils ont t abords (couleur rose fonce). Pour accder aux logs de traitement, il suffit de faire un clic droit sur la session puis de choisir "Get Session log". Les logs du serveur seront alors automatiquement chargs dans un diteur de texte.- 12 -

http://jsdarges.developpez.com/tutoriels/presentation-suite-informatica-power-center/

Prsentation de la suite Informatica Power Center par DARGES Jean-Sbastien (Accueil)

5 : l'excution des workflows peut aussi se visualiser dans l'onglet task view qui affiche uniquement le nom du traitement et son tat. Privilgiez la vue "Gantt Chart" pour avoir une vue d'ensemble et plus dtaille sur l'excution des workflows.

VIII - ConclusionCe tutoriel vous a rapidement prsent la suite Informatica PowerCenter et plus particulirement les applications clientes. Vous pourrez retrouver, dans un prochain tutoriel en cours de rdaction, comment crer votre premier mapping sous Informatica. Je rentrerai alors plus dans les dtails du Designer.

IX - RemerciementsJe remercie jacques_jean et Antoun pour leur relecture et Brnice MAUREL et Fleur-Anne Blain pour leurs conseils et remarques.

http://jsdarges.developpez.com/tutoriels/presentation-suite-informatica-power-center/

- 13 -