Éditions Informatica Big Data Management
Bénéfices• Commercialisation plus rapide
des produits et services innovants et amélioration des opérations métiers
• Réduction du coût de gestion des Big Data et capacité à gérer la complexité accrue des données et l'explosion des volumes de données
• Amélioration des performances et réduction des coûts via l'adoption de Hadoop sur l'ensemble des projets
• Réduction des risques via un logiciel éprouvé d'intégration des données qui masque la complexité des nouvelles technologies et protège les données sensibles
Transformez les pétaoctets en bénéficesAlors que le rythme des activités s'accélère et que les entreprises font face à une pression
considérable de la part de leurs concurrents qui les oblige à transformer leurs activités, elles ont
aujourd'hui l'opportunité de moderniser et d'optimiser leurs architectures de données et de faire
de leurs données des ressources stratégiques pour leurs prises de décisions organisationnelles.
Les entreprises utilisent les données pour se démarquer et prospérer. Les données sont en effet
des mines de renseignements qui leur permettent d'accroître leur rentabilité, de découvrir
de nouvelles opportunités, d'accélérer la livraison de leurs produits et services et d'offrir à leurs
clients une expérience d'une qualité exceptionnelle. Les données peuvent également augmenter
l'efficacité opérationnelle et atténuer les risques associés à la fraude, à la criminalité, aux temps
d'arrêt système ou aux atteintes à la sécurité.
Informatica Big Data Management est la solution de gestion de données du marché la plus complète
et la première dont l'architecture est conçue pour ingérer, traiter, nettoyer, gouverner et sécuriser
les Big Data à grande échelle. La solution Informatica conjugue intégration, qualité, gouvernance
et sécurité des Big Data sous la forme d'une solution intégrée unique.
Intégration dynamique et optimisée des Big Data
Informatica Big Data Management offre une ingestion haut débit des données et un traitement
à grande échelle, afin que les analystes métiers puissent prendre des décisions éclairées à l'aide
d'outils d'analyse de nouvelle génération. Des centaines de connecteurs prédéfinis hautement
performants, de transformations d'intégration de données et d'analyseurs permettent d'ingérer
et de traiter rapidement quasiment tous types de données sur les plates-formes Big Data, telles
que Hadoop, NoSQL et les appliances MPP. Un paramétrage et des mappings dynamiques
favorisent l'automatisation de la programmation des processus d'intégration de données.
La génération automatique de classes complètes de flux de données lors de l'exécution, basée sur
des schémas de conception n'utilisant qu'une poignée de modèles, augmente considérablement
la productivité et la facilité de maintenance. Le support des schémas dynamiques permet de traiter
des formats de données flexibles. Les moteurs optimisés offrent des performances et une utilisation
des ressources maximales pour une intégration de données à grande échelle. Par exemple, pour
optimiser les charges de travail des Big Data, Informatica utilise MapReduce et le nouveau moteur
Blaze d'Informatica via YARN.
1
Fiche technique
Gouvernance et qualité des Big Data de bout en bout
La gouvernance et la qualité des Big Data de bout en bout signifient que les utilisateurs métiers
et informatiques peuvent avoir confiance dans les données qu'ils utilisent. Informatica Big Data
Management offre une expérience intuitive non technique à ses utilisateurs : les experts en données,
les analystes de données et l'entreprise peuvent donc collaborer efficacement : profiling, découverte
et envoi d'alertes – Le profiling et la découverte des données, notamment le profiling de règle métier,
mettent en lumière les problèmes et anomalies de qualité des données. Il est également facile
de créer des règles de surveillance et des alertes pour suivre et signaler les problèmes de qualité.
Les règles de qualité des données et la validation des adresses se déploient dans Hadoop pour
nettoyer et préparer les données à grande échelle et assurer qu'elles sont adaptées à leur finalité.
La Cartographie de données en temps réel, catalogue de métadonnées universel et graphe de
connaissances, vous permet de rechercher, de découvrir et de comprendre les données d'entreprise.
Cette cartographie utilise Spark pour créer rapidement des graphes de connaissances à grande
échelle. La traçabilité des données de bout en bout au-delà de Hadoop répond aux exigences
de conformité et permet une analyse efficace des causes et impacts de la qualité des données.
Sécurité des Big Data axée sur les risques
La sécurité des Big Data axée sur les risques analyse toutes les données afin de détecter et d'agir sur
les risques et les vulnérabilités clés. Cela nécessite une vue à 360 degrés des données sensibles, ainsi
qu'une analyse des risques et une protection des données à risque basée sur des règles. La sécurité
des Big Data agit ensuite pour anonymiser les informations contrôlées par des règles d'entreprise
et des réglementations sectorielles. Informatica Big Data Management offre une option de masking
permanent et non intrusif des données qui protège les données sensibles dans les environnements de
production et de développement Hadoop et contribue à minimiser les risques d'atteinte à la sécurité.
« Nous plaçons les clients au coeur de tout ce que nous faisons
et Western Union a cette incroyable opportunité de pouvoir mettre à profit
toute la puissance d'analyse des données pour identifier les tendances qui
l'aideront à façonner son activité et à améliorer l'expérience de ses clients.
Nous sommes impatients de continuer notre travail avec Informatica car
il nous permet de révéler le véritable potentiel de notre activité et de notre
base clients à l'échelle globale. »
— Sanjay Saraf, Senior Vice President et Chief Technology Officer,
Western Union
Éditions Informatica Big Data Management 2
Principales fonctionnalitésIntégration de données (ETL) dans Hadoop
Cette solution contient une bibliothèque étendue de capacités prédéfinies de transformation
d'intégration des données. Ces capacités s'exécutent en natif sur Hadoop, ce qui vous permet de traiter
tous les types de données, à toute échelle : des téraoctets aux pétaoctets. Votre équipe informatique
peut développer rapidement des flux de données dans Hadoop grâce à un environnement de
développement visuel qui offre une productivité jusqu'à cinq fois supérieure à celle du codage manuel.
Schémas dynamiques et modèles de mappings
Informatica Big Data Management vous permet de générer des centaines de flux de données
d'exécution à l'aide de quelques schémas de conception, via les modèles de mappings. Ces mappings
se paramètrent facilement pour gérer les schémas dynamiques tels que les fichiers journaux
de machine et du Web, fréquents dans le cadre des projets de Big Data. Vous pouvez donc élaborer
rapidement des flux de donnés faciles à gérer et résistants face aux changements de schémas.
Profilage des données sur Hadoop
Vous pouvez effectuer le profilage des données dans Hadoop à l'aide de l'outil de développement
Informatica et d'un outil d'analyse reposant sur un navigateur. De cette manière, les développeurs,
analystes et experts peuvent facilement comprendre les données, identifier plus tôt les problèmes
de qualité des données, collaborer sur les spécifications de flux de données et valider les
transformations de mapping et les logiques de règles.
Informatica Big Data Management offre un environnement de développement visuel avec transformations prédéfinies qui favorise la réutilisation pour une productivité jusqu'à cinq fois supérieure au codage manuel.
Éditions Informatica Big Data Management 3
Qualité des données sur Hadoop
Nettoyez, rapprochez et normalisez des données de tout type, quel que soit leur volume, en natif
sur Hadoop et obtenez des données fiables et sûres. Utilisez un ensemble complet de règles
de qualité des données prédéfinies ou créez votre propre ensemble à l'aide de l'environnement
de développement visuel. Exécutez la validation des adresses pour analyser, nettoyer, normaliser
et enrichir les données d'adresses à l'échelle globale.
Analyse des données complexes sur Hadoop
Informatica Big Data Management simplifie l'accès et l'analyse des données complexes, multi-
structurées, non structurées et régies par les normes du secteur, telles que les données de journaux
Web, JSON, XML et issues d'objets connectés. Des analyseurs prédéfinis pour les données de marché
et les normes du secteur telles que SWIFT, ACORD, HL7, HIPAA et EDI sont également disponibles.
Catalogue de métadonnées universel
Les experts en données et analystes de données disposent à présent d'une vision à 360° de leurs
données grâce à la Cartographie de données en temps réel. Il s'agit d'un catalogue de métadonnées
universel et d'un graphe de connaissances qui permettent de rechercher, de découvrir et de comprendre
les données d'entreprise. Cette Cartographie utilise Spark pour créer rapidement des graphes
de connaissances à grande échelle.
Traçabilité des données de bout en bout
Les analystes de données et les utilisateurs métiers peuvent afficher une vue complète de la traçabilité
des données de bout en bout, ce qui est un gage de confiance et de conformité réglementaire.
Cette traçabilité des données visuelle contient un historique détaillé de l'ensemble des mouvements
et transformations des données (dans Hadoop et les systèmes traditionnels), des applications cibles
jusqu'aux systèmes sources d'origine. La recherche et la collaboration métier/informatique sont
améliorées par un glossaire métier de termes communs portant sur les objets de données et leur
traçabilité.
Masking permanent des données sur Hadoop
L'option de masking permanent des données améliore la sécurité et la confidentialité des données
en rendant anonymes et non identifiables les données sensibles. Les données obscurcies conservent
leur contexte et leur intégrité référentielle persiste, de sorte que les données masquées peuvent être
utilisées dans des environnements de test, d'analyse ou de support.
Accès universel aux données
Votre équipe informatique peut accéder à tous les types de Big Data de transaction, notamment
RDBMS, OLTP, OLAP, ERP, CRM, mainframe, Cloud, etc. Vous pouvez également accéder aux données
suivantes : réseaux sociaux, fichiers journaux, données de capteurs de machines, Hadoop, formats
NoSQL, documents, e-mails et autres types de données non structurées ou multi-structurées
et magasins de données.
Éditions Informatica Big Data Management 4
Ingestion et extraction haute vitesse des données
Vous pouvez accéder aux Big Data, les charger, les transformer et les extraire entre les systèmes
sources et cibles, ou directement dans Hadoop, les magasins de données NoSQL ou dans votre
data warehouse. La connectivité hautes performances par le biais d'API natives vers les systèmes
source et cible avec traitement en parallèle assure une ingestion et une extraction haute vitesse
des données.
Découverte des données dans Hadoop
Automatisez la découverte des domaines de données et des relations entre les données dans Hadoop.
Découvrez par exemple des ensembles de données ou des données sensibles en lien avec les clients
et les produits, comme les numéros de sécurité sociale et de carte crédit, qui nécessitent d'être
masquées à des fins de conformité.
Traitement du langage naturel dans Hadoop
À l'aide d'une liste de mots ou d'expressions clés et en utilisant l'analyse de texte et la reconnaissance
d'entités nommées, vous pouvez facilement extraire et classifier vos entités clients et produits à partir
de données non structurées, telles que les e-mails, les données de réseaux sociaux, les demandes
d'indemnisation, les fiches du service client et les documents. Vous pouvez enrichir les données
de référence avec des analyses du comportement des clients ou des informations produits, telles
que des tarifs de la concurrence.
Conception unique déploiement accéléré
L'écosystème Hadoop évolue rapidement : la communauté open source enchaîne les innovations sans
temps mort. Informatica Big Data Management s'appuie sur la structure Hadoop open source
et préserve toute la logique de transformation de vos pipelines de données. Les développeurs peuvent
donc élaborer une fois pour toutes une conception unique, sans connaissances spécifiques des
concepts et langages Hadoop, et déployer facilement des pipelines de données sans devoir réintégrer
à chaque fois les changements Hadoop. Résultat : les innovations Hadoop sont implémentées
plus rapidement avec un impact et un risque moindres sur les systèmes de production.
Éditions Informatica Big Data Management 5
Comparez ces éditions d'Informatica Big Data Management pour sélectionner celle qui vous convient.
Entreprise Advanced
Connectivité avec les bases de données, Hadoop, les réseaux sociaux et les applications
● ●
Ingestion très rapide de données ● ●
Intégration de données dans Hadoop ● ●
Optimisation Pushdown des bases de données ● ●
Profilage des données et découverte des domaines sur Hadoop
● ●
Analyse des données complexes ● ●
Analyse du texte - Reconnaissance d'entités nommées
● ●
Schémas dynamiques et modèles de mappings ● ●
Catalogue de métadonnées universel ● ●
Traçabilité des données de bout en bout ● ●
Qualité des données sur Hadoop ●
Validation des adresses sur Hadoop ●
Glossaire métierLimité aux
environnements Big Data
100 utilisateurs nominatifs analystes de données Informatica
● ●
Support (inclus avec la licence d'abonnement uniquement)
8 h/24 et 5 j/7 24 h/24 et 7 j/7
Éditions Informatica Big Data Management 6
IN06_1012_02194Siège mondial, 2100 Seaport Blvd., Redwood City, CA 94063, États-Unis Téléphone : +33 1 42 04 89 00 (France) Numéro gratuit aux États-Unis : 1.800.653.3871www.informatica.com/fr www.informatica.com linkedin.com/company/informatica twitter.com/InformaticaFr© Copyright Informatica LLC 2018. Tous droits réservés. Informatica® et Put potential to work™ sont des marques ou des marques déposées d'Informatica Corporation aux États-Unis et dans d'autres pays. Tous les autres noms de sociétés et de produits peuvent avoir fait l'objet d'un dépôt de marque.
À propos d'Informatica
Informatica est un éditeur de logiciels indépendant de premier plan. Sa mission : soutenir une innovation centrée sur la transformation afin d'appréhender l'avenir de l'univers des données. Les sociétés du monde entier font confiance à Informatica pour exploiter le potentiel de leurs informations et répondre à leurs principaux impératifs métiers. Plus de 5 800 entreprises font confiance à Informatica pour tirer pleinement profit de leurs ressources en matière d'informations hébergées sur site, dans le Cloud et sur Internet, y compris sur les réseaux sociaux.
Bénéfices clésCommercialisation plus rapide des produits et services innovants
Grâce à Informatica Big Data Management, vos experts en données et analystes de données
peuvent se focaliser sur de nouvelles informations exploitables — non sur l'intégration de données —
utiles à votre entreprise pour développer des produits et services innovants. Cette solution fournit
un environnement de développement d'intégration de données permettant l'importation des mappings
PowerCenter® existants ainsi que la réutilisation des compétences Informatica. Elle fournit un
environnement de développement visuel convivial ainsi qu'un modèle de processus de développement
réutilisable. Elle étend l'intégration de données et la qualité des données aux données de réseaux
sociaux, journaux Web, données de capteurs, documents, e-mails et autres données multi-structurées
ou non structurées, sans codage manuel. Par conséquent, cette solution augmente considérablement
la productivité de votre équipe informatique et accélère sensiblement le déploiement.
Réduction du coût des projets de Big Data
Informatica Big Data Management réduit le coût des Big Data. Vous pouvez télécharger des données
à partir de votre warehouse et de vos systèmes sources et les traiter sur du matériel meilleur
marché. En passant du codage manuel aux outils éprouvés de productivité d'intégration de données,
vous pouvez multiplier votre productivité par cinq. Vous pouvez concevoir vos flux de données une
seule fois et les déployer partout, ce qui vous permet de réduire les coûts en optimisant l'utilisation
du traitement de données à la fois sur les platesformes de données existantes et les technologies
en pleine évolution, telles que Hadoop.
Adoption de Hadoop à travers l'entreprise
Informatica Big Data Management permet une plus large adoption de Hadoop sur une multitude
de projets. Pas besoin de procéder à un codage manuel en Java MapReduce, Python ou langages
de script pour profiter des avantages de Hadoop en termes de performances et de coûts — il existe
déjà plus de 100 000 développeurs formés par Informatica et disponibles à travers le monde pour
travailler sur vos projets Big Data. Cette solution est plus facile à administrer et peut prendre en charge
plusieurs projets Big Data à la fois. Elle offre en outre les garanties suivantes : performances optimales
de bout en bout, fiabilité grâce à la traçabilité des données de bout en bout, sécurité pour minimiser les
risques et accélération des déploiements.
Réduction des risques associés à l'adoption de nouvelles technologies
Informatica Big Data Management minimise les risques associés aux toutes dernières technologies
telles que Hadoop. En effet, votre service informatique investit dans un logiciel à la fois compatible
avec les technologies émergentes et les infrastructures de données traditionnelles. Cette solution
minimise l'impact des schémas dynamiques et les risques connexes grâce à la possibilité de protéger
les données sensibles. Elle offre une approche unique et cohérente de l'intégration pour tous les types
de données. Alors que les technologies les plus récentes telles que Hadoop continuent d'évoluer,
Informatica Big Data Management vous garantit de pouvoir facilement adopter les innovations sans
avoir à redéfinir vos mappings et flux de données.