Click here to load reader
Upload
lythien
View
220
Download
0
Embed Size (px)
Citation preview
Dell | Solution Apache Hadoop de Cloudera, accélérée par IntelProfitez d’outils matériels, de logiciels et de services optimisés pour les entreprises avec la solution Dell | Apache Hadoop de Cloudera
Une solution simplifiée pour résoudre les problèmes des entreprises
Tout ce dont vous avez besoin
Lorsque vous adoptez la solution Dell™ | Apache™ Hadoop® de Cloudera® accélérée par Intel, vous pouvez compter sur les performances du produit Cloudera’s Distribution including Apache® Hadoop® (distribution Hadoop de Cloudera, ou CDH), l’une des principales distributions mondiales de Hadoop dans les environnements commerciaux et non commerciaux.
Le produit CDH offre un moyen simple d’utiliser Apache Hadoop pour résoudre les problèmes de production des entreprises. Idéal pour les entreprises recherchant une solution Hadoop stable et éprouvée sans dépendance envers un fournisseur, CDH relie les informations des organisations utilisant Hadoop au niveau de la production et le flux constant d’innovations en provenance de la communauté Apache.
Bien documenté et prêt à l’emploi, le produit CDH est composé d’une pile Hadoop open source 100 % Apache, ainsi que de l’ensemble des composants logiciels open source nécessaire pour utiliser Hadoop, qui peuvent être activés selon les besoins. CDH a été rigoureusement testé et certifié pour s’intégrer à une vaste gamme de systèmes d’exploitation et d’outils matériels, de bases de données et d’entrepôts de données. Le produit fonctionne également avec de nombreux systèmes d’informatique décisionnelle et d’extraction, transformation et chargement (ETL). Cette large compatibilité permet à votre entreprise de tirer profit de la technologie Hadoop à partir des outils et ressources existants.
La solution Dell | Apache Hadoop de Cloudera accélérée par Intel vous offre tout ce dont vous avez besoin pour relever les défis relatifs aux Big Data, notamment des logiciels, du matériel, des services, une architecture de référence et un guide de déploiement. Commencez par les serveurs de la série PowerEdge™ R730xd et les solutions Dell Networking (composants éprouvés dans le cadre du déploiement des Big Data et du Cloud), puis choisissez Cloudera Enterprise ou les solutions CDH d’Apache Hadoop.
Les services Dell simplifient la mise en route. Les options incluent notamment la conception de solutions personnalisées, le déploiement matériel et logiciel, la prise en charge continue, ainsi que la formation. Cela vous offre la garantie que votre solution est prise en charge par une assistance experte pour le matériel et les logiciels, pouvant être personnalisée selon vos besoins particuliers.
Simplicité et certitudeEn raison de la croissance exponentielle des volumes de données et de leur complexité, les entreprises de toute taille adoptent la plateforme open source Apache Hadoop pour stocker, traiter et utiliser efficacement toutes leurs données. La technologie Hadoop présente de nombreux avantages, notamment en termes de flexibilité et d’économie. Mais à l’instar de toutes les technologies open source, son implémentation dans un environnement de production présente un ensemble unique de difficultés et de questions.
Comment garantir la stabilité du système ? De quels composants de la plateforme open source avez-vous besoin et comment pouvez-vous être sûr qu’ils s’intégreront correctement à votre environnement ? La technologie est-elle bien documentée ? Qui appeler en cas de problème ? L’incertitude qui découle de ces questions incite certaines entreprises à investir dans des solutions propriétaires, malgré leur prix plus élevé et le risque de dépendance vis-à-vis du fournisseur.
Cloudera a créé sa propre distribution de la technologie Hadoop dans un seul et unique but : supprimer l’incertitude et les barrières qui dissuadent parfois les entreprises à déployer une solution Hadoop open source en production.
La voie du succès avec Hadoop, en toute simplicité• Bénéficiez de tous les composants requis pour une
utilisation en production ; implémentez-les selon vos besoins.
• Balayez toute incertitude avec une distribution entièrement prise en charge.
• Vos investissements existants sont protégés et le travail d’intégration est fait à votre place.
Une technologie Hadoop stable et fiable, sans dépendance vis-à-vis d’un fournisseur• Tirez parti d’une technologie Hadoop 100 % Apache,
renforcée pour les environnements de production.• Faites davantage confiance à une distribution
rigoureusement testée par des ingénieurs experts.• Passez à des dizaines de milliers de nœuds dans des
environnements d’entreprise.
Une solution tournée vers la communauté• Intégrez uniquement des composants open source :
pas de logiciel dérivé ni de bases propriétaires.• Profitez d’un accès à un flux continu d’innovations en
provenance de la communauté Hadoop.• Tirez parti d’une distribution éprouvée et téléchargeable
gratuitement.
La solution Dell | Apache Hadoop de Cloudera propose :
Un ensemble complet de tous les composants nécessaires pour utiliser la technologie Apache Hadoop en production
CDH contient tout ce dont vous avez besoin pour une implémentation réussie, et l’ensemble de la solution est entièrement documenté. En facilitant le développement de votre pile Hadoop, la solution CDH vous permet de résoudre simplement de vrais problèmes d’entreprise.
Une technologie Hadoop 100 % Apache, renforcée pour les environnements de production
Avec CDH, Cloudera maintient son engagement à défendre la norme open source. Depuis le cœur du système de fichiers jusqu’à l’interface utilisateur, le produit CDH ne contient aucune dérivation de code ou base propriétaire, et son téléchargement est gratuit. L’ensemble de la distribution a subi des tests de qualité par Cloudera, et son évolutivité jusqu’à des dizaines de milliers de nœuds avec diverses charges de travail en environnement d’entreprise a été prouvée. CDH est une solution Hadoop stable et fiable sans dépendance vis-à-vis d’un fournisseur.
Le cadre de certification « Cloudera Ready »
CDH a été testé et certifié pour s’intégrer à une grande variété d’outils matériels, de systèmes d’exploitation et d’outils d’analyse de données, ce qui contribue à réduire les risques, à simplifier le déploiement et à protéger vos investissements dans les solutions existantes d’analyse de données et d’informatique décisionnelle.
Composants de la solution CDH
Apache Hadoop Stockage et traitement distribués fiables et évolutifs
DataFu Bibliothèque dotée de fonctions définies par l’utilisateur pour le data mining et les tâches statistiques
Apache Flume Service distribué permettant de collecter et de regrouper des données de journal et d’événement
Apache HBase Base de données Hadoop pour un accès en lecture/écriture aléatoire en temps réel
Apache Hive Interface de bureau basé sur un navigateur permettant d’interagir avec la solution Hadoop
Hue Langage de haut niveau servant dans les programmes d’analyses de données
Apache Mahout™ Outil permettant de créer des bibliothèques évolutives d’apprentissage machine
Apache MRv2 Architecture logicielle MapReduce pour traiter de vastes ensembles de données
Apache Oozie Moteur de flux de travail basé sur un serveur pour les activités Hadoop
Apache Pig Langage de type SQL et référentiel de métadonnées
Apache Spark Moteur de traitement de données rapide et général prenant en charge le flux cyclique et le traitement des données en mémoire
Apache Squoop Transfère des données en masse entre Apache Hadoop et les banques de données structurées
Apache Whirr Bibliothèque permettant d’exécuter la solution Hadoop sur le Cloud
Apache Zookeeper Gestionnaire de ressources pour Hadoop : la nouvelle génération d’architecture MapReduce
Apache Flume Service distribué permettant de collecter et de regrouper des données de journal et d’événement
Détails de la distribution CDH 5.4
Versions des composants
Apache Hadoop 2.6 v2.0.0+552
DataFu v0.0.4+9
Apache Flume v1.2.0+122Apache HBase 1.0 v0.92.1+160Apache Hive 1.1 0.9.0+155
Hue v2.1.0+221Apache Mahout™ v0.7+8Apache MRv2 v2.3.0+1265Apache Oozie v3.2.0+126Apache Pig v0.10.0+58
Apache Spark 1.3 v0.9.0
Apache Squoop 2.0 v1.4.1+54
Apache Whirr v0.8.0+18Apache YARN v3.4.3+28Cloudera Impala 2.2
Apache Kafka 13
Apache Sentry 1.5.0
Cloudera Search 1.0.0+0
Versions de systèmes d’exploitation pris en charge
Red Hat RHEL 6.6
CentOS CentOS 6.6
Ubuntu Lucid, Precise
SUSE SUSE 11 SP1
Infrastructures de conception et plateformes de Cloud prises en charge
Infrastructure de conception Apache Maven
Plateformes de Cloud
Rackspace Softlayer
Amazon AWS Microsoft Azure
Amazon EC2 OpenStack
Pour en savoir plus, consultez les sites : DellBigData.com et www.Dell.com/Hadoop
Intel et le logo Intel sont des marques d’Intel Corporation aux États-Unis et/ou dans d’autres pays.
© 2015 Dell Inc. Tous droits réservés. Dell, le logo DELL, le badge DELL et PowerEdge sont des marques de Dell Inc. D’autres marques et noms de produits peuvent apparaître dans le présent document en référence aux entités revendiquant la propriété de ces marques et noms ou à leurs produits. Dell renonce à tout droit de propriété sur les marques et noms de produits autres que les siens. Ce document est fourni à titre informatif uniquement. Dell se réserve le droit de modifier sans préavis les produits décrits dans le présent document. Le contenu est fourni en l’état, sans garantie expresse ni implicite d’aucune sorte.
Console WebSystème de fichiers
Connectivité
Co
nc
ep
tio
n/T
est
Flux de travail
Langages/Compilateurs
Coordination
Cloudera Manager Free Edition (Assistant d’installation)
Intégration des données
Accès rapide en lecture/écriture
Métadonnées
FUSE-NFS
BIG
TO
P
ODBC/JDBC
FLUME, SQOOP
WHIRR
OOZIE
PIG, HIVE
HBASE
ZOOKEEPER
HIVE
HUE MAHOUT
Data mining