2

Click here to load reader

Dell | Solution Apache Hadoop de Cloudera,i.dell.com/.../Spec-Sheet-Dell-Cloudera-Apache-Hadoop-Solution_fr.pdf · Dell | Solution Apache Hadoop de Cloudera, accélérée par Intel

  • Upload
    lythien

  • View
    220

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Dell | Solution Apache Hadoop de Cloudera,i.dell.com/.../Spec-Sheet-Dell-Cloudera-Apache-Hadoop-Solution_fr.pdf · Dell | Solution Apache Hadoop de Cloudera, accélérée par Intel

Dell | Solution Apache Hadoop de Cloudera, accélérée par IntelProfitez d’outils matériels, de logiciels et de services optimisés pour les entreprises avec la solution Dell | Apache Hadoop de Cloudera

Une solution simplifiée pour résoudre les problèmes des entreprises

Tout ce dont vous avez besoin

Lorsque vous adoptez la solution Dell™ | Apache™ Hadoop® de Cloudera® accélérée par Intel, vous pouvez compter sur les performances du produit Cloudera’s Distribution including Apache® Hadoop® (distribution Hadoop de Cloudera, ou CDH), l’une des principales distributions mondiales de Hadoop dans les environnements commerciaux et non commerciaux.

Le produit CDH offre un moyen simple d’utiliser Apache Hadoop pour résoudre les problèmes de production des entreprises. Idéal pour les entreprises recherchant une solution Hadoop stable et éprouvée sans dépendance envers un fournisseur, CDH relie les informations des organisations utilisant Hadoop au niveau de la production et le flux constant d’innovations en provenance de la communauté Apache.

Bien documenté et prêt à l’emploi, le produit CDH est composé d’une pile Hadoop open source 100 % Apache, ainsi que de l’ensemble des composants logiciels open source nécessaire pour utiliser Hadoop, qui peuvent être activés selon les besoins. CDH a été rigoureusement testé et certifié pour s’intégrer à une vaste gamme de systèmes d’exploitation et d’outils matériels, de bases de données et d’entrepôts de données. Le produit fonctionne également avec de nombreux systèmes d’informatique décisionnelle et d’extraction, transformation et chargement (ETL). Cette large compatibilité permet à votre entreprise de tirer profit de la technologie Hadoop à partir des outils et ressources existants.

La solution Dell | Apache Hadoop de Cloudera accélérée par Intel vous offre tout ce dont vous avez besoin pour relever les défis relatifs aux Big Data, notamment des logiciels, du matériel, des services, une architecture de référence et un guide de déploiement. Commencez par les serveurs de la série PowerEdge™ R730xd et les solutions Dell Networking (composants éprouvés dans le cadre du déploiement des Big Data et du Cloud), puis choisissez Cloudera Enterprise ou les solutions CDH d’Apache Hadoop.

Les services Dell simplifient la mise en route. Les options incluent notamment la conception de solutions personnalisées, le déploiement matériel et logiciel, la prise en charge continue, ainsi que la formation. Cela vous offre la garantie que votre solution est prise en charge par une assistance experte pour le matériel et les logiciels, pouvant être personnalisée selon vos besoins particuliers.

Simplicité et certitudeEn raison de la croissance exponentielle des volumes de données et de leur complexité, les entreprises de toute taille adoptent la plateforme open source Apache Hadoop pour stocker, traiter et utiliser efficacement toutes leurs données. La technologie Hadoop présente de nombreux avantages, notamment en termes de flexibilité et d’économie. Mais à l’instar de toutes les technologies open source, son implémentation dans un environnement de production présente un ensemble unique de difficultés et de questions.

Comment garantir la stabilité du système ? De quels composants de la plateforme open source avez-vous besoin et comment pouvez-vous être sûr qu’ils s’intégreront correctement à votre environnement ? La technologie est-elle bien documentée ? Qui appeler en cas de problème ? L’incertitude qui découle de ces questions incite certaines entreprises à investir dans des solutions propriétaires, malgré leur prix plus élevé et le risque de dépendance vis-à-vis du fournisseur.

Cloudera a créé sa propre distribution de la technologie Hadoop dans un seul et unique but : supprimer l’incertitude et les barrières qui dissuadent parfois les entreprises à déployer une solution Hadoop open source en production.

La voie du succès avec Hadoop, en toute simplicité• Bénéficiez de tous les composants requis pour une

utilisation en production ; implémentez-les selon vos besoins.

• Balayez toute incertitude avec une distribution entièrement prise en charge.

• Vos investissements existants sont protégés et le travail d’intégration est fait à votre place.

Une technologie Hadoop stable et fiable, sans dépendance vis-à-vis d’un fournisseur• Tirez parti d’une technologie Hadoop 100 % Apache,

renforcée pour les environnements de production.• Faites davantage confiance à une distribution

rigoureusement testée par des ingénieurs experts.• Passez à des dizaines de milliers de nœuds dans des

environnements d’entreprise.

Une solution tournée vers la communauté• Intégrez uniquement des composants open source :

pas de logiciel dérivé ni de bases propriétaires.• Profitez d’un accès à un flux continu d’innovations en

provenance de la communauté Hadoop.• Tirez parti d’une distribution éprouvée et téléchargeable

gratuitement.

Page 2: Dell | Solution Apache Hadoop de Cloudera,i.dell.com/.../Spec-Sheet-Dell-Cloudera-Apache-Hadoop-Solution_fr.pdf · Dell | Solution Apache Hadoop de Cloudera, accélérée par Intel

La solution Dell | Apache Hadoop de Cloudera propose :

Un ensemble complet de tous les composants nécessaires pour utiliser la technologie Apache Hadoop en production

CDH contient tout ce dont vous avez besoin pour une implémentation réussie, et l’ensemble de la solution est entièrement documenté. En facilitant le développement de votre pile Hadoop, la solution CDH vous permet de résoudre simplement de vrais problèmes d’entreprise.

Une technologie Hadoop 100 % Apache, renforcée pour les environnements de production

Avec CDH, Cloudera maintient son engagement à défendre la norme open source. Depuis le cœur du système de fichiers jusqu’à l’interface utilisateur, le produit CDH ne contient aucune dérivation de code ou base propriétaire, et son téléchargement est gratuit. L’ensemble de la distribution a subi des tests de qualité par Cloudera, et son évolutivité jusqu’à des dizaines de milliers de nœuds avec diverses charges de travail en environnement d’entreprise a été prouvée. CDH est une solution Hadoop stable et fiable sans dépendance vis-à-vis d’un fournisseur.

Le cadre de certification « Cloudera Ready »

CDH a été testé et certifié pour s’intégrer à une grande variété d’outils matériels, de systèmes d’exploitation et d’outils d’analyse de données, ce qui contribue à réduire les risques, à simplifier le déploiement et à protéger vos investissements dans les solutions existantes d’analyse de données et d’informatique décisionnelle.

Composants de la solution CDH

Apache Hadoop Stockage et traitement distribués fiables et évolutifs

DataFu Bibliothèque dotée de fonctions définies par l’utilisateur pour le data mining et les tâches statistiques

Apache Flume Service distribué permettant de collecter et de regrouper des données de journal et d’événement

Apache HBase Base de données Hadoop pour un accès en lecture/écriture aléatoire en temps réel

Apache Hive Interface de bureau basé sur un navigateur permettant d’interagir avec la solution Hadoop

Hue Langage de haut niveau servant dans les programmes d’analyses de données

Apache Mahout™ Outil permettant de créer des bibliothèques évolutives d’apprentissage machine

Apache MRv2 Architecture logicielle MapReduce pour traiter de vastes ensembles de données

Apache Oozie Moteur de flux de travail basé sur un serveur pour les activités Hadoop

Apache Pig Langage de type SQL et référentiel de métadonnées

Apache Spark Moteur de traitement de données rapide et général prenant en charge le flux cyclique et le traitement des données en mémoire

Apache Squoop Transfère des données en masse entre Apache Hadoop et les banques de données structurées

Apache Whirr Bibliothèque permettant d’exécuter la solution Hadoop sur le Cloud

Apache Zookeeper Gestionnaire de ressources pour Hadoop : la nouvelle génération d’architecture MapReduce

Apache Flume Service distribué permettant de collecter et de regrouper des données de journal et d’événement

Détails de la distribution CDH 5.4

Versions des composants

Apache Hadoop 2.6 v2.0.0+552

DataFu v0.0.4+9

Apache Flume v1.2.0+122Apache HBase 1.0 v0.92.1+160Apache Hive 1.1 0.9.0+155

Hue v2.1.0+221Apache Mahout™ v0.7+8Apache MRv2 v2.3.0+1265Apache Oozie v3.2.0+126Apache Pig v0.10.0+58

Apache Spark 1.3 v0.9.0

Apache Squoop 2.0 v1.4.1+54

Apache Whirr v0.8.0+18Apache YARN v3.4.3+28Cloudera Impala 2.2

Apache Kafka 13

Apache Sentry 1.5.0

Cloudera Search 1.0.0+0

Versions de systèmes d’exploitation pris en charge

Red Hat RHEL 6.6

CentOS CentOS 6.6

Ubuntu Lucid, Precise

SUSE SUSE 11 SP1

Infrastructures de conception et plateformes de Cloud prises en charge

Infrastructure de conception Apache Maven

Plateformes de Cloud

Rackspace Softlayer

Amazon AWS Microsoft Azure

Amazon EC2 OpenStack

Pour en savoir plus, consultez les sites : DellBigData.com et www.Dell.com/Hadoop

Intel et le logo Intel sont des marques d’Intel Corporation aux États-Unis et/ou dans d’autres pays.

© 2015 Dell Inc. Tous droits réservés. Dell, le logo DELL, le badge DELL et PowerEdge sont des marques de Dell Inc. D’autres marques et noms de produits peuvent apparaître dans le présent document en référence aux entités revendiquant la propriété de ces marques et noms ou à leurs produits. Dell renonce à tout droit de propriété sur les marques et noms de produits autres que les siens. Ce document est fourni à titre informatif uniquement. Dell se réserve le droit de modifier sans préavis les produits décrits dans le présent document. Le contenu est fourni en l’état, sans garantie expresse ni implicite d’aucune sorte.

Console WebSystème de fichiers

Connectivité

Co

nc

ep

tio

n/T

est

Flux de travail

Langages/Compilateurs

Coordination

Cloudera Manager Free Edition (Assistant d’installation)

Intégration des données

Accès rapide en lecture/écriture

Métadonnées

FUSE-NFS

BIG

 TO

P

ODBC/JDBC

FLUME, SQOOP

WHIRR

OOZIE

PIG, HIVE

HBASE

ZOOKEEPER

HIVE

HUE MAHOUT

Data mining