33
Charly CLAIRMONT CTO ALTIC http://altic.org [email protected] @egwada Plateforme Big Data orientée BI avec Hadoop et Spark

Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Embed Size (px)

DESCRIPTION

Description de l'architecture bigdata chez Altic Hortonworks HDP Apache Spark InfiniDB Tableau Software JasperReports Birt Talend

Citation preview

Page 1: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Charly CLAIRMONTCTOALTIChttp://altic.org

[email protected]@egwada

Plateforme Big Data orientée BI avecHadoop et Spark

Page 2: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

petite bio

Depuis 10 ans Altic

Une évolution permanente avec les technologies suivantes :

Un des animateurs de l'écosystème Hadoop en France

Un groupe de plus en plus actif !(messages échangés sur l'année)

Page 3: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Altic@Altic_Buzz

Métier

Informatique Décisionnelle

Intégration de données

Valeurs

– Innovations

– Open Source

Une maîtrise de toute la chaîne de valeur du Big Data

Page 4: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Notre approche historique de la BI

● Intégration de données

– Talend

● Reporting :

– JasperReports,

– Birt

● OLAP :

– Mondrian,

– Jedox

● Portail décisionnel :

– SpagoBI,

– JasperServer

Page 5: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Tout le monde parle de déluge de données !

Chez Altic nous aimerions déjà décloisonner l'entreprise !

Et lui rappeler qu'elle est une « Entreprise étendue »

Page 6: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Toute organisation peut désormais avoir son « lac de données »,

construire une vision unifiée de ses clients, ses produits, ses partenaires, ses

processus

Page 7: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Le standard du Big Data : « Hadoop », et son compagnon par défaut « Spark »

Page 8: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Hadoop est robuste !

● Stable

– Testé - Yahoo! (40 000 nœuds)

● Fiable

– Tolérant à la panne

● Flexible

– Schéma à la lecture !

– Passage à l'échelle

● Économique

– Prédictibilité des coûts

Page 9: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Hadoop,système d'exploitation de la donnée

Page 10: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Vous connaissez ?

Page 11: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Spark, Simple et rapide

Iter. 1

LectureHDFS

ÉcritureRAM

Iter. 2

LectureRAM

ÉcritureRAM

. . .

LectureHDFS

ÉcritureHDFS

LectureHDFS

ÉcritureHDFS

. . .Iter. 1 Iter. 2

Hadoop Map / Reduce

Spark

Page 12: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Spark,meilleur compagnon d'Hadoop

Page 13: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Construire sa plateforme Big Data

Page 14: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Une architecture BI à l'heure du Big Data

Page 15: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Collecter, Transformer, avec Talend Big Data

Des jobs Talend Pig !

Des composants toujours plus riches

Page 16: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Hortonworks HDP, une distribution open source

Page 17: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Analyser de larges volume de données en SQL avec

InfiniDB

● Sans doute le moteur SQL pour Hadoop le plus performant du moment

Page 18: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Reporting

● JasperReports

– Connecteur Hive

– Connecteur HBase

– Connecteur Avro

● Birt

– Connecteur pour Hive

Page 19: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Visualisation, Exploration

Datameer Tableau Software

Via Hive (Odbc, Jdbc)

Page 20: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Cas d'utilisation

Page 21: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Oui, mais concrètement...

Page 22: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

– Groupe bancaire de plein exercice

– 3.2 millions de sociétaires et clients

– 9000 salariés

– 84 milliard d'euros de total de bilan (2011)

Hadoop dans le monde bancaire : Crédit Mutuel Arkea

Page 23: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Hadoop dans le monde bancaire : Crédit Mutuel Arkea

http://www.journaldunet.com/solutions/dsi/big-data-dans-les-dsi/l

● Offrir une meilleure expérience aux utilisateurs

– Les clients peuvent accéder à leur historique de paiements depuis 2001 !

● Dé-silotage l'organisation

– Avoir une vision à 360° des clients, des produits

Page 24: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Quelle démarche pour votre projet Big Data !

Page 25: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Commencer petit !

Page 26: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Oublier les démarches classiques ! Trop long !

Page 27: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Oublier les démarches classiques ! Trop long !

Page 28: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Soyez Lean !

Page 29: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Big Data, BI,le tout en mode agile

Page 30: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Commencer petit !

Page 31: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Y aller pas à pas

● Télécharger une VM prêt à l'emploi (Pseudo cluster)

– Tester les démos / tutoriels

– Essayer avec vos données

● Passer à la vitesse supérieure avec une offre hébergée

● Formez vous, faites vous accompagner

● Lancez vous avec vos propres machines, hébergées ou non !

Page 32: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Questions

Page 33: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Charly [email protected]@egwada@ALtic_Buzz

Merci !

Plateforme Big Data orientée BI avecHadoop et Spark