View
517
Download
2
Category
Preview:
Citation preview
DATALAKEDE L’IDÉE À LA PLATE-FORME
1
07 / 03 / 2016Vincent Heuschling CEO Affini-Techvhe@affini-tech.com@vhe74
DATALAKE ???
N’est pas un datawarehouse moderne.
Est flexible et agile.
Absorbe tous les flux d’informations internes et externes.
Permet de construire des pipelines et services de données.
Permet d’experimenter.
2
E.T.L. IS DEAD !
THINK E.L.T.
3
Charger les données brutes
Les nettoyer et les normaliser
Construire des pipelines de transformation
KEY FEATURES
6
STORE
COMPUTE RESSOURCES
EXPLORE & EXPERIMENT COLLECT
( EXTRACT & LOAD )
TRANSFORM & PROCESS
EXPOSE ( WEBSERVICE & SQL )
INDEX & CATALOG
DETAILS
7
Raw data
Clean & structured
Structuredmodels
Analytics
Applications
Business Domain
Datalake
{
Datascience tools
Machine Learning
External DB
Collectors
REAL-TIME ?
8
Raw data
Clean & structured
Structuredmodels
Analytics
Applications
Business Domain
Datalake
Collectors
{
Datascience tools
Machine Learning
External DB
Real-time Applications& Partenaires
16
Cloud StorageMachines Virtuelles
Machines Virtuelles Bigquery (sql)
Data-visualisation
Data-science
??
CLOUD
3 GRANDES ETAPES
22
Construire une roadmapQuels sont les leviers pour améliorer l’efficacité avec la Data ?Quelles innovations sont possibles avec la Data ?
1 Imaginer 2 ExperimenterPasser de l’intuition à la convictionDémontrer les ROIMener des PoC sur un moisTechnologies Data-science
3 ConstruireConstruire les outils et services innovants Mettre en oeuvre des plateformes de données globales.
GO !
23
Démarrer avec du KPI / Reporting
Un use-case simple (en jours !)
Trouver des use-cases Data-Science
Itérer…
Recommended