DATALAKE ???
N’est pas un datawarehouse moderne.
Est flexible et agile.
Absorbe tous les flux d’informations internes et externes.
Permet de construire des pipelines et services de données.
Permet d’experimenter.
2
E.T.L. IS DEAD !
THINK E.L.T.
3
Charger les données brutes
Les nettoyer et les normaliser
Construire des pipelines de transformation
KEY FEATURES
6
STORE
COMPUTE RESSOURCES
EXPLORE & EXPERIMENT COLLECT
( EXTRACT & LOAD )
TRANSFORM & PROCESS
EXPOSE ( WEBSERVICE & SQL )
INDEX & CATALOG
DETAILS
7
Raw data
Clean & structured
Structuredmodels
Analytics
Applications
Business Domain
Datalake
{
Datascience tools
Machine Learning
External DB
Collectors
REAL-TIME ?
8
Raw data
Clean & structured
Structuredmodels
Analytics
Applications
Business Domain
Datalake
Collectors
{
Datascience tools
Machine Learning
External DB
Real-time Applications& Partenaires
16
Cloud StorageMachines Virtuelles
Machines Virtuelles Bigquery (sql)
Data-visualisation
Data-science
??
CLOUD
3 GRANDES ETAPES
22
Construire une roadmapQuels sont les leviers pour améliorer l’efficacité avec la Data ?Quelles innovations sont possibles avec la Data ?
1 Imaginer 2 ExperimenterPasser de l’intuition à la convictionDémontrer les ROIMener des PoC sur un moisTechnologies Data-science
3 ConstruireConstruire les outils et services innovants Mettre en oeuvre des plateformes de données globales.
GO !
23
Démarrer avec du KPI / Reporting
Un use-case simple (en jours !)
Trouver des use-cases Data-Science
Itérer…
MERCI
Vincent Heuschling
Gsm : 06 61 88 76 71
Email : [email protected]
Web : http://www.affini-tech.com
Twitter : @affinitech & @vhe74
24