27
OFFRE UMANIS BIG DATA & INTELLIGENCE ARTIFICIELLE 1

SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

  • Upload
    others

  • View
    15

  • Download
    0

Embed Size (px)

Citation preview

Page 1: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

OFFRE UMANIS

BIG DATA & INTELLIGENCE ARTIFICIELLE

1

Page 2: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

LE BIG DATA ET LA DATASCIENCE

2

Une évolution pour Umanis

Une révolution pour nos clients

UMANIS, UNE VISION UNIQUE

Page 3: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

3

UNE EXPERTISE UNIQUEINNOVATION

• Station-U : Notre Labo R&D, BIG Data, IA et digital, c’est quatre laboratoires (Paris,

Lyon, Tours et Toulouse).

• Ce sont quarante docteurs en mathématiques appliquées, en informatique, en

traitement du signal et en Machine Learning

• Un directeur de la R&D qui pilote les comités mensuellement

→ Le tout pour une recherche orientée client amenant :

Page 4: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

4

IMPLÉMENTATIONUNE EXPERTISE UNIQUE

40 projets innovants sur les Agents conversationnels

(ChatBots), IoT, Blockchain

50 projets de migration / modernisation de plateformes

techniques

Plus de 500 projets BIdans les 4 dernières années

Plus de 200 projets Cloud depuis 2 ans dont 50 Infrastructures d’envergure

Plus de 160 projets Big Data et Intelligence Artificielle en 2017

Page 5: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

Ingérer Stocker Analyser

5

LES PROBLÉMATIQUES SONT LES MÊMES

LE BIG DATA

• Prédire le futur

• Identifier les anomalies

• Optimiser les processus

• Prioriser les actions

Page 6: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

6

UMANIS, C’EST 25 ANS D’EXPERTISE DANS LA DATA

Un engagement dans l’Open Innovation

Des partenariats avec tous les GAFAM

Un ADN unique

Un partenariat avec de nombreux Laboratoires de Recherche

Un laboratoire interne de R&DUmanis est le leader français

de la Data On-Premise

et dans le Cloud

Page 7: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

7

NOTRE OFFRE

ACCOMPAGNEMENT DE NOS CLIENTS DANS

L’IMPLÉMENTATION DE PROJETS BIG DATA & INTELLIGENCE

ARTIFICIELLE

Page 8: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

QUELLE EST L’INTERVENTION D’UMANIS ?

8

Accompagner les clients dans la mise en œuvre de leurs projets Big Data et Intelligence Artificielle

Page 9: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

9

Outils d’ETL (SSIS, Talend,…)

DatawarehouseSQL Server, Teradata, Oracle…

Extract LoadTransform

Stockage et

process

élastiquesHDFS, Blob Storage…

Outils

de visualisation

Datamarts

Applications

Data Lakes

Outils d’ingestion

Transform Machine

Learning

Machine Learning

Temps réel

Gestion de l’IoT

Machine Learning

Deep Learning

CONSEIL ET RÉALISATION EN ARCHITECTURE BIG DATA

Page 10: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

ANALYSE DES DONNÉES À DISPOSITION

10

Notre objectif : vous donner les outils pour…

Support Vector

Machines

Régressions linéaires, logistiques

Améliorer la qualité

des infrastructures et des services

Anticiper les évolutions, prédire et prescrire

Mieux comprendre

les citoyens, les infrastructures, les entreprises

Arbres de décisions

Naïve Bayes classification

Deep Learning

Page 11: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

MISE À DISPOSITION D’ÉQUIPES POINTUES

11

Notre équipe : Une équipe certifiée, maîtrisant théorie et pratique

SAS / R / R Server / Python / SQL / CNTK / SCALA …

Microsoft Data Science Summit, Atlanta, Septembre 2016

Train The Trainer Program – R Server, Sunnyvale, Octobre 2016

Cortana Analytics Workshop, Seattle, Septembre 2015

Formée aux dernières technologies

Engagée profondément dans le succès du client

Expérimentée grâce à des projets complexes

Algorithmes prédictifs en temps réel

Machine Learning sur des données non structurées

Problématiques métiers et algorithmes complexes

Plus de 2/3 des prestations avec engagements

Reconnaissance dans la qualité du delivery

Page 12: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

ECOSYSTÈME BIG DATA & PARTENAIRE

UN RÉSEAU D’EXPERTS,D’ARCHITECTES, DE DATA SCIENTISTS ET DE PARTENAIRES AU SERVICE DE LA RÉVOLUTION DIGITALE

12

Page 13: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

13

Plateforme de stockage et de calcul distribuée

• Projets Open Source : Apache Hadoop

• Partenaires

• Pure players : MapR, Cloudera, Hortonworks, Pivotal

• GAFAM et Leaders : Microsoft, IBM, Google, Amazon, Oracle

Base de données NoSQL

• Dépasser les limitations des bases de données relationnelles (Passage à

l’échelle, flexibilité du schéma, etc.)

• Trois types

• Base de données orientées document : MongoDB, Couchbase

• Base de données clé valeur : HBase, Cassandra,

• Base de données graphe : Neo4J,

Moteurs de recherche

• Accès aux données de l’entreprise comme on le fait naturellement sur Google

• Indexer toutes les données de l’entreprise afin de pouvoir y accéder

simplement et rapidement (Base de données client, RH, informations

financières, mails, etc.)

UN RÉSEAU DE PARTENAIRES SOLIDES

Page 14: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

14

ZOOM SUR L’EXPERTISE DATA INTELLIGENCESchéma directeur

Data Science

Etude, POC& Processus Data Science

Formation, Méthodes Statistiques et R

Mise en œuvre,Algorithmes et expertise IT

Transformations organisationnelles, méthodes BI et Data Science

Trajectoire de transformation des SI Data vers les SI Big Data & Analytic

• Estimation Bayésienne,

• Quantification et Propagation des

Incertitudes,

• Tests d’Hypothèses Statistiques,

• Moindres Carrés,

• Techniques Monte Carlo par Chaine de

Markov,

• Analyse des Signaux non stationnaires

(Transformée en Ondelettes, STFT, WVD),

• Analyse en Composantes Principales

(ACP), Linear Discriminant Analysis (LDA)

• Classification (SVM, KNN, Neural Network,

Régression Logistique, Arbres de décision)

• Clustering (k-Means, Expectation-

Maximization, Hierarchical Clustering,

Naïve Bayes)

• Validation Croisée (Selection de Modèle)

• Recherche Opérationnelle (Optimisation

Combinatoire, Algorithmes Génétique)

• Predictive analysis, classic data Mining

techniques, time series …

• Segmentation (kmeans, knn, Hierarchical

classification kmod, Kohonen,…)

• Forecast (simulation methods , decision

trees , SVM , logistic regression …)

• Modeling complex processes and

implementation of algorithms for complex

problems (NP-complet, Contraint

Satisfaction Problem) using tools like,

Madkit, Jad)

Page 15: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

15

ZOOM SUR L’EXPERTISE BIG DATASchéma directeur

Big Data

Etude, POC & ArchitectureBig Data

Formation et Méthodes d’architectures pour données structurées et non structurées

Mise en œuvre, architecture et expertise IT

Transformations organisationnelles, méthodes Big Data

Trajectoire de transformation des SI Data vers les SI Big Data & Analytic

• Algorithmes Map Reduce et Architectures

de stockage HDFS/WebFS

• Langages Pig, Hive, Json, Python et

Scala

• Hadoop Cloudera, Hortonworks et MapR

• Solutions Google Cloud Platform et

Microsoft Azure Data Lake Analytics

• Dataïku

• Apache Spark, Storm, Flume et Kafka

• Management Zookeeper, Ambari, Sqoop

et Ooziet

• Bases de données relationnelles « VLDB »

(Very Large Database)

• Moteurs MPP (Massively Parallel Processing)

• Solutions OnPremise Teradata, Oracle

Exalytics, Microsoft Analytic Platform System

• Solutions Cloud Amazon Redshift, Microsoft

Azure SQL Datawarehouse, Google Big

Query et Snowflake

• Solution ETL Hybrides Talend et Microsoft

Azure Data Factory

• Solutions d’hybridation entre données

structurées / Non structurées (MS Polybase

ou Snowflake)

• Bases de données maitre/esclave Hadoop

Hbase

• Bases de données géo-réparties haute

disponibilité en cluster Apache Cassandra,

Amazon DynamoDB et Microsoft CosmoDB

• Bases de données orientées documents

Couchbase et Microsoft Azure DocumentDB

• Base de donnée réparties MongoDB et

Google Big Table

• Solutions de métadonnées et de gouvernance

Hcatalog et Azure Data Catalog

Page 16: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

DES RÉFÉRENCES CLIENTS

EXEMPLES D’IMPLÉMENTATIONS

PASSÉES OU EN COURS

16

Page 17: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

17

CONTEXTE

ENJEUX ET BENEFICES

SOLUTION

FOCUS

La complexité de l’interprétation des informations issues desstatistiques monétaires et financières, en temps réel, n’a paspermis aux institutions d’identifier des alertes précoces dans lecadre de la crise financière de 2008, mieux utiliser l’informationdisponible est donc dès lors devenu le défi majeur desBanques Centrales et des Autorités de Supervision. Il s’avèredésormais essentiel que l’appareil statistique puisse fournirrapidement les alertes appropriées en cas d’apparition d’unnouveau foyer de vulnérabilité.

Mise en place par Umanis d’équipes de Maitrise d’ouvrage, de Pilotage de projet, de

coordination d’équipes MOA, et d’équipes d’expertise technique en MOE et Métier. Après une

phase d’analyse des besoins, de recueil et d’enrichissement des métadonnées, puis la rédaction

des spécifications fonctionnelles, le lancement de campagnes de tests soutenue par des experts

en gestion de crise et en conduite du changement, à conduit le SI à s’équiper d’une solution

centralisant les données passées sur une Plateforme dédiée basée sur les technologies « Big

Data » open source (ElasticSearch pour les recherches, et Hadoop pour le stockage de données

hétérogènes)

En

jeu

x

I.Développer les synergies par un accès et une exploitation plus transversale du capital d’informations microéconomiques de la Banque

II.Regrouper dans un espace mutualisé des données individuelles sur les institutions financières et les entreprises non financières produites par plusieurs Directions Générales

III.Favoriser la transversalité en développant les échanges et le partage de données entre DG B

én

éfice

s

Enrichir les études et analyses réalisées par chaque DG grâce à une synergie fortement accrue

Contribuer à accroître l’influence de la Banque par une meilleure qualité globale des travaux

Anticiper voire orienter les décisions de la BCE en matière de « data sharing »

Gains prévisibles à moyen terme sur l’administration du SI

BANQUE DE FRANCE•DÉTECTER LES SIGNAUX PRÉCURSEURS DE CRISE

Une équipe de 30 statisticiens Umanis pendant 2 ans

Page 18: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

CONTEXTE

ENJEUX ET BENEFICES

SOLUTIONLa branche commerce EDF, responsable de la relation client, de lafacturation au recouvrement gère plus de 27 millions de clients d’EDFsur 33 millions de sites et assure la relation avec ENEDIS(raccordement compteur, relèves, ouverture/fin des contrats...)

Le SID historique, construit sur trois entrepôts de données avait atteintses limites techniques avec les technologies traditionnelles alors que lesbesoins, eux, suivent une courbe exponentielle, freinant le métier dansson action.

Transformation des entrepôts existants sous forme d’un Datalake et mis en place d’un système

de collecte, de gouvernance et d’analyse de données sous Infrastructure HP.

Sur cette infrastructure, Umanis a déployé une distribution Hadoop Hortonworks Open Enterprise

Hadoop Data Platform, déclinée sur un cluster de 40 nœuds et secondé d’une base de données

NoSQL / Hbase et d’un framework d’analyse développé sous Hive, Elastic search (ELK), Spark

pour le calcul temps réel et Sqoop pour l’Integration.

EDFRÉPONDRE AUX BESOINS ANALYTIQUES DE LA DIRECTION COMMERCE

Création d’une plateforme Big Data pour gérer toutes les données de 27 millions de clients avec 33 millions de sites

En

jeu

x

Construction d’une base de connaissance client

Répondre aux besoins analytiques de la direction commerce

Mise à disposition de l’historique des données des SI opérationnels multisources avec une profondeur temporelle et fonctionnelle plus importante

Optimisation du déroulement de processus opérationnels

Alimentation des SI opérationnels d’informations à valeur ajoutée

fice

s

Une augmentation progressive du niveau de service et du périmètre fonctionnel pour répondre aux enjeux et attentes métiers

Unification des règles de gestion

Réduction des délais de livraison de nouveaux flux de données de 50% en moyenne

Une capacité à faire évoluer les capacités de la plateforme facilement

Ecoute des réseaux sociaux

Une vision unifiée des habitudes de consommation chaque client

18

FOCUS•

2017

métriques

33Millions

de Sites

27Millions

de clients

Page 19: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

19

CONTEXTE

ENJEUX ET BENEFICES

SOLUTION

FOCUS

AXA Group Solutions est la société de services du GroupeAXA. Elle a pour mission d’aider le Groupe AXA à tirer parti desa présence internationale en identifiant des opportunités deProgrammes Groupe ou de Solutions Groupe, structurant,déployant et en assurant l'exécution. Son business model estbasé sur la réutilisation et la mutualisation des ressources.AXA Group Solutions développe et maintient de nombreusesapplications à usage interne ou externe.

Les équipes d’expertise Big Data et Data Science d’Umanis ont développé une plateforme pour

le monitoring des investissements du groupe AXA en construisant une Plateforme Big Data /

Machine Learning et le bouquet de services associés basée sur les technologies « Cloudera

Enterprise Data Hub Edition » déclinée sur un cluster de 5 nœuds, et équipées des solutions de

datamining SAS et R, de TIBCO Spotfire, et Microsoft SQL Server 2016 Reporting Services pour

les besoins de datavisualisation / analytic, et d’ElasticSearch pour les recherches, ainsi que des

outils MapReduce, Pig et Informatica pour les couches techniques de traitements et d’agrégation

de la donnée.

En

jeu

x

I.Le processus de collecte, consolidation et diffusion de données de suivi des investissements a gagné en complexité avec le temps. La fragmentation de la donnée rend le travail du département Group Investment and ALM de plus en plus complexe à réaliser.

II.Face à ce besoin stratégique il a été décidé de mettre en place un Data Lake sur lequel toutes les données de monitoring des investissements seront centralisées, avant leur utilisation. B

én

éfice

s

Centralisation des données sur les investissements

Industrialisation de la génération des rapports, des prévisions et des alertes

Simplification du partage de données

Exploitation de l’historique pour la construction d’indicateurs et alertes intelligentes

AXAEXPLOITER L’HISTORIQUE POUR LA CONSTRUCTION D’ALERTES INTELLIGENTES

20 experts techniques et scientifiques pour la construction du Datalake de monitoring des investissements du GROUPE

Page 20: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

20

CONTEXTE

ENJEUX ET BENEFICES

SOLUTION

FOCUS

Le groupe ALTICE (9 Telecom, Virgin Mobile, SFR, Numericable) a 23Millions clients dont 15 sur mobile. Son enjeu-clé est de conserver etdévelopper son parc client face à une concurrence de plus en plusforte. Une plateforme Big Data a été installé pour collecter tous lesponts de données (logs Box-TV, logs des applications mobiles,navigation Web, appels aux serveurs vocaux, passages en point devente, appels au SAV, facturation etc.). Umanis s’est basé sur cesdonnées pour mettre en place un système Anti-churn en temps réel.

Umanis a développé une solution récupérant l’ensemble des données sur une seule plateforme,

puis conçu des modèles de machine learning « d’ensemble », combinant la puissance de

plusieurs algorithmes (Réseaux de neurones, algorithmes de Kohonen et méthodes de

régression), permettant en temps réel d’effectuer les actions prescriptives anti-churn, intégrées

directement dans le workflow métier de l’entreprise, et mis à jour à fréquence élevée pour

s’adapter à la vélocité d’évolution des offres du secteur. La solution est basée sur R, SPSS et

KXEN, pour la partie DataScience et un cluster Cloudera de 20 nœuds doté de Spark pour

assurer un service temps réel.

En

jeu

x

I.Unifier le calcul de churn pour tous les opérateurs composant le groupe

II.Réduire le nombre de résiliations en détectant, en temps réel, les clients disposant

III.d'un ou de plusieurs marqueurs forts de résiliation.

IV.Approfondir la connaissance client, par croisement de tous les canaux de

V.communication avec lui.

VI.Améliorer et enrichir la capture de données

VII.Optimiser les procès de calcul de churn

fice

sRéduire de le taux d'attrition le premier mois qui a suivi la mise en production de l'application.

Développer des nouveaux marqueurs de clients en marge de l'application d'anti-churn

Réduire les délais nécessaires pour contacter le client (quelques heures vs d'une dizaine de jours)

Compréhension plus profonde des besoins clients

Réduire le coût du plateau service-client anti-churn par un ciblage plus précis

Améliorer la qualité de service en détectant des disfonctionnements très tôt sur tous les canaux

ALTICE (SFR)PRÉVENIR L’ATTRITION CLIENT EN TEMPS RÉEL

Prévenir l’attrition de 23 Millions de clients avec R, SPSS, et KXEN sur une plateforme Cloudera - Teradata de 20 nœuds

Page 21: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

CONTEXTE SOLUTION

FOCUS

La Sacem, Société des Auteurs, Compositeurs et Editeurs deMusique, est une société civile à but non lucratif, dont lamission essentielle est de collecter les droits d'auteur enFrance et de les redistribuer aux créateurs français et dumonde entier.

Cette mission est fondamentale pour pérenniser la création etle fonctionnement de la filière musicale en ligne .

Les équipes R&D et Data Science d’Umanis ont développé une plateforme pour l’acquisition et le

traitement des données en temps réel des plateformes musicales en lignes, fondée sur une

infrastructure cloud OVH sur laquelle est déployée une Plateforme Big Data / Machine Learning

sous distribution Hortonworks Data Platform 2.1 de 10 nœuds, dotées de SGBD NoSQL

Cassandra 2.1 et DataStax Enterprise 4.6, et soutenues par un moteur de recherche élastique

(ElasticSearch) ainsi que d’une solution de traitement en temps réel de données sous Apache

Spark.

SACEMPÉRENNISER LE FONCTIONNEMENT DE LA FILIÈRE MUSICALE EN LIGNE

En gérant 180 Téraoctets de données sur une plateforme Big Data Hortonworks Data Platform 2.1 dans le Cloud OVH

ENJEUX ET BENEFICES

Enje

ux

I.L’apparition de nouveaux modèles de consommation (ventes en ligne, streaming, etc.) de produits culturels (Clip video, musique, etc.) via les plateformes digitales telle que iTunes, Deezer ou Spotify a démultiplié le volume de données que doit collecter et traiter la SACEM.

II.Etant le garant de la rémunération des ayants droit la SACEM a entrepris de mettre en place une plateforme Big Data pour le traitement temps réel des données. L’objectif étant : donner une visibilité complète aux ayant droits sur la façon dont leurs œuvres sont consommées

fice

sCapacité à collecter et à traiter des volumes très importants de données (au moins 100Go de données par jour)

Robustesse de la plateforme face à des variations très importantes en termes de vélocité et de volumétrie

Calcul des redistribution des droits d’auteur en temps réel

Vue 360 sur la consommation par œuvre, auteur et canal de consommation

21

Page 22: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

CONTEXTE

BENEFICES

SOLUTION

FOCUS

MediaMobile équipe 80 % du marché en Europe pour la diffusion des données d’infotraffic en temps réel dans les GPS des véhicules de particuliers. Pour conserver sa position de leader, MediaMobile doit maitriser et améliorer à tout prix la qualité de ses informations, et pour cela, contrôler en quasi temps-réel la tenue des SLA par ses fournisseurs (qui donnent en temps réel les coordonnées GPS de véhicules roulants) et optimiser la pertinence par le prédictif sur une grande quantité de données (36 TB).

- Troisième niveau

- Quatrième niveau

- Cinquième niveau

Mise en œuvre d’une démarche BIG DATA (Architecture Lambda, Traitements distribués)

Migration du Système Décisionnel existant dans Azure en PaaS (Azure SQL DWH)

Couplage de la partie Big Data avec le système décisionnel existant via Polybase (Réutilisation

de l’existant, courbe d’apprentissage réduite pour Mediamobile)

Mise en œuvre d’une démarche d’innovation technique pour l’optimisation (Index Spatiaux

hiérarchisés distribués dans Hadoop, Décompression distribuée , Externalisation Metastore

Spark)

MEDIAMOBILEAMÉLIORER STRATÉGIQUEMENT LA QUALITÉ DES DONNÉES

Déploiement Cloud de 36 To avec Microsoft Cortana Intelligence Suite (Spark for HDInsight, Polybase, Azure SQL DWH, Power BI)

22

Page 23: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

CONTEXTE OBJECTIFS ET SOLUTION

FOCUS

SNCF RESEAU nous a confié un projet d’incidentologie, qui consiste à identifier les causes de retard de trains, l’impact des retards de trains sur les autres trains, et les corrélations entre différents paramètres et facteurs, actuels et historiques, liés à la circulation des trains pour d’une part comprendre le fonctionnement actuel, mais également trouver des axes d’optimisations afin d’améliorer la ponctualité des lignes.

L’objectif est de mettre à disposition des tableaux de bords permettant de mesurer, grâce à l’analyse prédictive, des gains fondés sur les effets d’une intervention sur les facteurs incidentogènes. En termes de Data Science, les modèles sont élaborés avec SQL Server R Services qui apporte notamment le parallélisme par rapport à R, et en terme de visualisation nous avons choisi Power BI pour son intégration avec R - L’attendu principal de cette Data Visualisation est la description visuelle des « sillons » permettant d’appréhender facilement l’impact des petits retards sur le reste du déroulé du parcours. Le rapport permettra in fine d’optimiser les horaires des lignes pour améliorer la qualité du service.

SNCF RESEAUOPTIMISER LA PONCTUALITÉ DU RÉSEAU

Equipe de 10 experts Data Science sur SQL SERVER 2016 R SERVICES et Power BI

23

Page 24: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

24

CONTEXTE

ENJEUX ET BENEFICES

SOLUTION TECHNIQUE

FOCUS

La Branche Services-Courrier-Colis de la POSTE a construit au fil desans un outil industriel permettant la récupération à des fins deproduction, de monitoring et de facturation, des données à toutes lesétapes de l’acheminement d’un objet ou d’une prestation de service.Elle a confié à Umanis un plan de travaux « Data » pour aller plus loindans l’optimisation des process internes et la qualité de service maisaussi pour construire un socle de nouvelles offres clients, basée sur lavalorisation des données disponibles en fonction des critères de retoursur investissement des sujets.

Transformation des entrepôts existants sous forme d’un Datalake pour la collecte, la

gouvernance et l’analyse de données sur une infrastructure hétérogène MPP / Hadoop basée

sur la solution Oracle Big Data Appliance. Umanis a ainsi déployé côte à côte Exalytics (MPP In

Memory) et une solution Cloudera (Enterprise Hub Edition). Sur cette infrastructure, dotée de

deux clusters de 6 nœuds Umanis a déployé le système de gestion de base de données NoSQL

Impala, le moteur de recherche SolR (Cloudera Search) et un framework d’analyse temps réel

basé sur Spark, Pig et doté d’un système d’intermédiation de flux basé sur Apache Kafka.

En

jeu

x

I.Améliorer la détection des nouvelles tendances de fond sur nos marchés

II.Améliorer la conception produits et services de demain et développer les nouveaux services

III.Améliorer et d’enrichir la capture de données

IV.Améliorer la prédiction des flux

V.Mieux piloter la production pour réaliser la promesse client

VI.Optimiser les process dans un objectif de réduction des coûts, dont les coûts d’acquisition des données Bé

fice

s

Collecte de toutes les données disponibles sur le SI

Réduction des délais nécessaires pour la réalisation d’analyses

Compréhension plus profonde des besoins clients

Meilleure capacité à prévoir la charge en production au quotidien, les évolutions futures du marché ou des modes de consommation

Amélioration du fonctionnement global en identifiant les optimisations possibles et à forte valeur ajoutée

LA POSTEAMÉLIORER LA CAPACITÉ À PRÉVOIR LA CHARGE EN PRODUCTION

Création et couplage de deux plateformes BIG DATA, une pour les données structurées et un pour les données non structurées

Page 25: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

CONTEXTE

NOTRE RÔLE

SOLUTION ET RÉSULTAT

FOCUS

DAHER-SOCATA est un équipementier-intégrateur industriel mondial de premier rang , grâce à deux métiers, celui d’industriel et de prestataire de services. Pour optimiser ses processus et réduire ses coûts, face à un carnet de commande bien rempli (4 ans d’activité), la DSI de DAHER souhaite tirer partie des toutes dernières innovations en matière d’objets connectés offertes par les géants du marché comme Microsoft, et nous a confié un premier pilote visant à lever des fonds auprès de l’ensemble de ses branches métiers. pour aborder de plein pied les virages technologiques tout connecté et prédictif

• Démontrer la pertinence des plateforme analytique Azure IoT Suite et Cortana Intelligence Suite

Innovation

ROI

Diversité des usages (BI, BIG DATA, IoT, Forecasting…)

• Sous les axes :

Concentrateur d’évènements

Stockage en base de données

Restitution via outils MS BI

Maintenance prédictive

Détection de comportements anormaux

Comment optimiser par la maintenance prédictive les vérifications des techniciens déballant le

matériel à l’issue d’une longue chaine transport et logistique ? La solution retenue, met en

œuvre des capteurs (fumée, poussière, lumière, température, humidité) sur un Arduino,

embarquée avec le matériel. La carte transmet en temps réel ces paramètres via différents

canaux, dans le cloud via MS Azure IoT Suite. Les données subissent alors une période

d’apprentissage pour la corrélation des paramètres de transports avec les anomalies, puis le

modèle statistique est implémenté dans la chaine de donnés pour une restitution aux

techniciens. Suite à ce test concluant, la DSI DAHER a mis en œuvre une plateforme IoT / Big

Data Microsoft Azure, et les branches métiers ont identifiés 60 projets IoT à ce jour.

DAHEROPTIMISER LES MARGES GRÂCE À LA MAINTENANCE PRÉDICTIVE

Réalisation d’une plateforme IoT - Big Data – Data Science pour gérer 60 projets d’optimisation métier

25

Page 26: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

26

QU’EST-CE QU’UMANIS ?

Page 27: SOLUTIONS INDUSTRIELLES DATA ORIENTED · • Solutions OnPremise Teradata, Oracle Exalytics, Microsoft Analytic Platform System • Solutions Cloud Amazon Redshift, Microsoft Azure

27

CONTACTEZ-NOUS