of 84 /84
Big Data, BI, NoSQL, SGBD, Big Data et NoSQL Face à l'explosion quantitative des données produites et collectées (capteurs, réseaux sociaux, contenus multimédias, transactions...), les technologies Big Data offrent de nouvelles perspectives : analyse rapide de grands volumes de données, identification en temps réel des informations clés... Les stages ORSYS permettent de maîtriser les différentes solutions proposées par les acteurs du Big Data (Hadoop, Spark, Storm, Cloudera, Talend, Tableau, ELK...) de l'administration des infrastructures jusqu'à l'organisation, l'analyse et la visualisation des données. Etat de l'art, conception Big Data, état de l'art (réf. BGA) .... p.3 Big Data, synthèse technique (réf. BAG) .... p.5 Big Data, Data Science, Machine Learning, leur impact dans l’entreprise (réf. BMD) .... p.7 Big Data Foundation, certification (réf. BDT) .... p.9 Big Data, méthodes et solutions pratiques pour l'analyse des données (réf. BID) .... p.11 Bases de données NoSQL, enjeux et solutions (réf. NSQ) .... p.13 Data Mining : synthèse (réf. DMI) .... p.15 Master Data Management, la gouvernance des données (réf. CYE) .... p.17 Deep Learning et réseaux de neurones : les fondamentaux (réf. DRN) .... p.19 Machine learning, l'état de l'art (réf. MLE) .... p.21 Machine learning, méthodes et solutions (réf. MLA) .... p.23 Microsoft Azure Machine Learning, développer et exploiter des algorithmes (réf. AZL) .... p.25 Hadoop, installation et administration (réf. HOD) .... p.27 Elasticsearch, administration et exploitation (réf. ELA) .... p.29 Apache Cassandra, administration et exploitation (réf. SSA) .... p.31 MongoDB, mise en oeuvre et administration (réf. MGO) .... p.33 Talend Open Studio for Big Data, exploiter vos données massives (réf. TAD) .... p.35 SQL Server 2016 Business Intelligence, nouveautés pour le Big Data (réf. MOV) .... p.37 Recherche et Datavisualisation ElasticSearch, Logstash et Kibana : indexation, recherche et visualisation de données (réf. ELK) .... p.39 Data Clustering, organiser les données du Big Data (réf. DAU) .... p.41 Développer des applications de DataVisualisation (réf. DTV) .... p.43 DataVisualisation, créer des reportings visuels et interactifs avec Power Map et Power View (réf. AVI) .... p.45 Tableau Desktop, exploiter visuellement vos données (réf. TBL) .... p.47 Statistiques descriptives, introduction (réf. UES) .... p.49 Modélisation statistique (réf. STA) .... p.51 Environnement R, traitement de données et analyse statistique (réf. TDA) .... p.53 Technique de Big Data Analytics avec R (réf. DTA) .... p.55 Technique de Big Data Analytics avec Python (réf. BDA) .... p.57 ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Défense cedex. Tél : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 1

Big Data, BI, NoSQL, SGBD, Big Data et NoSQL - orsys.fr · Deux exemples : splunk et Logstash. - Les crawlers Open Source. - Recherche et analyse : ... - Une architecture générale

Embed Size (px)

Text of Big Data, BI, NoSQL, SGBD, Big Data et NoSQL - orsys.fr · Deux exemples : splunk et Logstash. -...

  • Big Data, BI, NoSQL, SGBD, Big Data et NoSQL

    Face l'explosion quantitative des donnes produites et collectes (capteurs, rseauxsociaux, contenus multimdias, transactions...), les technologies Big Data offrent de nouvellesperspectives : analyse rapide de grands volumes de donnes, identification en temps reldes informations cls... Les stages ORSYS permettent de matriser les diffrentes solutionsproposes par les acteurs du Big Data (Hadoop, Spark, Storm, Cloudera, Talend, Tableau,ELK...) de l'administration des infrastructures jusqu' l'organisation, l'analyse et la visualisationdes donnes.

    Etat de l'art, conception

    Big Data, tat de l'art (rf. BGA) .... p.3

    Big Data, synthse technique (rf. BAG) .... p.5

    Big Data, Data Science, Machine Learning, leur impact dans lentreprise (rf. BMD) .... p.7

    Big Data Foundation, certification (rf. BDT) .... p.9

    Big Data, mthodes et solutions pratiques pour l'analyse des donnes (rf. BID) .... p.11

    Bases de donnes NoSQL, enjeux et solutions (rf. NSQ) .... p.13

    Data Mining : synthse (rf. DMI) .... p.15

    Master Data Management, la gouvernance des donnes (rf. CYE) .... p.17

    Deep Learning et rseaux de neurones : les fondamentaux (rf. DRN) .... p.19

    Machine learning, l'tat de l'art (rf. MLE) .... p.21

    Machine learning, mthodes et solutions (rf. MLA) .... p.23

    Microsoft Azure Machine Learning, dvelopper et exploiter des algorithmes (rf. AZL) .... p.25

    Hadoop, installation et administration (rf. HOD) .... p.27

    Elasticsearch, administration et exploitation (rf. ELA) .... p.29

    Apache Cassandra, administration et exploitation (rf. SSA) .... p.31

    MongoDB, mise en uvre et administration (rf. MGO) .... p.33

    Talend Open Studio for Big Data, exploiter vos donnes massives (rf. TAD) .... p.35

    SQL Server 2016 Business Intelligence, nouveauts pour le Big Data (rf. MOV) .... p.37

    Recherche et Datavisualisation

    ElasticSearch, Logstash et Kibana : indexation, recherche et visualisation de donnes (rf. ELK) ....p.39

    Data Clustering, organiser les donnes du Big Data (rf. DAU) .... p.41

    Dvelopper des applications de DataVisualisation (rf. DTV) .... p.43

    DataVisualisation, crer des reportings visuels et interactifs avec Power Map et Power View (rf. AVI) ....p.45

    Tableau Desktop, exploiter visuellement vos donnes (rf. TBL) .... p.47

    Statistiques descriptives, introduction (rf. UES) .... p.49

    Modlisation statistique (rf. STA) .... p.51

    Environnement R, traitement de donnes et analyse statistique (rf. TDA) .... p.53

    Technique de Big Data Analytics avec R (rf. DTA) .... p.55

    Technique de Big Data Analytics avec Python (rf. BDA) .... p.57

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 1

  • Environnement R, manipulations et statistiques lmentaires (rf. MDR) .... p.59

    Traitement de donnes Big Data en temps rel avec Spark et Storm (rf. DSS) .... p.61

    Apache Hadoop, dvelopper des applications pour le Big Data (rf. APH) .... p.63

    MongoDB, prise en main et dveloppement (rf. MNO) .... p.65

    Spark, dvelopper des applications pour le Big Data (rf. SPK) .... p.67

    Apache Storm, dvelopper des applications pour le Big Data (rf. ASB) .... p.69

    MapReduce et Aggregation Framework pour MongoDB (rf. RAG) .... p.71

    100% E-Learning

    Introduction la datavisualisation, collecter, traiter et reprsenter les donnes (rf. 4TF) .... p.73

    Hbase, introduction la base de donnes NoSQL d'Hadoop (rf. 4TG) .... p.75

    Redis, prsentation de la base de donnes NoSQL pour une utilisation en PHP (rf. 4TH) .... p.77

    HDFS, utiliser le systme de fichiers distribu d'Hadoop (rf. 4TO) .... p.79

    MapReduce, appliquer le paradigme dans tous les langages et le transposer sous Hadoop (rf. 4TP) ....p.81

    Big Data, introduction la plateforme Hadoop et son cosystme (rf. 4TX) .... p.83

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 2

  • Sminaire de 2 jour(s)Rf : BGA

    ParticipantsDSI, directeurs techniques,chefs de projet, architectes,responsables SI.

    Pr-requisConnaissances de base desarchitectures techniques.

    Prix 2018 : 1910 HT

    Dates des sessions

    BRUXELLES04 oct. 2018, 10 dc. 2018

    GENEVE04 oct. 2018, 10 dc. 2018

    LUXEMBOURG04 oct. 2018, 10 dc. 2018

    PARIS06 sep. 2018, 08 nov. 201810 dc. 2018

    ModalitsdvaluationLes apports thoriques et lespanoramas des techniqueset outils ne ncessitentpas davoir recours unevaluation des acquis.

    Comptences duformateurLes experts qui animentla formation sont desspcialistes des matiresabordes. Ils ont tvalids par nos quipespdagogiques tant sur leplan des connaissancesmtiers que sur celui de lapdagogie, et ce pour chaquecours quils enseignent. Ilsont au minimum cinq dixannes dexprience dansleur domaine et occupentou ont occup des postes responsabilit en entreprise.

    Moyenspdagogiques ettechniques Les moyens pdagogiqueset les mthodesd'enseignement utilisssont principalement : aidesaudiovisuelles, documentationet support de cours, exercicespratiques d'application etcorrigs des exercices pourles stages pratiques, tudesde cas ou prsentation de casrels pour les sminaires deformation.

    A l'issue de chaque stage ousminaire, ORSYS fournit aux

    Big Data, tat de l'art> Big Data, BI, NoSQL, SGBD> Big Data et NoSQL

    L'accroissement continuel des donnes numriques dans les entreprises et les organismes publics a conduit l'mergence du Big Data. Ce concept recouvre les questions de stockage et de conservation de vastesquantits de donnes, mais aussi celles lies au gisement potentiel de valeur que reprsentent ces massesde donnes. Ce sminaire prsente les problmes spcifiques du Big Data et les solutions techniquespotentielles, de la gestion des donnes aux diffrents types de traitement, qui tmoignent d'une rupture parrapport aux moyens usuels d'analyse du fait des quantits traites.

    OBJECTIFS PEDAGOGIQUES

    Dcouvrir les principaux concepts du Big DataIdentifier les enjeux conomiquesEvaluer les avantages et les inconvnients du Big DataComprendre les principaux problmes et les solutions potentiellesIdentifier les principales mthodes et champs d'application du Big Data

    1) Introduction2) Big Data : traitements depuis l'acquisitionjusqu'au rsultat3) Relations entre Cloud et Big Data4) Introduction l'Open Data

    5) Matriel pour les architectures de stockage6) Protection des donnes7) Mthodes de traitement et champsd'application8) Cas d'usage travers des exemples etconclusion

    1) Introduction

    - Les origines du Big Data : un monde de donnes numriques, l'e-sant, chronologie.- Une dfinition par les quatre V : la provenance des donnes.- Une rupture : changements de quantit, de qualit, d'habitudes.- La valeur de la donne : un changement d'importance.- La donne en tant que matire premire.- Le quatrime paradigme de la dcouverte scientifique.

    2) Big Data : traitements depuis l'acquisition jusqu'au rsultat

    - L'enchanement des oprations. L'acquisition.- Le recueil des donnes : crawling, scraping.- La gestion de flux vnementiel (Complex Event Processing, CEP).- L'indexation du flux entrant.- L'intgration avec les anciennes donnes.- La qualit des donnes : un cinquime V ?- Les diffrents types de traitement : recherche, apprentissage (machine learning, transactionnel, datamining).- D'autres modles d'enchanement : Amazon, e-Sant.- Un ou plusieurs gisements de donnes ? De Hadoop l'in-memory.- De l'analyse de tonalit la dcouverte de connaissances.

    3) Relations entre Cloud et Big Data

    - Le modle d'architecture des Clouds publics et privs.- Les services XaaS.- Les objectifs et avantages des architectures Cloud.- Les infrastructures.- Les galits et les diffrences entre Cloud et Big Data.- Les Clouds de stockage.- Classification, scurit et confidentialit des donnes.- La structure comme critre de classification : non structure, structure, semi-structure.- Classification selon le cycle de vie : donnes temporaires ou permanentes, archives actives.- Difficults en matire de scurit : augmentation des volumtries, la distribution.- Les solutions potentielles.

    4) Introduction l'Open Data

    - La philosophie des donnes ouvertes et les objectifs.- La libration des donnes publiques.- Les difficults de la mise en uvre.- Les caractristiques essentielles des donnes ouvertes.- Les domaines d'application. Les bnfices escompts.

    5) Matriel pour les architectures de stockage

    - Les serveurs, disques, rseau et l'usage des disques SSD, l'importance de l'infrastructure rseau.

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 3

  • participants un questionnaired'valuation du cours quiest ensuite analys par nosquipes pdagogiques.

    Une feuille dmargementpar demi-journe de prsenceest fournie en fin de formationainsi quune attestation de finde formation si le stagiaire abien assist la totalit de lasession.

    - Les architectures Cloud et les architectures plus traditionnelles.- Les avantages et les difficults.- Le TCO. La consommation lectrique : serveurs (IPNM), disques (MAID).- Le stockage objet : principe et avantages.- Le stockage objet par rapport aux stockages traditionnels NAS et SAN.- L'architecture logicielle.- Niveaux d'implantation de la gestion du stockage.- Le "Software Defined Storage".- Architecture centralise (Hadoop File System).- L'architecture Peer-to-Peer et l'architecture mixte.- Les interfaces et connecteurs : S3, CDMI, FUSE, etc.- Avenir des autres stockages (NAS, SAN) par rapport au stockage objet.

    6) Protection des donnes

    - La conservation dans le temps face aux accroissements de volumtrie.- La sauvegarde, en ligne ou locale ?- L'archive traditionnelle et l'archive active.- Les liens avec la gestion de hirarchie de stockage : avenir des bandes magntiques.- La rplication multisites.- La dgradation des supports de stockage.

    7) Mthodes de traitement et champs d'application

    - Classification des mthodes d'analyse selon le volume des donnes et la puissance des traitements.- Hadoop : le modle de traitement Map Reduce.- L'cosystme Hadoop : Hive, Pig. Les difficults d'Hadoop.- OpenStack et le gestionnaire de donnes Ceph.- Le Complex Event Processing : un exemple ? Storm.- Du BI au Big Data.- Le dcisionnel et le transactionnel renouvels : les bases de donnes NoSQL.Typologie et exemples.- L'ingestion de donnes et l'indexation. Deux exemples : splunk et Logstash.- Les crawlers Open Source.- Recherche et analyse : Elasticsearch.- L'apprentissage : Mahout. In-memory.- Visualisation : temps rel ou non, sur le Cloud (Bime), comparaison QlikView, Tibco Spotfire, Tableau.- Une architecture gnrale du data mining via le Big Data.

    8) Cas d'usage travers des exemples et conclusion

    - L'anticipation : besoins des utilisateurs dans les entreprises, maintenance des quipements.- La scurit : des personnes, dtection de fraude (postale, taxes), le rseau.- La recommandation. Analyses marketing et analyses d'impact.- Analyses de parcours. Distribution de contenu vido.- Big Data pour l'industrie automobile ? Pour l'industrie ptrolire ?- Faut-il se lancer dans un projet Big Data ?- Quel avenir pour les donnes ?- Gouvernance du stockage des donnes : rle et recommandations, le Data Scientist, les comptences d'unprojet Big Data.

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 4

  • Cours de synthse de 2jour(s)Rf : BAG

    ParticipantsDataminers, chargs d'tudesstatistiques, dveloppeurs,chefs de projet, consultantsen informatique dcisionnelle.

    Pr-requisConnaissances de basedes modles relationnels,des statistiques et deslangages de programmation.Connaissances de base desconcepts de la BusinessIntelligence.

    Prix 2018 : 1770 HT

    Dates des sessions

    PARIS12 juil. 2018, 20 sep. 201829 nov. 2018

    ModalitsdvaluationLobjectif de cette formationtant essentiellement defournir une synthse desmthodes et technologiesexistantes, il nest pasncessaire davoir recours une valuation des acquis.

    Comptences duformateurLes experts qui animentla formation sont desspcialistes des matiresabordes. Ils ont tvalids par nos quipespdagogiques tant sur leplan des connaissancesmtiers que sur celui de lapdagogie, et ce pour chaquecours quils enseignent. Ilsont au minimum cinq dixannes dexprience dansleur domaine et occupentou ont occup des postes responsabilit en entreprise.

    Moyenspdagogiques ettechniques Les moyens pdagogiqueset les mthodesd'enseignement utilisssont principalement : aidesaudiovisuelles, documentationet support de cours, exercicespratiques d'application etcorrigs des exercices pourles stages pratiques, tudesde cas ou prsentation de casrels pour les sminaires deformation.

    Big Data, synthse technique> Big Data, BI, NoSQL, SGBD> Big Data et NoSQL

    Ce cours de synthse vous prsentera les enjeux et les apports du Big Data ainsi que les technologies poursa mise en uvre. Vous apprendrez grer un projet de gestion de donnes massives depuis l'installationd'une plateforme Big Data, tout en passant par la gestion, l'analyse et la visualisation des donnes.

    OBJECTIFS PEDAGOGIQUES

    Dcouvrir les concepts cls du Big DataComprendre l'cosystme technologique d'un projet Big DataEvaluer les techniques de gestion des flux de donnes massivesImplmenter des modles d'analyses statistiques pour rpondre aux besoins mtiersDcouvrir les outils de Data Visualisation

    1) Comprendre les concepts cls et les enjeuxdu Big Data2) Technologies du Big Data3) Traitement des donnes Big Data

    4) Mthodes d'analyse et traitements desdonnes pour le Big Data5) Data Visualisation, reprsenter des donnesde faon visuelle6) Conclusion

    Dmonstration

    Prsenter la plateforme Hadoop et ses composants de base, utiliser un ETL pour grer les donnes, crerdes modles d'analyse et dashboards.

    1) Comprendre les concepts cls et les enjeux du Big Data

    - Les origines du Big Data.- La valeur de la donne : un changement d'importance.- La donne en tant que matire premire.- Les chiffres cls du march dans le monde et en France.- Les enjeux du Big Data : ROI, organisation, confidentialit des donnes.

    DmonstrationPrsentation d'une architecture Big Data.

    2) Technologies du Big Data

    - Architecture et composants de la plateforme Hadoop 2.- Les modes de stockage (NoSQL, HDFS).- Fonctionnement de MapReduce et Yarn...- Principales distributions Hadoop : Hortonworks, Cloudera, MapR...- Les technologies mergentes : Spark, Storm, Machine Learning Azure...- Dmarche d'installation d'une plateforme Hadoop.- Prsentation des technologies spcifiques pour le Big Data (Talend, Tableau, Qlikview ...).

    DmonstrationInstallation d'une plateforme Big Data complte.

    3) Traitement des donnes Big Data

    - Fonctionnement de Hadoop Distributed File System (HDFS).- Importer des donnes vers HDFS.- Traitement des donnes avec PIG.- Requtes SQL avec HIVE.- Cration de flux de donnes massives avec un ETL.

    DmonstrationImplmentation de flux de donnes massives.

    4) Mthodes d'analyse et traitements des donnes pour le Big Data

    - Les mthodes d'exploration.- Segmentation et classification.- Machine Learning, estimation et prdiction.- Le temps rel, l'IA.- L'implmentation des modles.

    DmonstrationPrsentation de l'environnement Spark, Jupyter Notebook, R Notebook et Shiny. Mise en place d'analyses demachine-learning avec le langage R, Python et Scala.

    5) Data Visualisation, reprsenter des donnes de faon visuelle

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 5

  • A l'issue de chaque stage ousminaire, ORSYS fournit auxparticipants un questionnaired'valuation du cours quiest ensuite analys par nosquipes pdagogiques.

    Une feuille dmargementpar demi-journe de prsenceest fournie en fin de formationainsi quune attestation de finde formation si le stagiaire abien assist la totalit de lasession.

    - Principales solutions du march.- Aller au-del des rapports statiques.- La Data Visualisation et l'art de raconter des chiffres de manire crative et ludique.- Mesurer l'e-rputation, la notorit d'une marque, l'exprience et la satisfaction clients...

    DmonstrationPrsentation et utilisation d'un outil de Data Visualisation pour constituer des analyses dynamiques.

    6) Conclusion

    - Les conditions du succs.- Synthse des meilleures pratiques.- Bibliographie.

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 6

  • Sminaire de 2 jour(s)Rf : BMD

    ParticipantsDirigeants d'entreprise,directeurs financiers,responsables mtier,responsables matrised'ouvrage, DSI, responsablesinformatiques, consultants,auditeurs, informaticiens.

    Pr-requisAucune connaissanceparticulire.

    Prix 2018 : 1910 HT

    Dates des sessions

    PARIS24 sep. 2018, 13 dc. 2018

    ModalitsdvaluationLes apports thoriques et lespanoramas des techniqueset outils ne ncessitentpas davoir recours unevaluation des acquis.

    Comptences duformateurLes experts qui animentla formation sont desspcialistes des matiresabordes. Ils ont tvalids par nos quipespdagogiques tant sur leplan des connaissancesmtiers que sur celui de lapdagogie, et ce pour chaquecours quils enseignent. Ilsont au minimum cinq dixannes dexprience dansleur domaine et occupentou ont occup des postes responsabilit en entreprise.

    Moyenspdagogiques ettechniques Les moyens pdagogiqueset les mthodesd'enseignement utilisssont principalement : aidesaudiovisuelles, documentationet support de cours, exercicespratiques d'application etcorrigs des exercices pourles stages pratiques, tudesde cas ou prsentation de casrels pour les sminaires deformation.

    A l'issue de chaque stage ousminaire, ORSYS fournit auxparticipants un questionnaired'valuation du cours quiest ensuite analys par nosquipes pdagogiques.

    Big Data, Data Science, Machine Learning, leur impactdans lentreprise> Big Data, BI, NoSQL, SGBD> Big Data et NoSQL

    La rvolution numrique est rendue possible par l'explosion du volume des donnes changes au sein eten dehors des entreprises. Cette rvolution a permis l'apparition de nombreux nouveaux usages et nousn'en sommes qu'au dbut. Sans entrer dans le dtail de la technique ni des aspects architecturaux ou desmodles de donnes, ce sminaire vous prsentera une vision d'ensemble de l'impact que peuvent avoir leBig Data, la Data Science et le Machine Learning sur les nouveaux modles d'entreprise.

    OBJECTIFS PEDAGOGIQUES

    Dcouvrir les fondamentaux du Big Data, de la Data Science et du Machine LearningEvaluer en quoi les donnes prennent une position prdominante dans les nouveaux business modelsComprendre le rle de la Data Science au sein de l'organisation et de la gouvernance de l'informationPrsenter les enjeux des usages que reprsentent le machine learning, le deep learning et les impactsorganisationnelsJustifier l'ouverture du SI vers l'extrieur, tant en collecte de donnes qu'en fourniture

    1) Historique et contexte de l'explosion desusages autour des donnes2) Le Big Data, la Data Science, la MachineLearning, l'IA3) La gestion du patrimoine informationnel et lepilotage de la valeur

    4) Les acteurs du Big Data et les enjeuxorganisationnels associs5) Le Big Data tendu6) Les notions pour aller plus loin et quelquespistes pour se lancer

    1) Historique et contexte de l'explosion des usages autour des donnes

    - La rvolution numrique est en route ... pousse par un tsunami informationnel !- Quelles sont les grandes briques fonctionnelles et techniques de la gestion du patrimoine informationnel ?- Qu'est ce que le Big Data ? Dfinition et primtre gnral.- Un peu d'histoire sur les origines et l'explosion du Big Data.- Le Big Data n'est pas une mode et s'inscrit dans la rvolution numrique comme le carburant del'innovation.- Le Big Data : les grands usages actuels.- Quelques grandes notions technologiques retenir et comment surnager parmi tous ces acronymestechniques.- Quelle cohabitation entre les diffrentes gnrations de systme de gestion des donnes ?- Quel futur pour toutes ces solutions et usages ? Quel est le niveau de maturit date ?

    EchangesRflexion collective sur la rvolution numrique.

    2) Le Big Data, la Data Science, la Machine Learning, l'IA

    - Crer et amliorer les facults de l'entreprise grce aux Big Data.- Les grandes briques applicatives au service du Big Data dans l'entreprise.- De l'analyse statistique la Data Science : quels profils, pour quels bnfices ?- Les principales dclinaisons de l'Intelligence Artificielle.- L'Intelligence Artificielle dans l'analyse prdictive.- Le Machine Learning ou la capacit d'apprentissage par la machine.- Apprendre par le traitement de masse de l'information recueillie : le Deep Learning.- L'Intelligence Artificielle, le Machine Learning et le Deep Learning : quels enjeux pour nos socits ?

    EchangesRflexion collective sur l'volution de le Big Data, de la Data Science, du Machine Learning et l'IntelligenceArtificielle.

    3) La gestion du patrimoine informationnel et le pilotage de la valeur

    - La place des donnes dans la rvolution numrique.- La place de la donne dans les modles d'entreprise disruptifs.- La valeur des donnes au coeur des enjeux mtiers.- Peut-on connatre et piloter la valeur de son patrimoine informationnel ?- Quel est le risque d'infobsit ? Comment s'en prmunir ?- Les opportunits de montisation de l'information.- Comment installer une culture de la donne dans l'entreprise ?- Le poids et le cot de la qualit des donnes du patrimoine gr par l'entreprise.- L'apport de valeur par les donnes touche tous les mtiers de nos clients.

    Etude de casEtude de cas sur l'analyse de la valeur de la donne.

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 7

  • Une feuille dmargementpar demi-journe de prsenceest fournie en fin de formationainsi quune attestation de finde formation si le stagiaire abien assist la totalit de lasession.

    4) Les acteurs du Big Data et les enjeux organisationnels associs

    - Organisation, rles et gouvernance : les nouveaux modles l'heure du Big Data.- Pourquoi les silos organisationnels sont un frein majeur l'exploitation des donnes et comment yremdier ?- La Data Science : adapter les profils de statisticiens aux nouveaux enjeux.- Les spcialistes des nouveaux domaines et leurs mthodes de travail.- Les thmatiques de mise en uvre de la gouvernance des donnes.- Les acteurs de la gouvernance de la donne.- Les acteurs en charge de la qualit de la donne.- Quelles sont les grandes tendances rglementaires autour de la gestion des donnes et comment lesaborder ?

    DmonstrationDmonstration de l'importance de la gouvernance des donnes.

    5) Le Big Data tendu

    - La place de l'entreprise dans son cosystme de donnes.- Les donnes la frontire de l'entreprise (DMP).- Les donnes fournies par des partenaires : rseaux sociaux...- L'Internet des Objets (IoT) ou comment rendre son entreprise sensible aux nouveaux usages.- L'Open Data et ses apports dans l'analyse de donnes : nouvelles donnes, enrichissement, croisement dedonnes.- L'mergence des Chatbots ou l'automatisation de fonctions d'interface clients : quels impacts dans nosorganisations ?- L'exprience client augmente, levier de la transformation digitale des entreprises.- La fourniture de donnes comme nouvelle source de revenus.- Les donnes, carburant de l'innovation mtier.

    DmonstrationDmonstrations sur l'innovation base sur le Big Data, la Data Science et le Machine Learning.

    6) Les notions pour aller plus loin et quelques pistes pour se lancer

    - Quels sont les risques ne pas prendre en compte la gestion du patrimoine informationnel ?- Les grandes tendances autour de la Data pour les trois annes venir.- Les solutions technologiques : Big Data et Machine Learning.- Mode d'emploi pour lancer une initiative Big Data.- Les techniques du Big Data : tour d'horizon.- Les mtiers, fonctions et rles autour de la donne : la synthse et les diffrents niveaux de mise en uvre.- Pourquoi les entreprises se lancent-elles dans le Big Data ?

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 8

  • Stage pratique de 3 jour(s)Rf : BDT

    ParticipantsResponsables SI, architectesIT, chefs de projet et toutepersonne souhaitant acqurirdes bases sur le Big Data.

    Pr-requisConnaissances de base desarchitectures techniques.

    Prix 2018 : 2570 HT

    Dates des sessions

    PARIS17 sep. 2018, 03 dc. 2018

    ModalitsdvaluationPour les certifications, desexamens blancs permettentde mesurer le degr deprparation. Pour les cyclescertifiants, une journedexamen est mise en place.

    Comptences duformateurLes experts qui animentla formation sont desspcialistes des matiresabordes. Ils ont tvalids par nos quipespdagogiques tant sur leplan des connaissancesmtiers que sur celui de lapdagogie, et ce pour chaquecours quils enseignent. Ilsont au minimum cinq dixannes dexprience dansleur domaine et occupentou ont occup des postes responsabilit en entreprise.

    Moyenspdagogiques ettechniques Les moyens pdagogiqueset les mthodesd'enseignement utilisssont principalement : aidesaudiovisuelles, documentationet support de cours, exercicespratiques d'application etcorrigs des exercices pourles stages pratiques, tudesde cas ou prsentation de casrels pour les sminaires deformation.

    A l'issue de chaque stage ousminaire, ORSYS fournit auxparticipants un questionnaired'valuation du cours quiest ensuite analys par nosquipes pdagogiques.

    Une feuille dmargementpar demi-journe de prsence

    Big Data Foundation, certification> Big Data, BI, NoSQL, SGBD> Big Data et NoSQL

    L'explosion quantitative des donnes numriques a contraint trouver de nouvelles faons d'analyser lemonde, et cela a abouti l'mergence du Big Data. Cette formation apportera aux participants les bases duBig Data et du Data Mining et les prparera au passage de la certification Big Data Foundation de l'EXIN.

    OBJECTIFS PEDAGOGIQUES

    Dcouvrir les fondamentaux du Big DataComprendre ce qu'est le Data MiningEvaluer les technologies mergentes du Big DataPasser la certification Big Data Foundation

    1) Les fondamentaux du Big Data2) Mise en pratique des approches Big Data,synthse3) Les sources du Big Data4) Les donnes et l'information

    5) Data Mining6) Outil : Hadoop7) Outil : MongoDB8) Examen "Big Data Foundation" de l'EXIN

    Certification

    Le passage de l'examen s'effectue le dernier jour, en ligne et en anglais. Cela consiste en un QCM d'uneheure, comportant 40 questions. Un score minimum de 65% est requis pour russir l'examen.

    1) Les fondamentaux du Big Data

    - L'histoire et les principaux bnfices du Big Data.- Les trois dimensions du Big Data (volume, varit, vlocit).- Les technologies Hadoop et MongoDB.- Les limites du Big Data.- Les grands acteurs du march. La vie prive.

    2) Mise en pratique des approches Big Data, synthse

    - La fraude bancaire.- La relation client et le marketing.- L'internet des objets.- Le "People Analytics".

    3) Les sources du Big Data

    - Les principaux types de donnes.- Les donnes de l'entreprise (Oracle, SAP, Microsoft, Data Warhouses, donnes non-structures).- Les liens avec les rseaux sociaux (Facebook, Twitter, autres).- Les donnes publiques (Opendata, conomiques, financires, comportementales...).

    4) Les donnes et l'information

    - La notion de Datalake.- Collecter, prparer et grer les donnes.- La modlisation de donnes.- La Data Scurit, la Data Gouvernance, la Data Scientist.- La Metadata.

    5) Data Mining

    - Qu'est-ce que le Data Mining ?- Les diffrents types (classification, association...).- Quelques algorithmes essentiels (rgression linaires, rgression polynomiale).- Notion de sries temporelles.- La Machine Learning et l'Intelligence Artificielle (IA).- Les outils (Weka, KNIME, R).- Principales application : Analyse sentiment sur Twitter, analyse des log rseau...

    6) Outil : Hadoop

    - Prsentation de Hadoop (les principaux composants).- Architecture d'Hadoop. Installation et configuration.- MapReduce (Parallelisation automatique des programmes Hadoop).- DataProcessing avec Hadoop (Analyse de sentiment, analyse des logs).

    7) Outil : MongoDB

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 9

  • est fournie en fin de formationainsi quune attestation de finde formation si le stagiaire abien assist la totalit de lasession.

    - Prsentation de MongoDB (fonctionnalits et concepts).- Rplication et Sharding.- Ecosystmes (langages, drivers, outils, intgration avec Hadoop).- Installation et configuration.- Base de donnes de documents.- Modle de donnes de documents (Analyse de sentiment, analyse des logs).

    8) Examen "Big Data Foundation" de l'EXIN

    - Examen blanc avec correction commente.- Passage de l'examen "Big Data Foundation".

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 10

  • Stage pratique de 5 jour(s)Rf : BID

    ParticipantsDataminers, chargs d'tudesstatistiques, dveloppeurs,chefs de projet, consultantsen informatique dcisionnelle.

    Pr-requisConnaissances de basedes modles relationnels,des statistiques et deslangages de programmation.Connaissances de base desconcepts de la BusinessIntelligence.

    Prix 2018 : 3030 HT

    Dates des sessions

    AIX10 sep. 2018, 19 nov. 2018

    ANGERS10 sep. 2018, 19 nov. 2018

    BORDEAUX17 sep. 2018, 03 dc. 2018

    BRUXELLES10 sep. 2018, 26 nov. 2018

    DIJON17 sep. 2018, 03 dc. 2018

    GENEVE10 sep. 2018, 26 nov. 2018

    GRENOBLE17 sep. 2018, 03 dc. 2018

    LILLE10 sep. 2018, 19 nov. 2018

    LIMOGES10 sep. 2018, 19 nov. 2018

    LUXEMBOURG10 sep. 2018, 26 nov. 2018

    LYON17 sep. 2018, 03 dc. 2018

    MONTPELLIER10 sep. 2018, 19 nov. 2018

    NANCY10 sep. 2018, 19 nov. 2018

    NANTES10 sep. 2018, 19 nov. 2018

    ORLEANS10 sep. 2018, 19 nov. 2018

    PARIS09 juil. 2018, 27 ao. 201810&24 sep. 2018, 08&22 oct.201812&19 nov. 2018, 10 dc.2018

    RENNES10 sep. 2018, 19 nov. 2018

    ROUEN10 sep. 2018, 19 nov. 2018

    SOPHIA-ANTIPOLIS10 sep. 2018, 19 nov. 2018

    STRASBOURG10 sep. 2018, 19 nov. 2018

    TOULOUSE17 sep. 2018, 03 dc. 2018

    Big Data, mthodes et solutions pratiques pour l'analysedes donnes> Big Data, BI, NoSQL, SGBD> Big Data et NoSQL

    Ce stage vous permettra de comprendre les enjeux et les apports du Big Data ainsi que les technologies pourle mettre en uvre. Vous apprendrez intgrer des volumtries massives de donnes structures et nonstructures via un ETL, puis les analyser grce des modles statistiques et des dashboards dynamiques.

    OBJECTIFS PEDAGOGIQUES

    Comprendre les concepts et l'apport du Big Data par rapport aux enjeux mtiersComprendre l'cosystme technologique ncessaire pour raliser un projet Big DataAcqurir les comptences techniques pour grer des flux de donnes complexes, non structurs et massifsImplmenter des modles d'analyses statistiques pour rpondre aux besoins mtiersApprhender un outil de data visualisation pour restituer des analyses dynamiques

    1) Comprendre les concepts et les enjeux du BigData2) Les technologies du Big Data3) Grer les donnes structures et nonstructures

    4) Technique et mthodes Big data analytics5) Data visualisation et cas d'usage concrets6) Conclusion

    Exercice

    Mettre en place une plateforme Hadoop et ses composants de base, utiliser un ETL pour grer les donnes,crer des modles d'analyse et dashboards.

    1) Comprendre les concepts et les enjeux du Big Data

    - Origines et dfinition du Big Data.- Les chiffres cls du march dans le monde et en France.- Les enjeux du Big Data : ROI, organisation, confidentialit des donnes.- Un exemple d'architecture Big Data.

    2) Les technologies du Big Data

    - Description de l'architecture et des composants de la plateforme Hadoop.- Les modes de stockage (NoSQL, HDFS).- Principes de fonctionnement de MapReduce, Spark, Storm...- Principales distributions du march (Hortonworks, Cloudera, MapR, Elastic Map Reduce, Biginsights).- Installer une plateforme Hadoop.- Les technologies du datascientist.- Prsentation des technologies spcifiques pour le Big Data (Tableau, Talend, Qlikview ...).

    ExerciceInstallation d'une plateforme Big Data Hadoop (via Cloudera QuickStart ou autre).

    3) Grer les donnes structures et non structures

    - Principes de fonctionnement de Hadoop Distributed File System (HDFS).- Importer des donnes externes vers HDFS.- Raliser des requtes SQL avec HIVE.- Utiliser PIG pour traiter la donne.- Le principe des ETL (Talend...).- Gestion de streaming de donnes massive (NIFI, Kafka, Spark, Storm...)

    ExerciceImplmentation de flux de donnes massives.

    4) Technique et mthodes Big data analytics

    - Machine Learning, une composante de l'intelligence artificielle.- Dcouvrir les trois familles : Rgression, Classification et Clustering.- La prparation des donnes (data preparation, feature engineering).- Gnrer des modles en R ou Python.- Ensemble Learning.- Dcouvrir les outils du march : Jupyter Notebook, Dataku, Amazon Machine Learning...

    ExerciceMise en place d'analyses avec une des outils tudis.

    5) Data visualisation et cas d'usage concrets

    - Dfinir le besoin de la data visualisation.

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 11

  • TOURS10 sep. 2018, 19 nov. 2018

    ModalitsdvaluationLvaluation des acquis sefait tout au long de la sessionau travers des multiplesexercices raliser (50 70%du temps).

    Comptences duformateurLes experts qui animentla formation sont desspcialistes des matiresabordes. Ils ont tvalids par nos quipespdagogiques tant sur leplan des connaissancesmtiers que sur celui de lapdagogie, et ce pour chaquecours quils enseignent. Ilsont au minimum cinq dixannes dexprience dansleur domaine et occupentou ont occup des postes responsabilit en entreprise.

    Moyenspdagogiques ettechniques Les moyens pdagogiqueset les mthodesd'enseignement utilisssont principalement : aidesaudiovisuelles, documentationet support de cours, exercicespratiques d'application etcorrigs des exercices pourles stages pratiques, tudesde cas ou prsentation de casrels pour les sminaires deformation.

    A l'issue de chaque stage ousminaire, ORSYS fournit auxparticipants un questionnaired'valuation du cours quiest ensuite analys par nosquipes pdagogiques.

    Une feuille dmargementpar demi-journe de prsenceest fournie en fin de formationainsi quune attestation de finde formation si le stagiaire abien assist la totalit de lasession.

    - Analyse et visualisation des donnes.- Peut concerner tous les types de donnes dans la DataViz ?- Les outils DataViz du march.

    ExerciceInstallation et utilisation d'un outil de Data Visualisation pour constituer des analyses dynamiques.

    6) Conclusion

    - Ce qu'il faut retenir.- Synthse des bonnes pratiques.- Bibliographie.

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 12

  • Sminaire de 2 jour(s)Rf : NSQ

    ParticipantsDirection informatique etfonctionnelle. Responsableinformatique, chef de projet,architecte, dveloppeur.

    Pr-requisConnaissances de base desarchitectures techniqueset du management SI.Connaissances de bases dedonnes.

    Prix 2018 : 1910 HT

    Dates des sessions

    BRUXELLES06 sep. 2018, 29 nov. 2018

    GENEVE06 sep. 2018, 29 nov. 2018

    LUXEMBOURG06 sep. 2018, 29 nov. 2018

    PARIS20 sep. 2018, 29 nov. 2018

    ModalitsdvaluationLes apports thoriques et lespanoramas des techniqueset outils ne ncessitentpas davoir recours unevaluation des acquis.

    Comptences duformateurLes experts qui animentla formation sont desspcialistes des matiresabordes. Ils ont tvalids par nos quipespdagogiques tant sur leplan des connaissancesmtiers que sur celui de lapdagogie, et ce pour chaquecours quils enseignent. Ilsont au minimum cinq dixannes dexprience dansleur domaine et occupentou ont occup des postes responsabilit en entreprise.

    Moyenspdagogiques ettechniques Les moyens pdagogiqueset les mthodesd'enseignement utilisssont principalement : aidesaudiovisuelles, documentationet support de cours, exercicespratiques d'application etcorrigs des exercices pourles stages pratiques, tudesde cas ou prsentation de cas

    Bases de donnes NoSQL, enjeux et solutions> Big Data, BI, NoSQL, SGBD> Big Data et NoSQL

    Les bases de donnes NoSQL proposent une nouvelle approche rpondant des besoins de volumtrieet de nouveaux types de donnes. Ce sminaire prsente les raisons qui ont men ces bases, leurarchitecture, leurs bnfices et leurs limites ainsi que les produits existants.

    OBJECTIFS PEDAGOGIQUES

    Identifier les diffrences des BDD SQL et des BDD NoSQLvaluer les avantages et les inconvnients inhrents aux technologies NoSQLAnalyser les principales solutions du monde NoSQLIdentifier les champs d'application des BDD NoSQLComprendre les diffrentes architectures, les modles de donnes, les implmentations techniques.

    1) Introduction au NoSQL2) Le Relationnel et le NoSQL.3) Les mondes du NoSQL

    4) NoSQL et Big Data5) Choisir et mettre en place

    1) Introduction au NoSQL

    - L'historique du mouvement NoSQL.- Les diffrentes approches de gestion de BDD travers le temps : hirarchiques, relationnelles, objets, XML,NoSQL.- Les grands acteurs l'origine du mouvement NoSQL et du Big Data analytique : Google et Amazon.- Donnes structures, semi-structures et non-structures : provenance, typologie...- Vue synoptique des diffrents types de moteurs NoSQL du point de vue du modle de donnes.- Le NoSQL, le Big Data et les architectures Cloud: principes d'architecture communs et divergents.- Les modes de distribution : avec matre et dcentralis.- Le positionnement du NoSQL au sein du Big Analytics : de l're de la transaction l're de l'interaction.

    Rflexion collectivePourquoi le NoSQL ? et pourquoi son succs ? Les besoins, l'volution des architectures, la distribution etl'lasticit, le commodity hardware, quelques scnarios d'utilisation.

    2) Le Relationnel et le NoSQL.

    - Les bases de donnes relationnelles : leurs forces et leurs limites.- Structuration forte des donnes (schma explicite) versus Structure souple (schma implicite) et lamodlisation Agile.- Des qualits ACID aux qualits BASE.- Thorme CAP (cohrence, disponibilit, tolrance au partitionnement).- Les diffrents niveaux de cohrence.- Le langage SQL, la performance des jointures. L'accs par la cl en NoSQL.- L'volution vers le distribu : extensibilit verticale et horizontale.- Comprendre le NoSQL par le modle de l'agrgat et de la centralit de la donne.

    Rflexion collectiveComment choisir ? (le modle de l'agrgat versus le modle relationnel), comment grer l'interoprabilit ?

    3) Les mondes du NoSQL

    - Monde du NoSQL travers ses choix techniques et diffrentes bases NoSQL libres (du moins structur auplus structur).- L'architecture distribue : principes, le shared-nothing.- Disponibilit et cohrence diffre : gossip, timestamps, vector clock, rgle de majorit, arbre de Merkle.- Les patterns et les modles. Comment modliser et travailler efficacement en NoSQL.- Diffrents modles de connexion avec le client : sur cluster dcentralis, protocoles comme Thrift ouProtoBuf, REST...- Les bases orientes cl-valeur et en mmoire : Redis, Riak, Projet Voldemort, Aerospike.- Les bases orientes documents : Le format JSON. Couchbase Server, MongoDB, Elasticsearch.- Les bases orientes colonne distribues pour le Big Data oprationnel : Hadoop, Hbase, Cassandra,Accumulo...- Les moteurs orients graphes : Neo4j, OrientDB...- L'cosystme Hadoop : les diffrences avec les SGBDR, les relations avec le NoSQL.

    DmonstrationDmonstrations techniques, du point de vue de dveloppement, de la mise en uvre et de l'administration,des principaux moteurs NoSQL libres.

    4) NoSQL et Big Data

    - Big Data analytique : l'cosystme Hadoop.- Stockage et traitements. Les diffrentes formes de stockage dans HDFS : SequenceFile, Apache Parquet.

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 13

  • rels pour les sminaires deformation.

    A l'issue de chaque stage ousminaire, ORSYS fournit auxparticipants un questionnaired'valuation du cours quiest ensuite analys par nosquipes pdagogiques.

    Une feuille dmargementpar demi-journe de prsenceest fournie en fin de formationainsi quune attestation de finde formation si le stagiaire abien assist la totalit de lasession.

    - Diffrents types de traitements : MapReduce, Graphe orient acyclique, flux, Machine Learning, de graphesdistribu...- Les architectures Big Data : traitements batch, micro-batch, flux. Architecture Lambda, architecture Kappa.- Les outils intgrs : Apache Spark, Apache Flink.- Les outils d'analyses de donnes : dveloppement pour l'analyse Big Data, les outils du data scientist.- La prennit des outils du Big Data analytique devant l'volution trs rapide des frameworks.

    DmonstrationDmonstrations de l'usage d'une plate-forme intgre de Big Data analytique comme Apache Spark.

    5) Choisir et mettre en place

    - Le type d'utilisation propice au NoSQL. quels usages correspondent les bases NoSQL.- Les choix matriels.- Qu'est-ce qu'un modle de donnes NoSQL ?- Comment aborder la migration ?- Les impacts sur le dveloppement client. Comment dvelopper efficacement avec des bases NoSQL ?- Quels outils de supervision et comment les choisir ?- Quelle est la complexit administrative et la courbe d'apprentissage ?- Cas d'utilisation dans des entreprises existantes.- Et les performances ? Quelques benchmarks ?- Qu'est-ce que NewSQL ?

    Rflexion collectiveQuel est l'intrt de dployer des moteurs NoSQL dans le contexte de chacun, et quel moteur NoSQLchoisir ?

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 14

  • Sminaire de 2 jour(s)Rf : DMI

    ParticipantsResponsables Infocentre,responsables marketing,statisticiens, responsablesinformatiques, chefsde projets et expertsdcisionnels. Utilisateurset gestionnaires mtiers debases de donnes.

    Pr-requisConnaissances de baseen analyse dcisionnelle.Connaissances de base enstatistiques.

    Prix 2018 : 1910 HT

    Dates des sessions

    PARIS04 oct. 2018, 06 dc. 2018

    ModalitsdvaluationLes apports thoriques et lespanoramas des techniqueset outils ne ncessitentpas davoir recours unevaluation des acquis.

    Comptences duformateurLes experts qui animentla formation sont desspcialistes des matiresabordes. Ils ont tvalids par nos quipespdagogiques tant sur leplan des connaissancesmtiers que sur celui de lapdagogie, et ce pour chaquecours quils enseignent. Ilsont au minimum cinq dixannes dexprience dansleur domaine et occupentou ont occup des postes responsabilit en entreprise.

    Moyenspdagogiques ettechniques Les moyens pdagogiqueset les mthodesd'enseignement utilisssont principalement : aidesaudiovisuelles, documentationet support de cours, exercicespratiques d'application etcorrigs des exercices pourles stages pratiques, tudesde cas ou prsentation de casrels pour les sminaires deformation.

    A l'issue de chaque stage ousminaire, ORSYS fournit auxparticipants un questionnaired'valuation du cours qui

    Data Mining : synthse> Big Data, BI, NoSQL, SGBD> Big Data et NoSQL

    Le Data Mining apporte des solutions pour l'extraction de connaissances partir de donnes brutes. Cesminaire, alliant principes thoriques et expriences pratiques, vous propose une synthse sur le DataMining, ses applications, ses apports pour l'entreprise, ainsi que sur les mthodes et outils les plus utiliss.

    OBJECTIFS PEDAGOGIQUES

    Comprendre les principes et la finalit du Data Mining (DM)Identifier les principales techniques du DM et leur cas d'utilisationMettre en oeuvre sur un cas simple les mthodes de scoring et de gomarketingDcouvrir les mthodes prdictives et les mthodes descriptives du DMConnatre les principales tapes d'un projet Data Mining

    1) Le Systme d'Information Dcisionnel (SID)2) Comprendre le Data Mining (DM)3) Les techniques du Data Mining4) La mthode descriptive du Clustering

    5) Exemples d'application du DM6) Les donnes de l'entreprise7) Mthodologie de projet Data Mining8) Panorama des outils

    1) Le Systme d'Information Dcisionnel (SID)

    - Les enjeux du SID : besoins, domaines d'application.- Architecture type d'un SID, tat de l'art.- Elaboration des informations dcisionnelles.- Conception d'un SID : tapes, optimisation, organisation des donnes, dictionnaires.

    2) Comprendre le Data Mining (DM)

    - Dfinition et finalit du Data Mining (DM).- Quel lien entre le DM et les statistiques, quelle dpendance entre le DM et l'informatique ?- Diffrence entre DM et OLAP ?- Les attentes des entreprises, les rponses du DM.

    3) Les techniques du Data Mining

    - Les diffrentes familles du DM.- Les mthodes prdictives et les mthodes descriptives.- Analyse factorielle, typologique. La classification...- Les arbres de dcisions, les rseaux de neurones...- Classification des techniques de DM.

    4) La mthode descriptive du Clustering

    - Dfinition et mthodologie.- Les critres pour structurer les donnes classer.- Evaluation et validation des classes obtenues.- Les diffrentes sous-familles du Clustering.

    ExemplePrsentation d'applications du Clustering.

    5) Exemples d'application du DM

    - Le scoring : dfinition, finalit, mthodologie.- Le gomarketing : dfinition, finalit, mthodologie.

    ExempleMise en uvre de la mthode de scoring. Cas pratique d'utilisation de gomarketing.

    6) Les donnes de l'entreprise

    - Rappel de la problmatique des donnes du SI.- Qualit des donnes et administration des donnes.- Processus de collecte et d'exploration.- Cration d'agrgats et de nouvelles donnes.- Transformation des donnes.

    7) Mthodologie de projet Data Mining

    - Dfinition du problme mtier rsoudre et des objectifs atteindre.- Inventorier, dcrire et classer les donnes.- Concevoir et alimenter la base Data Mining.- Explorer, segmenter des entits analyses.

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 15

  • est ensuite analys par nosquipes pdagogiques.

    Une feuille dmargementpar demi-journe de prsenceest fournie en fin de formationainsi quune attestation de finde formation si le stagiaire abien assist la totalit de lasession.

    - Etablir et appliquer les modles d'analyse.- Itrer, dployer auprs des utilisateurs.- Maintenir le modle et le logiciel associ.

    8) Panorama des outils

    - Principaux outils du march : SAS, R, IBM SPSS...- Zoom sur l'outil SAS et sur l'ETL Powercenter.- Quels critres de choix pour ce type d'outils ?

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 16

  • Cours de synthse de 2jour(s)Rf : CYE

    ParticipantsToute personne ayant mettre en place unedmarche de gouvernancedes donnes d'une entrepriseet/ou un projet de Master DataManagement.

    Pr-requisAucune connaissanceparticulire.

    Prix 2018 : 1770 HT

    Dates des sessions

    PARIS20 sep. 2018, 08 nov. 201820 dc. 2018

    ModalitsdvaluationLobjectif de cette formationtant essentiellement defournir une synthse desmthodes et technologiesexistantes, il nest pasncessaire davoir recours une valuation des acquis.

    Comptences duformateurLes experts qui animentla formation sont desspcialistes des matiresabordes. Ils ont tvalids par nos quipespdagogiques tant sur leplan des connaissancesmtiers que sur celui de lapdagogie, et ce pour chaquecours quils enseignent. Ilsont au minimum cinq dixannes dexprience dansleur domaine et occupentou ont occup des postes responsabilit en entreprise.

    Moyenspdagogiques ettechniques Les moyens pdagogiqueset les mthodesd'enseignement utilisssont principalement : aidesaudiovisuelles, documentationet support de cours, exercicespratiques d'application etcorrigs des exercices pourles stages pratiques, tudesde cas ou prsentation de casrels pour les sminaires deformation.

    A l'issue de chaque stage ousminaire, ORSYS fournit auxparticipants un questionnaired'valuation du cours qui

    Master Data Management, la gouvernance des donnes> Big Data, BI, NoSQL, SGBD> Big Data et NoSQL

    Les enjeux concurrentiels et la ncessit accrue de transparence sur les donnes impose de disposerd'une mthodologie et d'une architecture de donnes matrises et alignes sur les mtiers. Ce cours vousprsentera les enjeux et les mthodes afin d'engager tous les Systmes d'Information dans cette dmarche.

    OBJECTIFS PEDAGOGIQUES

    Comprendre le rle stratgique de la gestion des donnes pour l'entreprise.Comprendre les principes d'architecture des donnesMettre en place une mthode de gouvernanceIntgrer la gestion des Master Data dans la dmarcheSavoir identifier les acteurs du MDM et leur positionnement

    1) Introduction2) La gouvernance des donnes3) Le Master Data Management

    4) Cycle de vie des donnes5) Prsentation des offres de MDM

    1) Introduction

    - Enjeux stratgiques des donnes pour l'entreprise.- Dfinition des notions "Donne" et "Information".- Les diffrentes sources de donnes de l'entreprise.- Les diffrentes formes d'exploitation des donnes.- Systme d'information oprationnel et dcisionnel.- Architectures : Relationnelle/Big Data.

    EchangesEchanges sur le rle stratgique des donnes pour l'entreprise.

    2) La gouvernance des donnes

    - Dfinition et enjeux de la gouvernance des donnes.- L'approche COBIT dans la gouvernance des donnes.- Les acteurs de la gouvernance des donnes.- Outils de mesure pour l'valuation de la maturit d'une entreprise.- Les grands principes de la dmarche de gouvernance de donnes.- Rfrences et tat de l'art.

    EchangesUne organisation met en place une dmarche de gouvernance des donnes l'occasion de la fusion de sonSI avec un nouveau SI provenant d'une acquisition. Etude de l'impact sur l'organisation et les SI

    3) Le Master Data Management

    - Positionnement du Master Data Management dans le Systme d'Information d'entreprise.- Les tapes essentielles de la dmarche Master Data Management.- Prsentation des architectures Master Data Management.- L'administration des donnes rfrentielles (Master Data).- Audit et gestion de la qualit des donnes.- Synthse des bonnes pratiques.- Le rle des utilisateurs dans le dispositif MDM.

    Rflexion collectiveEtude de cas d'un SI dpourvu de gestion de Master Data sur lequel on effectue une analyse des besoins enMD. Comparaison de deux approches possibles de mise en uvre.

    4) Cycle de vie des donnes

    - Typologie et volume de donnes.- Archivage de base de donnes.- Confidentialit des donnes.- Gestion des donnes de test.- Dcommisionnement d'applications.

    EchangesEchanges sur la gestion des donnes et leur cycle de vie.

    5) Prsentation des offres de MDM

    - Les tendances du march- MDM dans les suites Informatic /IBM/SAP.- MDM Microsoft.- Talend MDM.

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 17

  • est ensuite analys par nosquipes pdagogiques.

    Une feuille dmargementpar demi-journe de prsenceest fournie en fin de formationainsi quune attestation de finde formation si le stagiaire abien assist la totalit de lasession.

    - Conclusion.

    EchangesEchanges sur les stratgies d'approches possibles selon les contextes.

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 18

  • Sminaire de 3 jour(s)Rf : DRN

    ParticipantsIngnieurs, Data Scientistsdsirant s'initier aux rseauxde neurones et au DeepLearning.

    Pr-requisAvoir des bases enprogrammation. Avoirune bonne matrise desoutils informatiques et desstatistiques.

    Prix 2018 : 2610 HT

    Dates des sessions

    PARIS26 sep. 2018, 28 nov. 2018

    ModalitsdvaluationLes apports thoriques et lespanoramas des techniqueset outils ne ncessitentpas davoir recours unevaluation des acquis.

    Comptences duformateurLes experts qui animentla formation sont desspcialistes des matiresabordes. Ils ont tvalids par nos quipespdagogiques tant sur leplan des connaissancesmtiers que sur celui de lapdagogie, et ce pour chaquecours quils enseignent. Ilsont au minimum cinq dixannes dexprience dansleur domaine et occupentou ont occup des postes responsabilit en entreprise.

    Moyenspdagogiques ettechniques Les moyens pdagogiqueset les mthodesd'enseignement utilisssont principalement : aidesaudiovisuelles, documentationet support de cours, exercicespratiques d'application etcorrigs des exercices pourles stages pratiques, tudesde cas ou prsentation de casrels pour les sminaires deformation.

    A l'issue de chaque stage ousminaire, ORSYS fournit auxparticipants un questionnaired'valuation du cours quiest ensuite analys par nosquipes pdagogiques.

    Deep Learning et rseaux de neurones : lesfondamentaux> Big Data, BI, NoSQL, SGBD> Big Data et NoSQL

    L'Intelligence Artificielle, aprs avoir boulevers de nombreux domaines scientifiques, a commenc rvolutionner un grand nombre de secteurs conomiques (industrie, mdecine, communication, etc.).Nanmoins, sa prsentation dans les grands mdias relve souvent du fantasme, trs loigne de ce quesont rellement les domaines du machine learning ou du deep learning. Ce sminaire vous permettra dematriser les concepts cl du deep learning et de ses diffrents domaines de spcialisation. Vous dcouvrirezgalement les principales architectures de rseau existant aujourd'hui.

    OBJECTIFS PEDAGOGIQUES

    Comprendre les cls fondamentales d'une approche Machine ou Deep LearningMatriser les bases thoriques et pratiques d'architecture et de convergence de rseaux de neuronesConnatre les diffrentes architectures fondamentales existantes et matriser leurs implmentationsfondamentalesMatriser les mthodologies de mise en place de rseaux de neurones, les points forts et les limites de cesoutils

    1) Introduction IA, machine learning et deeplearning2) Concepts fondamentaux d'un rseau deneurones3) Outils usuels machine learning et deeplearning4) Convolutional Neural Networks (CNN)

    5) Recurrent Neural Networks (RNN)6) Modles gnrationnels : VAE et GAN7) Deep Reinforcement Learning

    Mthodes pdagogiques

    Ce sminaire se base sur des prsentations, des changes et des tudes de cas. Des outils comme Lasagneou Keras seront prsents.

    1) Introduction IA, machine learning et deep learning

    - Historique, concepts de base et applications de l'intelligence artificielle loin des fantasmes ports par cedomaine.- Intelligence collective : agrger une connaissance partage par de nombreux agents virtuels.- Algorithmes gntiques : faire voluer une population d'agents virtuels par slection.- Machine Learning usuel : dfinition.- Types de tches : Supervised Learning, Unsupervised Learning, Reinforcement Learning.- Types d'actions : classification, rgression, clustering, estimation de densit, rduction de dimensionalit.- Exemples d'algorithmes Machine Learning : rgression linaire, Naive Bayes, Random Tree.- Machine Learning vs Deep Learning : pourquoi le ML reste aujourd'hui l'tat de l'art (Random Forests &XGBoosts) ?

    2) Concepts fondamentaux d'un rseau de neurones

    - Rappel de bases mathmatiques.- Le rseau de neurones : architecture, fonctions d'activation et de pondration des activations prcdentes...- L'apprentissage d'un rseau de neurones : fonctions de cot, back-propagation, stochastic gradientdescent...- Modlisation d'un rseau de neurones : modlisation des donnes d'entre et de sortie selon le type deproblme.- Approximer une fonction par un rseau de neurones. Approximer une distribution par un rseau deneurones.- Data Augmentation : comment quilibrer un dataset ?- Gnralisation des rsultats d'un rseau de neurones.- Initialisations et rgularisations d'un rseau de neurones : L1/L2 Regularization, Batch Normalization.- Optimisations et algorithmes de convergence.

    DmonstrationApproximation d'une fonction et d'une distribution par un rseau de neurones.

    3) Outils usuels machine learning et deep learning

    - Outils de gestion de donne : Apache Spark, Apache Hadoop.- Outils Machine Learning usuel : Numpy, Scipy, Sci-kit.- Frameworks DL haut niveau : PyTorch, Keras, Lasagne.- Frameworks DL bas niveau : Theano, Torch, Caffe, Tensorflow.

    DmonstrationApplications et limites des outils prsents.

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 19

  • Une feuille dmargementpar demi-journe de prsenceest fournie en fin de formationainsi quune attestation de finde formation si le stagiaire abien assist la totalit de lasession.

    4) Convolutional Neural Networks (CNN)

    - Prsentation des CNNs : principes fondamentaux et applications.- Fonctionnement fondamental d'un CNN : couche convolutionnelle, utilisation d'un kernel, padding et stride...- Architectures CNN ayant port l'tat de l'art en classification d'images : LeNet, VGG Networks, Network inNetwork...- Utilisation d'un modle d'attention.- Application un cas de figure de classification usuel (texte ou image).- CNNs pour la gnration : super-rsolution, segmentation pixel pixel.- Principales stratgies d'augmentation des Feature Maps pour la gnration d'une image.

    Etude de casInnovations apportes par chaque architecture CNN et leurs applications plus globales (convolution 1x1 ouconnexions rsiduelles).

    5) Recurrent Neural Networks (RNN)

    - Prsentation des RNNs : principes fondamentaux et applications.- Fonctionnement fondamental du RNN : hidden activation, back propagation through time, unfolded version.- Evolutions vers les GRU (Gated Recurrent Units) et LSTM (Long Short Term Memory).- Problmes de convergence et vanising gradient.- Types d'architectures classiques : prdiction d'une srie temporelle, classification...- Architecture de type RNN Encoder Decoder. Utilisation d'un modle d'attention.- Applications NLP : word/character encoding, traduction.- Applications vido : prdiction de la prochaine image gnre d'une squence vido.

    DmonstrationDiffrents tats et volutions apportes par les architectures Gated Recurrent Units et Long Short TermMemory.

    6) Modles gnrationnels : VAE et GAN

    - Prsentation des modles gnrationnels Variational AutoEncoder (VAE) et Generative AdversarialNetworks (GAN).- Auto-encoder : rduction de dimensionnalit et gnration limite.- Variational AutoEncoder : modle gnrationnel et approximation de la distribution d'une donne.- Dfinition et utilisation de l'espace latent. Reparameterization trick.- Fondamentaux du Generative Adversarial Networks.- Convergence d'un GAN et difficults rencontres.- Convergence amliore : Wasserstein GAN, BeGAN. Earth Moving Distance.- Applications de gnration d'images ou de photographies, gnration de texte, super rsolution.

    DmonstrationApplications des modles gnrationnels et utilisation de l'espace latent.

    7) Deep Reinforcement Learning

    - Reinforcement Learning.- Utilisation d'un rseau de neurones pour approximer la fonction d'tat.- Deep Q Learning : experience replay et application au contrle d'un jeu vido.- Optimisations de la politique d'apprentissage. On-policy et off-policy. Actor critic architecture. A3C.- Applications : contrle d'un jeu vido simple ou d'un systme numrique.

    DmonstrationContrle d'un agent dans un environnement dfini par un tat et des actions possibles.

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 20

  • Sminaire de 2 jour(s)Rf : MLE

    ParticipantsDirigeants d'entreprise (CEO,COO, CFO, SG, DRH...),DSI, les CDO, responsablesinformatique, consultants,responsables de projets BigData.

    Pr-requisPossder une cultureinformatique de base. Laconnaissance des bases desmathmatiques statistiquesest un plus.

    Prix 2018 : 1910 HT

    Dates des sessions

    PARIS13 sep. 2018, 13 dc. 2018

    ModalitsdvaluationLes apports thoriques et lespanoramas des techniqueset outils ne ncessitentpas davoir recours unevaluation des acquis.

    Comptences duformateurLes experts qui animentla formation sont desspcialistes des matiresabordes. Ils ont tvalids par nos quipespdagogiques tant sur leplan des connaissancesmtiers que sur celui de lapdagogie, et ce pour chaquecours quils enseignent. Ilsont au minimum cinq dixannes dexprience dansleur domaine et occupentou ont occup des postes responsabilit en entreprise.

    Moyenspdagogiques ettechniques Les moyens pdagogiqueset les mthodesd'enseignement utilisssont principalement : aidesaudiovisuelles, documentationet support de cours, exercicespratiques d'application etcorrigs des exercices pourles stages pratiques, tudesde cas ou prsentation de casrels pour les sminaires deformation.

    A l'issue de chaque stage ousminaire, ORSYS fournit auxparticipants un questionnaired'valuation du cours qui

    Machine learning, l'tat de l'art> Big Data, BI, NoSQL, SGBD> Big Data et NoSQL

    Ce sminaire vise prendre conscience des enjeux lis au traitement de la donne par l'intelligenceartificielle, et en particulier par les algorithmes du machine learning. Il montre aux dcideurs, par uneapproche vulgarisatrice et interactive, les mcanismes du machine learning, les solutions concrtes et ladmarche de projet appliquer selon les cas d'usages en entreprise.

    OBJECTIFS PEDAGOGIQUES

    Comprendre les enjeux de l'utilisation du machine learning dans l'entreprisePositionner le machine learning dans la chane de traitement de la donneDistinguer les comptences ncessaires ou les profils recruterIdentifier les cls de russite d'un projet autour du machine learning

    1) Histoire du machine learning et contexte duBig Data2) Les donnes disposition : collecte etprparation3) Les outils du march pour le traitement de ladonne et le machine learning4) Les diffrents types d'apprentissage enmachine learning

    5) Les algorithmes du machine learning6) Procdure d'entranement et d'valuation desalgorithmes7) Mise en production d'un algorithme demachine learning8) Aspects thiques et juridiques lis l'Intelligence Artificielle

    Mthodes pdagogiques

    Illustration par des cas concrets. Prsentation des principaux cas d'usage selon les secteurs d'activits(Automobile, industrie, biens de consommation, finance, sant nergie, agriculture, transports,tlcommunication...).

    1) Histoire du machine learning et contexte du Big Data

    - Replacer leur chelle les concepts d'Intelligence Artificielle, apprentissage automatique (machinelearning)...- Le lien avec les mathmatiques, statistiques (infrentielles), data mining et data science.- Passer de l'analyse descriptive l'analyse prdictive puis prescriptive.- Les applications du machine learning (moteurs de recherche, dtection des spams, lecture des chques).- La typologie des algorithmes de Dominique CARDON.- La communaut Data Science et les challenges Kaggle (ex. de Netflix).

    Etude de casEtudes d'applications concrtes du machine learning (moteurs de recherche, dtection des spams, lecturedes chques).

    2) Les donnes disposition : collecte et prparation

    - Donnes structures, semi-structures et non structures.- Nature statistique des donnes (qualitatives ou quantitatives).- Objets connects (IoT) et streaming.- Opportunits et limites de l'Open Data.- Identification des corrlations, problme de la multicolinarit.- Rduction des dimensions par Analyse des Composantes Principales.- Dtection et correction des valeurs aberrantes.- Les ETL (Extract Transform Load).- Le Web scraping.

    DmonstrationDmonstration d'un ETL (Extract Transform Load). Recueil de donnes Web.

    3) Les outils du march pour le traitement de la donne et le machine learning

    - Les logiciels traditionnels (SAS, SPSS, Stata...) et leur ouverture l'Open Source.- Choisir entre les deux leaders Open Source : Python et R.- Plateformes Cloud (Azure, AWS, Google Cloud Platform) et solutions SAAS (IBM Watson, Dataku).- Nouveaux postes en entreprises : data engineer, data scientist, data analyst, etc.- Associer les bonnes comptences ces diffrents outils.- Les API en ligne (IBM Watson, Microsoft Cortana Intelligence...).- Les chats bot (agent conversationnel).

    DmonstrationDmonstration d'un chat bot (agent conversationnel) et d'Azure Machine Learning.

    4) Les diffrents types d'apprentissage en machine learning

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 21

  • est ensuite analys par nosquipes pdagogiques.

    Une feuille dmargementpar demi-journe de prsenceest fournie en fin de formationainsi quune attestation de finde formation si le stagiaire abien assist la totalit de lasession.

    - Apprentissage supervis : rpter un exemple.- Apprentissage non supervis : dcouvrir les donnes.- Online (machine) learning par opposition aux techniques batch.- Reinforcement learning : optimisation d'une rcompense.- Autres types d'apprentissage (par transfert, squentiel, actif...).- Illustrations (moteurs de recommandation...).

    DmonstrationDmonstrations sur les diffrents types d'apprentissage machine learning possibles.

    5) Les algorithmes du machine learning

    - Rgression linaire simple et multiple. Limites des approches linaires.- Rgression polynomiale (LASSO). Sries temporelles.- Rgression logistique et applications en scoring.- Classification hirarchique et non hirarchique (KMeans).- Classification par arbres de dcision ou approche Nave Bayes.- Ramdom Forest (dveloppement des arbres de dcision).- Gradiant Boosting. Rseaux de neurones. Machine support de vecteurs.- Deep learning : exemples et raisons du succs actuel.- Text Mining : analyse des corpus de donnes textuelles.

    DmonstrationDmonstration des diffrents algorithmes de base sous R ou Python.

    6) Procdure d'entranement et d'valuation des algorithmes

    - Sparation du jeu de donnes en plusieurs : entranement, test et validation.- Techniques de bootstrap (bagging).- Exemple de la validation croise.- Dfinition d'une mtrique de performance.- Descente de gradient stochastique (minimisation de la mtrique).- Courbes ROC et de lift pour valuer et comparer les algorithmes.- Matrice de confusion : faux positifs et faux ngatifs.

    DmonstrationDmonstration du choix du meilleur algorithme.

    7) Mise en production d'un algorithme de machine learning

    - Description d'une plateforme Big Data.- Principe de fonctionnement des API.- Du dveloppement la mise en production.- Stratgie de maintenance corrective et volutive.- Evaluation du cot de fonctionnement en production.

    DmonstrationDmonstration d'API de golocalisation et d'analyse de sentiments.

    8) Aspects thiques et juridiques lis l'Intelligence Artificielle

    - Missions de la CNIL et volutions venir.- Question du droit d'accs aux donnes personnelles.- Question de la proprit intellectuelle des algorithmes.- Nouveaux rles dans l'entreprise : Chief Data Officer et Data Protection Officer.- Question de l'impartialit des algorithmes.- Attention au biais de confirmation.- Les secteurs et les mtiers touchs par l'automatisation.

    Rflexion collectiveRflexion en commun pour identifier les cls de russite.

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 22

  • Stage pratique de 3 jour(s)Rf : MLA

    ParticipantsIngnieurs / chefs de projetsouhaitant considrer lestechniques d'apprentissageautomatique dans larsolution de problmesindustriels.

    Pr-requisBonnes connaissances enstatistiques de base, ouconnaissances quivalentes celles apportes par le stage"Statistiques, matriser lesfondamentaux" (Rf. STA).

    Prix 2018 : 1990 HT

    Dates des sessions

    PARIS09 juil. 2018

    ModalitsdvaluationLvaluation des acquis sefait tout au long de la sessionau travers des multiplesexercices raliser (50 70%du temps).

    Comptences duformateurLes experts qui animentla formation sont desspcialistes des matiresabordes. Ils ont tvalids par nos quipespdagogiques tant sur leplan des connaissancesmtiers que sur celui de lapdagogie, et ce pour chaquecours quils enseignent. Ilsont au minimum cinq dixannes dexprience dansleur domaine et occupentou ont occup des postes responsabilit en entreprise.

    Moyenspdagogiques ettechniques Les moyens pdagogiqueset les mthodesd'enseignement utilisssont principalement : aidesaudiovisuelles, documentationet support de cours, exercicespratiques d'application etcorrigs des exercices pourles stages pratiques, tudesde cas ou prsentation de casrels pour les sminaires deformation.

    A l'issue de chaque stage ousminaire, ORSYS fournit auxparticipants un questionnaired'valuation du cours qui

    Machine learning, mthodes et solutions> Big Data, BI, NoSQL, SGBD> Big Data et NoSQL

    Le machine learning couvre l'ensemble des mthodes et concepts qui permettent d'extraire automatiquement partir de donnes, des modles de prdiction et de prise de dcision. Vous mettrez en uvre toute lachane de conception applique au machine learning dans un contexte Big Data batch et streaming.

    OBJECTIFS PEDAGOGIQUES

    Comprendre les diffrents modles d'apprentissageModliser un problme pratique sous forme abstraiteIdentifier les mthodes d'apprentissage pertinentes pour rsoudre un problmeAppliquer et valuer les mthodes identifies sur un problmeFaire le lien entre les diffrentes techniques d'apprentissage

    1) Introduction au machine learning2) Procdures d'valuation de modles3) Les modles prdictifs l'approche frquentiste

    4) Les modles et apprentissage baysiens5) Machine learning en production

    Mthodes pdagogiques

    Chaque algorithme de la formation est d'abord prsent thoriquement suivi d'une dmonstration danschacun des trois langages R, Python et Scala.

    Travaux pratiques

    Les stagiaires sont libres de choisir R, Python ou Scala pour d'effectuer les exercices sur plusieurs jeux dedonnes d'une trs grande varit.

    1) Introduction au machine learning

    - Le Big Data et le machine learning.- Les algorithmes d'apprentissage superviss, non superviss et par renforcement.- Les tapes de construction d'un modle prdictif.- Dtecter les valeurs aberrantes et traiter les donnes manquantes.- Comment choisir l'algorithme et les variables de l'algorithme.

    DmonstrationPrise en main de l'environnement Spark avec R, Python et Scala l'aide de Jupiter Notebook. Visualiserplusieurs exemples de modles fournis.

    2) Procdures d'valuation de modles

    - Les techniques de r-chantillonnage en jeu d'apprentissage, de validation et de test.- Test de reprsentativit des donnes d'apprentissage.- Mesures de performance des modles prdictifs.- Matrice de confusion, de cot et la courbe ROC et AUC.

    Travaux pratiquesEvaluation et comparaison des diffrents algorithmes sur les modles fournis.

    3) Les modles prdictifs l'approche frquentiste

    - Apprentissage statistique.- Conditionnement des donnes et rduction de dimension.- Machines vecteurs supports et mthodes noyaux.- Quantification Vectorielle.- Rseaux de neurones et deep learning.- Ensemble learning et arbres de dcision.- Bandits optimisme face l'incertitude.

    Travaux pratiquesMise en uvre des familles d'algorithmes en utilisant des jeux de donnes varis.

    4) Les modles et apprentissage baysiens

    - Principes d'infrence et d'apprentissage baysiens.- Modles graphiques : rseaux baysiens, champs de Markov, infrence et apprentissage.- Mthodes baysiennes : Naive Bayes, mlanges de gaussiennes, processus gaussiens.- Modles markoviens : processus markoviens, chanes de Markov, chanes de Markov caches, filtragebaysien.

    Travaux pratiquesMise en uvre des familles d'algorithmes en utilisant des jeux de donnes varis.

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 23

  • est ensuite analys par nosquipes pdagogiques.

    Une feuille dmargementpar demi-journe de prsenceest fournie en fin de formationainsi quune attestation de finde formation si le stagiaire abien assist la totalit de lasession.

    5) Machine learning en production

    - Les spcificits lies au dveloppement d'un modle en environnement distribu.- Le dploiement Big Data avec Spark et la MLlib.- Le Cloud : Amazon, Microsoft Azure ML, IBM Bluemix...- La maintenance du modle.

    Travaux pratiquesMise en production d'un modle prdictif avec l'intgration dans des processus de batch et dans des flux detraitements.

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 24

  • Stage pratique de 3 jour(s)Rf : AZL

    ParticipantsData Scientists, data miners,statisticiens, dveloppeursen charge de la mise enproduction des modles.

    Pr-requisConnaissances de baseen statistiques (centrage,dispersion, corrlation,tests d'hypothses). Desnotions de programmation oud'algorithmique peuvent treutiles.

    Prix 2018 : 1990 HT

    Dates des sessions

    PARIS17 sep. 2018, 26 nov. 2018

    ModalitsdvaluationLvaluation des acquis sefait tout au long de la sessionau travers des multiplesexercices raliser (50 70%du temps).

    Comptences duformateurLes experts qui animentla formation sont desspcialistes des matiresabordes. Ils ont tvalids par nos quipespdagogiques tant sur leplan des connaissancesmtiers que sur celui de lapdagogie, et ce pour chaquecours quils enseignent. Ilsont au minimum cinq dixannes dexprience dansleur domaine et occupentou ont occup des postes responsabilit en entreprise.

    Moyenspdagogiques ettechniques Les moyens pdagogiqueset les mthodesd'enseignement utilisssont principalement : aidesaudiovisuelles, documentationet support de cours, exercicespratiques d'application etcorrigs des exercices pourles stages pratiques, tudesde cas ou prsentation de casrels pour les sminaires deformation.

    A l'issue de chaque stage ousminaire, ORSYS fournit auxparticipants un questionnaired'valuation du cours qui

    Microsoft Azure Machine Learning, dvelopper etexploiter des algorithmes> Big Data, BI, NoSQL, SGBD> Big Data et NoSQL

    Les algorithmes s'imposent comme l'un des sujets prdominants du Big Data. Ce sont les outils desmthodes exploratoires, explicatives ou prdictives que l'on applique aux donnes, dans le cadre du MachineLearning. Ce cours vous permettra d'acqurir les comptences ncessaires l'utilisation d'Azure MachineLearning.

    OBJECTIFS PEDAGOGIQUES

    Prendre en main l'interface d'Azure Machine LearningChoisir parmi plusieurs algorithmes quivalents selon une problmatiqueDcouvrir les bases des langages R et Python pour augmenter les capacits d'Azure Machine LearningExploiter une exprience au travers d'un Web Service

    1) Prise en main de l'interface Azure MachineLearning2) Crer une exprience de Machine Learning3) Savoir paramtrer les grandes famillesd'algorithmes

    4) Traiter d'autres types de donnes5) Dcouvrir le nouvel outil Azure MachineLearning Workbench

    Exercice

    Cas pratiques sur des donnes ralistes et volumineuses

    1) Prise en main de l'interface Azure Machine Learning

    - L'offre Azure. Facturation l'usage.- Prise en main de l'interface Machine Learning Studio.- Crer un dataset. Se connecter une source de donnes.- Construire une exprience de ML.- Dfinir un Web Service prdictif.- La Gallery Cortana Intelligence.

    Travaux pratiquesPrise en main de l'interface Azure ML. Cration d'un dataset. Dfinition d'un Web Service prdictif.

    2) Crer une exprience de Machine Learning

    - Utiliser l'arbre de choix des algorithmes.- Dtecter les valeurs aberrantes.- Choisir les variables de l'algorithme (features slection).- Initialiser le modle, entraner le modle, valuer le modle.- Reformer un modle prdictif.- Transformer les variables de lalgorithme (features engineering).- Limiter les lignes dun jeu de donnes.

    Travaux pratiquesvaluer des diffrents algorithmes l'aide de la courbe ROC.

    3) Savoir paramtrer les grandes familles d'algorithmes

    - Algorithmes de clustering (approche non supervise).- Algorithmes de rgression linaire.- Algorithmes de rgression logistique ou ordinale.- Algorithmes de classification (approche supervise) binaire ou one-versus-all.- Mthodes ensemblistes (fort, jungle).- Packages R et Python. Le framework Vowpall Wabbit.- Paramtrage des algorithmes.

    Travaux pratiquesParamtrer des familles d'algorithmes avec R/Python.

    4) Traiter d'autres types de donnes

    - Analyser les sries temporelles, dtecter les anomalies.- Analyse de donnes textuelles avec les packages R.- Appliquer un algorithme Vowpal Wabbit (Latent Dirichlet Analysis).- Exploiter les images avec notebooks Jupyter.

    Travaux pratiquesTraitement des donnes texte ou image.

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 25

  • est ensuite analys par nosquipes pdagogiques.

    Une feuille dmargementpar demi-journe de prsenceest fournie en fin de formationainsi quune attestation de finde formation si le stagiaire abien assist la totalit de lasession.

    5) Dcouvrir le nouvel outil Azure Machine Learning Workbench

    - Nouvelles briques Azure pour le ML (Experimentation / Model Management).- Rle et installation du client Workbench.- Inspection et prparation des donnes (transformations par exemple, transformations avances).- Dveloppement dans un notebook.- Suivi des excutions et des mtriques dvaluation.- Scnarios de dploiement (local/Spark/Docker).

    Travaux pratiquesPrparation de donnes avec Azure ML Workbench.

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 26

  • Stage pratique de 4 jour(s)Rf : HOD

    ParticipantsAdministrateurs de clusterHadoop, dveloppeurs.

    Pr-requisBonnes connaissancesde l'administration Linux.Exprience requise.

    Prix 2018 : 2490 HT

    Dates des sessions

    PARIS04 sep. 2018, 13 nov. 2018

    ModalitsdvaluationLvaluation des acquis sefait tout au long de la sessionau travers des multiplesexercices raliser (50 70%du temps).

    Comptences duformateurLes experts qui animentla formation sont desspcialistes des matiresabordes. Ils ont tvalids par nos quipespdagogiques tant sur leplan des connaissancesmtiers que sur celui de lapdagogie, et ce pour chaquecours quils enseignent. Ilsont au minimum cinq dixannes dexprience dansleur domaine et occupentou ont occup des postes responsabilit en entreprise.

    Moyenspdagogiques ettechniques Les moyens pdagogiqueset les mthodesd'enseignement utilisssont principalement : aidesaudiovisuelles, documentationet support de cours, exercicespratiques d'application etcorrigs des exercices pourles stages pratiques, tudesde cas ou prsentation de casrels pour les sminaires deformation.

    A l'issue de chaque stage ousminaire, ORSYS fournit auxparticipants un questionnaired'valuation du cours quiest ensuite analys par nosquipes pdagogiques.

    Une feuille dmargementpar demi-journe de prsenceest fournie en fin de formationainsi quune attestation de fin

    Hadoop, installation et administration> Big Data, BI, NoSQL, SGBD> Big Data et NoSQL

    La plateforme Apache Hadoop permet de faciliter la cration d'applications distribues. Ce stage vouspermettra de comprendre son architecture et vous donnera les connaissances ncessaires pour installer,configurer et administrer un cluster Hadoop. Vous apprendrez galement l'optimiser et le maintenir dans letemps.

    OBJECTIFS PEDAGOGIQUES

    Dcouvrir les concepts et les enjeux lis HadoopComprendre le fonctionnement de la plateforme et de ses composantsInstaller la plateforme et la grerOptimiser la plateforme

    1) Prsentation du Framework Apache Hadoop2) Prparations et configuration du clusterHadoop3) Installation d'une plateforme Hadoop4) Gestion d'un cluster Hadoop

    5) Gestion des donnes dans HDFS6) Configuration avance7) Monitoring et optimisation Tuning

    Mthodes pdagogiques

    Mthode pdagogique de type "magistrale" avec des exercices pratiques l'appui, aprs chaque notion ougroupe de notions exposes.

    Travaux pratiques

    Installation du cluster Hadoop et paramtrage.

    1) Prsentation du Framework Apache Hadoop

    - Enjeux du Big Data et apports du framework Hadoop.- Prsentation de l'architecture Hadoop.- Description des principaux composants de la plateforme Hadoop.- Prsentation des distributions principales du march et des outils complmentaires (Cloudera, MapR,Dataiku...).- Avantages/inconvnients de la plateforme.

    2) Prparations et configuration du cluster Hadoop

    - Principes de fonctionnement de Hadoop Distributed File System (HDFS).- Principes de fonctionnement de MapReduce.- Design "type" du cluster.- Critres de choix du matriel.

    Travaux pratiquesConfiguration du cluster Hadoop.

    3) Installation d'une plateforme Hadoop

    - Type de dploiement.- Installation d'Hadoop.- Installation d'autres composants (Hive, Pig, HBase, Flume...).

    Travaux pratiquesInstallation d'une plateforme Hadoop et des composants principaux.

    4) Gestion d'un cluster Hadoop

    - Gestion des nuds du cluster Hadoop.- Les TaskTracker, JobTracker pour MapReduce.- Gestion des tches via les schedulers.- Gestion des logs.- Utiliser un manager.

    Travaux pratiquesLister les jobs, statut des queues, statut des jobs, gestion des tches, accs la web UI.

    5) Gestion des donnes dans HDFS

    - Import de donnes externes (fichiers, bases de donnes relationnelles) vers HDFS.- Manipulation des fichiers HDFS.

    Travaux pratiquesImporter des donnes externes avec Flume, consulter des bases de donnes relationnelles avec Sqoop.

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 27

  • de formation si le stagiaire abien assist la totalit de lasession.

    6) Configuration avance

    - Gestion des autorisations et de la scurit.- Reprise sur chec d'un name node (MRV1).- NameNode high availability (MRV2/YARN).

    Travaux pratiquesConfiguration d'un service-level authentication (SLA) et d'un Access Control List (ACL).

    7) Monitoring et optimisation Tuning

    - Monitoring (Ambari, Ganglia...).- Benchmarking/profiling d'un cluster.- Les outils Apache GridMix, Vaaidya.- Choisir la taille des blocs.- Autres options de tuning (utilisation de la compression, configuration mmoire...).

    Travaux pratiquesApprhender les commandes au fil de l'eau de monitoring et d'optimisation de cluster.

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 28

  • Stage pratique de 3 jour(s)Rf : ELA

    ParticipantsCTO, COO, chefs deprojets techniques,responsables d'applications,responsables des oprations,administrateurs techniques.

    Pr-requisConnaissances de baseen dveloppement.Connaissances de base enadministration du systmed'exploitation Windows ouLinux/Unix.

    Prix 2018 : 1990 HT

    Dates des sessions

    PARIS03 sep. 2018, 14 nov. 201817 dc. 2018

    ModalitsdvaluationLvaluation des acquis sefait tout au long de la sessionau travers des multiplesexercices raliser (50 70%du temps).

    Comptences duformateurLes experts qui animentla formation sont desspcialistes des matiresabordes. Ils ont tvalids par nos quipespdagogiques tant sur leplan des connaissancesmtiers que sur celui de lapdagogie, et ce pour chaquecours quils enseignent. Ilsont au minimum cinq dixannes dexprience dansleur domaine et occupentou ont occup des postes responsabilit en entreprise.

    Moyenspdagogiques ettechniques Les moyens pdagogiqueset les mthodesd'enseignement utilisssont principalement : aidesaudiovisuelles, documentationet support de cours, exercicespratiques d'application etcorrigs des exercices pourles stages pratiques, tudesde cas ou prsentation de casrels pour les sminaires deformation.

    A l'issue de chaque stage ousminaire, ORSYS fournit auxparticipants un questionnaired'valuation du cours qui

    Elasticsearch, administration et exploitation> Big Data, BI, NoSQL, SGBD> Big Data et NoSQL

    Elasticsearch est un moteur de recherche et d'indexation de donnes proposant des fonctionnalits derecherche et d'analyse innovantes. Ce stage vous apprendra les principes cls de recherche de donnes etles possibilits offertes par Elasticsearch et installer, configurer et administrer Elasticsearch.

    OBJECTIFS PEDAGOGIQUES

    Comprendre le fonctionnement d'Elasticsearch, logstash et KibanaEvaluer les possibilits offertes par Elasticsearch, logstash et KibanaInstaller et configurer ElasticsearchAdministrer et surveiller un cluster Elasticsearch

    1) Installation et utilisation d'Elasticsearch,logstash et Kibana2) Fonctionnement d'Elasticsearch3) Possibilits offertes par Elasticsearchlogstash et Kibana

    4) Configuration de la recherche et del'indexation5) Configuration et administration du cluster6) Administration du cluster

    1) Installation et utilisation d'Elasticsearch, logstash et Kibana

    - Dveloppement d'applications utilisant Elasticsearch.- Impact sur le design d'applications existantes.- Prrequis et types d'installations.- Configuration et mise en uvre.

    Travaux pratiquesInstallation d'Elasticsearch, logstash et Kibana.

    2) Fonctionnement d'Elasticsearch

    - Prsentation d'Apache Lucene.- Architecture as a Cloud et concepts cls (cluster, node, etc.).- Le format JSON. L'API REST.- Scoring et pertinence des requtes.- Recherches simples.- Stockage de donnes.- Le rle de logstash et de Kibana.

    Travaux pratiquesStockage de donnes dans Elasticsearch. Importation de donnes. Administration et premires requtessimples de recherche.

    3) Possibilits offertes par Elasticsearch logstash et Kibana

    - Traitement de gros volumes de requtes et d'indexation.- Indexation et recherches sur les documents et des donnes.- Analyse de documents et de donnes.- Calcul des listes de rponses.- Filtrage et tri des rsultats.- Suggestion de requtes.

    Travaux pratiquesManipulation de l'indexation. Mise en uvre de requtes, de filtrage et de tri de rsultats. Configuration pourle traitement des gros volumes.

    4) Configuration de la recherche et de l'indexation

    - Gros volumes de requtes et d'indexation.- L'indexation des donnes.- Les requtes de recherche.- Les recherches avances.- La percolation.

    Travaux pratiquesConfiguration de l'extraction de donnes issues de fichiers non structurs et de la recherche de donnesavance.

    5) Configuration et administration du cluster

    - Configuration du cluster Elasticsearch.- Prparation du cluster Elasticsearch pour le traitement des gros volumes.- Configuration des nodes.- Gestion des templates.

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 29

  • est ensuite analys par nosquipes pdagogiques.

    Une feuille dmargementpar demi-journe de prsenceest fournie en fin de formationainsi quune attestation de finde formation si le stagiaire abien assist la totalit de lasession.

    - Administration du cluster Elasticsearch.

    Travaux pratiquesRevue dtaille du fichier elasticsearch.yml. Mise en uvre d'un cluster Elasticsearch.

    6) Administration du cluster

    - Surveillance du cluster.- La rpartition de charge.- L'allocation des nodes.- Alias d'index. Plug-ins Elasticsearch.- Proprits "Transient" et "Persistent".- Principes de la sauvegarde et la restauration.

    ExempleUtilisation des Plug-ins et de scripts Elasticsearch.

    ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Dfense cedex. Tl : +33 (0)1 49 07 73 73. Fax : +33(0)1 49 07 73 78 page 30

  • Stage pratique de 3 jour(s)Rf : SSA

    ParticipantsCette formation s'adresseaux administrateurs et au