4
animé par GUY CHESNOT BIG DATA, SYNTHÈSE PROCHAINES SESSIONS 2017 PARIS LA DÉFENSE 23-24 MARS 22-23 JUIN 7-8 SEPTEMBRE 11-12 DÉCEMBRE Édition janvier 2017 SÉMINAIRES État de l’art

Séminaire BIG DATA, SYNTHÈSE - ORSYS Formation

Embed Size (px)

Citation preview

Page 1: Séminaire BIG DATA, SYNTHÈSE - ORSYS Formation

animé par GUY CHESNOT

BIG DATA, SYNTHÈSE

PROCHAINES SESSIONS 2017PARIS LA DÉFENSE

23-24 MARS 22-23 JUIN 7-8 SEPTEMBRE 11-12 DÉCEMBRE

Édition janvier 2017

SÉMINAIRES État de l’art

Page 2: Séminaire BIG DATA, SYNTHÈSE - ORSYS Formation

GUY CHESNOTResponsable avant-vente stoc-kage et Big Data chez Silicon Graphics, c’est un ancien élève de l’École Polytechnique et de Télécom ParisTech. Il se consacre à l’étude et à la préconisation des architectures de stockage (à ce titre, il est régulièrement

cité dans des articles de presse), des grands projets de calcul intensif, des infrastructures d’analyse de données et des centres de données. Il était auparavant chez Cray Research. Il a également enseigné l’architecture des ordinateurs, la conception des systèmes d’exploitation, le stockage de données et le parallélisme à l’université de Marne-la-Vallée, en 2ème et 3ème cycles. Il donne des conférences sur les principes et les aspects techniques du Big Data depuis 2009, et préconise des architectures matérielles et logicielles dans le cadre d’analyses avan-cées de données numériques.

Publications chez Vuibert Informatique Logiciels de stockage de données (2001)Solutions Informatiques pour la Vidéo (2007)Cloud computing, big data, parallélisme, Hadoop – stockage de données du futur (2013, nominé en 2014 au Prix du livre informatique francophone).

Selon IBM, la planète génère, chaque jour, 2,5 trillions d’octets de données. Entre les données structurées et les informations tirées des réseaux sociaux, 90% des données actuelles ont été créées au cours des deux dernières années. Les technologies du Big Data se proposent d’analyser cette avalanche de données, structurées ou non, pour prévenir les pannes, détecter les anomalies, anticiper les besoins des consommateurs mais aussi créer des produits et services « disruptifs ». Ce séminaire de deux jours passe en revue les différentes méthodes utilisées pour enregistrer les données, les stocker, y accéder en temps réel, ainsi que les nouvelles méthodes d’analyse. Des exemples concrets illustrent également les différents cas d’usage du Big Data.

JOUR 1

z Introduction - Les origines du Big Data : un monde de données numériques, l’e-santé, chronologie.

- Une définition par les quatre V : la provenance des données. - Une rupture : changements de quantité, de qualité, d’habitudes.

- La valeur de la donnée : un changement d’importance. - La donnée en tant que matière première. - Le quatrième paradigme de la découverte scientifique.

z Big Data : traitements, depuis l’acquisition jusqu’au résultat

- L’enchaînement des opérations. L’acquisition. - Le recueil des données : crawling, scraping. - La gestion de flux événementiel (Complex Event Processing, CEP).

- L’indexation du flux entrant. - L’intégration avec les anciennes données. - La qualité des données : un cinquième V ? - Les différents types de traitement : recherche, apprentissage (machine learning, transactionnel, data mining).

- D’autres modèles d’enchaînement : Amazon, e-Santé. - Un ou plusieurs gisements de données ? De Hadoop à l’in-memory.

- De l’analyse de tonalité à la découverte de connaissances.

z Relations entre Cloud et Big Data - Le modèle d’architecture des Clouds publics et privés. - Les services XaaS. - Les objectifs et avantages des architectures Cloud. - Les infrastructures. - Les égalités et les différences entre Cloud et Big Data. - Les Clouds de stockage. - Classification, sécurité et confidentialité des données. - La structure comme critère de classification : non structurée, structurée, semi-structurée.

- Classification selon le cycle de vie : données temporaires ou permanentes, archives actives.

Big Data : synthèse

Big Data et Business Intelligence

Planning complet ci-joint. Tous nos séminaires peuvent également être organisés en intra-entreprise, contactez-nous.

Durée : 2 jours

Réf. : BGA Prix HT

1 950 €

Prochaines sessions 2017Paris La Défense

23-24 mars 22-23 juin 7-8 sept. 11-12 décembre

INTERVENANT

Page 3: Séminaire BIG DATA, SYNTHÈSE - ORSYS Formation

- Difficultés en matière de sécurité : augmentation des volumétries, la distribution.

- Les solutions potentielles.

z Introduction à l’Open Data - La philosophie des données ouvertes et les objectifs. - La libération des données publiques. - Les difficultés de la mise en œuvre. - Les caractéristiques essentielles des données ouvertes. - Les domaines d’application. Les bénéfices escomptés.

z Matériel pour les architectures de stockage - Les serveurs, disques, réseau et l’usage des disques SSD, l’importance de l’infrastructure réseau.

- Les architectures Cloud et les architectures plus traditionnelles.

- Les avantages et les difficultés. - Le TCO. La consommation électrique : serveurs (IPNM), disques (MAID).

- Le stockage objet : principe et avantages. - Le stockage objet par rapport aux stockages traditionnels NAS et SAN.

- L’architecture logicielle. - Niveaux d’implantation de la gestion du stockage. - Le «Software Defined Storage». - Architecture centralisée (Hadoop File System). - L’architecture Peer-to-Peer et l’architecture mixte. - Les interfaces et connecteurs : S3, CDMI, FUSE, etc. - Avenir des autres stockages (NAS, SAN) par rapport au stockage objet.

JOUR 2

z Protection des données - La conservation dans le temps face aux accroissements de volumétrie.

- La sauvegarde, en ligne ou locale ? - L’archive traditionnelle et l’archive active. - Les liens avec la gestion de hiérarchie de stockage : avenir des bandes magnétiques.

- La réplication multisite. - La dégradation des supports de stockage.

z Méthodes de traitement et champs d’application - Classification des méthodes d’analyse selon le volume des données et la puissance des traitements.

- Hadoop : le modèle de traitement Map Reduce. - L’écosystème Hadoop : Hive, Pig. Les difficultés d’Hadoop. - OpenStack et le gestionnaire de données Ceph. - Le Complex Event Processing : un exemple ? Storm. - Du BI au Big Data. - Le décisionnel et le transactionnel renouvelés : les bases de données NoSQL.Typologie et exemples.

- L’ingestion de données et l’indexation. Deux exemples : splunk et Logstash.

- Les crawlers Open Source. - Recherche et analyse : Elasticsearch. - L’apprentissage : Mahout. In-memory. - Visualisation : temps réel ou non, sur le Cloud (Bime), comparaison QlikView, Tibco Spotfire, Tableau.

- Une architecture générale du data mining via le Big Data.

z Cas d’usage à travers des exemples et conclusion - L’anticipation : besoins des utilisateurs dans les entreprises, maintenance des équipements.

- La sécurité : des personnes, détection de fraude (postale, taxes), le réseau.

- La recommandation. Analyses marketing et analyses d’impact. - Analyses de parcours. Distribution de contenu vidéo. - Big Data pour l’industrie automobile ? Pour l’industrie pétrolière ?

- Faut-il se lancer dans un projet Big Data ? - Quel avenir pour les données ? - Gouvernance du stockage des données : rôle et recommandations, le Data Scientist, les compétences d’un projet Big Data.

Page 4: Séminaire BIG DATA, SYNTHÈSE - ORSYS Formation

Téléchargez notre application Séminaires

Google PlayApp Store

z Comment s’inscrire ?

- En envoyant à ORSYS un bon de commande (par courrier ou par voie électronique à [email protected]), dûment complété. Un accusé de réception confirmant l’inscription vous sera envoyé en retour. L’inscription n’est considérée comme définitive qu’après réception du règlement correspondant, excepté pour les entreprises ayant conclu un accord cadre.

- Quelque temps avant le séminaire, une convocation sera adressée à chaque participant indiquant le lieu, les horaires et les moyens d’accès avec un plan détaillé. ORSYS se réserve le droit de le reporter pour des raisons de force majeure ou si le nombre de participants n’est pas suffisant.

z Frais d’inscription

- Les prix indiqués correspondent aux tarifs 2017. Pour la France, la TVA s’applique aux tarifs indiqués dans ce catalogue (20%). Ils comprennent les déjeuners, les rafraîchissements et la documentation. Tarifs préférentiels : ils sont accordés aux entreprises désireuses d’inscrire un nombre important de participants. N’hésitez pas à nous contacter à ce sujet.

z Facturation - Convention

- La facture envoyée tient lieu de Convention de Formation Simplifiée. - L’attestation de présence est envoyée à la fin du cours. En cas de non-participation, toute inscription qui n’aurait pas été annulée par écrit au moins une semaine avant le début du séminaire sera due intégralement, il est toujours possible de se faire remplacer par une autre personne de l’entreprise.

z Horaires

Les séminaires ont lieu de 9h à 17h30. Le premier jour, le cours débute à 9h30 et le dernier jour, il se termine à 17h. Tous les jours, notre personnel d’accueil se tient à votre disposition dès 8h45 pour vous accueillir autour d’un petit-déjeuner. Les déjeuners sont servis entre 12h30 et 14h.

z Hébergement

Les participants qui désirent réserver une chambre doivent le faire par leurs propres moyens. Une liste des principaux hôtels à proximité du lieu du séminaire peut être envoyée sur simple demande.

z Lieux des séminaires

› Hôtel Hilton - Paris La Défense › Hôtel Sofitel - Paris La Défense› Hôtel Renaissance - Paris La Défense› Hôtel Vendôme Marivaux - Bruxelles › Hôtel Novotel - Luxembourg› Hôtel Novotel - Genève

ORSYS FranceLa Grande Arche, paroi Nord

92044 Paris La DéfenseAlbertina Delvaque

Tél : +33(0)1 49 07 73 73

ORSYS Belgium56 avenue des ArtsB-1000 Bruxelles

Sarah RedoutéTél : +32 (0) 2 801 1381

ORSYS Suisse18 avenue Louis Casaï

1209 GenèveMartin Bachelard

Tél : +41 (0) 22 747 7555

ORSYS Luxembourg32-36 boulevard d’Avranches

L-1160 LuxembourgCamille Seguy

Tél : +352 26 49 79 1204

www.seminaires-orsys.com

Renseignements et inscriptions