37
Big Data Hervé Desaunois Responsable IT Détails d’une mise en œuvre

Valtech - Big Data : Détails d’une mise en œuvre

  • Upload
    valtech

  • View
    2.078

  • Download
    0

Embed Size (px)

DESCRIPTION

Big Data : Détails d’une mise en œuvre Construction d’une solution d’analyse d’e-reputation Collecter et stocker les données : Quelle infrastructure ? Corréler et agréger les données : Quelle analyse ? Restituer et exploiter : Quels résultats ? Présentation animée par Hervé Desaunois, Responsable Technique, Valtech [email protected] Evénement - Big Data : ne dormez pas sur vos données ! Valtech - 29/11

Citation preview

Page 1: Valtech - Big Data : Détails d’une mise en œuvre

Big Data

Hervé Desaunois Responsable IT

Détails d’une mise en œuvre

Page 2: Valtech - Big Data : Détails d’une mise en œuvre

Méthodologie

Architecture!

Cas d’utilisation Valtech

Tendance Big Data

Page 3: Valtech - Big Data : Détails d’une mise en œuvre

Sommaire

Ò  Présentation Ò  Cas d’utilisation Ò  Architecture Ò  Cas Pratique Ò  Conclusion Ò  Références Ò  Annexes

3

Méthodologie

Page 4: Valtech - Big Data : Détails d’une mise en œuvre

Big Data / Méthodologie

La mise en place d’une démarche Big Data est toujours composée de trois étapes :

Ò  Collecter, stocker les données. Ò  Analyser, explorer, corréler, agréger les données.

Ò  Visualiser, exploiter.

Page 5: Valtech - Big Data : Détails d’une mise en œuvre

Architecture

Page 6: Valtech - Big Data : Détails d’une mise en œuvre

Architecture Big Data

Audio, Vidéo, Image

Docs, Texte, XML

Web logs, Clicks,

Social, Graphs,

RSS,

Capteurs, Graphs,

RSS,

Spatial, GPS Autres

Base de données Orientée colonne

NoSQL

Distributed File

System

Map Reduce

Base de données SQL

Analytiques , Business Intelligent

CO

LLECTER

LES D

ON

NEES

STOC

KA

GE &

OR

GA

NISATIO

N

EXTRA

CTIO

N

AN

ALYSER

&

VISU

ALISER

BUSINESS

SQL

Page 7: Valtech - Big Data : Détails d’une mise en œuvre

Architecture Big Data

Audio, Vidéo, Image

Docs, Texte, XML

Web logs, Clicks,

Social, Graphs,

RSS,

Capteurs, Graphs,

RSS,

Spatial, GPS Autres

SQL

CO

LLECTER

LES D

ON

NEES

STOC

KA

GE &

OR

GA

NISATIO

N

EXTRA

CTIO

N

AN

ALYSER

&

VISU

ALISER

BUSINESS

HBase, Big Table, Cassandra,

DynamoDB, …

HDFS, GFS, S3,

Oracle, DB2, MySQL, …

Page 8: Valtech - Big Data : Détails d’une mise en œuvre

Cas d’utilisation Valtech eReputation

Page 9: Valtech - Big Data : Détails d’une mise en œuvre

Sommaire

Ò  Présentation Ò  Cas d’utilisation Ò  Architecture Ò  Cas Pratique Ò  Conclusion Ò  Références Ò  Annexes

9

Itération I

Page 10: Valtech - Big Data : Détails d’une mise en œuvre

Cas d’utilisation Valtech eReputation

eReputation Server

ERM MapReduce

DynamoDB S3

Histogramme Client RIA GWT

Page 11: Valtech - Big Data : Détails d’une mise en œuvre

Collecter les données

Web Service / Rest Google Custom Search API

Connecteurs Web Service

Web Service / Rest Twitter Search API

Web Service / Rest Facebook Search API

Page 12: Valtech - Big Data : Détails d’une mise en œuvre

Stockage

Base de données Orientée Colonne

Page 13: Valtech - Big Data : Détails d’une mise en œuvre

Organisation

Modèle de données – Attributs, éléments et tables

Page 14: Valtech - Big Data : Détails d’une mise en œuvre

Organisation

Modèle de données – Attributs, éléments et tables

Page 15: Valtech - Big Data : Détails d’une mise en œuvre

Extraction

Amazon Elastic MapReduce

Page 16: Valtech - Big Data : Détails d’une mise en œuvre

Analyser

Stocker les réponses sur S3

Page 17: Valtech - Big Data : Détails d’une mise en œuvre

Analyser

Visualisation du résultat sur S3

Page 18: Valtech - Big Data : Détails d’une mise en œuvre

Visualiser

Client RIA GWT

Page 19: Valtech - Big Data : Détails d’une mise en œuvre

Démo eReputation Valtech

Page 20: Valtech - Big Data : Détails d’une mise en œuvre

BIG DATA Complexité

Big Data

Big Data + Business Intelligent = ROI

Big Data Self Intelligent ?

Data Scientist

Page 21: Valtech - Big Data : Détails d’une mise en œuvre

Sommaire

Ò  Présentation Ò  Cas d’utilisation Ò  Architecture Ò  Cas Pratique Ò  Conclusion Ò  Références Ò  Annexes

21

Itération II

Page 22: Valtech - Big Data : Détails d’une mise en œuvre

Cas d’utilisation Valtech eReputation

eReputation Server

MapReduce

DynamoDB S3

New New

New SaaS

New

Page 23: Valtech - Big Data : Détails d’une mise en œuvre

Aujourd'hui

• Volumes de données importants (Tera, Peta, ..)

• De l’infiniment petit (génomique) à l’infiniment grand (astrophysique)

• Du plus quotidien (reconnaissance de l’écriture manuscrite sur les enveloppes) au moins quotidien (aide au pilotage aéronautique)

• Du plus ouvert (e-commerce) au plus sécuritaire (détection de la fraude dans la téléphonie mobile ou les cartes bancaires)

• Du plus industriel (contrôle qualité…) au plus théorique (sciences humaines, biologie…)

• Du plus alimentaire (agronomie et agroalimentaire) au plus divertissant (prévisions d’audience TV) • Systèmes d’aide à la décision plus ou moins automatiques

© Stéphane Tufféry

Page 24: Valtech - Big Data : Détails d’une mise en œuvre

Machine Learning

L'apprentissage automatique (machine learning en

anglais), un des champs d'étude de l'intelligence artificielle, est la discipline scientifique concernée par le développement, l'analyse et l'implémentation de méthodes automatisables qui permettent à une machine (au sens large) d'évoluer grâce à un processus d'apprentissage, et ainsi de remplir des tâches qu'il est difficile ou impossible de remplir par des moyens algorithmiques plus classiques.

Page 25: Valtech - Big Data : Détails d’une mise en œuvre

Analyse - Algorithme Machine Learning

Recommandation

Classification

Cluster

Page 26: Valtech - Big Data : Détails d’une mise en œuvre

Analyse sémantique

Natural Language Processing

Utilisation d’une solution de

”Catégorisation de document – Machine learning”

Page 27: Valtech - Big Data : Détails d’une mise en œuvre

Analyse sémantique

Catégorisation : Expertise java Ò  26 mai 2008 – Grâce à son expertise Java, Valtech Technology s'associe avec

Talend pour améliorer l'agilité des systèmes d'information de ses clients. Ò  Cédric Bertrand, Consultant confirmé JAVA/J2EE, Valtech de Paris (Ile-de-France). Ò  Valtech Agency propose une triple maîtrise dans les domaines du conseil, ... Des

compétences de développement Java, .. Ò  Valtech: conseil en management, en technologies. Conseil et projets ebusiness,

agence web, Offshore, Formation nouvelles technologies, objet, Java EE Ò  Au travers du déroulement itératif d'un projet, vous utiliserez des techniques moins

connues de programmation Java comme la gestion poussée des Threads

Natural Language Processing

Page 28: Valtech - Big Data : Détails d’une mise en œuvre

Analyser

Algorithme de clusters K-Means

Page 29: Valtech - Big Data : Détails d’une mise en œuvre

Data Scientist

L’intelligence des données Web Mining & Text Mining

Page 30: Valtech - Big Data : Détails d’une mise en œuvre

Analyser -

Algorithme Data Mining

Page 31: Valtech - Big Data : Détails d’une mise en œuvre

Tendance Big Data

Page 32: Valtech - Big Data : Détails d’une mise en œuvre

Gartner talk

« D'ici 2015, 4,4 millions d'emplois informatiques seront créés dans le monde pour soutenir le Big Data, dont 1,9 millions aux Etat-Unis », a déclaré Peter Sondergaard, senior vice-président et responsable mondial de la recherche chez Gartner.

Wanted « Data Scientist »

100 000 to 500 000 $

Page 33: Valtech - Big Data : Détails d’une mise en œuvre

Valtech Web Scientiste

L’intelligence des données Web Mining & Text Mining

Page 34: Valtech - Big Data : Détails d’une mise en œuvre

Big Data tendance Cloud

Page 35: Valtech - Big Data : Détails d’une mise en œuvre

Big Data full solution

Page 36: Valtech - Big Data : Détails d’une mise en œuvre

Thank you

Page 37: Valtech - Big Data : Détails d’une mise en œuvre

Tarification!

Ò  ERM : http://aws.amazon.com/fr/elasticmapreduce/#pricing

Ò  DynamoDB : http://aws.amazon.com/fr/dynamodb/#pricing

Ò  S3 : http://aws.amazon.com/fr/s3/pricing/ Ò  EC2 : http://aws.amazon.com/fr/ec2/pricing/