De 20 000 à 4 millions d'utilisateurs : mode d'emploi

De 20 000 à 4 millions

Khanh Tuong Maudoux

@jetoile

Qui suis-

Khanh Tuong Maudoux

Développeur Java indépendant

blog : http://blog.jetoile.fr

@jetoile

khanh.maudoux@jetoile.fr

Contexte

Collecteur

Stockage

Lecture

Traitement

Contexte

Contexte Fonctionnel

Réception de relevés de compteurs (fichiers xml)

Fournir une consolidation (valorisation) des consommations en fonction de différents critères

Algorithmes de lissage et de détection à faire sur les données

Algorithmes de valorisation à faire sur les données

Contexte Volumétrie

Avant : 20.0000 clients

Cible : 4.000.000 clients

~ 3.000.000 fichiers par jours (~156 Go/jour)

Avec un pas de 30 minutes !

Contexte État des lieux

Algorithmes de lissage et de détection fait au moment de la collecte long »

=> anomalies « courantes »

Algorithmes de consolidation exécutés par batch sur les données stockées

Stockage TimeSeries

Data Data

Collecteur Consolidation Applicatif

Stockage

Contexte Objectifs

Objectif : Remplacer la solution de stockage

Ne pas oublier la phase le ré-import totale! (~3 ans de données)

Collecteur

Collecteur Objectifs

Batch de collecte avec stockage dans une solution propriétaire

Objectifs : Valider différentes solutions (Cassandra, MySQL Cluster)

Valider le modèle de données

Collecteur État des lieux

Stockage

Data Data

Data XML

Data Java

Data DTO

Collecteur Pistes

Pistes :

Spring Batch

Spring Batch + EIP

Collecteur

Outils / Framework : Spring Integration

Metrics

JMX / Jolokia

Hawt.io

Maven!

Collecteur

Spring Integration Architecture « Pipe and Filters »

Collecteur

Stockage

Data Data

Data XML

Data Java

Data DTO

Spring Integration

Collecteur

Spring Integration

Collecteur

Spring Integration

Collecteur

Spring Integration

Collecteur

Spring Integration

Collecteur

Spring Integration

Collecteur

Spring Integration Message-history

Scalabilité horizontale

Collecteur

Metrics

Collecteur

Jolokia JMX via HTTP/JSON

Collecteur

Hawt.io

Collecteur

Maven maven-jaxb2-plugin (org.jvnet.jaxb2.maven2)

appassembler-maven-plugin (org.codehaus.mojo)

Collecteur

endpoint REST pour injection

Stockage

Stockage Objectifs

Rappels : Remplacer la solution existante de stockage

Chaque capteur remonte une donnée toutes les 30 minutes

Time series (au plus 50 000 colonnes par ligne)

Stockage

Cassandra Base de données orientée colonnes

Keyspace

Column Family

Column

Stockage

Cassandra Time series : 1 ligne avec de multiples colonnes (clé composite)

CREATE TABLE capteur (

capteur_id text,

event timestamp,

temperature text,

PRIMARY KEY (capteur_id, event)

Ordonnée

capteur_id event

temperature

Stockage

Attention longueur/taille de ligne

CREATE TABLE capteur (

capteur_id text,

event_period text,

event timestamp,

value text,

PRIMARY KEY ((capteur_id, event_period), event)

Attention modélisation

aggrégation

Stockage

Jolokia Comme agent sur la JVM

Lecture

Lecture Objectifs

Évaluer la pertinence de la solution de stockage

Véloce

Simple

Remonté de métriques

=> injecteur !

Lecture Pistes

Pistes : From scratch

Lecture

Outils / Framework : RestEasy Netty

Swagger

JMX / Jolokia

Hawt.io

Gatling / AB

Lecture

RestEasy Netty : JAX-RS

Simple

Lecture

Swagger :

Lecture

Jolokia

Lecture

Gatling

Traitement

Traitement Rappel

Stockage TimeSeries

Data Data

Collecteur Consolidation Applicatif

Stockage

Traitement Objectifs

Objectif : Collecte

Rapide

Pas de pertes de données (sécurisation de la données)

Détection des données fausses Faite en aval de la collecte

Consolidation Faite sur les données « valides » avec stockage des mesures dans des « batch View »

Séparation des concepts !

Objectif : Lambda architecture

Query = function (all data)

Objectif :

Query = function (all data)

Service Layer Batch Layer

Data Data

collecte

transformation

All datas Precompute views Batch views

Traitement

Spark / Hadoop

Traitement Objectifs ?

Volumétrie non acceptable pour la production :

Duplication de la donnée

Souhaite une solution avec calcul à la demande

Traitement

Service Layer

Data Data

collecte

transformation

All datas Precompute views Batch views

Algorithme de lissage en amont

Conclusion

Merci !

Questions ?

pas le feedback en sortant !

De 20 000 à 4 millions d'utilisateurs : mode d'emploi

Technology

MODE D'EMPLOI - ludovic walsh de serrant , RexLudex ... · 2 Précautions de sécurité et d'emploi Précautions de sécurité et d'emploi Dans ce mode d'emploi, des symboles servent

Mode d'emploi - medias.audiofanzine.com · Précautions de sécurité et d'emploi 02 Précautions de sécurité et d'emploi PRÉCAUTIONS DE SÉCURITÉ Dans ce mode d'emploi, des symboles

Azote, phosphore et eutrophisation. Azote Atmosphère : 3900 millions Tg Lithosphère : 400 millions Tg Hydrosphère : 0.7 millions Tg Biomasse : 0.1 millions

Mode d'emploi - Dethleffs

Coding dojos à Hydro-Québec Retour d'expérience Jean Desbiens desbiens.jean@hydro.qc.ca François Beauregard Groupe d'utilisateurs Agiles de Montréal –

MODE D'EMPLOI - docs.whirlpool.eudocs.whirlpool.eu/_doc/501931533001F.pdf · 59 mode d'emploi description de l'appareil avant d'utiliser le rÉfrigÉrateur installation mode d'emploi

Trademob - Quelle stratégie efficace d'acquisition d'utilisateurs actifs d'apps mobile?

Télétravail mode d'emploi

Manuel - Safescansafescandownload.safescan.com/Downloads/fr/time...5.2.4suppression d'utilisateurs 5.2.5 Ajout d'utilisateurs 5.3service de messages courts ( sMs) 5.3.1 comment créer

cours - La Mondialisation [ca V3.0] - Aubel.free.fraubel.free.fr/GEO/monde/COURS_Mondialisation_Interdependances... · Illustration 10: Carte des 500 millions d'utilisateurs de Facebook

1 Décembre 2009 Fr, Total33,4 millions [31,1 – 35,8 millions] Adultes31,3 millions [29,2 – 33,7 millions] Femmes (15 ans et plus)15,7 millions [14,2 –

download.microsoft.comdownload.microsoft.com/documents/France/windowsphone/2010/... · d'utilisateurs dans l'entreprise, la ... l'agglomération européenne du 21e siècle. Avec 156

DUCATION ET D VELOPPEMENT DURABLE 5.3*0...Femmes Femmes Hommes Hommes 53,3 millions 196,1 millions 32,2 millions 45,1 millions 32,6 millions 3O,9 millions 57,5 millions 28,4 millions

applications d'utilisateurs

Mode d'emploi - download.p4c.philips.com

FLUPA 2011 - Tri de cartes : à combien d'utilisateurs doit faire appel ? par Michaël Masseroni

1 ECUM Emergence de Communautés d'Utilisateurs de MathEnPoche (IREM de Rennes, IUFM de Bretagne, INRP)

Posters mode d'emploi

MODE D'EMPLOI - Velleman

yOS tour- 1 milliard d'utilisateurs !