44
Oxalide © 2016 – Documents confidentiels Jérémy Smadja Industrialisation du monitoring

Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

Embed Size (px)

Citation preview

Page 1: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

Oxalide © 2016 – Documents confidentiels

Jérémy Smadja

Industrialisation du monitoring

Page 2: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

Qui sommes nous ?

2

•Conseil – Infogérance – Hébergement

•Depuis 15 ans

•70 collaborateurs

•Bureaux au centre de Paris

•Chiffre d’Affaires > 10M€

Page 3: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

Oxalide © 2013 – Documents confidentiels

The History

Page 4: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

L’historique de l’industrialisation du monitoring

4

2000

Oxalide

• Conseil

• Développement

2004 Scripting

• BASH, check HTTP

• Alerting SMS

2005

Mon

• Nagios

• Cacti

• Script BASH

• LDAP

2006Oxacheck

• RTG

2008

Centreon

• Host/Svc Tmpl

• Scalabilité

• Ticket mon

2014

CLAPI

• Infrana

2016 - ?

Page 5: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

Centreon

5

HOSTS SERVICES

4703 166447

SERVICE TEMPLATE

1318

POLLERS

21

RRD Size RRD Count

415 GB 491433

Page 6: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

Infrana & Co.

6

Page 7: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

Oxalide © 2013 – Documents confidentiels

Chef, Oui Chef !

Page 8: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

Processus Chef - CLAPIMonitoring automatisé

8

Page 9: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

Schéma globalMonitoring automatisé

9

Page 10: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

Exemple JSONMonitoring automatisé

10

"monitoring": { "notification_period": "24x7", "notification_options": "d,u,r", "contact_groups": "Oxalide", "host_groups": "_Team_3",

"linux.sys.load": "!50,50,50!70,70,70",

"http_externe": [ {

"site": « 9gag.fr", "uri": "/", "pattern": "NSFW", "htaccess": "no:no", "port": "80"

} ]

}

Page 11: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

Win / FailMonitoring automatisé

11

WIN FAIL

Administration plus rare Production abêti

Autonomie de la production Ticket monitoring plus complexe

Moins de ticket monitoring Astreinte toujours pénible

Uniformisation du monitoring

Moins d’oubli

Page 12: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

Oxalide © 2013 – Documents confidentiels

Les temps changent…

Page 13: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

Ce temps est révolu…

13

On Premise vs Public Cloud

Page 14: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

Ce temps est révolu…

14

On Premise vs Public Cloud

AWS Auto-Scalling

Page 15: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

Ce temps est révolu…

15

On Premise vs Public Cloud

AWS Auto-Scalling

Docker

Page 16: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

Ce temps est révolu…

16

On Premise vs Public Cloud

AWS Auto-Scalling

Docker

DevOPS

Page 17: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

Oxalide © 2013 – Documents confidentiels

« Smart-Monitoring »

Page 18: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

LE – BUSINESSSSSSSSSS !Smart-monitoring

18

Remettre son monitoring en question :

Page 19: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

LE – BUSINESSSSSSSSSS !Smart-monitoring

19

Remettre son monitoring en question :

Déterminer le « bon fonctionnement » de votre application

Page 20: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

LE – BUSINESSSSSSSSSS !Smart-monitoring

20

Remettre son monitoring en question :

Déterminer le « bon fonctionnement » de votre application

Intervention immédiate nécessaire ?

Page 21: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

LE – BUSINESSSSSSSSSS !Smart-monitoring

21

Remettre son monitoring en question :

Déterminer le « bon fonctionnement » de votre application

Intervention immédiate nécessaire ?

Ouai ça load et alors ?? T’as un problème !?!?

Page 22: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

LE – BUSINESSSSSSSSSS !Smart-monitoring

22

Remettre son monitoring en question :

Déterminer le « bon fonctionnement » de votre application

Intervention immédiate nécessaire ?

Ouai ça load et alors ?? T’as un problème !?!?

Monitoring saisonnier

Page 23: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

LE – BUSINESSSSSSSSSS !Smart-monitoring

23

Lâcher prise sur les anciennes sondes : RAM, inodes…

augmenter les seuils, supprimer l’alerting…

Page 24: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

LE – BUSINESSSSSSSSSS !Smart-monitoring

24

Lâcher prise sur les anciennes sondes : RAM, inodes…

augmenter les seuils, supprimer l’alerting…

Réfléchir aux métriques pertinentes :

Page 25: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

LE – BUSINESSSSSSSSSS !Smart-monitoring

25

Lâcher prise sur les anciennes sondes : RAM, inodes…

augmenter les seuils, supprimer l’alerting…

Réfléchir aux métriques pertinentes :

Temps de réponse du site internet

Page 26: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

LE – BUSINESSSSSSSSSS !Smart-monitoring

26

Lâcher prise sur les anciennes sondes : RAM, inodes…

augmenter les seuils, supprimer l’alerting…

Réfléchir aux métriques pertinentes :

Temps de réponse du site internet

Bon fonctionne du processus d’achat

Page 27: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

LE – BUSINESSSSSSSSSS !Smart-monitoring

27

Lâcher prise sur les anciennes sondes : RAM, inodes…

augmenter les seuils, supprimer l’alerting…

Réfléchir aux métriques pertinentes :

Temps de réponse du site internet

Bon fonctionne du processus d’achat

Temps de traitement d’un batch

Page 28: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

LE – BUSINESSSSSSSSSS !Smart-monitoring

28

Lâcher prise sur les anciennes sondes : RAM, inodes…

augmenter les seuils, supprimer l’alerting…

Réfléchir aux métriques pertinentes :

Temps de réponse du site internet

Bon fonctionne du processus d’achat

Temps de traitement d’un batch

Espace disque ? :o

Page 29: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

LE – BUSINESSSSSSSSSS !Smart-monitoring

29

Lâcher prise sur les anciennes sondes : RAM, inodes…

augmenter les seuils, supprimer l’alerting…

Réfléchir aux métriques pertinentes :

Temps de réponse du site internet

=> Check HTTP…

Bon fonctionne du processus d’achat

Temps de traitement d’un batch

Espace disque ? :o

Page 30: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

LE – BUSINESSSSSSSSSS !Smart-monitoring

30

Lâcher prise sur les anciennes sondes : RAM, inodes…

augmenter les seuils, supprimer l’alerting…

Réfléchir aux métriques pertinentes :

Temps de réponse du site internet

=> Check HTTP…

Bon fonctionne du processus d’achat

=> Cucumber, CasperJS, Selenium

Temps de traitement d’un batch

Espace disque ? :o

Page 31: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

LE – BUSINESSSSSSSSSS !Smart-monitoring

31

Lâcher prise sur les anciennes sondes : RAM, inodes…

augmenter les seuils, supprimer l’alerting…

Réfléchir aux métriques pertinentes :

Temps de réponse du site internet

=> Check HTTP…

Bon fonctionne du processus d’achat

=> Cucumber, CasperJS, Selenium

Temps de traitement d’un batch

=> we need your help!

Espace disque ? :o

Page 32: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

Oxalide © 2013 – Documents confidentiels

Next-Step

Page 33: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

Next-Step

33

« Tout ce que nous devons décider, c'est que faire du temps qui nous est imparti. »

by ???

Page 34: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

Résumé des besoinsNext-Step

34

• Configuration dynamique

• Scalable

• Granularité fine

• Modularité des composants

• Système d’alerting intelligent

L’industrialisation apporte l’efficience et le dynamisme, le monitoring doit suivre le rythme.

Page 35: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

Notre monde idéalNext-Step

35

Page 36: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

DatabasesNext-Step

36

graphite

Page 37: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

Alerting SystemNext-Step

37

https://docs.influxdata.com

Page 38: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

User InterfaceNext-Step

38

http://grafana.org/

https://www.centreon.com

Page 39: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

AgentNext-Step

39

http://prometheus.io/from prometheus_client import start_http_server, Summaryimport ("github.com/prometheus/client_golang/prometheus")package io.prometheus.client;

avg(rate(rpc_durations_microseconds_count[5m])) by (job, service)

Page 40: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

External Monitoring SystemNext-Step

40

http://newrelic.com/

Page 41: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

MigrationNext-Step

41

L’existant doit co-exister.

Page 42: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

MigrationNext-Step

42

L’existant doit co-exister.

Les architectures modulaires permettent l’agilité.

Page 43: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

MigrationNext-Step

43

L’existant doit co-exister.

Les architectures modulaires permettent l’agilité.

L’industrialisation permet l’adoption rapide d’une nouvelle solution.

Page 44: Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

Oxalide © 2013 – Documents confidentiels

Merci

On recrute ;)