PPE 3 · dun réseau. Les solutions de supervision permettent de remonter des informations ... La supervision informatique permet de superviser lensemble du système

PPE 3.8 Solution de supervision de l’infrastructure réseau et système permettant

d’assurer l’anticipation des pannes.

Table des matières

1 CONTEXTE : ......................................................................................................................... 4 1.1 PRESENTATION DE L’ENTREPRISE : ....................................................................................... 4 1.2 PRESENTATION DU PRESTATAIRE INFORMATIQUE : .............................................................. 4 1.3 ENSEIGNEMENTS SUR LE SYSTEME INFORMATIQUE DE L’ORGANISATION : ......................... 5

2 CAHIER DES CHARGES : .................................................................................................. 7 MISSION SUPERVISION ..................................................................................................................... 13

Titre du projet .......................................................................................................................... 13

Plan du travail : ....................................................................................................................... 13

3 SOLUTION .......................................................................................................................... 14 3.1 INTRODUCTION A LA SUPERVISION ....................................................................................... 14 3.2 SUPERVISER : QUOI ? ........................................................................................................... 15 3.3 LES NIVEAUX DE SUPERVISION ............................................................................................ 15

Supervision environnementale ................................................................................................. 15 Supervision réseau et matérielle ............................................................................................. 15 Supervision des systèmes ........................................................................................................ 15 Supervision des applications et services ............................................................................... 15 Superviser : pourquoi ? ............................................................................................................. 15

3.4 SUPERVISER : COMMENT ?................................................................................................... 16 3.5 NAGIOS .................................................................................................................................. 16

3.5.1 Présentation ................................................................................................................. 16 Moniteur de supervision : ...................................................................................................... 16

Ordonnanceur et analyseur gérant les actions : ................................................................ 16

Possibilités .................................................................................................................................. 17 Architecture ................................................................................................................................. 17 Avantages ................................................................................................................................... 18 Inconvénients .............................................................................................................................. 18

3.6 CENTREON ............................................................................................................................ 18 Schéma Fonctionnel .................................................................................................................. 18 Avantages ................................................................................................................................... 19 Avantages ................................................................................................................................... 20 Inconvénients .............................................................................................................................. 20

3.7 CACTI ..................................................................................................................................... 20 Présentation de Cacti ................................................................................................................ 20 Présentation de RRDtool .......................................................................................................... 21 Avantages ................................................................................................................................... 22 Inconvénients .............................................................................................................................. 22

3.8 ZABBIX ................................................................................................................................... 22 Fonctionnalités ........................................................................................................................... 23 Avantages ................................................................................................................................... 25 Inconvénients .............................................................................................................................. 25

3.9 SHINKEN ................................................................................................................................ 25 Présentation ................................................................................................................................ 25 Fonctionnalités ........................................................................................................................... 26

CHOIX DE SOLUTION ........................................................................................................................ 26

4 PROJET .............................................................................................................................. 27 4.1 OBJECTIFS ET BUT DU PROJET : .......................................................................................... 27 4.2 PLANNING .............................................................................................................................. 27

5 INSTALLATION ET CONFIGURATION DE NAGIOS ..................................................... 27 Installation et configuration du plugin Nagios permettant l’accès via l’interface web ...... 29 Superviser des machines Windows ........................................................................................ 32 Configuration des notifications Nagios ................................................................................... 33

Les notifications par mail : ..................................................................................................... 33

1 Contexte :

1.1 Présentation de l’entreprise :

Lors de la construction de ce stade, le réseau qui prenait en charge ses bureaux commerciaux

et ses services de sécurité proposait des fonctionnalités de communication de pointe. Au fil

des ans, la société a ajouté de nouveaux équipements et augmenté le nombre de connexions

sans tenir compte des objectifs commerciaux généraux ni de la conception de l’infrastructure

à long terme. Certains projets ont été menés sans souci des conditions de bande passante,

de définition de priorités de trafic et autres, requises pour prendre en charge ce réseau critique

de pointe.

StadiumCompany fournit l’infrastructure réseau et les installations sur le stade.

StadiumCompany emploie 170 personnes à temps plein :

· 35 dirigeants et responsables

· 135 employés

Environ 80 intérimaires sont embauchés en fonction des besoins, pour des événements

spéciaux dans les services installations et sécurité.

À présent, la direction de StadiumCompany veut améliorer la satisfaction des clients en

ajoutant des fonctions haute technologie et en permettant l’organisation de concerts, mais le

réseau existant ne le permet pas.

La direction de StadiumCompany sait qu’elle ne dispose pas du savoir-faire voulu en matière

de réseau pour prendre en charge cette mise à niveau. StadiumCompany décide de faire appel

à des consultants réseau pour prendre en charge la conception, la gestion du projet et sa mise

en œuvre. Ce projet sera mis en œuvre suivant trois phases. La première phase consiste à

planifier le projet et préparer la conception réseau de haut niveau.

La deuxième phase consiste à développer la conception réseau détaillée. La troisième phase

consiste à mettre en œuvre la conception.

1.2 Présentation du prestataire informatique :

Après quelques réunions, StadiumCompany charge NetworkingCompany, une société locale

spécialisée dans la conception de réseaux et le conseil, de la phase 1, la conception de haut

niveau. NetworkingCompany est une société partenaire Cisco Premier Partner. Elle emploie

20 ingénieurs réseau qui disposent de diverses certifications et d’une grande expérience dans

ce secteur.

Pour créer la conception de haut niveau, NetworkingCompany a tout d’abord interrogé le

personnel du stade et décrit un profil de l’organisation et des installations.

Créée en 1989, NetworkingCompany est une société spécialiste en infrastructures systèmes

et vente de matériel informatique pour professionnels de la vidéo.

Employant aujourd’hui 20 ingénieurs réseau, l’activité de NetworkingCompany s’établit à 1,8

millions d'euros de chiffre d’affaires.

Son cœur de métier se situe au niveau de l’infrastructure informatique afin de garantir les

besoins des activités « métiers ».

NetworkingCompany est l’une des seules sociétés de services informatique qui accompagne

réellement et jusqu’au bout ses clients dans le choix et la mise en œuvre de solutions.

NetworkingCompany intervient en mode Projet (Engagement de résultats), Régie

(Engagement de moyens) et Infogérance des environnements Windows.

Son outil de compétitivité et de productivité réside dans la capitalisation de son savoir-faire, le

haut niveau de certification de ses partenariats ainsi qu’une veille technologiques active.

NetworkingCompany a développé une expertise forte dans les domaines de la virtualisation,

les infrastructures d’accès (Application delivery), l’industrialisation du poste de travail (Itil,

Supervision, Télédistribution), les annuaires et la gestion de l’identité.

Reconnu depuis 25 ans comme une entreprise innovante, et avec aujourd’hui plus de 300

collaborateurs, cette société répond avec flexibilité et efficacité à tous les besoins, qu’ils

émanent de PME ou de grands comptes.

Enfin, NetworkingCompany est en partenariat avec de nombreux gros groupes du monde de

l’informatique, tout comme Microsoft, CISCO, HP, Huawei ou encore DELL, pour ne citer que

les plus importants.

1.3 Enseignements sur le système informatique de l’organisation :

Organisation de StadiumCompany :

Nombre de serveurs : 9 dont : (web, DHCP, commerce électronique, comptabilité(x3), paie)

Utilisateurs :

- 35 dirigeants

- 135 employés

- environs 80 intérimaires

- équipe A (90 personnes : 4 dirigeants, 12 entraineurs, 14 employé, 60 joueurs)

- équipe B

- équipe visiteurs

- restaurant

- fournisseur de concessions

- équipe B (4 dirigeants, 8 entraineurs, 12 employé, 40 joueurs)

- équipe visiteurs :

- fournisseur de concessions 5 employé 2 employé a temps partiel : intérimaire non

défini

- restaurant de luxe : 4 dirigent, 2 employé,

- 20 loges de luxe

- 2 sites distants

Services : DNS, DHCP, web

- dirigeants : PC et téléphones connecter à un PABX

- personnel et sécurité : 50 téléphones et PC réparti dans le stade

- 12 téléphones analogiques répartis dans le stade qui prennent en charges la

télécopie, et d’autres offrant un accès direct aux services de police et pompier.

- locaux connecté par fibre optiques

- équipe A : 15 bureaux dont 5 partagé 24 PC et 28 téléphones dans ces bureaux ;

vestiaire 5 téléphone, salon des joueurs : 15 téléphones

- équipe B : 12 bureaux dont 3 partagé, 19 PC et 22 téléphones, vestiaires 5

téléphones, salon des joueurs 15 téléphones

- équipe visiteur : salon et vestiaire doté de 10 téléphones

- fournisseur de concession : 2 bureau privée 5 PC et 7 téléphones, 32 stand

permanent non équipé pour le moment.

- restaurant de luxe : 4 bureau privé, 6 téléphones + 2 utilisé en salle pour les

réservations

- 20 loges de luxe : 20 téléphones

- zone de presse : 10 téléphones analogique, 2 ports de données réseaux + Wireless

AP

- 2 sites distant : connecter Via VPN (router FAI x3 pour gérer la connexion

StadiumCompany dispose d’un routeur de périmètre.

Processus : Pas d’information sur les processus, contrats et chartes informatiques.

2 Cahier des charges :

Cette année, vous allez intégrer la division du stade de StadiumCompany. Vous serez chargé

de la maintenance des systèmes et réseaux informatiques.

StadiumCompany est composé de plusieurs sites :

Site 1 : Stade (hébergement informatique, siège social et centre administratif)

Site 2 : Billetterie (vente des billets)

Site 3 : Magasin (vente des souvenirs)

Les différentes solutions retenues pour l’étude du projet d’un point de vue général de

StadiumCompany pourront faire l’objet de documentations techniques suivant la complexité

de la mise en œuvre.

http://172.20.0.0/22

Mission 8 :

Mission supervision

Titre du projet Mise en place d’un système de supervision Open source.

Travail demandé

Stadiumcompagny recherche, l’Implémentation et la configuration d'une solution Open Source

qui vise à superviser à distance les différents éléments actifs de l’infrastructure systèmes et

réseaux du Stade avec gestion des alertes.

Plan du travail : Le but principal du projet est de pouvoir établir, choisir et installer une solution de surveillance

des serveurs, routeurs, commutateurs, …, qui remplit les conditions suivantes :

- Coûts financiers les plus réduits possibles.

- Récupération des informations permettant la détection des pannes, l’indisponibilité des

serveurs (Windows, Linux), routeurs, commutateurs, les états des imprimantes réseau et leurs

services.

- Des renseignements supplémentaires de monitoring sur la charge CPU, espace disque,

mémoire disponible, input/output, processus en cours d’exécution, paquet perdu, temps

moyen de parcours (round trip average), information d'état SNMP, trafic, bande passante

consommée etc...

- Des renseignements supplémentaires de monitoring sur les services DNS, DHCP, http,

SMTP, POP, IMAP, FTP, …

- Gestion des alertes.

- Notification par mail ou SMS en cas de problème.

- Générer des rapports sur le fonctionnement des serveurs par mois.

- Générer des graphes (cartographie du réseau, …)

- Une interface graphique claire pour l’interaction utilisateur/Logiciel

3 Solution 3.1 Introduction à la supervision

La supervision est un processus informatique qui permet de surveiller l’ensemble du SI d’une organisation. Les outils de supervisions s’appellent des superviseurs qui permettent de surveiller les traitements informatiques. Dès qu’un traitement ne s’est pas exécuté correctement l’outil de supervision déclenche une alerte ; l’alerte est ensuite traitée par l’équipe pilotage. L’équipe de pilotage ont pour mission de surveiller les alertes remontées et d’exécuter des consignes pour résoudre ces alertes.

La supervision consiste à indiquer et à commander l’état d’un appel, d’un système ou d’un réseau. Les solutions de supervision permettent de remonter des informations techniques et fonctionnelles du système d’information.

L’informatique étant devenue l’épine dorsale de l’entreprise quel que soit son secteur d’activité, le système d’information est au centre de l’activité de différentes entités métiers et doit fonctionner pleinement et en permanence pour garantir l’efficacité de l’entreprise. A tous les niveaux, les réseaux, les terminaux utilisateurs, les serveurs d’applications et les données constituent autant de maillons sensibles dont la disponibilité et la qualité de service conditionnent le bon fonctionnement de l’entreprise.

Les problèmes liés à l’informatique doivent donc être réduits au minimum, car une indisponibilité du système d’information a des impacts très préjudiciables sur l’activité et sur la notoriété d’une entreprise.

Il existe deux enjeux majeurs pour les directions informatiques. Le premier est de garantir la disponibilité et les niveaux de service du système en cas de panne ou de dégradation des performances (par des mécanismes de redondance et d’équilibrage…). Le second est de tenter de prévenir en cas de problème et, le cas échéant, garantir une remontée d’information rapide et une durée d’intervention minimale. C’est le rôle de la supervision.

Il existe plusieurs méthodes pour superviser le système d'information :

Analyser les fichiers de log Récupérer des résultats de commandes et de scripts locaux ou distants SNMP : Simple Network Management Protocol

Gestion proactive est une démarche de travail qui permet d’agir en avance puisqu’on anticipe les incidents c'est-à-dire on sait à l’avance qu’est-ce qu’on va faire lorsque des incidents surviennent. Prévoir pour mieux gérer c’est à dire agir avant qu'une situation ne devienne une cause de confrontation ou de crise. Donc, anticiper en se posant les bonnes questions est primordial.

3.2 Superviser : quoi ?

La supervision informatique permet de superviser l’ensemble du système d’Information de l’entreprise :

o Le réseau et ses équipements o Les serveurs o Les périphériques o Les applications o Le workflow o Surveiller les systèmes d’information o assurer la disponibilité des services. o prévenir les défaillances. o détecter les anomalies (sécurité, système). o fédérer l’information d’équipements hétérogénes en un portail unique. o Automatiser les téches o alerter en cas d’interruption d’un service. o relancer des services interrompus.

3.3 Les niveaux de supervision

Supervision environnementale

o température de la pièce o humidité de la pièce

Supervision réseau et matérielle

o commutateurs et routeurs : disponibilité, interrogation des sondes, alertes. o serveurs : disponibilité, interrogation des sondes matérielles, alertes. o onduleurs : disponibilité, charge, état. o imprimantes : disponibilité, état de l’imprimante et des consommables.

Supervision des systèmes

o commutateurs : utilisation des ressources, métrologie. o serveurs : utilisation des ressources.

Supervision des applications et services

o disponibilité. o cohérence des réponses aux interrogations. o performances.

Superviser : pourquoi ?

L’informatique est au cœur de l’entreprise, quelle que soit son secteur d’activité. On peut facilement comparer la place que joue l’informatique au sein d’une entreprise é celle que joue le système nerveux chez l’être humain. En effet, il est au centre de l’activité, et doit fonctionner pleinement et en permanence pour garantir l’activité.

Certaines ramifications même comme le réseau et les terminaux utilisateurs doivent aussi fonctionner, à l’instar des nerfs du système dans le corps humain.

Les problèmes liés à l’informatique doivent donc être réduits au minimum, car une indisponibilité du système d’information peut être la cause de plusieurs millions d’euros de pertes.

Deux phases sont donc importantes pour les directeurs informatiques : garantir la disponibilité du système en cas de panne (par des mécanismes de redondance…) mais aussi tenter de prévenir en cas de problème et, le cas échéant, garantir une remontée d’information rapide et une durée d’intervention minimale : c’est le rôle de la supervision.

3.4 Superviser : comment ?

Il existe plusieurs méthodes pour superviser le système d’information :

Analyser les fichiers de log Récupérer des résultats de commandes et de scripts locaux ou distants Supervision en mode actif Supervision en mode passif

3.5 Nagios

Nagios est un logiciel de supervision destiné à vous informer de problèmes éventuels dans votre système d’informations avant que vos clients, utilisateurs ou managers ne le fassent. Il est prévu pour fonctionner sur système d’exploitation Linux mais fonctionne également sans problème sur la plupart des variantes *NIX. Le démon de supervision effectue des contrôles intermittents sur les hôtes et services que vous spécifiez en utilisant des plugins externes qui retournent un status d’état à Nagios. Quand des problèmes surviennent, il peut envoyer des notifications à des contacts administratifs de façons différentes (email, SMS, messagerie instantanée, etc…). Les informations d’états courants, les historiques et les rapports peuvent être consultés à partir d’un simple navigateur.

3.5.1 Présentation

Moniteur de supervision :

o vérification des services réseau (SMTP, HTTP, …etc.). o surveillance des ressources des hôtes (charge CPU, espace disque, …etc.). o contrôle des équipements réseau (CPU, ventilateurs, …etc.).

Ordonnanceur et analyseur gérant les actions :

o système complet de notification fonction du service, de l’heure et de la date. o gestion des escalades. o possibilité de paramétrer des réactions automatisées.

http://wiki.monitoring-fr.org/supervision/actif

http://wiki.monitoring-fr.org/supervision/passif

http://wiki.monitoring-fr.org/_detail/nagios/nagios_logo.png?id=nagios:start

o possibilité de définir des gestionnaires d’événements. o Système de modules/plugins de vérification o fonctionne tels des programmes externes. o permet de développer ses propres modules. o Possibilité de définir la hiérarchie du réseau en utilisant des hôtes parents. o Une interface Web avec gestion des droits pour la consultation. o Génération de rapports de surveillance. o N’est pas destiné à faire de la métrologie.

Possibilités

Nagios (anciennement appelé Netsaint) est un logiciel qui permet de superviser un système d’information complet. C’est un logiciel libre, il est sous licence GPL.

C’est un programme modulaire qui se décompose en trois parties:

1. Le moteur de l’application qui vient ordonnancer les tâches de supervision. 2. L’interface web, qui permet d’avoir une vue d’ensemble du système d’information et

des possibles anomalies. 3. Les plugins, une centaine de mini programmes que l’on peut compléter en fonction

de nos besoins pour superviser chaque service ou ressource disponible sur l’ensemble des ordinateurs ou éléments réseaux de notre SI.

o Superviser des services réseaux : (SMTP, POP3, HTTP, NNTP, ICMP, SNMP, LDAP , etc.)

o Superviser les ressources des serveurs (charge du processeur, occupation du disque dur, utilisation de la mémoire paginée) et ceci sur les systèmes d’exploitations les plus répandus.

o La supervision à distance peut utiliser SSH ou un tunnel SSL. o Les plugins sont écrits dans les langages de programmation les plus adaptés à leur

tâche (Bash, C++, Python, Perl, PHP, C, etc.) o La vérification des services se fait en parallèle. o Possibilité de définir une hiérarchie dans le réseau pour pouvoir faire la différence

entre un serveur en panne et un serveur injoignable. o La remontée des alertes est entièrement paramétrable grâce à l’utilisation de plugins

(alerte par email, SMS, etc.) o Chaque test renvoi un état particulier:

1. # OK (tout va bien) 2. # WARNING (le seuil d’alerte est dépassé) 3. # CRITICAL (le service a un problème) 4. # UNKNOWN (impossible de connaître l’état du service)

Architecture

o un ordonnanceur qui gère : o l’ordonnancement et les dépendances des vérifications. o les actions à entreprendre suite à des incidents (alertes, escalades,

corrections automatiques). o une interface graphique de type client Web. o des modules/sondes dont un grand nombre sont fournis de base. (ex : check_mailq,

check_http, check_imap). o Nagios est un noyau o ordonnanceur et analyseur.

o système de modules pour les vérifications. o rassemblement et analyse d’informations. o réaction, prévention et réparation. o souplesse et finesse de configuration.

Avantages

o Reconnu auprès des entreprises, grande communauté o Plétore de plugins qui permettent d'étendre les possibilités (agents comme zabbix,

reporting amélioré, etc...) o Une solution complète permettant le reporting, la gestion de panne et d'alarmes,

gestion utilisateurs, ainsi que la cartographie du réseaux o Beaucoup de documentations sur le web o Performances du moteur

Inconvénients

o Interface non ergonomique et peu intuitive o Configuration fastidieuse via beaucoup de fichiers o Pour avoir toute les fonctionnalités il faut installer des plugins, de base c'est assez

limité.

3.6 Centreon

Centreon est LE dérivé français de Nagios de référence développé par la société Merethis. Il s’agit d’une couche applicative Web venant se greffer à Nagios pour offrir une administration moins rudimentaire (évite les fichiers de configuration et les lignes de commandes brute). L’équipe de chez Merethis est avant-gardiste et a inspiré pour certains points les lignes directrices de la communauté. C’est un produit très complet et son interface le rend très professionnel aux yeux des dirigeants.

Schéma Fonctionnel

o Principe de fonctionnement

Le schéma ci-dessous montre comment Centreon et Nagios intéragissent l’un avec l’autre.

http://www.centreon.com/

http://wiki.monitoring-fr.org/_detail/nagios/centreon_logo.png?id=centreon:start

o Gestion des flux

Le schéma ci-dessous montre les protocoles et flux utilisés par les différents éléments qui compose une supervision Centreon / Nagios

Avantages

o La robustesse et la renommée de Nagios

http://wiki.monitoring-fr.org/_detail/powered/centreon/archi-centreon.jpg?id=centreon:start

http://wiki.monitoring-fr.org/_detail/powered/centreon/centreon-flux.jpg?id=centreon:start

o Une interface beaucoup plus sympathique, permettant de tout configurer, de garder un oeil sur tout le réseau en permanence

o Les utilisateurs de Nagios ne seront pas perdus pour autant, l'interface reprenant avantageusement certaines vues Nagios

o Une solution complète permettant le reporting, la gestion de panne et d'alarmes, gestion utilisateurs, ainsi que la cartographie du réseau

o Une entreprise qui pousse le développement o Peut-être décorelé du serveur Nagios et tourner tout seul sur un autre serveur

Avantages

o La robustesse et la renommée de Nagios o Une interface beaucoup plus sympathique, permettant de tout configurer, de garder

un oeil sur tout le réseau en permanence o Les utilisateurs de Nagios ne seront pas perdus pour autant, l'interface reprenant

avantageusement certaines vues Nagios o Une solution complète permettant le reporting, la gestion de panne et d'alarmes,

gestion utilisateurs, ainsi que la cartographie du réseau o Une entreprise qui pousse le développement o Peut-être décorelé du serveur Nagios et tourner tout seul sur un autre serveur

Inconvénients

o L'interface peut paraître complexe car il existe beaucoup d'options, de vues....cela nécessite une petite formation

o Un développement qui n'est pas encore en phase avec celui de Nagios : Parfois des problèmes de compatibilité

o Un peu plus lourd que du Nagios pur

3.7 Cacti

Présentation de Cacti

Cacti est un logiciel de supervision (dit de « capacity planning ») basé sur RRDtool permettant de surveiller l’activité de son architecture informatique à partir de graphiques quotidiens, hebdomadaires, mensuels et annuels.

Cette solution n’est donc pas destinée à alerter en temps réel sur les dysfonctionnements d’un système mais bien de proposer une vision dans le temps de l’évolution d’indicateurs matériels et logiciels (trafic réseau, occupation des disques, temps de réponse, etc…).

acti est une interface de présentation (frontend) complète à RRDTool, il stocke toute l’information nécessaire pour créer des graphiques et pour les peupler avec des données dans une base de données MySQL. Le frontend est complètement écrit PHP. Il supporte également SNMP et tend à se substituer à MRTG pour créer des graphiques.

Cacti permet d’alimenter les graphiques à partir de n’importe quel script / command externe.

Une fois qu’un ou plusieurs points d’émission de données sont définis, un graphique de RRDTool peut être créé en utilisant les données. Cacti vous permet de créer presque n’importe quel graphique en utilisant tous les types de graphique de RRDTool et fonctions standards de consolidation, mais aussi de présentation. Cacti offre également une gestion d’utilisateurs qui permet à chacun la possibilité de personnaliser l’interface mais aussi de limiter l’accès.

Présentation de RRDtool

Le programme RRDtool a été développé par Tobias Etiker dès 1995. Il est librement téléchargeable sur le site suivant : http://people.ee.ethz.ch/~oetiker/webtools/rrdtool/.

RRD est l’acronyme de Round Robin Database, qui peut se traduire par « base de données cyclique ». Ce mécanisme permet de stocker des données dans des fichiers de taille invariante, définie à la création, par un mécanisme de pile LILO (Last In Last Out). Un fichier RRD peut contenir plusieurs RRA (Round Robin Archive) qui correspondent aux différents cycles de conservation des données (jour, semaine, mois, année, etc.).

Une fois les données collectées, RRDtool fournit des outils permettant de générer des graphiques hautement personnalisables, retraitant les données à la volée.

http://people.ee.ethz.ch/~oetiker/webtools/rrdtool/

http://wiki.monitoring-fr.org/_detail/cacti/cacti.png?id=cacti:start

Avantages

o Interface : Beaucoup plus claire que celle de NetMRG elle permet également beaucoup plus de choses (Plus de modes d'affichages et plus de possibilités de configuration)

o Configuration : Avec l'utilisation des templates pour les machines, les graphiques, et la récupération des données tout se configure aisément et entièrement via l'interface web. Import/ Export très simple des templates au format XML. On peut aussi très facilement utiliser des options poussées de RRDTOOL

o Performance : Avec le choix du moteur de récolte des données, On peut opter pour la performance ou la simplicité

o Gestion des utilisateurs o Communauté sur le web, présence d'une dizaine de plugins permettant d'étendre les

fonctionnalités

Inconvénients

o Pas de gestion d'alarmes, sauf avec un plugin nommé Thold o Pas de gestion de panne et absence d'une cartographie de réseau o Un développement lent

3.8 Zabbix

Zabbix est une application libre (open source) de supervision des systèmes et des réseaux en infrastructure IT, développée en C. L’interface web est quant à elle, développée en PHP et en JavaScript.

Mise à part les versions serveur et proxy qui sont exclusivement sur Unix, Zabbix est multiplateforme, et est disponible sous des systèmes d’exploitation tels que par exemple Windows, Linux, Solaris, …etc.

Par sa polyvalence, Zabbix peut superviser et vérifier les statuts d’une multitude de services réseaux, ou systèmes (serveurs), tout en surveillant au niveau matériel de nombreux types d’équipements présents au sein d’une infrastructure IT, comme un routeur, une imprimante, un téléphone IP, grâce à l’utilisation du protocole SNMP.

Zabbix supporte également le protocole IPMI, et dispose d’outils d’auto-découverte d’équipements. Il intègre par défaut la gestion de cartes (réseaux) et de graphiques, tous visualisables depuis une même interface.

http://wiki.monitoring-fr.org/_detail/supervision/zabbix_logo.png?id=zabbix:start

Fonctionnalités

Supervision

Configuration centralisée, Accès centralisée

à toutes les données, Jusqu’à 1000 nœuds

ZABBIX, Nombre illimité de proxy

Evolutivité

Testé avec 100000 équipements et serveurs

supervisés, Testé avec 1000000 de contrôles

de disponibilités et de performances,

Traitement de milliers de contrôles de

disponibilités et de performances par

seconde

Suivi en temps réel

Surveillance des performances, Surveillance

des disponibilités, Surveillance des intégrités,

Conditions de notifications flexibles, Alertes

des utilisateurs (email, SMS, jabber),

Journalisation (logging)

Visualisation Vues et diaporama définies par l’utilisateur,

Cartographie, Graphiques, Zoom

Résolution rapide des problèmes

Envoi des alertes par email, téléphone, SMS,

ou par alertes audio, Exécute des

commandes à distance

Gestion du SLA Services IT hiérarchiques, Rapport SLA en

temps réel

Rapports et tendances

Facilités d’intégration d’outils, Analyse des

statistiques

journalières/mensuelles/annuelles, Rapports

SLA

Import/Export de données XML Facilité de partage des templates

Auto-découverte

Découverte par plage d’adresse IP, services

ou SNMP, Surveillance automatique des

équipements découverts

Supervision Web

Surveillance des performances et des

disponibilités Web, Scénarios flexibles,

Support des méthodes POST et GET

Flexibilité

Support des protocoles IPv4 et IPv6,

Facilités d’extension des agents natifs,

Toutes les méthodes de notifications,

Fonctionne sur toute plateforme

Supervision pro-active

Exécution automatique de commandes à

distance, Exécution automatique des

commandes IPMI

Surveillance globale Suivi d’un groupe d’hôtes comme un seul

hôte

Surveillance sans agent

Surveillance de services distants (FTP, SSH,

HTTP, …), Support du SNMPv1/v2/v3,

Support de l’IPMI, Support des traps SNMP

Agents de haute performance

Toutes les plateformes sont supportées

(Unix, Windows, Novell), Utilisation de la

mémoire, Utilisation du réseau, Disk I/O,

Disponibilité de l’espace disque, Contrôle

des fichiers, Surveillances des fichiers

journaux, …etc

Sécurité

Permissions des utilisateurs flexibles,

Authentification par adresse IP, Protection

contre les attaques du type Brute Force

Escalades et notifications

Notifications répétées, Escalades illimitées,

Récupération des messages, Notification

lorsqu’un problème est résolu

Fonctions de gestion ping, traceroute vers un hôte, Toutes les

autres fonctions

Tableau de bord

Tableau de bord personnalisable,

Ressources, données favorites, Haut niveau

de vision

Supervision avec agent Agent natif pour toute plateforme, Evite les

problèmes de connections

Administration facile

Très rapide courbe d’apprentissage, Toutes

les données sont stockées dans une base de

données (MySQL, PostgreSQL, Oracle,

SQLite), Configuration centralisée et

stockage de l’information

Solution Open Source

Aucune licence de limitation du moteur,

Accès au code source, Ouvert aux audits du

code

Toutes les informations en ligne Manuel ZABBIX, Wiki ZABBIX, Forums

ZABBIX

Soutenu par la société Zabbix

Contrats de support annuels, Solutions clés

en main, Compte de responsable technique,

Services professionnels

Avantages

o Une solution très complète : cartographie de réseaux, gestion poussée d'alarmes via SMS, Jabber ou Email, gestion des utilisateurs, gestion de pannes, statistiques et reporting

o Une entreprise qui pousse le développement, et une communauté croissante o Une interface vaste mais claire o Une gestion des templates poussée, avec import/export xml, modifications via

l'interface o Des performances au rendez-vous : l'application a été testée avec succès avec

10000 équipements supervisés o Compatible avec MySQL, PostgreSQL, Oracle, SQLite

Inconvénients

o Interface est un peu vaste, la mise en place des templates n'est pas évidente au début : petit temps de formation nécessaire

o L'agent zabbix communique par défaut en clair les informations, nécessité de sécuriser ces données (via VPN par exemple)

o Commence à être connu, mais pas encore auprès des entreprises : Peu d'interfaçage avec d'autres solutions commerciales

3.9 Shinken

Présentation

Le projet Shinken consiste en une refonte complète du cœur de Nagios en Python, lui apportant une nouvelle architecture plus souple et plus facile à maintenir que le daemon monolithique actuel. Se basant sur une vue Unix, l’architecture se compose de daemons simples qui coopèrent afin de proposer les mêmes fonctionnalités que Nagios, voir plus.

Ainsi en se basant sur la configuration actuelle de Nagios, ainsi que ses innombrables sondes, Shinken est capable de remplacer Nagios dans la supervision classique :

o vérifications des états SOFT/HARD o gestion des dépendances réseaux et logiques (applicatives) o gestion des actions correctrices o supervision active et passive o vérification de la fraicheur des informations dans le cadre de la supervision

passive

Mais il est également possible d’obtenir bien plus qu’un Nagios standard :

o supervision distribuée hautement disponible très facile à mettre en place, et de manière intégrée à la configuration globale

o gestion des noms en UTF-8 o presque 5 fois plus de performances que le Nagios classique o Multiplateforme : tourne nativement sur GNU/Linux et Windows. Il est même

possible de mixer les deux dans une même architecture!

Le nom est inspiré des sabres Shinken japonais qui sont les armes les plus coupantes des guerriers. Le programme permet en effet de couper automatiquement la configuration des administrateurs et ce intelligemment (enfin au moins il essaie).

Fonctionnalités

Répartition de charge Possibilité de pondérer le découpage de la configuration

Haute disponibilité Minimise le temps d’indisponibilité en ne rattachant aucune

configuration à un hôte physique

Multi plateforme Compatible sur toutes les plateformes où Python est

installable (Windows, Linux, Solaris, FreeBSD, Android, …

Simple de migration Nagios

vers Shinken

La migration de Nagios vers Shinken ne prend que quelques

minutes

Compatible Nagios

Configuration et plugins

Pas seulement Open

Source, il est libre Shinken est sous licence AGPL v3

Choix de Solution

Pour ce projet notre choix de solution se tourne vers Nagios qui est un outil de supervision

complet et simple d’utilisation qui permet la supervision de tout type matériel système,

réseau et autre et dans lequel on peut facilement intégrer des plugin afin de superviser tout

type d’outil. Nagios est un logiciel libre et gratuit avec une forte communauté très actif qui

http://www.gnu.org/licenses/agpl.html

propose régulièrement des nouveaux plugins, mise à jour ect… Et il existe un grand nombre

documentation sur cet outil. Nagios nous permettra de répondre à l’ensemble des besoin du

cahier des charges de la supervision à la métrologie en effectuant des graphe grâce au

protocole RRDTools .

4 Projet 4.1 Objectifs et but du projet :

4.2 Planning

5 Installation et configuration de Nagios

Sur une Debian Jessie pour ce tutoriel commençons par mettre à jour nos dépôts et nos

paquets afin de commencer avec un environnement propre.

Ensuite installons les paquets nécessaire u bon fonctionnement de Nagios (préparer vous un

café) :

Créons un utilisateur du nom de nagios et un groupe nagcmd puis ajoutons cet utilisateur

dans le groupe nagcmd :

Téléchargeons l’archive de la dernière version de Nagios version 4.1.1

Décompressons l’archive fraichement télécharger :

Maintenant il nous faut lancer le script configure :

Ensuite il faut lancer la compilation des fichiers de Magios avec les commandes make :

o make all Vous devez voir Enjoy.

o make install

o make install-init

o make install-commandmode

o make install-config

Créer les dossiers suivant /etc/httpd et etc/httpd/conf.d

Il nous reste maintenant une dernière compilation de Nagios à réaliser :

Copions maintenant le dossier contrib/eventhandlers/ dans /usr/local/nagios/libexec/

Changeons le propriétaire de ce dossier pour que ce soit l’utilisateur nagios qui en soit le

propriétaire :

Vérifions que le propriétaire à bien changer avec la commande ls –la :

On remarque bien que le propriétaire de ce dossier et de ses sous-dossiers est bien

l’utilisateur nagios

Vérifions maintenant la bonne configuration de Nagios :

Le retour verbeux de cette commande doit retourner 0 Warning et 0 erreurs :

Changer le mot de passe de Nagios dans le fichier htpasswd.users (avec l’option –C

pour qu’il soit créé s’il n’existe pas) dont le login par défaut est nagiosadmin. Pour cela il

faut d’abord installer le paquet apache2-utils qui contient la commande htpasswd :

Puis ensuite lancer la commande :

Installation et configuration du plugin Nagios permettant l’accès via l’interface web

Télécharger l’archive du plugin en n’oubliant pas de faire un retour en arrière dans

l’arborescence afin de sortir du dossier nagios-4.1.1 :

Décompressons l’archive fraichement télécharger :

Maintenant nous allons nous rendre dans le dossier nagios-plugins-2.1.1 et effectuer le

même rituel qu’avec Nagios, nous allons exécuter le script configure puis ensuite le

compiler avec la commande make (let’s go) :

Puis on compile maintenant avec la série de make :

o make

o make all

o make install

Maintenant nous allons copier le fichier de configuration de Nagios dans apache2 mais

avant nous allons installer apache2 et mysql:

Copie du fichier nagios.conf

Mise en place d’un lien symbolique entre le fichier conf de nagios que l’on vien de copier

et les sites active d’apache2 :

Redémarrer apache2 :

Redémarrer nagios :

Check du bon fonctionnement de la configuration de Nagios plugins :

Le retour de cette commande doit être 0 Warning et 0 erreurs :

Rendez-vous maintenant sur le navigateur web pour terminer les configurations de

Nagios via http://addresseIP/nagios.

Login nagiosadmin et le password le mot de passe renseigner plus haut avec la

commande htpassd :

Ouppps : Que s’est-il passé ? Notre serveur ne traduit pas le PHP ! Normal nous avons

oublié d’installé php5 donc tout de suite nous allons installer le paquet php5 :

Voilà Nagios fonctionne normalement ou presque car il est signalé Not running, pour

corriger cette erreur il faut ajouter l’adresse du serveur dans le fichier de configuration

d’apache2 :

Éditons ce fichier pour y ajouter Servername notreaddresseIP et on redémarrer

apache2:

http://addresseip/nagios

Activer les cgi d’apache2 :

Redémarrer apache2

Redémarrer Nagios :

Remarque : si vous avez toujours l’erreur rebooter le serveur.

Maintenant notre Nagios est fonctionnelle et prêt à superviser notre architecture

Superviser des machines Windows Éditons le fichier /usr/local/nagios/etc/nagios.cfg pour y dé-commenter la ligne correspondant

au remonter des hôtes windows ;

Ensuite éditons le fichier windows.cfg pour ajouterl’hôte windows à superviser :

Une fois dans ce fichier ajoutons notre hôte. Nous allons modifier juste l’alias et l’adresse ip

de la configuration déjà existante cela à titre d’exemple nous verrons plus bas comment

créer nos propre fichier de configuration d’hôte, de service, etc…

Nous voyons bien ici que Nagios à bien checker notre hôte :

Nous pouvons aussi voir les services superviser dans l’onglet service :

Remarque : tous les services de notre machine Windows sont rouges donc down, c’est

normal, pour corriger ce problème il faut installer un agent sur les machines Windows pour

qu’elles puissent communiquer correctement avec Nagios. Cet agent c’est NSClient++ ou

maintenant appelé NSCP nous y reviendrons plus tard lorsque nous aurons installé et

configurer le check NRPE et les fonctions de transport NSCA

Configuration des notifications Nagios

Pour configurer les notifications de Nagios il existe plusieurs moyens, nous allons voir ici

différents type notification pouvant être effectué par Nagios, notamment des notifications par

e-mail, SMS ou via twitter (mais ça c’est une surprise)

Les notifications par mail :

La gestion de la configuration par mail ce fait dans le fichier

/usr/local/nagios/etc/objects/contact.cfg

Nous ajouter quelques options et paramètres à ceux déjà présents par défaut :

Voici maintenant la définition de notre notification

Quelques explications s’impose concernant ces paramètres, nous allons voir un par un à

quoi ils peuvent bien servir :

o La directive service_notifiction_period : Période pendant laquelle les notifications

concernant les services sont émises par le Nagios vers le contact, ici nous avons mis

24*7 ce qui signifie à tout moment pour éviter que certains disfonctionnement ne soit

pas notifier.

o La directive host_notification_period : Identique à service_notification_period mais

pour les hôtes, ici encore nous mettons 24*7.

o Service_notification_options : renseigne à nagios à quel moment ou à quel état d’un

service une notification doit être envoyé, pour notre cas ce sont les états w,u,c,r.

W : Notification sur les états Warning d’un service

U : Notification sur les états UNKNOWN d’un service

C : Notification sur les états CRITICAL d’un service

R : Notification sur les états OK d’un service

Il existe deux autres états de notification, l’état ‘f’ qui correspond aux notifications

quand le service démarre et aux arrêts de battement. Puis l’état n correspondant à

none pour que le contact ne reçoive aucune notification.

Documents

PPE 3 · dun réseau. Les solutions de supervision permettent de remonter des informations ... La supervision informatique permet de superviser lensemble du système