Upload
ngoanh
View
214
Download
0
Embed Size (px)
Citation preview
PPE 3.8 Solution de supervision de l’infrastructure réseau et système permettant
d’assurer l’anticipation des pannes.
Table des matières
1 CONTEXTE : ......................................................................................................................... 4 1.1 PRESENTATION DE L’ENTREPRISE : ....................................................................................... 4 1.2 PRESENTATION DU PRESTATAIRE INFORMATIQUE : .............................................................. 4 1.3 ENSEIGNEMENTS SUR LE SYSTEME INFORMATIQUE DE L’ORGANISATION : ......................... 5
2 CAHIER DES CHARGES : .................................................................................................. 7 MISSION SUPERVISION ..................................................................................................................... 13
Titre du projet .......................................................................................................................... 13
Plan du travail : ....................................................................................................................... 13
3 SOLUTION .......................................................................................................................... 14 3.1 INTRODUCTION A LA SUPERVISION ....................................................................................... 14 3.2 SUPERVISER : QUOI ? ........................................................................................................... 15 3.3 LES NIVEAUX DE SUPERVISION ............................................................................................ 15
Supervision environnementale ................................................................................................. 15 Supervision réseau et matérielle ............................................................................................. 15 Supervision des systèmes ........................................................................................................ 15 Supervision des applications et services ............................................................................... 15 Superviser : pourquoi ? ............................................................................................................. 15
3.4 SUPERVISER : COMMENT ?................................................................................................... 16 3.5 NAGIOS .................................................................................................................................. 16
3.5.1 Présentation ................................................................................................................. 16 Moniteur de supervision : ...................................................................................................... 16
Ordonnanceur et analyseur gérant les actions : ................................................................ 16
Possibilités .................................................................................................................................. 17 Architecture ................................................................................................................................. 17 Avantages ................................................................................................................................... 18 Inconvénients .............................................................................................................................. 18
3.6 CENTREON ............................................................................................................................ 18 Schéma Fonctionnel .................................................................................................................. 18 Avantages ................................................................................................................................... 19 Avantages ................................................................................................................................... 20 Inconvénients .............................................................................................................................. 20
3.7 CACTI ..................................................................................................................................... 20 Présentation de Cacti ................................................................................................................ 20 Présentation de RRDtool .......................................................................................................... 21 Avantages ................................................................................................................................... 22 Inconvénients .............................................................................................................................. 22
3.8 ZABBIX ................................................................................................................................... 22 Fonctionnalités ........................................................................................................................... 23 Avantages ................................................................................................................................... 25 Inconvénients .............................................................................................................................. 25
3.9 SHINKEN ................................................................................................................................ 25 Présentation ................................................................................................................................ 25 Fonctionnalités ........................................................................................................................... 26
CHOIX DE SOLUTION ........................................................................................................................ 26
4 PROJET .............................................................................................................................. 27 4.1 OBJECTIFS ET BUT DU PROJET : .......................................................................................... 27 4.2 PLANNING .............................................................................................................................. 27
5 INSTALLATION ET CONFIGURATION DE NAGIOS ..................................................... 27 Installation et configuration du plugin Nagios permettant l’accès via l’interface web ...... 29 Superviser des machines Windows ........................................................................................ 32 Configuration des notifications Nagios ................................................................................... 33
Les notifications par mail : ..................................................................................................... 33
1 Contexte :
1.1 Présentation de l’entreprise :
Lors de la construction de ce stade, le réseau qui prenait en charge ses bureaux commerciaux
et ses services de sécurité proposait des fonctionnalités de communication de pointe. Au fil
des ans, la société a ajouté de nouveaux équipements et augmenté le nombre de connexions
sans tenir compte des objectifs commerciaux généraux ni de la conception de l’infrastructure
à long terme. Certains projets ont été menés sans souci des conditions de bande passante,
de définition de priorités de trafic et autres, requises pour prendre en charge ce réseau critique
de pointe.
StadiumCompany fournit l’infrastructure réseau et les installations sur le stade.
StadiumCompany emploie 170 personnes à temps plein :
· 35 dirigeants et responsables
· 135 employés
Environ 80 intérimaires sont embauchés en fonction des besoins, pour des événements
spéciaux dans les services installations et sécurité.
À présent, la direction de StadiumCompany veut améliorer la satisfaction des clients en
ajoutant des fonctions haute technologie et en permettant l’organisation de concerts, mais le
réseau existant ne le permet pas.
La direction de StadiumCompany sait qu’elle ne dispose pas du savoir-faire voulu en matière
de réseau pour prendre en charge cette mise à niveau. StadiumCompany décide de faire appel
à des consultants réseau pour prendre en charge la conception, la gestion du projet et sa mise
en œuvre. Ce projet sera mis en œuvre suivant trois phases. La première phase consiste à
planifier le projet et préparer la conception réseau de haut niveau.
La deuxième phase consiste à développer la conception réseau détaillée. La troisième phase
consiste à mettre en œuvre la conception.
1.2 Présentation du prestataire informatique :
Après quelques réunions, StadiumCompany charge NetworkingCompany, une société locale
spécialisée dans la conception de réseaux et le conseil, de la phase 1, la conception de haut
niveau. NetworkingCompany est une société partenaire Cisco Premier Partner. Elle emploie
20 ingénieurs réseau qui disposent de diverses certifications et d’une grande expérience dans
ce secteur.
Pour créer la conception de haut niveau, NetworkingCompany a tout d’abord interrogé le
personnel du stade et décrit un profil de l’organisation et des installations.
Créée en 1989, NetworkingCompany est une société spécialiste en infrastructures systèmes
et vente de matériel informatique pour professionnels de la vidéo.
Employant aujourd’hui 20 ingénieurs réseau, l’activité de NetworkingCompany s’établit à 1,8
millions d'euros de chiffre d’affaires.
Son cœur de métier se situe au niveau de l’infrastructure informatique afin de garantir les
besoins des activités « métiers ».
NetworkingCompany est l’une des seules sociétés de services informatique qui accompagne
réellement et jusqu’au bout ses clients dans le choix et la mise en œuvre de solutions.
NetworkingCompany intervient en mode Projet (Engagement de résultats), Régie
(Engagement de moyens) et Infogérance des environnements Windows.
Son outil de compétitivité et de productivité réside dans la capitalisation de son savoir-faire, le
haut niveau de certification de ses partenariats ainsi qu’une veille technologiques active.
NetworkingCompany a développé une expertise forte dans les domaines de la virtualisation,
les infrastructures d’accès (Application delivery), l’industrialisation du poste de travail (Itil,
Supervision, Télédistribution), les annuaires et la gestion de l’identité.
Reconnu depuis 25 ans comme une entreprise innovante, et avec aujourd’hui plus de 300
collaborateurs, cette société répond avec flexibilité et efficacité à tous les besoins, qu’ils
émanent de PME ou de grands comptes.
Enfin, NetworkingCompany est en partenariat avec de nombreux gros groupes du monde de
l’informatique, tout comme Microsoft, CISCO, HP, Huawei ou encore DELL, pour ne citer que
les plus importants.
1.3 Enseignements sur le système informatique de l’organisation :
Organisation de StadiumCompany :
Nombre de serveurs : 9 dont : (web, DHCP, commerce électronique, comptabilité(x3), paie)
Utilisateurs :
- 35 dirigeants
- 135 employés
- environs 80 intérimaires
- équipe A (90 personnes : 4 dirigeants, 12 entraineurs, 14 employé, 60 joueurs)
- équipe B
- équipe visiteurs
- restaurant
- fournisseur de concessions
- équipe B (4 dirigeants, 8 entraineurs, 12 employé, 40 joueurs)
- équipe visiteurs :
- fournisseur de concessions 5 employé 2 employé a temps partiel : intérimaire non
défini
- restaurant de luxe : 4 dirigent, 2 employé,
- 20 loges de luxe
- 2 sites distants
Services : DNS, DHCP, web
- dirigeants : PC et téléphones connecter à un PABX
- personnel et sécurité : 50 téléphones et PC réparti dans le stade
- 12 téléphones analogiques répartis dans le stade qui prennent en charges la
télécopie, et d’autres offrant un accès direct aux services de police et pompier.
- locaux connecté par fibre optiques
- équipe A : 15 bureaux dont 5 partagé 24 PC et 28 téléphones dans ces bureaux ;
vestiaire 5 téléphone, salon des joueurs : 15 téléphones
- équipe B : 12 bureaux dont 3 partagé, 19 PC et 22 téléphones, vestiaires 5
téléphones, salon des joueurs 15 téléphones
- équipe visiteur : salon et vestiaire doté de 10 téléphones
- fournisseur de concession : 2 bureau privée 5 PC et 7 téléphones, 32 stand
permanent non équipé pour le moment.
- restaurant de luxe : 4 bureau privé, 6 téléphones + 2 utilisé en salle pour les
réservations
- 20 loges de luxe : 20 téléphones
- zone de presse : 10 téléphones analogique, 2 ports de données réseaux + Wireless
AP
- 2 sites distant : connecter Via VPN (router FAI x3 pour gérer la connexion
StadiumCompany dispose d’un routeur de périmètre.
Processus : Pas d’information sur les processus, contrats et chartes informatiques.
2 Cahier des charges :
Cette année, vous allez intégrer la division du stade de StadiumCompany. Vous serez chargé
de la maintenance des systèmes et réseaux informatiques.
StadiumCompany est composé de plusieurs sites :
Site 1 : Stade (hébergement informatique, siège social et centre administratif)
Site 2 : Billetterie (vente des billets)
Site 3 : Magasin (vente des souvenirs)
Les différentes solutions retenues pour l’étude du projet d’un point de vue général de
StadiumCompany pourront faire l’objet de documentations techniques suivant la complexité
de la mise en œuvre.
Mission 8 :
Mission supervision
Titre du projet Mise en place d’un système de supervision Open source.
Travail demandé
Stadiumcompagny recherche, l’Implémentation et la configuration d'une solution Open Source
qui vise à superviser à distance les différents éléments actifs de l’infrastructure systèmes et
réseaux du Stade avec gestion des alertes.
Plan du travail : Le but principal du projet est de pouvoir établir, choisir et installer une solution de surveillance
des serveurs, routeurs, commutateurs, …, qui remplit les conditions suivantes :
- Coûts financiers les plus réduits possibles.
- Récupération des informations permettant la détection des pannes, l’indisponibilité des
serveurs (Windows, Linux), routeurs, commutateurs, les états des imprimantes réseau et leurs
services.
- Des renseignements supplémentaires de monitoring sur la charge CPU, espace disque,
mémoire disponible, input/output, processus en cours d’exécution, paquet perdu, temps
moyen de parcours (round trip average), information d'état SNMP, trafic, bande passante
consommée etc...
- Des renseignements supplémentaires de monitoring sur les services DNS, DHCP, http,
SMTP, POP, IMAP, FTP, …
- Gestion des alertes.
- Notification par mail ou SMS en cas de problème.
- Générer des rapports sur le fonctionnement des serveurs par mois.
- Générer des graphes (cartographie du réseau, …)
- Une interface graphique claire pour l’interaction utilisateur/Logiciel
3 Solution 3.1 Introduction à la supervision
La supervision est un processus informatique qui permet de surveiller l’ensemble du SI d’une organisation. Les outils de supervisions s’appellent des superviseurs qui permettent de surveiller les traitements informatiques. Dès qu’un traitement ne s’est pas exécuté correctement l’outil de supervision déclenche une alerte ; l’alerte est ensuite traitée par l’équipe pilotage. L’équipe de pilotage ont pour mission de surveiller les alertes remontées et d’exécuter des consignes pour résoudre ces alertes.
La supervision consiste à indiquer et à commander l’état d’un appel, d’un système ou d’un réseau. Les solutions de supervision permettent de remonter des informations techniques et fonctionnelles du système d’information.
L’informatique étant devenue l’épine dorsale de l’entreprise quel que soit son secteur d’activité, le système d’information est au centre de l’activité de différentes entités métiers et doit fonctionner pleinement et en permanence pour garantir l’efficacité de l’entreprise. A tous les niveaux, les réseaux, les terminaux utilisateurs, les serveurs d’applications et les données constituent autant de maillons sensibles dont la disponibilité et la qualité de service conditionnent le bon fonctionnement de l’entreprise.
Les problèmes liés à l’informatique doivent donc être réduits au minimum, car une indisponibilité du système d’information a des impacts très préjudiciables sur l’activité et sur la notoriété d’une entreprise.
Il existe deux enjeux majeurs pour les directions informatiques. Le premier est de garantir la disponibilité et les niveaux de service du système en cas de panne ou de dégradation des performances (par des mécanismes de redondance et d’équilibrage…). Le second est de tenter de prévenir en cas de problème et, le cas échéant, garantir une remontée d’information rapide et une durée d’intervention minimale. C’est le rôle de la supervision.
Il existe plusieurs méthodes pour superviser le système d'information :
Analyser les fichiers de log Récupérer des résultats de commandes et de scripts locaux ou distants SNMP : Simple Network Management Protocol
Gestion proactive est une démarche de travail qui permet d’agir en avance puisqu’on anticipe les incidents c'est-à-dire on sait à l’avance qu’est-ce qu’on va faire lorsque des incidents surviennent. Prévoir pour mieux gérer c’est à dire agir avant qu'une situation ne devienne une cause de confrontation ou de crise. Donc, anticiper en se posant les bonnes questions est primordial.
3.2 Superviser : quoi ?
La supervision informatique permet de superviser l’ensemble du système d’Information de l’entreprise :
o Le réseau et ses équipements o Les serveurs o Les périphériques o Les applications o Le workflow o Surveiller les systèmes d’information o assurer la disponibilité des services. o prévenir les défaillances. o détecter les anomalies (sécurité, système). o fédérer l’information d’équipements hétérogénes en un portail unique. o Automatiser les téches o alerter en cas d’interruption d’un service. o relancer des services interrompus.
3.3 Les niveaux de supervision
Supervision environnementale
o température de la pièce o humidité de la pièce
Supervision réseau et matérielle
o commutateurs et routeurs : disponibilité, interrogation des sondes, alertes. o serveurs : disponibilité, interrogation des sondes matérielles, alertes. o onduleurs : disponibilité, charge, état. o imprimantes : disponibilité, état de l’imprimante et des consommables.
Supervision des systèmes
o commutateurs : utilisation des ressources, métrologie. o serveurs : utilisation des ressources.
Supervision des applications et services
o disponibilité. o cohérence des réponses aux interrogations. o performances.
Superviser : pourquoi ?
L’informatique est au cœur de l’entreprise, quelle que soit son secteur d’activité. On peut facilement comparer la place que joue l’informatique au sein d’une entreprise é celle que joue le système nerveux chez l’être humain. En effet, il est au centre de l’activité, et doit fonctionner pleinement et en permanence pour garantir l’activité.
Certaines ramifications même comme le réseau et les terminaux utilisateurs doivent aussi fonctionner, à l’instar des nerfs du système dans le corps humain.
Les problèmes liés à l’informatique doivent donc être réduits au minimum, car une indisponibilité du système d’information peut être la cause de plusieurs millions d’euros de pertes.
Deux phases sont donc importantes pour les directeurs informatiques : garantir la disponibilité du système en cas de panne (par des mécanismes de redondance…) mais aussi tenter de prévenir en cas de problème et, le cas échéant, garantir une remontée d’information rapide et une durée d’intervention minimale : c’est le rôle de la supervision.
3.4 Superviser : comment ?
Il existe plusieurs méthodes pour superviser le système d’information :
Analyser les fichiers de log Récupérer des résultats de commandes et de scripts locaux ou distants Supervision en mode actif Supervision en mode passif
3.5 Nagios
Nagios est un logiciel de supervision destiné à vous informer de problèmes éventuels dans votre système d’informations avant que vos clients, utilisateurs ou managers ne le fassent. Il est prévu pour fonctionner sur système d’exploitation Linux mais fonctionne également sans problème sur la plupart des variantes *NIX. Le démon de supervision effectue des contrôles intermittents sur les hôtes et services que vous spécifiez en utilisant des plugins externes qui retournent un status d’état à Nagios. Quand des problèmes surviennent, il peut envoyer des notifications à des contacts administratifs de façons différentes (email, SMS, messagerie instantanée, etc…). Les informations d’états courants, les historiques et les rapports peuvent être consultés à partir d’un simple navigateur.
3.5.1 Présentation
Moniteur de supervision :
o vérification des services réseau (SMTP, HTTP, …etc.). o surveillance des ressources des hôtes (charge CPU, espace disque, …etc.). o contrôle des équipements réseau (CPU, ventilateurs, …etc.).
Ordonnanceur et analyseur gérant les actions :
o système complet de notification fonction du service, de l’heure et de la date. o gestion des escalades. o possibilité de paramétrer des réactions automatisées.
o possibilité de définir des gestionnaires d’événements. o Système de modules/plugins de vérification o fonctionne tels des programmes externes. o permet de développer ses propres modules. o Possibilité de définir la hiérarchie du réseau en utilisant des hôtes parents. o Une interface Web avec gestion des droits pour la consultation. o Génération de rapports de surveillance. o N’est pas destiné à faire de la métrologie.
Possibilités
Nagios (anciennement appelé Netsaint) est un logiciel qui permet de superviser un système d’information complet. C’est un logiciel libre, il est sous licence GPL.
C’est un programme modulaire qui se décompose en trois parties:
1. Le moteur de l’application qui vient ordonnancer les tâches de supervision. 2. L’interface web, qui permet d’avoir une vue d’ensemble du système d’information et
des possibles anomalies. 3. Les plugins, une centaine de mini programmes que l’on peut compléter en fonction
de nos besoins pour superviser chaque service ou ressource disponible sur l’ensemble des ordinateurs ou éléments réseaux de notre SI.
o Superviser des services réseaux : (SMTP, POP3, HTTP, NNTP, ICMP, SNMP, LDAP , etc.)
o Superviser les ressources des serveurs (charge du processeur, occupation du disque dur, utilisation de la mémoire paginée) et ceci sur les systèmes d’exploitations les plus répandus.
o La supervision à distance peut utiliser SSH ou un tunnel SSL. o Les plugins sont écrits dans les langages de programmation les plus adaptés à leur
tâche (Bash, C++, Python, Perl, PHP, C, etc.) o La vérification des services se fait en parallèle. o Possibilité de définir une hiérarchie dans le réseau pour pouvoir faire la différence
entre un serveur en panne et un serveur injoignable. o La remontée des alertes est entièrement paramétrable grâce à l’utilisation de plugins
(alerte par email, SMS, etc.) o Chaque test renvoi un état particulier:
1. # OK (tout va bien) 2. # WARNING (le seuil d’alerte est dépassé) 3. # CRITICAL (le service a un problème) 4. # UNKNOWN (impossible de connaître l’état du service)
Architecture
o un ordonnanceur qui gère : o l’ordonnancement et les dépendances des vérifications. o les actions à entreprendre suite à des incidents (alertes, escalades,
corrections automatiques). o une interface graphique de type client Web. o des modules/sondes dont un grand nombre sont fournis de base. (ex : check_mailq,
check_http, check_imap). o Nagios est un noyau o ordonnanceur et analyseur.
o système de modules pour les vérifications. o rassemblement et analyse d’informations. o réaction, prévention et réparation. o souplesse et finesse de configuration.
Avantages
o Reconnu auprès des entreprises, grande communauté o Plétore de plugins qui permettent d'étendre les possibilités (agents comme zabbix,
reporting amélioré, etc...) o Une solution complète permettant le reporting, la gestion de panne et d'alarmes,
gestion utilisateurs, ainsi que la cartographie du réseaux o Beaucoup de documentations sur le web o Performances du moteur
Inconvénients
o Interface non ergonomique et peu intuitive o Configuration fastidieuse via beaucoup de fichiers o Pour avoir toute les fonctionnalités il faut installer des plugins, de base c'est assez
limité.
3.6 Centreon
Centreon est LE dérivé français de Nagios de référence développé par la société Merethis. Il s’agit d’une couche applicative Web venant se greffer à Nagios pour offrir une administration moins rudimentaire (évite les fichiers de configuration et les lignes de commandes brute). L’équipe de chez Merethis est avant-gardiste et a inspiré pour certains points les lignes directrices de la communauté. C’est un produit très complet et son interface le rend très professionnel aux yeux des dirigeants.
Schéma Fonctionnel
o Principe de fonctionnement
Le schéma ci-dessous montre comment Centreon et Nagios intéragissent l’un avec l’autre.
o Gestion des flux
Le schéma ci-dessous montre les protocoles et flux utilisés par les différents éléments qui compose une supervision Centreon / Nagios
Avantages
o La robustesse et la renommée de Nagios
o Une interface beaucoup plus sympathique, permettant de tout configurer, de garder un oeil sur tout le réseau en permanence
o Les utilisateurs de Nagios ne seront pas perdus pour autant, l'interface reprenant avantageusement certaines vues Nagios
o Une solution complète permettant le reporting, la gestion de panne et d'alarmes, gestion utilisateurs, ainsi que la cartographie du réseau
o Une entreprise qui pousse le développement o Peut-être décorelé du serveur Nagios et tourner tout seul sur un autre serveur
Avantages
o La robustesse et la renommée de Nagios o Une interface beaucoup plus sympathique, permettant de tout configurer, de garder
un oeil sur tout le réseau en permanence o Les utilisateurs de Nagios ne seront pas perdus pour autant, l'interface reprenant
avantageusement certaines vues Nagios o Une solution complète permettant le reporting, la gestion de panne et d'alarmes,
gestion utilisateurs, ainsi que la cartographie du réseau o Une entreprise qui pousse le développement o Peut-être décorelé du serveur Nagios et tourner tout seul sur un autre serveur
Inconvénients
o L'interface peut paraître complexe car il existe beaucoup d'options, de vues....cela nécessite une petite formation
o Un développement qui n'est pas encore en phase avec celui de Nagios : Parfois des problèmes de compatibilité
o Un peu plus lourd que du Nagios pur
3.7 Cacti
Présentation de Cacti
Cacti est un logiciel de supervision (dit de « capacity planning ») basé sur RRDtool permettant de surveiller l’activité de son architecture informatique à partir de graphiques quotidiens, hebdomadaires, mensuels et annuels.
Cette solution n’est donc pas destinée à alerter en temps réel sur les dysfonctionnements d’un système mais bien de proposer une vision dans le temps de l’évolution d’indicateurs matériels et logiciels (trafic réseau, occupation des disques, temps de réponse, etc…).
acti est une interface de présentation (frontend) complète à RRDTool, il stocke toute l’information nécessaire pour créer des graphiques et pour les peupler avec des données dans une base de données MySQL. Le frontend est complètement écrit PHP. Il supporte également SNMP et tend à se substituer à MRTG pour créer des graphiques.
Cacti permet d’alimenter les graphiques à partir de n’importe quel script / command externe.
Une fois qu’un ou plusieurs points d’émission de données sont définis, un graphique de RRDTool peut être créé en utilisant les données. Cacti vous permet de créer presque n’importe quel graphique en utilisant tous les types de graphique de RRDTool et fonctions standards de consolidation, mais aussi de présentation. Cacti offre également une gestion d’utilisateurs qui permet à chacun la possibilité de personnaliser l’interface mais aussi de limiter l’accès.
Présentation de RRDtool
Le programme RRDtool a été développé par Tobias Etiker dès 1995. Il est librement téléchargeable sur le site suivant : http://people.ee.ethz.ch/~oetiker/webtools/rrdtool/.
RRD est l’acronyme de Round Robin Database, qui peut se traduire par « base de données cyclique ». Ce mécanisme permet de stocker des données dans des fichiers de taille invariante, définie à la création, par un mécanisme de pile LILO (Last In Last Out). Un fichier RRD peut contenir plusieurs RRA (Round Robin Archive) qui correspondent aux différents cycles de conservation des données (jour, semaine, mois, année, etc.).
Une fois les données collectées, RRDtool fournit des outils permettant de générer des graphiques hautement personnalisables, retraitant les données à la volée.
Avantages
o Interface : Beaucoup plus claire que celle de NetMRG elle permet également beaucoup plus de choses (Plus de modes d'affichages et plus de possibilités de configuration)
o Configuration : Avec l'utilisation des templates pour les machines, les graphiques, et la récupération des données tout se configure aisément et entièrement via l'interface web. Import/ Export très simple des templates au format XML. On peut aussi très facilement utiliser des options poussées de RRDTOOL
o Performance : Avec le choix du moteur de récolte des données, On peut opter pour la performance ou la simplicité
o Gestion des utilisateurs o Communauté sur le web, présence d'une dizaine de plugins permettant d'étendre les
fonctionnalités
Inconvénients
o Pas de gestion d'alarmes, sauf avec un plugin nommé Thold o Pas de gestion de panne et absence d'une cartographie de réseau o Un développement lent
3.8 Zabbix
Zabbix est une application libre (open source) de supervision des systèmes et des réseaux en infrastructure IT, développée en C. L’interface web est quant à elle, développée en PHP et en JavaScript.
Mise à part les versions serveur et proxy qui sont exclusivement sur Unix, Zabbix est multiplateforme, et est disponible sous des systèmes d’exploitation tels que par exemple Windows, Linux, Solaris, …etc.
Par sa polyvalence, Zabbix peut superviser et vérifier les statuts d’une multitude de services réseaux, ou systèmes (serveurs), tout en surveillant au niveau matériel de nombreux types d’équipements présents au sein d’une infrastructure IT, comme un routeur, une imprimante, un téléphone IP, grâce à l’utilisation du protocole SNMP.
Zabbix supporte également le protocole IPMI, et dispose d’outils d’auto-découverte d’équipements. Il intègre par défaut la gestion de cartes (réseaux) et de graphiques, tous visualisables depuis une même interface.
Fonctionnalités
Supervision
Configuration centralisée, Accès centralisée
à toutes les données, Jusqu’à 1000 nœuds
ZABBIX, Nombre illimité de proxy
Evolutivité
Testé avec 100000 équipements et serveurs
supervisés, Testé avec 1000000 de contrôles
de disponibilités et de performances,
Traitement de milliers de contrôles de
disponibilités et de performances par
seconde
Suivi en temps réel
Surveillance des performances, Surveillance
des disponibilités, Surveillance des intégrités,
Conditions de notifications flexibles, Alertes
des utilisateurs (email, SMS, jabber),
Journalisation (logging)
Visualisation Vues et diaporama définies par l’utilisateur,
Cartographie, Graphiques, Zoom
Résolution rapide des problèmes
Envoi des alertes par email, téléphone, SMS,
ou par alertes audio, Exécute des
commandes à distance
Gestion du SLA Services IT hiérarchiques, Rapport SLA en
temps réel
Rapports et tendances
Facilités d’intégration d’outils, Analyse des
statistiques
journalières/mensuelles/annuelles, Rapports
SLA
Import/Export de données XML Facilité de partage des templates
Auto-découverte
Découverte par plage d’adresse IP, services
ou SNMP, Surveillance automatique des
équipements découverts
Supervision Web
Surveillance des performances et des
disponibilités Web, Scénarios flexibles,
Support des méthodes POST et GET
Flexibilité
Support des protocoles IPv4 et IPv6,
Facilités d’extension des agents natifs,
Toutes les méthodes de notifications,
Fonctionne sur toute plateforme
Supervision pro-active
Exécution automatique de commandes à
distance, Exécution automatique des
commandes IPMI
Surveillance globale Suivi d’un groupe d’hôtes comme un seul
hôte
Surveillance sans agent
Surveillance de services distants (FTP, SSH,
HTTP, …), Support du SNMPv1/v2/v3,
Support de l’IPMI, Support des traps SNMP
Agents de haute performance
Toutes les plateformes sont supportées
(Unix, Windows, Novell), Utilisation de la
mémoire, Utilisation du réseau, Disk I/O,
Disponibilité de l’espace disque, Contrôle
des fichiers, Surveillances des fichiers
journaux, …etc
Sécurité
Permissions des utilisateurs flexibles,
Authentification par adresse IP, Protection
contre les attaques du type Brute Force
Escalades et notifications
Notifications répétées, Escalades illimitées,
Récupération des messages, Notification
lorsqu’un problème est résolu
Fonctions de gestion ping, traceroute vers un hôte, Toutes les
autres fonctions
Tableau de bord
Tableau de bord personnalisable,
Ressources, données favorites, Haut niveau
de vision
Supervision avec agent Agent natif pour toute plateforme, Evite les
problèmes de connections
Administration facile
Très rapide courbe d’apprentissage, Toutes
les données sont stockées dans une base de
données (MySQL, PostgreSQL, Oracle,
SQLite), Configuration centralisée et
stockage de l’information
Solution Open Source
Aucune licence de limitation du moteur,
Accès au code source, Ouvert aux audits du
code
Toutes les informations en ligne Manuel ZABBIX, Wiki ZABBIX, Forums
ZABBIX
Soutenu par la société Zabbix
Contrats de support annuels, Solutions clés
en main, Compte de responsable technique,
Services professionnels
Avantages
o Une solution très complète : cartographie de réseaux, gestion poussée d'alarmes via SMS, Jabber ou Email, gestion des utilisateurs, gestion de pannes, statistiques et reporting
o Une entreprise qui pousse le développement, et une communauté croissante o Une interface vaste mais claire o Une gestion des templates poussée, avec import/export xml, modifications via
l'interface o Des performances au rendez-vous : l'application a été testée avec succès avec
10000 équipements supervisés o Compatible avec MySQL, PostgreSQL, Oracle, SQLite
Inconvénients
o Interface est un peu vaste, la mise en place des templates n'est pas évidente au début : petit temps de formation nécessaire
o L'agent zabbix communique par défaut en clair les informations, nécessité de sécuriser ces données (via VPN par exemple)
o Commence à être connu, mais pas encore auprès des entreprises : Peu d'interfaçage avec d'autres solutions commerciales
3.9 Shinken
Présentation
Le projet Shinken consiste en une refonte complète du cœur de Nagios en Python, lui apportant une nouvelle architecture plus souple et plus facile à maintenir que le daemon monolithique actuel. Se basant sur une vue Unix, l’architecture se compose de daemons simples qui coopèrent afin de proposer les mêmes fonctionnalités que Nagios, voir plus.
Ainsi en se basant sur la configuration actuelle de Nagios, ainsi que ses innombrables sondes, Shinken est capable de remplacer Nagios dans la supervision classique :
o vérifications des états SOFT/HARD o gestion des dépendances réseaux et logiques (applicatives) o gestion des actions correctrices o supervision active et passive o vérification de la fraicheur des informations dans le cadre de la supervision
passive
Mais il est également possible d’obtenir bien plus qu’un Nagios standard :
o supervision distribuée hautement disponible très facile à mettre en place, et de manière intégrée à la configuration globale
o gestion des noms en UTF-8 o presque 5 fois plus de performances que le Nagios classique o Multiplateforme : tourne nativement sur GNU/Linux et Windows. Il est même
possible de mixer les deux dans une même architecture!
Le nom est inspiré des sabres Shinken japonais qui sont les armes les plus coupantes des guerriers. Le programme permet en effet de couper automatiquement la configuration des administrateurs et ce intelligemment (enfin au moins il essaie).
Fonctionnalités
Répartition de charge Possibilité de pondérer le découpage de la configuration
Haute disponibilité Minimise le temps d’indisponibilité en ne rattachant aucune
configuration à un hôte physique
Multi plateforme Compatible sur toutes les plateformes où Python est
installable (Windows, Linux, Solaris, FreeBSD, Android, …
Simple de migration Nagios
vers Shinken
La migration de Nagios vers Shinken ne prend que quelques
minutes
Compatible Nagios
Configuration et plugins
Pas seulement Open
Source, il est libre Shinken est sous licence AGPL v3
Choix de Solution
Pour ce projet notre choix de solution se tourne vers Nagios qui est un outil de supervision
complet et simple d’utilisation qui permet la supervision de tout type matériel système,
réseau et autre et dans lequel on peut facilement intégrer des plugin afin de superviser tout
type d’outil. Nagios est un logiciel libre et gratuit avec une forte communauté très actif qui
propose régulièrement des nouveaux plugins, mise à jour ect… Et il existe un grand nombre
documentation sur cet outil. Nagios nous permettra de répondre à l’ensemble des besoin du
cahier des charges de la supervision à la métrologie en effectuant des graphe grâce au
protocole RRDTools .
4 Projet 4.1 Objectifs et but du projet :
4.2 Planning
5 Installation et configuration de Nagios
Sur une Debian Jessie pour ce tutoriel commençons par mettre à jour nos dépôts et nos
paquets afin de commencer avec un environnement propre.
Ensuite installons les paquets nécessaire u bon fonctionnement de Nagios (préparer vous un
café) :
Créons un utilisateur du nom de nagios et un groupe nagcmd puis ajoutons cet utilisateur
dans le groupe nagcmd :
Téléchargeons l’archive de la dernière version de Nagios version 4.1.1
Décompressons l’archive fraichement télécharger :
Maintenant il nous faut lancer le script configure :
Ensuite il faut lancer la compilation des fichiers de Magios avec les commandes make :
o make all Vous devez voir Enjoy.
o make install
o make install-init
o make install-commandmode
o make install-config
Créer les dossiers suivant /etc/httpd et etc/httpd/conf.d
Il nous reste maintenant une dernière compilation de Nagios à réaliser :
Copions maintenant le dossier contrib/eventhandlers/ dans /usr/local/nagios/libexec/
Changeons le propriétaire de ce dossier pour que ce soit l’utilisateur nagios qui en soit le
propriétaire :
Vérifions que le propriétaire à bien changer avec la commande ls –la :
On remarque bien que le propriétaire de ce dossier et de ses sous-dossiers est bien
l’utilisateur nagios
Vérifions maintenant la bonne configuration de Nagios :
Le retour verbeux de cette commande doit retourner 0 Warning et 0 erreurs :
Changer le mot de passe de Nagios dans le fichier htpasswd.users (avec l’option –C
pour qu’il soit créé s’il n’existe pas) dont le login par défaut est nagiosadmin. Pour cela il
faut d’abord installer le paquet apache2-utils qui contient la commande htpasswd :
Puis ensuite lancer la commande :
Installation et configuration du plugin Nagios permettant l’accès via l’interface web
Télécharger l’archive du plugin en n’oubliant pas de faire un retour en arrière dans
l’arborescence afin de sortir du dossier nagios-4.1.1 :
Décompressons l’archive fraichement télécharger :
Maintenant nous allons nous rendre dans le dossier nagios-plugins-2.1.1 et effectuer le
même rituel qu’avec Nagios, nous allons exécuter le script configure puis ensuite le
compiler avec la commande make (let’s go) :
Puis on compile maintenant avec la série de make :
o make
o make all
o make install
Maintenant nous allons copier le fichier de configuration de Nagios dans apache2 mais
avant nous allons installer apache2 et mysql:
Copie du fichier nagios.conf
Mise en place d’un lien symbolique entre le fichier conf de nagios que l’on vien de copier
et les sites active d’apache2 :
Redémarrer apache2 :
Redémarrer nagios :
Check du bon fonctionnement de la configuration de Nagios plugins :
Le retour de cette commande doit être 0 Warning et 0 erreurs :
Rendez-vous maintenant sur le navigateur web pour terminer les configurations de
Nagios via http://addresseIP/nagios.
Login nagiosadmin et le password le mot de passe renseigner plus haut avec la
commande htpassd :
Ouppps : Que s’est-il passé ? Notre serveur ne traduit pas le PHP ! Normal nous avons
oublié d’installé php5 donc tout de suite nous allons installer le paquet php5 :
Voilà Nagios fonctionne normalement ou presque car il est signalé Not running, pour
corriger cette erreur il faut ajouter l’adresse du serveur dans le fichier de configuration
d’apache2 :
Éditons ce fichier pour y ajouter Servername notreaddresseIP et on redémarrer
apache2:
Activer les cgi d’apache2 :
Redémarrer apache2
Redémarrer Nagios :
Remarque : si vous avez toujours l’erreur rebooter le serveur.
Maintenant notre Nagios est fonctionnelle et prêt à superviser notre architecture
Superviser des machines Windows Éditons le fichier /usr/local/nagios/etc/nagios.cfg pour y dé-commenter la ligne correspondant
au remonter des hôtes windows ;
Ensuite éditons le fichier windows.cfg pour ajouterl’hôte windows à superviser :
Une fois dans ce fichier ajoutons notre hôte. Nous allons modifier juste l’alias et l’adresse ip
de la configuration déjà existante cela à titre d’exemple nous verrons plus bas comment
créer nos propre fichier de configuration d’hôte, de service, etc…
Nous voyons bien ici que Nagios à bien checker notre hôte :
Nous pouvons aussi voir les services superviser dans l’onglet service :
Remarque : tous les services de notre machine Windows sont rouges donc down, c’est
normal, pour corriger ce problème il faut installer un agent sur les machines Windows pour
qu’elles puissent communiquer correctement avec Nagios. Cet agent c’est NSClient++ ou
maintenant appelé NSCP nous y reviendrons plus tard lorsque nous aurons installé et
configurer le check NRPE et les fonctions de transport NSCA
Configuration des notifications Nagios
Pour configurer les notifications de Nagios il existe plusieurs moyens, nous allons voir ici
différents type notification pouvant être effectué par Nagios, notamment des notifications par
e-mail, SMS ou via twitter (mais ça c’est une surprise)
Les notifications par mail :
La gestion de la configuration par mail ce fait dans le fichier
/usr/local/nagios/etc/objects/contact.cfg
Nous ajouter quelques options et paramètres à ceux déjà présents par défaut :
Voici maintenant la définition de notre notification
Quelques explications s’impose concernant ces paramètres, nous allons voir un par un à
quoi ils peuvent bien servir :
o La directive service_notifiction_period : Période pendant laquelle les notifications
concernant les services sont émises par le Nagios vers le contact, ici nous avons mis
24*7 ce qui signifie à tout moment pour éviter que certains disfonctionnement ne soit
pas notifier.
o La directive host_notification_period : Identique à service_notification_period mais
pour les hôtes, ici encore nous mettons 24*7.
o Service_notification_options : renseigne à nagios à quel moment ou à quel état d’un
service une notification doit être envoyé, pour notre cas ce sont les états w,u,c,r.
W : Notification sur les états Warning d’un service
U : Notification sur les états UNKNOWN d’un service
C : Notification sur les états CRITICAL d’un service
R : Notification sur les états OK d’un service
Il existe deux autres états de notification, l’état ‘f’ qui correspond aux notifications
quand le service démarre et aux arrêts de battement. Puis l’état n correspondant à
none pour que le contact ne reçoive aucune notification.