Focus sur les évolutions de la supervision avec Centreon 3.0 – Part 2

This post is also available in: Anglais

Dans un premier volet, nous vous avions présenté les modifications introduites dans les futures moutures de notre moteur de supervision Centreon Engine couplé à Centreon Broker.

Pour compléter ces dernières fonctionnalités, nous avons également choisi de modifier plusieurs éléments :
– les timeout
– le polling
– le système de notification du “Scheduler”

Meilleure gestion des Timeouts

Avec la future version de Centreon, différents timeouts pourront être configurés entre les hôtes et les services. La configuration de ce paramètre n’est donc maintenant plus globale mais plus locale à chaque configuration de ressources (hôtes et services). Ainsi, pour certaines vérifications, le timeout pourra être de 40 secondes et d’autres de 5 secondes. Cela permettra une meilleure gestion des problèmes de latence ou de blocage en cas d’exécution de commandes longues ou bloquantes.
Ce paramètre sera configurable au niveau des hôtes et des services et bien sûr, de leurs modèles. Cette gestion plus fine des timeouts d’exécution permet ainsi la gestion d’un polling plus rapproché de certaines ressources.

Le polling en dessous de la minute

Faire du polling avec un intervalle inférieur à une minute est dorénavant possible.
Les précédentes versions le permettaient mais les développeurs de Nagios ne garantissaient rien sur la fiabilité de la fonctionnalité. Cependant, pour que la fonctionnalité soit intégrée sans trop de risques pour la stabilité de la plate-forme de supervision, il y avait quand même un manque relativement important : la gestion des timeouts au niveau des hosts et des services.
Imaginez que vous ayez besoin de vérifier toutes les 5 secondes quelques services seulement. A un moment, si ces checks ne répondent pas dans les 5 secondes, vous produisez de la latence, ce qui provoque une dégradation de votre plate-forme.
Vous aviez alors la possibilité de passer les services timeout à 5 secondes mais cela impactait toute la plate-forme (tous les services, même ceux qui pouvaient demander 30 secondes d’exécution)… Cela n’était donc pas gérable vraiment en l’état.
Du coup, nous avons changé ça.

Les utilisateurs désirant avoir des compteurs suivis en dessous de la minute vont maintenant pouvoir s’amuser. Cependant, gardez un oeil sur la volumétrie !! En effet, si vous passez une vérification basée sur une intervalle de 60 secondes à 10 secondes, la volumétrie pour ce contrôle prendra 6 fois plus de place :).
Nous travaillons actuellement sur des nouveaux moteurs de SGBD et des stratégies d’historisation qui nous permettront de mieux gérer les gros volumes de données.
Mais on vous rappelle que cela ne sert à rien de stocker des données si vous n’en faites rien ;)
Faites parler ces données ! Pour cela, il vous faut Centreon BI et son DataWareHouse !

Extraction du système de notification du “Scheduler”

Nous sommes actuellement sur un travail d’extraction de la notification du coeur de supervision. Comme vous le savez, actuellement la notification est gérée par l’ordonnanceur avec un fonctionnement bloquant (encore un…). C’est-à-dire que lorsqu’une alerte est envoyée, aucune action n’est effectuée pendant ce temps-là au niveau de l’ordonnancement. Imaginez un peu, si vous avez plusieurs notifications à envoyer… Vous aurez plein de blocages…
Afin de résourdre ce problème, nous avons pris le parti de changer totalement le fonctionnement. La notification sera maintenant gérée par Centreon Broker. Nous avions déjà préparé le terrain en intégrant de la corrélation (sujet sur lequel nous travaillons depuis plus d’un an maintenant). La suite logique de la corrélation était donc d’envoyer des notifications (mails, SMS, traps SNMP, requêtes HTTP, etc..) lors de l’ouverture de ces incidents par le corrélateur afin d’être alerté même quand vous n’êtes pas devant votre console de supervision.
Nous pourrons gérer nos alertes depuis un point central : le broker; mais également depuis les pollers car vous aurez la possibilité d’avoir des brokers dans des zones spécifiques (au sein des pollers ou au sein de zones externes à votre réseau)… Les notifications envoyées pourront être corrélées mais cela ne sera pas une obligation. Vous y retrouverez bien sûr en grande partie les même règles de notifications (intervalles, contacts, groupes de contacts, status) mais avec plus de possibilités. Nous aurons par exemple plus d’informations concernant les dépendances et les impacts. Il y aura toujours la possibilité d’avoir des notifications non-corrélées mais l’évolution majeure sera de pouvoir recevoir des notifications uniquement concernant les problèmes racines (Root Causes).

C’est bien mais ca sort quand ?

Voici un premier lot de fonctionnalités et des changements sont encore en cours.
Nous devrions vous communiquer d’autres informations dans les semaines à venir. Nous prévoyons toujours une version stable de Centreon 3 pour la fin d’année. La partie moteur est maintenant la plus avancée.

Que pensez-vous de ce premier lot ?
Nous restons disponibles pour répondre à vos questions et bien entendu attentifs à vos remarques.
Si vous voulez tester, valider, documenter, communiquer avec nous, commentez cet article ou contactez-nous sur l’adresse community@centreon.com

Une réflexion au sujet de « Focus sur les évolutions de la supervision avec Centreon 3.0 – Part 2 »

  1. Bonjour,

    Merci pour votre travail et pour ce que vous faites. J’utilise actuellement la version 2.5.4 de Centreon et je suis pressé de voir une nouvelle version arrivée.

    Avez-vous des formations certifiantes de prévues ?

    Cordialement,
    Micko

Leave a Reply