Supervision Temps-réel

Le menu Supervision permet de visualiser en temps-réel l’évolution de la supervision de son système d’information.

Statut des objets

Les statuts sont des indicateurs pour les hôtes ou les services. Chaque statut a une signification bien précise pour l’objet. A chaque statut correspond un code généré par la sonde de supervision en fonction des seuils définis par l’utilisateur.

Statut des hôtes

Le tableau ci-dessous résume l’ensemble des statuts possibles pour un hôte.

Statut

Code de retour

Description

UP

0

L’hôte est disponible et joignable

DOWN

1

L’hôte est indisponible

UNREACHABLE

2

L’hôte est injoignable

Statut des services

Le tableau ci-dessous résume l’ensemble des statuts possibles pour un service.

Statut

Code de retour

Description

OK

0

Le service ne présente aucun problème

WARNING

1

Le service a dépassé le seuil d’alerte

CRITICAL

2

Le service a dépassé le seuil critique

UNKNOWN

3

Le statut du service ne peut être vérifié (exemple : agent SNMP DOWN…)

Statuts avancés

En plus des statuts standards, de nouveaux statuts permettent d’ajouter des informations complémentaires :

  • Le statut PENDING est un statut affiché pour un service ou un hôte fraîchement configuré mais qui n’a pas encore été contrôlé par l’ordonnanceur.

  • Le statut UNREACHABLE est un statut indiquant que l’hôte est situé (relation de parenté) en aval d’un hôte dans un statut DOWN.

  • Le statut FLAPPING (bagotant) est un statut indiquant que le pourcentage de changement de statut de l’objet est très élevé. Ce pourcentage est obtenu à partir de calculs effectués par le moteur de supervision.

  • Le statut ACKNOWLEDGED est un statut indiquant que l’incident du service ou de l’hôte est pris en compte par un utilisateur.

  • Le statut DOWNTIME est un statut indiquant que l’incident du service ou de l’hôte est survenu durant une période de temps d’arrêt programmé.

Etats SOFT et HARD

Un hôte ou un service peut avoir deux états :

  • SOFT : Signifie qu’un incident vient d’être détecté et que ce dernier doit être confirmé.

  • HARD : Signifie que le statut de l’incident est confirmé. Lorsque le statut est confirmé, le processus de notification est enclenché (envoi d’un mail, SMS, …).

Confirmation d’un statut

Un incident (statut non-OK) est confirmé à partir du moment où le nombre d’essai de validation est arrivé à son terme. La configuration d’un objet (hôte ou service) implique un intervalle de contrôle régulier, un nombre d’essai pour valider un état non-OK ainsi qu’un intervalle non-régulier de contrôle. Dès la détection du premier incident, le statut est dans un état “SOFT” jusqu’à sa validation en état “HARD” déclenchant le processus de notification.

Exemple :

Un service a les paramètres de vérifications suivants :

  • Nombre de contrôles avant validation de l’état : 3

  • Intervalle normal de contrôle : 5 minutes

  • Intervalle non-régulier de contrôle : 1 minute

Imaginons le scénario suivant :

  • Instant t + 0 : Le service est vérifié, il a le statut OK.

  • Instant t + 5 : La seconde vérification montre que le service a le statut CRITICAL. Le service passe en état SOFT (essai 1/3).

  • Instant t + 6 : La troisième vérification à lieu, le service a toujours le statut CRITICAL en état SOFT (essai 2/3).

  • Instant t + 7 : La quatrième vérification montre que le service a toujours le statut CRITICAL (essai 3/3). Le nombre d’essais a été atteint, le statut est configuré (état HARD). Le processus de notification est enclenché.

  • Instant t + 8 : Le service retrouve le statut OK. Il passe directement en état HARD. Le processus de notification est enclenché.

  • Instant t + 13 : Le service a le statut WARNING. Il passe en état SOFT (essai 1/3).

  • Instant t + 14 : Le service a toujours le statut WARNING (essai 2/3).

  • Instant t + 15 : Le service a le statut CRITICAL. Il reste en état SOFT car il a changé de statut.

Actions génériques

Par défaut, lors de la visualisation des statuts des hôtes ou des services, les données de supervision sont rafraîchies automatiquement (15 secondes par défaut). Cependant, plusieurs icônes permettent de contrôler le rafraichissement des données. Le tableau ci-dessous résume les différentes fonctions de ces icônes :

Icône

Description

refresh

Permet de rafraîchir manuellement les résultats

pause

Permet de mettre en pause le rafraîchissement automatique des données

resume

Permet de reprendre le rafraîchissement automatique des données

Hôtes

Visualisation

Pour visualiser le statut des hôtes, rendez-vous dans le menu Supervision > Détails des statuts > Hôtes.

../_images/04unhandledproblems.png

La barre de recherche grise permet de filtrer les résultats affichés.

  • Pour visualiser les hôtes rencontrant un problème mais étant non acquittés, sélectionnez le filtre Problèmes non acquittés

  • Pour visualiser tous les hôtes rencontrant un problème, sélectionnez le filtre Problèmes en cours

  • Pour visualiser tous les hôtes, sélectionnez le filtre All

  • Pour visualiser les hôtes classés par groupes d’hôtes, cliquez sur le menu Résumé des statuts par groupes d’hôtes

../_images/04hostgroup.png

Tableaux d’hôtes

Le tableau ci-dessous donne une description de toutes les colonnes du tableau affiché lors de la visualisation des hôtes :

Nom de la colonne

Description

S

Affiche le niveau de criticité de l’hôte

Hôtes

Affiche le nom de l’hôte. L’icône nonotifications indique que les notifications pour cet hôte sont désactivées. L’icône graphperformances permet de visualiser l’ensemble des graphiques de performances pour cet hôte

Statut

Permet de visualiser le statut de l’hôte

Adresse IP

Indique l’adresse IP de l’hôte

Dernier contrôle

Affiche la date et l’heure du dernier contrôle

Durée

Affiche la durée depuis laquelle l’hôte a conservé son statut actuel

Validé depuis

Affiche la durée depuis laquelle l’hôte a conservé son statut actuel (n’apparait pas lors de la visualisation de tous les hôtes)

Tentatives

Affiche le nombre de tentatives effectuées avant de valider l’état

Statut détaillé

Affiche le message expliquant le statut de l’hôte

Note

La colonne criticité ainsi que le filtre associé apparaissent si au moins un objet affiché possède un niveau de criticité.

Filtres disponibles

Vous pouvez filtrer le résultat présenté via les filtres suivants :

  • Hôte : permet de filtrer par nom d’hôte via une recherche de type SQL LIKE.

  • Statut : permet de filtrer sur le statut des hôtes.

  • Criticité : permet de filtrer par criticité.

  • Collecteur : permet de filtrer les hôtes par collecteur. Seuls les hôtes du collecteur sélectionné seront affichés.

  • Groupe d’hôte : permet de filtrer par groupe d’hôte. Seuls les hôtes du groupe d’hôtes sélectionné seront affichés.

Note

La recherche sur les champs texte ne commence qu’à partir de la saisie d’au moins 3 caractères.

Tableau de groupes d’hôtes

Le tableau ci-dessous donne une description de toutes les colonnes du tableau affiché lors de la visualisation des groupes d’hôtes :

Nom de la colonne

Description

Groupes d’hôtes

Liste l’ensemble des groupes d’hôtes

Etat des hôtes

Permet de visualiser le nombre d’hôtes ayant le statut disponible, indisponible, injoignable ou en attente

Etat des services

Permet de visualiser le nombre de services ayant le statut OK, WARNING, CRITICAL ou PENDING

Filtres disponibles

Vous pouvez filtrer le résultat présenté en sélectionnant dans la liste déroulante un collecteur. Seuls les hôtes du collecteur sélectionné seront affichés.

Détails d’un hôte

Lorsque vous cliquez sur un hôte, la page suivante s’affiche :

../_images/04hostdetail.png

Détails du statut

Le tableau ci-dessous résume l’ensemble des attributs de cette partie :

Attributs

Description

Statut de l’hôte

Affiche le statut de l’hôte

Statut détaillé

Affiche le message associé au statut de l’hôte

Données de performance

Affiche les données de performances renvoyées par la sonde

Tentative

Affiche le nombre de tentative avant validation de l’état

Type d’état

Affiche le type d’état (‘SOFT’ ou ‘HARD’)

Dernier contrôle

Affiche la date et l’heure du dernier contrôle effectué sur l’hôte

Prochain contrôle

Affiche la date et l’heure du prochain contrôle effectué sur l’hôte

Latence

Affiche le temps de latence entre la programmation de l’exécution et l’exécution réelle de la sonde

Temps d’exécution

Affiche le temps d’exécution de la sonde

Changement du dernier état

Affiche la date et l’heure depuis laquelle l’hôte est dans l’état actuel

Durée de l’état actuel

Affiche la durée depuis laquelle l’hôte est dans l’état actuel

Dernier notification

Affiche la date et l’heure d’envoi de la dernière notification

Prochaine notification

Affiche la date et l’heure d’envoi de la prochaine notification

Numéro de notification actuel

Affiche le nombre de notifications déjà envoyées

Est-ce que le statut de l’hôte bagote ?

Indique si l’hôte bagotte (a le statut FLAPPING)

Pourcentage de changement de statut

Affiche le pourcentage de changement d’état

Planification d’arrêt en cours?

Indique si l’hôte est concerné par un temps d’arrêt

Dernière mise à jour

Affiche la date et l’heure de la dernière mise à jour

Options et Commandes disponibles

Les options ainsi que les commandes permettent d’effectuer un certain nombre d’actions sur l’hôte. Ces différentes options sont traitées au sein du guide d’exploitation.

Liens

Le conteneur Liens permet de visualiser les groupes d’hôtes auxquels l’hôte appartient.

Notifications

Le conteneur Notifications permet de visualiser quels sont les contacts et les groupes de contacts qui seront alertés en cas d’envoi d’une notification.

Services

Visualisation

Pour visualiser le statut des services, rendez-vous dans le menu Supervision > Détails des statuts > Services.

../_images/04servicelist.png

La barre de recherche grise permet de filtrer les résultats affichés.

  • Pour visualiser les services rencontrant un problème validé (état “HARD”) mais étant non acquittés, sélectionnez le filtre Problèmes non acquittés

  • Pour visualiser tous les services rencontrant un problème (validé ou non, acquittés ou non), sélectionnez le filtre Problèmes en cours

  • Pour visualiser tous les services, sélectionnez le filtre Tous les services

  • Pour visualiser tous les services (classés par hôtes), quel que soit le statut, cliquez sur le menu Regroupement par hôte

../_images/04servicelistbyhostdetail.png
  • Pour visualiser le nombre de services (classés par hôtes et statuts), cliquez sur le menu Regroupement par hôte, puis sélectionnez le filtre Résumé

../_images/04servicelistbyhost.png
  • Pour visualiser tous les services (classés par groupes d’hôtes), cliquez sur le menu Regroupement par groupes d’hôtes

../_images/04servicelistbyhostgroupdetail.png
  • Pour visualiser le nombre de services (classés par groupes d’hôtes et statuts), cliquez sur le menu Regroupement par groupes d’hôtes, puis sélectionnez le filtre Résumé

../_images/04servicelistbyhostgroup.png
  • Pour visualiser tous les services (classés par groupes de services), cliquez sur le menu Regroupement par groupes de services

../_images/04servicelistbyservicegroupdetail.png
  • Pour visualiser le nombre de services (classés par groupes de services et statuts), cliquez sur le menu Regroupement par groupes de services, puis sélectionnez le filtre Résumé

../_images/04servicelistbyservicegroup.png
  • Pour visualiser les méta-services, rendez-vous dans le menu Supervision > Détails des statuts > Services et filtrez sur l’hôte meta

../_images/04metaservices.png

Tableaux de services

Le tableau ci-dessous décrit les colonnes affichées lors de la visualisation des services.

Nom de la colonne

Description

S

Affiche le niveau de criticité du service

Hôtes

Affiche le nom de l’hôte. L’icône url_link permet d’accéder à une page web décrivant l’hôte

Services

Affiche le nom du service. L’icône nonotifications indique que les notifications pour ce service sont désactivées. L’icône graphperformances permet de visualiser le graphique de performance lié à ce service. L’icône url_link permet d’accéder à une page web décrivant le service

Validé depuis

Affiche la durée depuis laquelle le service a conservé son statut actuel

Dernier contrôle

Affiche la date et l’heure du dernier contrôle effectué

Tentatives

Affiche le nombre de tentatives effectuées pour valider l’état

Statut détaillé

Affiche le message expliquant le statut du service

Note

La colonne criticité ainsi que le filtre associé apparaissent si au moins un objet affiché possède un niveau de criticité.

Note

La colonne Validé depuis n’apparait pas lors de la sélection du menu contextuel Tous les services.

Tableaux des groupes

Le tableau ci-dessous décrit les colonnes affichées lors de la visualisation des services classés par groupes.

Nom de la colonne

Description

Hôtes ou Groupes d’hôtes Hôtes ou Groupes de services Hôtes

Liste l’ensemble des hôtes ou hôtes séparés par des groupes d’hôtes ou hôtes séparées par des groupes de services L’icône showservices permet de visualiser l’ensemble des services liés à l’hôte L’icône graphperformances permet de visualiser l’ensemble des graphiques de performances liés aux services appartenant à l’hôte

Statut

Affiche le statut de l’hôte

Informations sur les services

Affiche le statut des services (Mode détaillé) ou le nombre de services classés par statut (Mode résumé)

Détails d’un service

Lorsque vous cliquez sur un service, la page suivante s’affiche :

../_images/04servicedetail.png

Détails du statut

Le tableau ci-dessous résume l’ensemble des attributs de cette partie :

Attributs

Description

Statut du service

Affiche le statut du service

Statut détaillé

Affiche le message associé au statut du service

Informations d’état étendues

Affiche le message long (“long output”) associé au statut du service

Données de performance

Affiche les données de performances renvoyées par la sonde

Tentative

Affiche le nombre de tentative en cours pour valider l’état

Type d’état

Affiche le type d’état (‘SOFT’ ou ‘HARD’)

Dernier contrôle

Affiche la date et l’heure du dernier contrôle effectué sur le service

Prochain contrôle

Affiche la date et l’heure du prochain contrôle effectué sur le service

Latence

Affiche le temps de latence entre la programmation de l’exécution et son exécution réelle

Temps d’exécution

Affiche le temps d’éxécution de la sonde

Changement du dernier état

Affiche la date et l’heure depuis laquelle le service est dans l’état actuel

Durée de l’état actuel

Affiche la durée depuis laquelle le service est dans l’état actuel

Dernier notification

Affiche la date et l’heure d’envoi de la dernière notification

Numéro de notification actuel

Affiche le nombre de notifications déjà envoyées

Est-ce que le statut du service bagote ?

Indique si le service bagotte (statut FLAPPING)

Pourcentage de changement de statut

Affiche le pourcentage de changement d’état

Planification d’arrêt en cours?

Indique si le service est concerné par un temps d’arrêt

Dernière mise à jour

Affiche la date et l’heure de la dernière mise à jour

Options et commandes du service

Les options ainsi que les commandes du service permettent d’effectuer un certain nombre d’actions sur le service. Ces différentes options sont traitées au sein du guide d’exploitation.

Graphique détaillé et graphiques des statuts

Les parties Graphique détaillé et Graphique des statuts permettent respectivement de visualiser le graphique de performance ainsi que le graphique d’historique de statuts pour ce service.

Raccourcis d’hôte et de service

Ces différentes options sont traitées au sein du guide d’exploitation.

Liens

Le conteneur Liens permet de visualiser :

  • Les groupes d’hôtes auxquels l’hôte contenant le service appartient

  • Les groupes de services auxquels le service appartient

  • Les catégories de services auxquels le service appartient

Notifications

Le conteneur Notifications permet de visualiser quels sont les contacts et les groupes de contacts qui seront alertés en cas d’envoi d’une notification.

Les temps d’arrêts

Pour visualiser les temps d’arrêts en cours sur les ressources, rendez-vous dans le menu Supervision > Temps d’arrêt

../_images/04downtimelist.png

Le tableau ci-dessous décrit les colonnes de cette page.

Nom de la colonne

Description

Nom de l’hôte

Indique le nom de l’hôte

Service (si on utilise la page Services)

Affiche le service concerné par le temps d’arrêt

Date et heure de début et Date et heure de fin

Affiche la date et l’heure de début et de fin

Durée

Affiche la durée du temps d’arrêt

Auteur

Affiche la personne ayant ajouté ce temps d’arrêt

Commentaires

Affiche le raison du temps d’arrêt

Démarré

Indique si le temps d’arrêt est en cours ou non

Fixe

Indique si le temps d’arrêt est fixe ou non

Filtres disponibles

Vous pouvez filtrer le résultat présenté via les filtres suivants :

  • Nom de l’hôte : permet de filtrer par nom d’hôte via une recherche de type SQL LIKE.

  • Service : permet de filtrer par le nom du service.

  • Statut détaillé : permet de filtrer par le statut détaillé des services.

  • Auteur : permet de filtrer par utilisateur ayant créé des commentaires.

  • Afficher les temps d’arrêt terminés : permet d’afficher en plus les temps d’arrêt terminés.

  • Afficher les temps d’arrêt récurrents : permet d’afficher les temps d’arrêts récurrents.

Note

La recherche sur les champs texte ne commence qu’à partir de la saisie du troisième caractère.

Les commentaires

Pour visualiser les commentaires définis sur les ressources, rendez-vous dans le menu Supervision > Temps d’arrêt > Commentaires

../_images/04comments.png

Le tableau ci-dessous décrit les colonnes de cette page.

Nom de la colonne

Description

Nom de l’hôte

Indique le nom de l’hôte

Service (si on utilise la page Services)

Affiche le service concerné par le commentaire

Date de saisie

Affiche la date et l’heure où le commentaire a été saisi

Auteur

Affiche la personne ayant ajouté ce commentaire

Commentaires

Affiche le contenu du commentaire

Acquittement persistant en cas de redémarrage de l’ordonnanceur

Indique si le commentaire reste après le redémarrage de l’ordonnanceur

Filtres disponibles

Vous pouvez filtrer le résultat présenté via les filtres suivants :

  • Nom de l’hôte : permet de filtrer par nom d’hôte via une recherche de type SQL LIKE.

  • Service : permet de filtrer par le nom du service.

  • Statut détaillé : permet de filtrer par le statut détaillé des services.

Note

La recherche sur les champs texte ne commence qu’à partir de la saisie du troisième caractère.