Version: 24.04

Guide d'utilisation

Sauf indication contraire, toutes les commandes de cette page doivent être exécutées en tant que « root ».

Se connecter à Centreon sur le nœud actif

L'accès à l'interface du nœud actif se fait via l'adresse IP de la VIP centrale. Cela signifie que vous utilisez toujours la même URL pour accéder à l'interface, que l'interface soit celle du nœud central 1 ou celle du nœud central 2.

Comment connaître l'état du cluster ?

Utiliser crm_mon et pcs status

Vous pouvez connaître l'état du cluster à tout moment en utilisant la commande crm_mon, ou la commande pcs status, sur n'importe quel membre du cluster (nœuds centraux, quorum device, nœuds de base de données).

pcs status a une sortie statique : cela affiche l'état du cluster tel qu'il est au moment où vous exécutez la commande.
crm_mon a une sortie dynamique : l'état du cluster est affiché en temps réel. Vous pouvez observer l'arrêt des ressources et leur transfert vers l'autre nœud. Utilisez crm_mon -fr pour continuer à afficher les ressources arrêtées.

Exemple de sortie lorsque le cluster fonctionne correctement :

Cluster Summary:
  * Stack: corosync (Pacemaker is running)
  * Current DC: @CENTRAL_NODE2_NAME@ (version 2.1.6-9.1.el8_9-6fdc9deea29) - MIXED-VERSION partition with quorum
  * Last updated: Tue Jun  4 07:49:50 2024 on @CENTRAL_NODE1_NAME@
  * Last change:  Tue Jun  4 05:44:11 2024 by root via crm_resource on @CENTRAL_NODE2_NAME@
  * 4 nodes configured
  * 21 resource instances configured

Node List:
  * Online: [ @CENTRAL_NODE1_NAME@ @CENTRAL_NODE2_NAME@ @DATABASE_NODE1_NAME@ @DATABASE_NODE2_NAME@ ]

Full List of Resources:
  * Clone Set: ms_mysql-clone [ms_mysql] (promotable):
    * Masters: [ @DATABASE_NODE1_NAME@ ]
    * Slaves: [ @DATABASE_NODE2_NAME@ ]
    * Stopped: [ @CENTRAL_NODE1_NAME@ @CENTRAL_NODE2_NAME@ ]
  * Clone Set: php-clone [php]:
    * Started: [ @CENTRAL_NODE1_NAME@ @CENTRAL_NODE2_NAME@ ]
    * Stopped: [ @DATABASE_NODE1_NAME@ @DATABASE_NODE2_NAME@ ]
  * Clone Set: cbd_rrd-clone [cbd_rrd]:
    * Started: [ @CENTRAL_NODE1_NAME@ @CENTRAL_NODE2_NAME@ ]
    * Stopped: [ @DATABASE_NODE1_NAME@ @DATABASE_NODE2_NAME@ ]
  * vip_mysql   (ocf::heartbeat:IPaddr2):        Started @DATABASE_NODE1_NAME@
  * Resource Group: centreon:
    * vip       (ocf::heartbeat:IPaddr2):        Started @CENTRAL_NODE1_NAME@
    * http      (systemd:httpd):         Started @CENTRAL_NODE1_NAME@
    * gorgone   (systemd:gorgoned):      Started @CENTRAL_NODE1_NAME@
    * centreon_central_sync     (systemd:centreon-central-sync):         Started @CENTRAL_NODE1_NAME@
    * cbd_central_broker        (systemd:cbd-sql):       Started @CENTRAL_NODE1_NAME@
    * centengine        (systemd:centengine):    Started @CENTRAL_NODE1_NAME@
    * centreontrapd     (systemd:centreontrapd):         Started @CENTRAL_NODE1_NAME@
    * snmptrapd (systemd:snmptrapd):     Started @CENTRAL_NODE1_NAME@

Migration Summary:

Ces commandes ne devraient pas renvoyer d'erreurs. S'il y a des Failed actions sur une ressource, dépannez-les en utilisant le guide de dépannage.

Utilisation de l'interface Centreon

Le processus d'installation comprend la supervision des membres du cluster par un poller. De cette façon, vous pouvez être notifié si un membre du cluster tombe en panne.

La page Statut des ressources vous donne les informations suivantes :

Sur les deux nœuds centraux, le service PCS-Status vous donne l'état détaillé du cluster. L'output du service dans le panneau de détails est la sortie de la commande pcs status.
Vous pouvez savoir quel nœud central est le nœud actif en regardant quel nœud porte les ressources du cluster dans l'output du service PCS-Status sur chaque nœud central.

Supprimer une erreur affichée dans l'état du cluster

Une fois la cause de l'erreur identifiée et corrigée (voir le guide de dépannage), vous devez supprimer le message d'erreur manuellement :

pcs resource cleanup

Ou si vous souhaitez supprimer uniquement les erreurs liées à une ressource :

pcs resource cleanup <resource_name>

Vérifier les contraintes

Si un basculement s'est produit à un moment donné, il se peut qu'il reste des contraintes d'emplacement. Exécutez la commande suivante pour afficher les contraintes actuelles :

pcs constraint

La commande doit renvoyer le résultat suivant :

Location Constraints:
  Resource: cbd_rrd-clone
    Disabled on:
      Node: @DATABASE_NODE1_NAME@ (score:-INFINITY)
      Node: @DATABASE_NODE2_NAME@ (score:-INFINITY)
  Resource: centreon
    Disabled on:
      Node: @DATABASE_NODE1_NAME@ (score:-INFINITY)
      Node: @DATABASE_NODE2_NAME@ (score:-INFINITY)
  Resource: ms_mysql-clone
    Disabled on:
      Node: @CENTRAL_NODE1_NAME@ (score:-INFINITY)
      Node: @CENTRAL_NODE2_NAME@ (score:-INFINITY)
  Resource: php-clone
    Disabled on:
      Node: @DATABASE_NODE1_NAME@ (score:-INFINITY)
      Node: @DATABASE_NODE2_NAME@ (score:-INFINITY)
Ordering Constraints:
Colocation Constraints:
  vip_mysql with ms_mysql-clone (score:INFINITY) (rsc-role:Started) (with-rsc-role:Master)
  ms_mysql-clone with vip_mysql (score:INFINITY) (rsc-role:Master) (with-rsc-role:Started)
Ticket Constraints:

L'output montre les contraintes que vous avez définies pendant la procédure d'installation : la ressource ms_mysql-clone ne s'exécute que sur les nœuds de base de données, les ressources cbd_rrd-clone, centreon et php-clone ne s'exécutent que sur les nœuds centraux.

Pour supprimer les contraintes obsolètes, exécutez la commande suivante :

pcs resource clear centreon

Vérifier l'état de la synchronisation de la base de données

Pour vérifier que la synchronisation de la base de données fonctionne, exécutez la commande suivante :

/usr/share/centreon-ha/bin/mysql-check-status.sh

La commande doit renvoyer le résultat suivant :

Connection MASTER Status '@DATABASE_NODE1_NAME@' [OK]
Connection SLAVE Status '@DATABASE_NODE2_NAME@' [OK]
Slave Thread Status [OK]
Position Status [OK]

Si la synchronisation indique KO, vous devez y remédier. La procédure ci-dessous explique comment réactiver manuellement la réplication de la base de données.

Restaurer la réplication actif-passif de la base de données

Cette procédure doit être appliquée en cas de panne du thread de réplication des bases de données ou d'un crash du serveur s'il ne peut pas être récupéré en exécutant pcs resource cleanup ms_mysql ou pcs resource restart ms_mysql.

Empêchez le cluster de gérer la ressource ms_mysql pendant l'opération (à exécuter depuis n'importe quel nœud) :

pcs resource unmanage ms_mysql

Connectez-vous au nœud de base de données passif et arrêtez le service de base de données :

mysqladmin -p shutdown

Connectez-vous au nœud de base de données actif et exécutez la commande suivante pour écraser les données du nœud passif par celles du nœud actif :

/usr/share/centreon-ha/bin/mysql-sync-bigdb.sh

Réactivez le cluster pour gérer la ressource ms_mysql :

pcs resource manage ms_mysql

Exécutez la commande suivante sur l'un des serveurs de base de données pour vous assurer que la réplication a été restaurée avec succès :

/usr/share/centreon-ha/bin/mysql-check-status.sh

Connection Status '@CENTRAL_MASTER_NAME@' [OK]
Connection Status '@CENTRAL_SLAVE_NAME@' [OK]
Slave Thread Status [OK]
Position Status [OK]

Afficher la configuration du cluster

Pour afficher une description très détaillée de la configuration du cluster (par exemple, pour vérifier que le nom des ressources ne contient pas de fautes de frappe, ou pour vérifier les informations relatives au réseau), exécutez la commande suivante :

pcs config show

Tester le cluster

Cette section vous fournit des exemples de tests pour valider le bon fonctionnement de votre cluster : effectuez un basculement, simulez une panne de réseau et vérifiez que le cluster se comporte comme prévu.

Comment effectuer un basculement manuel

Nous supposons que le nœud central 1 est le nœud central actif et que le nœud central 2 est le nœud central passif (vérifiez l'état du cluster si besoin).

Lorsque vous déplacez le groupe de ressources centreon du nœud central 1 vers le nœud central 2, le nœud central 2 devient le nœud actif et le nœud central 1 devient le nœud passif.

Exécutez la commande suivante pour effectuer le basculement :

pcs resource move centreon

Dans un autre terminal, vous pouvez également utiliser la commande crm_mon -fr pour observer le basculement au fur et à mesure qu'il se produit. Il sera nécessaire d'utiliser Ctrl+c pour quitter la commande.

Avertissement : La commande pcs resource move centreon définit une contrainte -INFINITY sur le nœud 1. Cela signifie que la ressource n'est plus autorisée à fonctionner sur ce nœud. (Vous effacerez cette contrainte à l'étape 3.)

Les ressources se déplacent vers le nœud 2. Pour vérifier que les ressources ont bien été déplacées, exécutez la commande suivante :

pcs status

Le résultat attendu est le suivant :

Cluster name: centreon_cluster

WARNINGS:
Following resources have been moved and their move constraints are still in place: 'centreon'
Run 'pcs constraint location' or 'pcs resource clear <resource id>' to view or remove the constraints, respectively

Cluster Summary:
  * Stack: corosync (Pacemaker is running)
  * Current DC: @CENTRAL_NODE2_NAME@ (version 2.1.6-9.1.el8_9-6fdc9deea29) - MIXED-VERSION partition with quorum
  * Last updated: Tue Jun  4 05:41:08 2024 on @CENTRAL_NODE2_NAME@
  * Last change:  Tue Jun  4 05:36:52 2024 by root via crm_resource on @CENTRAL_NODE1_NAME@
  * 4 nodes configured
  * 21 resource instances configured

Node List:
  * Online: [ @CENTRAL_NODE1_NAME@ @CENTRAL_NODE2_NAME@ @DATABASE_NODE1_NAME@ @DATABASE_NODE2_NAME@ ]

Full List of Resources:
  * Clone Set: ms_mysql-clone [ms_mysql] (promotable):
    * Masters: [ @DATABASE_NODE1_NAME@ ]
    * Slaves: [ @DATABASE_NODE2_NAME@ ]
    * Stopped: [ @CENTRAL_NODE1_NAME@ @CENTRAL_NODE2_NAME@ ]
  * Clone Set: php-clone [php]:
    * Started: [ @CENTRAL_NODE1_NAME@ @CENTRAL_NODE2_NAME@ ]
    * Stopped: [ @DATABASE_NODE1_NAME@ @DATABASE_NODE2_NAME@ ]
  * Clone Set: cbd_rrd-clone [cbd_rrd]:
    * Started: [ @CENTRAL_NODE1_NAME@ @CENTRAL_NODE2_NAME@ ]
    * Stopped: [ @DATABASE_NODE1_NAME@ @DATABASE_NODE2_NAME@ ]
  * vip_mysql   (ocf::heartbeat:IPaddr2):        Started @DATABASE_NODE1_NAME@
  * Resource Group: centreon:
    * vip       (ocf::heartbeat:IPaddr2):        Started @CENTRAL_NODE2_NAME@
    * http      (systemd:httpd):         Started @CENTRAL_NODE2_NAME@
    * gorgone   (systemd:gorgoned):      Started @CENTRAL_NODE2_NAME@
    * centreon_central_sync     (systemd:centreon-central-sync):         Started                                                                              @CENTRAL_NODE2_NAME@
    * cbd_central_broker        (systemd:cbd-sql):       Started @CENTRAL_NODE2_NAME@
    * centengine        (systemd:centengine):    Started @CENTRAL_NODE2_NAME@
    * centreontrapd     (systemd:centreontrapd):         Started @CENTRAL_NODE2_NAME@
    * snmptrapd (systemd:snmptrapd):     Started @CENTRAL_NODE2_NAME@

Daemon Status:
  corosync: active/enabled
  pacemaker: active/enabled
  pcsd: active/enabled

Une fois le basculement terminé, exécutez la commande suivante pour vous assurer que les ressources pourront être déplacées vers leur nœud d'origine à l'avenir (EL8 ou Debian).

pcs resource clear centreon

Cela supprimera les contraintes établies pendant le basculement.

Si vous déplacez une seule ressource du groupe de ressources centreon d'un nœud à l'autre, toutes les autres ressources du groupe basculeront également.

Si vous souhaitez revenir à la situation nominale (c'est-à-dire que le nœud central 1 est le nœud central actif et le nœud central 2 est le nœud central passif), vous devez effectuer un second basculement de ressources (et effacer les contraintes par la suite).

Comment simuler la perte du nœud central passif ?

Si le nœud central passif tombe en panne, le cluster devrait continuer à fonctionner comme avant, car les ressources sont gérées par le nœud central actif. Vous verrez que votre nœud central passif est hors service à la page Statut des ressources.

Pour simuler une panne de réseau qui isolerait le noeud central passif, vous pouvez utiliser iptables pour supprimer le trafic depuis et vers le noeud central passif. Le nœud central passif sera complètement exclu du cluster. Le nœud central actif conserve la majorité avec le quorum device.

Effectuer le test

Nous supposons que le nœud 1 est le nœud actif et le nœud 2 le nœud passif (vérifiez l'état du cluster si besoin).

Pour effectuer ce test, lancez les commandes iptables sur le nœud central passif. Grâce à ces règles, tout le trafic provenant du nœud central actif, des bases de données et du quorum device sera ignoré par le nœud central passif :

iptables -A INPUT -s @CENTRAL_NODE1_IPADDR@ -j DROP
iptables -A OUTPUT -d @CENTRAL_NODE1_IPADDR@ -j DROP
iptables -A INPUT -s @DATABASE_NODE1_IPADDR@ -j DROP
iptables -A OUTPUT -d @DATABASE_NODE1_IPADDR@ -j DROP
iptables -A INPUT -s @DATABASE_NODE2_IPADDR@ -j DROP
iptables -A OUTPUT -d @DATABASE_NODE2_IPADDR@ -j DROP
iptables -A INPUT -s @QDEVICE_IPADDR@ -j DROP
iptables -A OUTPUT -d @QDEVICE_IPADDR@ -j DROP

Le nœud central passif est maintenant exclu du cluster.

Si vous exécutez pcs status sur le nœud central actif :

Les ressources et le cluster fonctionnent toujours (l'output montre que le nœud actif voit toujours le quorum device).
Le nœud central passif est vu offline par le nœud actif :

Cluster name: centreon_cluster
Stack: corosync
Current DC: @CENTRAL_NODE1_NAME@ (version 1.1.23-1.el8_9.1-9acf116022) - partition with quorum
Last updated: Thu May  5 10:34:05 2022
Last change: Thu May  5 09:09:50 2022 by root via crm_resource on @CENTRAL_NODE1_NAME@

4 nodes configured
21 resource instances configured

Online: [ @DATABASE_NODE1_NAME@ @CENTRAL_NODE1_NAME@ @DATABASE_NODE2_NAME@ ]
OFFLINE: [ @CENTRAL_NODE2_NAME@ ]

Full list of resources:

 Master/Slave Set: ms_mysql-clone [ms_mysql]
     Masters: [ @DATABASE_NODE1_NAME@ ]
     Slaves: [ @DATABASE_NODE2_NAME@ ]
     Stopped: [ @CENTRAL_NODE1_NAME@ @CENTRAL_NODE2_NAME@ ]
 vip_mysql      (ocf::heartbeat:IPaddr2):       Started @DATABASE_NODE1_NAME@
 Clone Set: php-clone [php]
     Started: [ @CENTRAL_NODE1_NAME@ ]
     Stopped: [ @DATABASE_NODE1_NAME@ @DATABASE_NODE2_NAME@ @CENTRAL_NODE2_NAME@ ]
 Clone Set: cbd_rrd-clone [cbd_rrd]
     Started: [ @CENTRAL_NODE1_NAME@ ]
     Stopped: [ @DATABASE_NODE1_NAME@ @DATABASE_NODE2_NAME@ @CENTRAL_NODE2_NAME@ ]
 Resource Group: centreon
     vip        (ocf::heartbeat:IPaddr2):       Started @CENTRAL_NODE1_NAME@
     http       (systemd:httpd24-httpd):        Started @CENTRAL_NODE1_NAME@
     gorgone    (systemd:gorgoned):     Started @CENTRAL_NODE1_NAME@
     centreon_central_sync      (systemd:centreon-central-sync):        Started @CENTRAL_NODE1_NAME@
     cbd_central_broker (systemd:cbd-sql):      Started @CENTRAL_NODE1_NAME@
     centengine (systemd:centengine):   Started @CENTRAL_NODE1_NAME@
     centreontrapd      (systemd:centreontrapd):        Started @CENTRAL_NODE1_NAME@
     snmptrapd  (systemd:snmptrapd):    Started @CENTRAL_NODE1_NAME@

Daemon Status:
  corosync: active/enabled
  pacemaker: active/enabled
  pcsd: active/enabled

Si vous exécutez pcs status sur le nœud passif :

Toutes les ressources sont vues comme arrêtées par le nœud passif (car le nœud passif ne voit plus le quorum device, comme l'indique le message ci-dessous partition WITHOUT quorum. Les ressources sont arrêtées).
Le nœud actif est vu comme offline (car le nœud passif est coupé du reste du cluster) :

Cluster name: centreon_cluster
Stack: corosync
Current DC: @CENTRAL_NODE1_NAME@ (version 1.1.23-1.el8_9.1-9acf116022) - partition WITHOUT quorum
Last updated: Thu May 5 10:34:05 2022
Last change: Thu May 5 09:09:50 2022 by root via crm_resource on @CENTRAL_NODE1_NAME@

4 nodes configured
21 resource instances configured

ONLINE: [ @CENTRAL_NODE2_NAME@ ]
OFFLINE: [ @CENTRAL_NODE1_NAME@ @DATABASE_NODE1_NAME@  @DATABASE_NODE2_NAME@  ]

Full list of resources:

  * Master/Slave Set: ms_mysql-clone [ms_mysql]
    * Stopped: [ @DATABASE_NODE1_NAME@ @DATABASE_NODE2_NAME@ @CENTRAL_NODE1_NAME@ @CENTRAL_NODE2_NAME@ ]
  * vip_mysql (ocf::heartbeat:IPaddr2): Stopped
  * Clone Set: php-clone [php]
      * Stopped: [ @CENTRAL_NODE1_NAME@ @DATABASE_NODE1_NAME@ @DATABASE_NODE2_NAME@ @CENTRAL_NODE2_NAME@ ]
  * Clone Set: cbd_rrd-clone [cbd_rrd]
      * Stopped: [  @CENTRAL_NODE1_NAME@ @DATABASE_NODE1_NAME@ @DATABASE_NODE2_NAME@ @CENTRAL_NODE2_NAME@ ]
  * Resource Group: centreon
      * vip (ocf::heartbeat:IPaddr2): Stopped
      * http (systemd:httpd24-httpd): Stopped 
      * gorgone (systemd:gorgoned): Stopped 
      * centreon_central_sync (systemd:centreon-central-sync): Stopped 
      * cbd_central_broker (systemd:cbd-sql): Stopped
      * centengine (systemd:centengine): Stopped
      * centreontrapd (systemd:centreontrapd): Stopped
      * snmptrapd (systemd:snmptrapd): Stopped 

Daemon Status:
corosync: active/enabled
pacemaker: active/enabled
pcsd: active/enabled

Revenir à la situation nominale

Si vous souhaitez revenir à la situation nominale, supprimez les règles iptables.

Pour visualiser les différentes règles iptables configurées sur le nœud passif, exécutez la commande suivante :

iptables -L

La commande doit renvoyer les informations suivantes :

Chain INPUT (policy ACCEPT)
target     prot opt source               destination
DROP       all  --  @CENTRAL_NODE1_NAME@  anywhere
DROP       all  --  @DATABASE_NODE1_NAME@  anywhere
DROP       all  --  @DATABASE_NODE2_NAME@  anywhere
DROP       all  --  @QDEVICE_NAME@  anywhere

Chain FORWARD (policy ACCEPT)
target     prot opt source               destination

Chain OUTPUT (policy ACCEPT)
target     prot opt source               destination
DROP       all  --  anywhere             @CENTRAL_NODE1_NAME@
DROP       all  --  anywhere             @DATABASE_NODE1_NAME@
DROP       all  --  anywhere             @DATABASE_NODE2_NAME@
DROP       all  --  anywhere             @QDEVICE_NAME@

Si vous n'avez pas d'autres règles iptables configurées, vous pouvez exécuter la commande suivante pour supprimer les règles liées au test :

iptables -F

Dans le cas contraire, vous devrez lister les numéros de règles à l'aide de la commande suivante :

iptables -L --line-numbers

Et les supprimer avec la commande suivante :

iptables -D INPUT @RULE_NUMBER@
iptables -D OUTPUT @RULE_NUMBER@

Si vous exécutez pcs status sur le nœud actif, le nœud passif est à nouveau considéré comme online :

Cluster name: centreon_cluster
Cluster Summary:
  * Stack: corosync (Pacemaker is running)
  * Current DC: @CENTRAL_NODE1_NAME@ (version 2.1.8-3.el9-3980678f0) - partition with quorum
  * Last updated: Fri Mar 21 16:40:32 2025 on @CENTRAL_NODE1_NAME@
  * Last change:  Thu Mar 13 11:30:16 2025 by hacluster via hacluster on @CENTRAL_NODE1_NAME@
  * 4 nodes configured
  * 21 resource instances configured

Node List:
  * Online: [ @CENTRAL_NODE1_NAME@ @CENTRAL_NODE2_NAME@ @DATABASE_NODE1_NAME@ @DATABASE_NODE2_NAME@ ]

Full List of Resources:
  * Clone Set: ms_mysql-clone [ms_mysql] (promotable):
    * Promoted: [ @DATABASE_NODE1_NAME@ ]
    * Unpromoted: [ @DATABASE_NODE2_NAME@ ]
    * Stopped: [ @CENTRAL_NODE1_NAME@ @CENTRAL_NODE2_NAME@ ]
  * vip_mysql   (ocf:heartbeat:IPaddr2):         Started @DATABASE_NODE1_NAME@
  * Clone Set: php-clone [php]:
    * Started: [ @CENTRAL_NODE1_NAME@ @CENTRAL_NODE2_NAME@ ]
    * Stopped: [ @DATABASE_NODE1_NAME@ @DATABASE_NODE2_NAME@ ]
  * Clone Set: cbd_rrd-clone [cbd_rrd]:
    * Started: [ @CENTRAL_NODE1_NAME@ @CENTRAL_NODE2_NAME@ ]
    * Stopped: [ @DATABASE_NODE1_NAME@ @DATABASE_NODE2_NAME@ ]
  * Resource Group: centreon:
    * vip       (ocf:heartbeat:IPaddr2):         Started @CENTRAL_NODE1_NAME@
    * http      (systemd:httpd):         Started @CENTRAL_NODE1_NAME@
    * cbd_central_broker        (systemd:cbd-sql):       Started @CENTRAL_NODE1_NAME@
    * gorgone   (systemd:gorgoned):      Started @CENTRAL_NODE1_NAME@
    * centreon_central_sync     (systemd:centreon-central-sync):         Started @CENTRAL_NODE1_NAME@
    * centengine        (systemd:centengine):    Started @CENTRAL_NODE1_NAME@
    * centreontrapd     (systemd:centreontrapd):         Started @CENTRAL_NODE1_NAME@
    * snmptrapd (systemd:snmptrapd):     Started @CENTRAL_NODE1_NAME@

Vérifiez également que la réplication de la base de données est toujours opérationnelle à l'aide de la commande suivante :

/usr/share/centreon-ha/bin/mysql-check-status.sh

Le résultat attendu est le suivant :

Connection MASTER Status '@DATABASE_NODE1_NAME@' [OK]
Connection SLAVE Status '@DATABASE_NODE2_NAME@' [OK]
Slave Thread Status [OK]
Position Status [OK]

Comment simuler la perte du nœud central actif ?

Ce test permet de vérifier que les ressources sont basculées vers le nœud passif en cas d'indisponibilité du nœud actif, ce qui permet d'assurer la continuité du service.

Effectuer le test

Nous supposons que le nœud central 1 est le nœud central actif et que le nœud central 2 est le nœud central passif (vérifiez l'état du cluster si besoin).

Pour effectuer ce test, exécutez les commandes suivantes sur le nœud central actif. Grâce à ces règles, tout le trafic provenant du nœud central passif, des bases de données et du dispositif quorum sera ignoré par le nœud central actif :

iptables -A INPUT -s @CENTRAL_NODE2_IPADDR@ -j DROP
iptables -A OUTPUT -d @CENTRAL_NODE2_IPADDR@ -j DROP
iptables -A INPUT -s @DATABASE_NODE1_IPADDR@ -j DROP
iptables -A OUTPUT -d @DATABASE_NODE1_IPADDR@ -j DROP
iptables -A INPUT -s @DATABASE_NODE2_IPADDR@ -j DROP
iptables -A OUTPUT -d @DATABASE_NODE2_IPADDR@ -j DROP
iptables -A INPUT -s @QDEVICE_IPADDR@ -j DROP
iptables -A OUTPUT -d @QDEVICE_IPADDR@ -j DROP

Les ressources du nœud central actif (nœud central 1) doivent s'arrêter. Le noeud central 2 devient le noeud actif et toutes les ressources basculent vers lui. Vous pouvez utiliser la commande crm_mon -fr sur le noeud central 2 pour observer le démarrage des ressources :

Stack: corosync
Current DC: @CENTRAL_NODE1_NAME@ (version 1.1.23-1.el8_9.1-9acf116022) - partition with quorum
Last updated: Thu May 5 11:06:38 2022
Last change: Thu May  5 09:09:50 2022 by root via crm_resource on @CENTRAL_NODE1_NAME@

4 nodes configured
21 resource instances configured

Online: [ @DATABASE_NODE1_NAME@ @DATABASE_NODE2_NAME@ @CENTRAL_NODE2_NAME@ ]
OFFLINE: [ @CENTRAL_NODE1_NAME@ ]

Full list of resources:

 Master/Slave Set: ms_mysql-clone [ms_mysql]
     Masters: [ @DATABASE_NODE1_NAME@ ]
     Slaves: [ @DATABASE_NODE2_NAME@ ]
     Stopped: [ @CENTRAL_NODE1_NAME@ @CENTRAL_NODE2_NAME@ ]
vip_mysql       (ocf::heartbeat:IPaddr2):       Started @DATABASE_NODE1_NAME@
 Clone Set: php-clone [php]
     Started: [ @CENTRAL_NODE2_NAME@ ]
     Stopped: [ @DATABASE_NODE1_NAME@ @CENTRAL_NODE1_NAME@ @DATABASE_NODE2_NAME@ ]
 Clone Set: cbd_rrd-clone [cbd_rrd]
     Started: [ @CENTRAL_NODE2_NAME@ ]
     Stopped: [ @DATABASE_NODE1_NAME@ @CENTRAL_NODE1_NAME@ @DATABASE_NODE2_NAME@ ]
 Resource Group: centreon
     vip        (ocf::heartbeat:IPaddr2):       Started @CENTRAL_NODE2_NAME@
     http       (systemd:httpd24-httpd):        Started @CENTRAL_NODE2_NAME@
     gorgone    (systemd:gorgoned):     Started @CENTRAL_NODE2_NAME@
     centreon_central_sync      (systemd:centreon-central-sync):        Started @CENTRAL_NODE2_NAME@
     cbd_central_broker (systemd:cbd-sql):      Started @CENTRAL_NODE2_NAME@
     centengine (systemd:centengine):   Started @CENTRAL_NODE2_NAME@
     centreontrapd      (systemd:centreontrapd):        Started @CENTRAL_NODE2_NAME@
     snmptrapd  (systemd:snmptrapd):    Started @CENTRAL_NODE2_NAME@

Migration Summary:

Retour à la situation nominale

Pour vérifier les différentes règles iptables configurées sur le nœud central 1, exécutez la commande suivante :

iptables -L

La commande doit renvoyer les informations suivantes :

Chain INPUT (policy ACCEPT)
target     prot opt source               destination
DROP       all  --  @CENTRAL_NODE2_NAME@  anywhere
DROP       all  --  @DATABASE_NODE1_NAME@  anywhere
DROP       all  --  @DATABASE_NODE2_NAME@  anywhere
DROP       all  --  @QDEVICE_NAME@  anywhere

Chain FORWARD (policy ACCEPT)
target     prot opt source               destination

Chain OUTPUT (policy ACCEPT)
target     prot opt source               destination
DROP       all  --  anywhere             @CENTRAL_NODE2_NAME@
DROP       all  --  anywhere             @DATABASE_NODE1_NAME@
DROP       all  --  anywhere             @DATABASE_NODE2_NAME@
DROP       all  --  anywhere             @QDEVICE_NAME@

Si vous n'avez pas d'autres règles iptables configurées, vous pouvez exécuter la commande suivante pour supprimer les règles liées au test :

iptables -F

Dans le cas contraire, il sera nécessaire de lister les numéros des règles à l'aide de la commande suivante :

iptables -L --line-numbers

Et de les supprimer avec la commande suivante :

iptables -D INPUT @RULE_NUMBER@;
iptables -D OUTPUT @RULE_NUMBER@

Si vous exécutez la commande crm_mon sur le noeud central 2, vous pouvez voir que le noeud central 1 est toujours le noeud passif :

Cluster Summary:
  * Stack: corosync
  * Current DC: @CENTRAL_NODE1_NAME@ (version 2.1.2-4.el8_6.3-ada5c3b36e2) - partition with quorum
  * Last updated: Tue Nov 8 17:27:28 2022
  * Last change:  Tue Nov  8 17:23:19 2022 by root via crm_attribute on @CENTRAL_NODE2_NAME@
  * 4 nodes configured
  * 21 resource instances configured
Node List:
  * Online: [ @CENTRAL_NODE1_NAME@ @CENTRAL_NODE2_NAME@ @DATABASE_NODE1_NAME@ @DATABASE_NODE2_NAME@ ]
Full List of Resources:
  * Master/Slave Set: ms_mysql-clone [ms_mysql]
    * Masters: [ @DATABASE_NODE1_NAME@ ]
    * Slaves: [ @DATABASE_NODE2_NAME@ ]
    * Stopped: [ @CENTRAL_NODE1_NAME@ @CENTRAL_NODE2_NAME@ ]
  * vip_mysql (ocf::heartbeat:IPaddr2): Started @DATABASE_NODE1_NAME@
  * Clone Set: php-clone [php]
    * Started: [ @CENTRAL_NODE2_NAME@ @CENTRAL_NODE1_NAME@ ]
    * Stopped: [ @DATABASE_NODE1_NAME@ @DATABASE_NODE2_NAME@ ]
  * Clone Set: cbd_rrd-clone [cbd_rrd]
    * Started: [ @CENTRAL_NODE2_NAME@ @CENTRAL_NODE1_NAME@ ]
    * Stopped: [ @DATABASE_NODE1_NAME@ @DATABASE_NODE2_NAME@ ]
  * Resource Group: centreon
    * vip (ocf::heartbeat:IPaddr2): Started @CENTRAL_NODE2_NAME@
    * http (systemd:httpd24-httpd): Started @CENTRAL_NODE2_NAME@
    * gorgone (systemd:gorgoned): Started @CENTRAL_NODE2_NAME@
    * centreon_central_sync (systemd:centreon-central-sync): Started @CENTRAL_NODE2_NAME@
    * cbd_central_broker (systemd:cbd-sql): Started @CENTRAL_NODE2_NAME@
    * centengine (systemd:centengine): Started @CENTRAL_NODE2_NAME@
    * centreontrapd (systemd:centreontrapd): Started @CENTRAL_NODE2_NAME@
    * snmptrapd (systemd:snmptrapd): Started @CENTRAL_NODE2_NAME@

Si vous souhaitez que le nœud central 1 redevienne le nœud actif, vous devez procéder à un basculement. Avant cela, vous devez vérifier l'état du cluster.

Commencez par vérifier les contraintes :

pcs constraint

La commande doit renvoyer le résultat suivant :

Location Constraints:
  Resource: cbd_rrd-clone
    Disabled on:
      Node: @DATABASE_NODE1_NAME@ (score:-INFINITY)
      Node: @DATABASE_NODE2_NAME@ (score:-INFINITY)
  Resource: centreon
    Disabled on:
      Node: @DATABASE_NODE1_NAME@ (score:-INFINITY)
      Node: @DATABASE_NODE2_NAME@ (score:-INFINITY)
      Node: @CENTRAL_NODE2_NAME@ (score:-INFINITY) (role:Started)
  Resource: ms_mysql-clone
    Disabled on:
      Node: @CENTRAL_NODE1_NAME@ (score:-INFINITY)
      Node: @CENTRAL_NODE2_NAME@ (score:-INFINITY)
  Resource: php-clone
    Disabled on:
      Node: @DATABASE_NODE1_NAME@ (score:-INFINITY)
      Node: @DATABASE_NODE2_NAME@ (score:-INFINITY)
Ordering Constraints:
Colocation Constraints:
  vip_mysql with ms_mysql-clone (score:INFINITY) (rsc-role:Started) (with-rsc-role:Master)
  ms_mysql-clone with vip_mysql (score:INFINITY) (rsc-role:Master) (with-rsc-role:Started)
Ticket Constraints:

Vous pouvez maintenant effectuer un basculement pour revenir à la situation initiale.

pcs resource clear centreon

Effectuez un nettoyage pour éliminer les erreurs.

pcs resource cleanup

Vous pouvez effectuer un basculement en déplaçant la ressource centreon.

pcs resource move centreon

La ressource centreon est maintenant relocalisée et le cluster est OK. Vérifiez ceci avec crm_mon -fr sur n'importe quel noeud.

Cluster Summary:

Stack: corosync (Pacemaker is running)
Current DC: @CENTRAL_NODE1_NAME@ (version 2.1.8-3.el9-3980678f0) - partition with quorum
Last updated: Fri Mar 21 16:47:43 2025 on @CENTRAL_NODE1_NAME@
Last change: Thu Mar 13 11:30:16 2025 by hacluster via hacluster on @CENTRAL_NODE1_NAME@
4 nodes configured
21 resource instances configured
Node List:

Online: [ @CENTRAL_NODE1_NAME@ @CENTRAL_NODE2_NAME@ @DATABASE_NODE1_NAME@ @DATABASE_NODE2_NAME@ ]
Full List of Resources:

  * Clone Set: ms_mysql-clone [ms_mysql] (promotable):
    * Promoted: [ @DATABASE_NODE1_NAME@ ]
    * Unpromoted: [ @DATABASE_NODE2_NAME@ ]
    * Stopped: [ @CENTRAL_NODE1_NAME@ @CENTRAL_NODE2_NAME@ ]
  * vip_mysql (ocf:heartbeat:IPaddr2): Started @DATABASE_NODE1_NAME@
  * Clone Set: php-clone [php]:
    * Started: [ @CENTRAL_NODE1_NAME@ @CENTRAL_NODE2_NAME@ ]
    * Stopped: [ @DATABASE_NODE1_NAME@ @DATABASE_NODE2_NAME@ ]
  * Clone Set: cbd_rrd-clone [cbd_rrd]:
    * Started: [ @CENTRAL_NODE1_NAME@ @CENTRAL_NODE2_NAME@ ]
    * Stopped: [ @DATABASE_NODE1_NAME@ @DATABASE_NODE2_NAME@ ]
  * Resource Group: centreon:
    * vip (ocf:heartbeat:IPaddr2): Started @CENTRAL_NODE1_NAME@
    * http (systemd:httpd): Started @CENTRAL_NODE1_NAME@
    * cbd_central_broker (systemd:cbd-sql): Started @CENTRAL_NODE1_NAME@
    * gorgone (systemd:gorgoned): Started @CENTRAL_NODE1_NAME@
    * centreon_central_sync (systemd:centreon-central-sync): Started @CENTRAL_NODE1_NAME@
    * centengine (systemd:centengine): Started @CENTRAL_NODE1_NAME@
    * centreontrapd (systemd:centreontrapd): Started @CENTRAL_NODE1_NAME@
    * snmptrapd (systemd:snmptrapd): Started @CENTRAL_NODE1_NAME@

Voir les logs du cluster

Les journaux du cluster sont situés dans /var/log/cluster/corosync.log (ou dans /var/log/corosync/corosync.log pour Debian). Pour les afficher, utilisez la commande suivante :

tail -f /var/log/cluster/corosync.log

Des journaux utiles se trouvent également dans /var/log/pacemaker/pacemaker.log.

Modifier le niveau de verbosité des journaux du cluster

Pour modifier le niveau de verbosité des journaux du cluster, modifiez les fichiers suivants :

/etc/sysconfig/pacemaker
/etc/rsyslog.d/centreon-cluster.conf

Commandes avancées

Supprimer un groupe de ressources Pacemaker

Avertissement: Ces commandes détruiront votre cluster Centreon. Ne le faites que si vous savez ce que vous faites.

Connectez-vous à un nœud du cluster et exécutez les commandes suivantes :

pcs resource delete centreon             \
                cbd_central_broker       \
                gorgone                  \
                snmptrapd                \
                centreontrapd            \
                http                     \
                centreon_central_sync    \
                vip

Si cela ne fonctionne pas, c'est probablement parce qu'une ressource se trouve dans un état failed. Exécutez les commandes suivantes pour supprimer la ressource :

crm_resource --resource [resource] -D -t primitive -C
pcs resource cleanup centreon

Se connecter à Centreon sur le nœud actif​

Comment connaître l'état du cluster ?​

Utiliser crm_mon et pcs status​

Utilisation de l'interface Centreon​

Supprimer une erreur affichée dans l'état du cluster​

Vérifier les contraintes​

Vérifier l'état de la synchronisation de la base de données​

Restaurer la réplication actif-passif de la base de données​

Afficher la configuration du cluster​

Tester le cluster​

Comment effectuer un basculement manuel​

Comment simuler la perte du nœud central passif ?​

Effectuer le test​

Revenir à la situation nominale​

Comment simuler la perte du nœud central actif ?​

Effectuer le test​

Retour à la situation nominale​

Voir les logs du cluster​

Modifier le niveau de verbosité des journaux du cluster​

Commandes avancées​

Supprimer un groupe de ressources Pacemaker​

Se connecter à Centreon sur le nœud actif

Comment connaître l'état du cluster ?

Utiliser crm_mon et pcs status

Utilisation de l'interface Centreon

Supprimer une erreur affichée dans l'état du cluster

Vérifier les contraintes

Vérifier l'état de la synchronisation de la base de données

Restaurer la réplication actif-passif de la base de données

Afficher la configuration du cluster

Tester le cluster

Comment effectuer un basculement manuel

Comment simuler la perte du nœud central passif ?

Effectuer le test

Revenir à la situation nominale

Comment simuler la perte du nœud central actif ?

Effectuer le test

Retour à la situation nominale

Voir les logs du cluster

Modifier le niveau de verbosité des journaux du cluster

Commandes avancées

Supprimer un groupe de ressources Pacemaker