Aller au contenu principal

Azure Kubernetes Service

Azure Kubernetes Service (AKS) simplifie le déploiement d’un cluster Kubernetes managé en déléguant la charge opérationnelle à Azure. En tant que service Kubernetes hébergé, Azure gère des tâches critiques telles que l’analyse de l’intégrité et la maintenance.

Le connecteur de supervision Centreon Azure Kubernetes Service peut s'appuyer sur l'API d'Azure ou bien Azure CLI pour collecter les métriques relatives à AKS.

Contenu du pack

Modèles

Le connecteur de supervision Azure Kubernetes Service apporte un modèle d'hôte :

  • Cloud-Azure-Compute-Aks-custom

Le connecteur apporte les modèles de service suivants (classés selon le modèle d'hôte auquel ils sont rattachés) :

AliasModèle de serviceDescription
Allocatable-resourcesCloud-Azure-Compute-Aks-Allocatable-Resources-Api-customContrôle de la mémoire et des coeurs CPU allouables restants sur le Cluster AKS
Cpu-UsageCloud-Azure-Compute-Aks-Cpu-Usage-Api-customContrôle le CPU du cluster AKS
HealthCloud-Azure-Compute-Aks-Health-Api-customContrôle le statut du cluster AKS
MemoryCloud-Azure-Compute-Aks-Memory-Api-customContrôle le taux d'utilisation mémoire du cluster AKS
Node-StateCloud-Azure-Compute-Aks-Node-State-Api-customContrôle l'état des noeuds du cluster AKS
Pod-StateCloud-Azure-Compute-Aks-Pod-State-Api-customContrôle l'état des Pods du cluster AKS
StorageCloud-Azure-Compute-Aks-Storage-Api-customContrôle les statistiques de stockage du cluster AKS
TrafficCloud-Azure-Compute-Aks-Traffic-Api-customContrôle l'utilisation du réseau du cluster AKS
Unneeded-nodesCloud-Azure-Compute-Aks-Unneeded-Nodes-Api-customContrôle du nombre de noeuds inutiles sur le cluster AKS
Unschedulable-PodsCloud-Azure-Compute-Aks-Unschedulable-Pods-Api-customContrôle la présence de Pods non déployables du cluster AKS

Les services listés ci-dessus sont créés automatiquement lorsque le modèle d'hôte Cloud-Azure-Compute-Aks-custom est utilisé.

Règles de découverte

Découverte d'hôtes

Le connecteur de supervision Centreon Azure Kubernetes Service inclut un fournisseur de découverte d'hôtes nommé Microsoft Azure Kubernetes Service. Celui-ci permet de découvrir l'ensemble des instances rattachées à une souscription Microsoft Azure donnée et de les ajouter à la liste des hôtes supervisés.

Cette découverte n'est compatible qu'avec le mode api. Le mode azcli n'est pas supporté dans le cadre de cette utilisation.

Rendez-vous sur la documentation dédiée pour en savoir plus sur la découverte automatique d'hôtes.

Métriques & statuts collectés

Voici le tableau des services pour ce connecteur, détaillant les métriques rattachées à chaque service.

MétriqueUnité
aks.node.allocatable.cpu.coresN/A
aks.node.allocatable.memory.bytesB

Prérequis

Rendez-vous sur la documentation dédiée afin d'obtenir les prérequis nécessaires pour interroger les API d'Azure.

Installer le connecteur de supervision

Pack

  1. Si la plateforme est configurée avec une licence online, l'installation d'un paquet n'est pas requise pour voir apparaître le connecteur dans le menu Configuration > Gestionnaire de connecteurs de supervision. Au contraire, si la plateforme utilise une licence offline, installez le paquet sur le serveur central via la commande correspondant au gestionnaire de paquets associé à sa distribution :
dnf install centreon-pack-cloud-azure-compute-aks
  1. Quel que soit le type de la licence (online ou offline), installez le connecteur Azure Kubernetes Service depuis l'interface web et le menu Configuration > Gestionnaire de connecteurs de supervision.

Plugin

À partir de Centreon 22.04, il est possible de demander le déploiement automatique du plugin lors de l'utilisation d'un connecteur. Si cette fonctionnalité est activée, et que vous ne souhaitez pas découvrir des éléments pour la première fois, alors cette étape n'est pas requise.

Plus d'informations dans la section Installer le plugin.

Utilisez les commandes ci-dessous en fonction du gestionnaire de paquets de votre système d'exploitation :

dnf install centreon-plugin-Cloud-Azure-Compute-Aks-Api

Utiliser le connecteur de supervision

Utiliser un modèle d'hôte issu du connecteur

  1. Ajoutez un hôte à Centreon depuis la page Configuration > Hôtes.
  2. Remplissez le champ Adresse IP/DNS avec l'adresse 127.0.0.1.
  3. Appliquez le modèle d'hôte Cloud-Azure-Compute-Aks-custom. Une liste de macros apparaît. Les macros vous permettent de définir comment le connecteur se connectera à la ressource, ainsi que de personnaliser le comportement du connecteur.
  4. Renseignez les macros désirées. Attention, certaines macros sont obligatoires. Par exemple, pour ce connecteur, AZURECUSTOMMODE (valeurs possibles : api ou azcli). En effet, il existe plusieurs modes de communication avec l'équipement supervisé : soit l'outil en ligne de commande azcli, soit une interrogation directe de l'api.
MacroDescriptionValeur par défautObligatoire
AZURECLIENTIDSet Azure client IDX
AZURECLIENTSECRETSet Azure client secretX
AZURECUSTOMMODEWhen a plugin offers several ways (CLI, library, etc.) to get information the desired one must be defined with this optionapi
AZURERESOURCESet resource name or ID (required)
AZURERESOURCEGROUPSet resource group (required if resource's name is used)X
AZURESUBSCRIPTIONSet Azure subscription (required if logged to several subscriptions)X
AZURETENANTSet Azure tenant IDX
PROXYURLProxy URL if any
EXTRAOPTIONSAny extra option you may want to add to every command (a --verbose flag for example). Toutes les options sont listées ici.

Paramétrez les options suivantes dans la macro EXTRAOPTIONS si vous superviser des ressources Microsoft Azure géré par 21Vianet (Azure China): --management-endpoint='https://management.chinacloudapi.cn' --login-endpoint='https://login.partner.microsoftonline.cn'.

Deux méthodes peuvent être utilisées pour définir l'authentification :

  • Utilisation de l'ID complet de la ressource (de type /subscriptions/<subscription_id>/resourceGroups/<resourcegroup_id>/providers/XXXXXX/XXXXXXX/<resource_name>) dans la macro AZURERESOURCE.
  • Utilisation du nom de la ressource dans la macro AZURERESOURCE et du nom du groupe de ressources dans la macro AZURERESOURCEGROUP.
  1. Déployez la configuration. L'hôte apparaît dans la liste des hôtes supervisés, et dans la page Statut des ressources. La commande envoyée par le connecteur est indiquée dans le panneau de détails de l'hôte : celle-ci montre les valeurs des macros.

Utiliser un modèle de service issu du connecteur

  1. Si vous avez utilisé un modèle d'hôte et coché la case Créer aussi les services liés aux modèles, les services associés au modèle ont été créés automatiquement, avec les modèles de services correspondants. Sinon, créez les services désirés manuellement et appliquez-leur un modèle de service.
  2. Renseignez les macros désirées (par exemple, ajustez les seuils d'alerte). Les macros indiquées ci-dessous comme requises (Obligatoire) doivent être renseignées.
MacroDescriptionValeur par défautObligatoire
TIMEFRAMESet timeframe in seconds (i.e. 3600 to check last hour)900
INTERVALSet interval of the metric query (can be : PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H, PT24H)PT5M
FILTERMETRICFilter metrics (available metrics: 'Allocatable CPU Cores', 'Allocatable Memory Bytes') (can be a regexp).
WARNINGALLOCATABLECPUCORESSet warning threshold for number of remaining allocatable CPU Cores. It is a range, set 10: to get WARNING if there are less than 10 CPU cores allocatable remaining
CRITICALALLOCATABLECPUCORESSet critical threshold for number of remaining allocatable CPU Cores. It is a range, set 5: to get CRITICAL if there are less than 5 CPU cores allocatable remaining
WARNINGALLOCATABLEMEMORYSet warning threshold for remaining allocatable memory in bytes. It is a range, set 16GB: to get WARNING if there are less than 16GB allocatable left
CRITICALALLOCATABLEMEMORYSet critical threshold for remaining allocatable memory in bytes. It is a range, set 8GB: to get CRITICAL if there are less than 8GB allocatable left
EXTRAOPTIONSAny extra option you may want to add to the command (a --verbose flag for example). Toutes les options sont listées ici.
  1. Déployez la configuration. Le service apparaît dans la liste des services supervisés, et dans la page Statut des ressources. La commande envoyée par le connecteur est indiquée dans le panneau de détails du service : celle-ci montre les valeurs des macros.

Comment puis-je tester le plugin et que signifient les options des commandes ?

Une fois le plugin installé, vous pouvez tester celui-ci directement en ligne de commande depuis votre collecteur Centreon en vous connectant avec l'utilisateur centreon-engine (su - centreon-engine). Vous pouvez tester que le connecteur arrive bien à superviser une instance Azure en utilisant une commande telle que celle-ci (remplacez les valeurs d'exemple par les vôtres) :

/usr/lib/centreon/plugins/centreon_azure_compute_aks_api.pl \
--plugin=cloud::azure::compute::aks::plugin \
--mode=unschedulable-pods \
--custommode='api' \
--resource='' \
--resource-group='' \
--subscription='' \
--tenant='' \
--client-id='' \
--client-secret='' \
--proxyurl='' \
--warning-unschedulable-pods='' \
--critical-unschedulable-pods=''

La commande devrait retourner un message de sortie similaire à :

OK: Cluster Autoscaler Unschedulable Pods: 8 | 'aks.cluster.autoscaler.unschedulable.pods.count'=8;;;0;

Diagnostic des erreurs communes

Rendez-vous sur la documentation dédiée des plugins basés sur HTTP/API.

Modes disponibles

Dans la plupart des cas, un mode correspond à un modèle de service. Le mode est renseigné dans la commande d'exécution du connecteur. Dans l'interface de Centreon, il n'est pas nécessaire de les spécifier explicitement, leur utilisation est implicite dès lors que vous utilisez un modèle de service. En revanche, vous devrez spécifier le mode correspondant à ce modèle si vous voulez tester la commande d'exécution du connecteur dans votre terminal.

Tous les modes disponibles peuvent être affichés en ajoutant le paramètre --list-mode à la commande :

/usr/lib/centreon/plugins/centreon_azure_compute_aks_api.pl \
--plugin=cloud::azure::compute::aks::plugin \
--list-mode

Le plugin apporte les modes suivants :

ModeModèle de service associé
allocatable-resources [code]Cloud-Azure-Compute-Aks-Allocatable-Resources-Api-custom
cpu [code]Cloud-Azure-Compute-Aks-Cpu-Usage-Api-custom
discovery [code]Used for host discovery
health [code]Cloud-Azure-Compute-Aks-Health-Api-custom
memory [code]Cloud-Azure-Compute-Aks-Memory-Api-custom
node-state [code]Cloud-Azure-Compute-Aks-Node-State-Api-custom
pod-state [code]Cloud-Azure-Compute-Aks-Pod-State-Api-custom
storage [code]Cloud-Azure-Compute-Aks-Storage-Api-custom
traffic [code]Cloud-Azure-Compute-Aks-Traffic-Api-custom
unneeded-nodes [code]Cloud-Azure-Compute-Aks-Unneeded-Nodes-Api-custom
unschedulable-pods [code]Cloud-Azure-Compute-Aks-Unschedulable-Pods-Api-custom

Custom modes disponibles

Ce connecteur offre plusieurs méthodes pour se connecter à la ressource (CLI, bibliothèque, etc.), appelées custom modes. Tous les custom modes disponibles peuvent être affichés en ajoutant le paramètre --list-custommode à la commande :

/usr/lib/centreon/plugins/centreon_azure_compute_aks_api.pl \
--plugin=cloud::azure::compute::aks::plugin \
--list-custommode

Le plugin apporte les custom modes suivants :

  • api
  • azcli

Options disponibles

Options génériques

Les options génériques sont listées ci-dessous :

OptionDescription
--modeDefine the mode in which you want the plugin to be executed (see--list-mode).
--dyn-modeSpecify a mode with the module's path (advanced).
--list-modeList all available modes.
--mode-versionCheck minimal version of mode. If not, unknown error.
--versionReturn the version of the plugin.
--custommodeWhen a plugin offers several ways (CLI, library, etc.) to get information the desired one must be defined with this option.
--list-custommodeList all available custom modes.
--multipleMultiple custom mode objects. This may be required by some specific modes (advanced).
--pass-managerDefine the password manager you want to use. Supported managers are: environment, file, keepass, hashicorpvault and teampass.
--verboseDisplay extended status information (long output).
--debugDisplay debug messages.
--filter-perfdataFilter perfdata that match the regexp. Example: adding --filter-perfdata='avg' will remove all metrics that do not contain 'avg' from performance data.
--filter-perfdata-advFilter perfdata based on a "if" condition using the following variables: label, value, unit, warning, critical, min, max. Variables must be written either %{variable} or %(variable). Example: adding --filter-perfdata-adv='not (%(value) == 0 and %(max) eq "")' will remove all metrics whose value equals 0 and that don't have a maximum value.
--explode-perfdata-maxCreate a new metric for each metric that comes with a maximum limit. The new metric will be named identically with a '_max' suffix). Example: it will split 'used_prct'=26.93%;0:80;0:90;0;100 into 'used_prct'=26.93%;0:80;0:90;0;100 'used_prct_max'=100%;;;;
--change-perfdata --extend-perfdataChange or extend perfdata. Syntax: --extend-perfdata=searchlabel,newlabel,target[,[newuom],[min],[m ax]] Common examples: Convert storage free perfdata into used: --change-perfdata='free,used,invert()' Convert storage free perfdata into used: --change-perfdata='used,free,invert()' Scale traffic values automatically: --change-perfdata='traffic,,scale(auto)' Scale traffic values in Mbps: --change-perfdata='traffic_in,,scale(Mbps),mbps' Change traffic values in percent: --change-perfdata='traffic_in,,percent()'
--extend-perfdata-groupAdd new aggregated metrics (min, max, average or sum) for groups of metrics defined by a regex match on the metrics' names. Syntax: --extend-perfdata-group=regex,namesofnewmetrics,calculation[,[ne wuom],[min],[max]] regex: regular expression namesofnewmetrics: how the new metrics' names are composed (can use $1, $2... for groups defined by () in regex). calculation: how the values of the new metrics should be calculated newuom (optional): unit of measure for the new metrics min (optional): lowest value the metrics can reach max (optional): highest value the metrics can reach Common examples: Sum wrong packets from all interfaces (with interface need --units-errors=absolute): --extend-perfdata-group=',packets_wrong,sum(packets_(discard |error)_(in|out))' Sum traffic by interface: --extend-perfdata-group='traffic_in_(.*),traffic_$1,sum(traf fic_(in|out)_$1)'
--change-short-output --change-long-outputModify the short/long output that is returned by the plugin. Syntax: --change-short-output=pattern~replacement~modifier Most commonly used modifiers are i (case insensitive) and g (replace all occurrences). Example: adding --change-short-output='OK~Up~gi' will replace all occurrences of 'OK', 'ok', 'Ok' or 'oK' with 'Up'
--change-exitReplace an exit code with one of your choice. Example: adding --change-exit=unknown=critical will result in a CRITICAL state instead of an UNKNOWN state.
--range-perfdataRewrite the ranges displayed in the perfdata. Accepted values: 0: nothing is changed. 1: if the lower value of the range is equal to 0, it is removed. 2: remove the thresholds from the perfdata.
--filter-uomMask the units when they don't match the given regular expression.
--opt-exitReplace the exit code in case of an execution error (i.e. wrong option provided, SSH connection refused, timeout, etc). Default: unknown.
--output-ignore-perfdataRemove all the metrics from the service. The service will still have a status and an output.
--output-ignore-labelRemove the status label ("OK:", "WARNING:", "UNKNOWN:", CRITICAL:") from the beginning of the output. Example: 'OK: Ram Total:...' will become 'Ram Total:...'
--output-xmlReturn the output in XML format (to send to an XML API).
--output-jsonReturn the output in JSON format (to send to a JSON API).
--output-openmetricsReturn the output in OpenMetrics format (to send to a tool expecting this format).
--output-fileWrite output in file (can be combined with json, xml and openmetrics options). E.g.: --output-file=/tmp/output.txt will write the output in /tmp/output.txt.
--disco-formatApplies only to modes beginning with 'list-'. Returns the list of available macros to configure a service discovery rule (formatted in XML).
--disco-showApplies only to modes beginning with 'list-'. Returns the list of discovered objects (formatted in XML) for service discovery.
--float-precisionDefine the float precision for thresholds (default: 8).
--source-encodingDefine the character encoding of the response sent by the monitored resource Default: 'UTF-8'.

Options des custom modes

Les options spécifiques aux custom modes sont listées ci-dessous :

OptionDescription
--subscriptionSet Azure subscription ID.
--tenantSet Azure tenant ID.
--client-idSet Azure client ID.
--client-secretSet Azure client secret.
--login-endpointSet Azure login endpoint URL (default: 'https://login.microsoftonline.com')
--management-endpointSet Azure management endpoint URL (default: 'https://management.azure.com')
--timeframeSet timeframe in seconds (i.e. 3600 to check last hour).
--intervalSet interval of the metric query (can be : PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H, PT24H).
--aggregationDefine how the data must be aggregated. Available aggregations: 'minimum', 'maximum', 'average', 'total' and 'count'. Can be called multiple times.
--zeroedSet metrics value to 0 if they are missing. Useful when some metrics are undefined.
--timeoutSet timeout in seconds (default: 10).
--http-peer-addrSet the address you want to connect to. Useful if hostname is only a vhost, to avoid IP resolution.
--proxyurlProxy URL. Example: http://my.proxy:3128
--proxypacProxy pac file (can be a URL or a local file).
--insecureAccept insecure SSL connections.
--http-backendPerl library to use for HTTP transactions. Possible values are: lwp (default) and curl.
--ssl-optSet SSL Options (--ssl-opt="SSL_version => TLSv1" --ssl-opt="SSL_verify_mode => SSL_VERIFY_NONE").
--curl-optSet CURL Options (--curl-opt="CURLOPT_SSL_VERIFYPEER => 0" --curl-opt="CURLOPT_SSLVERSION => CURL_SSLVERSION_TLSv1_1" ).
--memcachedMemcached server to use (only one server).
--redis-serverRedis server to use (only one server). Syntax: address[:port]
--redis-attributeSet Redis Options (--redis-attribute="cnx_timeout=5").
--redis-dbSet Redis database index.
--failback-fileFailback on a local file if Redis connection fails.
--memexpirationTime to keep data in seconds (default: 86400).
--statefile-dirDefine the cache directory (default: '/var/lib/centreon/centplugins').
--statefile-suffixDefine a suffix to customize the statefile name (default: '').
--statefile-concat-cwdIf used with the '--statefile-dir' option, the latter's value will be used as a sub-directory of the current working directory. Useful on Windows when the plugin is compiled, as the file system and permissions are different from Linux.
--statefile-formatDefine the format used to store the cache. Available formats: 'dumper', 'storable', 'json' (default).
--statefile-keyDefine the key to encrypt/decrypt the cache.
--statefile-cipherDefine the cipher algorithm to encrypt the cache (default: 'AES').
--filter-dimensionSpecify the metric dimension (required for some specific metrics) Syntax example: --filter-dimension="$metricname eq '$metricvalue'"
--per-secDisplay the statistics based on a per-second period.

Options des modes

Les options disponibles pour chaque modèle de services sont listées ci-dessous :

OptionDescription
--resourceSet resource name or ID (required).
--resource-groupSet resource group (required if resource's name is used).
--warning-allocatable-memory-bytesSet warning threshold for remaining allocatable memory in bytes. It is a range, set 16GB: to get WARNING if there are less than 16GB allocatable left.
--critical-allocatable-memory-bytesSet critical threshold for remaining allocatable memory in bytes. It is a range, set 8GB: to get CRITICAL if there are less than 8GB allocatable left.
--warning-allocatable-cpu-coresSet warning threshold for number of remaining allocatable CPU Cores. It is a range, set 10: to get WARNING if there are less than 10 CPU cores allocatable remaining.
--critical-allocatable-cpu-coresSet critical threshold for number of remaining allocatable CPU Cores. It is a range, set 5: to get CRITICAL if there are less than 5 CPU cores allocatable remaining.

Pour un mode, la liste de toutes les options disponibles et leur signification peut être affichée en ajoutant le paramètre --help à la commande :

/usr/lib/centreon/plugins/centreon_azure_compute_aks_api.pl \
--plugin=cloud::azure::compute::aks::plugin \
--mode=unschedulable-pods \
--custommode='azcli' \
--help