Mode de maintenance
NCache prend en charge le mode maintenance pour le Réplique de partition topologie, qui est la topologie de mise en cache la plus couramment utilisée.
Le mode maintenance a été introduit pour permettre l'application de correctifs ou la mise à niveau du matériel/logiciel sur les serveurs de mise en cache. Un flux de travail typique de mise à niveau implique l'arrêt d'un nœud de cache à la fois, la mise à niveau du serveur et le redémarrage du ou des caches qu'il contient. Cette procédure de mise à niveau évite les temps d'arrêt des applications. Cependant, l'arrêt d'un nœud de cache déclenche un transfert d'état au sein de l'ensemble du cluster de cache, ce qui entraîne une utilisation excessive des ressources telles que le réseau et le processeur.
NCache Le mode maintenance résout ce problème en arrêtant le transfert d'état si un nœud doit être arrêté temporairement pour maintenance. Une fois qu'un nœud est spécifiquement arrêté pour maintenance, il informe le cluster de cache en cours d'exécution d'arrêter le transfert d'état pendant un délai d'expiration donné. Lorsqu'un cluster est en mode maintenance, les demandes de données client pour le nœud arrêté sont servies à partir de son nœud réplica. Une fois que le nœud arrêté rejoint le cluster, il transfère les données de son nœud réplica.
Fonctionnement du mode maintenance
Considérons un cluster de trois nœuds comme indiqué ci-dessous. Si le nœud 3 est marqué pour maintenance, le transfert d'état est interrompu pendant un délai d'attente spécifique pendant que toutes les opérations sont effectuées à partir de sa réplique sur le nœud 1. Pendant la période de maintenance, la réplique du nœud de maintenance agit comme sa partition active. Cela se produit sans aucune intervention du client et garantit le bon fonctionnement des opérations client, même si un nœud est arrêté pour maintenance.
Délai d'expiration et transfert d'état
Le délai d'attente, configuré par l'utilisateur, sert de période d'attente pour le thread de transfert d'état. Ce thread attend que le cluster quitte le mode de maintenance soit en rejoignant le nœud, soit en ne le rejoignant pas. Il y a deux issues dans ce cas :
Le nœud 3 ne rejoint pas le cluster dans le délai imparti :
Dans ce cas, la tâche de transfert d'état démarrera entre les nœuds restants (Nœud 1 et Nœud 2) et ils reprendront leur état normal.
Notez que si dans ce cas le nœud 2 quitte brusquement le cluster, une perte de données peut se produire car sa réplique existait sur le nœud 3.
Le nœud 3 rejoint le cluster dans le délai imparti :
Si le nœud 3 rejoint dans le délai d'expiration, le transfert d'état sera lancé pour reprendre l'état d'origine du cluster. Ce transfert d'état se compose désormais de deux étapes :
- Nœud 1 (réplique du Nœud 3) --> Nœud 3 (partition active du Nœud 3)
- Nœud 2 (partition active du Nœud 2) --> Nœud 3 (réplique du Nœud 2)
Comportement
Un minimum de 2 nœuds sont requis pour marquer un cluster pour la maintenance.
Si un cluster a été marqué pour maintenance, aucun nœud ne peut être ajouté ou supprimé du cluster via le NCache Centre de gestion ou outils.
Si un cluster a été marqué pour maintenance, aucun autre nœud, à l'exception de celui qui a été arrêté pour maintenance, ne peut être démarré. Supposons que le nœud 3 ait déjà été arrêté et que le nœud 2 ait été marqué pour maintenance, vous ne pouvez démarrer que le nœud 2.
Lors de l'arrêt/démarrage d'un nœud qui n'a pas été arrêté pour maintenance, l'exception : "Le cluster est déjà en maintenance" sera levée.
Si le transfert d'état est déjà en cours par nœud inactif ou actif, vous ne pouvez pas marquer un cluster pour maintenance. L'exception suivante sera levée : "Le cluster n'est pas disponible pour la maintenance, le transfert d'état ou le changement d'état du cluster en cours."
Les utilisateurs peuvent vérifier si un cluster est en transfert d'état ou non via des compteurs de transfert d'état ou en consultant les fichiers journaux du cache dans
%NCHOME%/log-files
(Windows) ou\opt\ncache\log-files
(Linux). "Le transfert d'état est terminé" sera enregistré dans les fichiers journaux.Une fois qu'un cluster est marqué pour la maintenance, les journaux de cache contiennent le journal "Cluster marqué sous maintenance du nœud : [IP] :[Port] pour xx:xx:xx {HH:MM:SS)."
Un cluster peut quitter le mode maintenance dans les scénarios suivants :
- Le nœud marqué pour maintenance redémarre.
- Le délai d'attente pour le mode de maintenance se produit.
- L'option « Quitter le mode maintenance » est sélectionnée via le NCache Centre de gestion.
- Un nœud quitte le cluster brusquement.
Une fois que le cluster quitte le mode maintenance, le transfert d'état est initié.
Voir aussi
Arrêter le nœud pour la maintenance
Quitter le mode d'entretien