Wiederherstellen von einem teilweise verbundenen Cache-Cluster ohne Ausfallzeit

Teilweise verbundener Cluster

Teilweise Konnektivität bedeutet, dass zwei oder mehr Cache-Server miteinander verbunden, aber nicht vollständig verbunden sind. Es könnte sein, dass die aktive Partition auf einem Cache-Server nicht mehr mit ihrer Replik auf einem anderen Cache-Server verbunden ist, obwohl die aktive Partition auf diesem anderen Server mit ihrer Replik auf dem ursprünglichen Server verbunden ist. Oder es könnte sein, dass einer der Cache-Server vollständig von den anderen Servern im Cluster getrennt ist.

Darüber hinaus enthält im Partition Replica Cache jeder Cache-Server eine aktive Partition und eine Replikatpartition. Das Replikat ist passiv und nur über seine aktive Partition kann darauf zugegriffen werden. Auf der Cache-Cluster-Ebene werden jedoch sowohl die aktive Partition als auch das Replikat als unabhängige „Knoten“ betrachtet. Ein 3-Server-Cache-Cluster im Partition-Replica-Cache verfügt also über einen „6-Knoten“-Cluster.

So erkennen Sie eine teilweise Konnektivität

Verwenden Sie die Cluster-Konnektivität anzeigen Registerkarte in NCache Geschäftsführer

  • Klicken Sie mit der rechten Maustaste auf Ihren Cache-Namen in NCache Manager und wählen Sie dann aus Clusterkonnektivität anzeigen zu erhalten
  • Dadurch wird ein weiteres Fenster mit dem Cluster-Konnektivitätsstatus geöffnet. Auf dieser Registerkarte können Sie überprüfen, ob Ihr Cache-Cluster vollständig oder teilweise verbunden ist.

Vollständig verbundener Cache-Cluster:

Im folgenden Beispiel wird ein vollständig verbundener (fehlerfreier) Cache-Cluster angezeigt. Es gibt 3 Server im Cluster und 6 „Knoten“. Daher soll jeder „Knoten“ mit fünf anderen „Knoten“ verbunden sein, wie in der Spalte „Mit Knoten verbunden“ gezeigt.


Knotenadresse Verbunden mit Knoten Status
20.200.20.100 20.200.20.100, 20.200.20.101, 20.200.20.101,
20.200.20.102, 20.200.20.102
Vollständig verbunden
20.200.20.101 20.200.20.101, 20.200.20.100, 20.200.20.100,
20.200.20.102, 20.200.20.102
Vollständig verbunden
20.200.20.102 20.200.20.102, 20.200.20.100, 20.200.20.100,
20.200.20.101, 20.200.20.101
Vollständig verbunden

Abbildung 1: Vollständig verbundener Cache-Cluster

Teilweise verbundener Cache-Cluster

Im folgenden Beispiel handelt es sich um einen teilweise verbundenen Cache-Cluster, bei dem 20.200.20.101 die Verbindung zu seinem Replikat auf 20.200.20.102 verloren hat und eine Verbindung zum Knoten 20.200.20.102 fehlt. Daher wird vor ihm unter „Mit Spalten verbunden“ eine geringere Anzahl an Knoten angezeigt.


Knotenadresse Verbunden mit Knoten Status
20.200.20.100 20.200.20.100, 20.200.20.101, 20.200.20.101,
20.200.20.102, 20.200.20.102
Teilweise verbunden
20.200.20.101 20.200.20.101, 20.200.20.100, 20.200.20.100,
20.200.20.102
Teilweise verbunden
20.200.20.102 20.200.20.102, 20.200.20.100, 20.200.20.100,
20.200.20.101, 20.200.20.101
Teilweise verbunden

Abbildung 2: Teilweise verbundener Cache-Cluster

Teilweise verbundener Cluster mit geteiltem Gehirn

Im folgenden Beispiel handelt es sich um einen weiteren teilweise verbundenen Cache mit einem Split Brain, bei dem 20.200.20.102 die Verbindung zu den beiden anderen Knoten vollständig verloren hat und daher den Cluster-Status des Single-Node-Cache anzeigt. Außerdem zeigen 20.200.20.100 und 20.200.20.101 den teilweise verbundenen Status an und 20.200.20.102 fehlt in der Spalte „Mit Knoten verbunden“.


Knotenadresse Verbunden mit Knoten Status
20.200.20.100 20.200.20.100, 20.200.20.101, 20.200.20.101 Teilweise verbunden
20.200.20.101 20.200.20.101, 20.200.20.100, 20.200.20.100 Teilweise verbunden
20.200.20.102 --- Einzelknoten-Cache-Cluster

Abbildung 3: Geteiltes Gehirn in teilweise verbundenem Cache-Cluster

So beheben Sie eine teilweise Konnektivität

Sie müssen einen oder mehrere Cache-Server starten, um eine teilweise Konnektivität zu beheben. In einem 2-Server-Cluster müssen Sie nur einen der Cache-Server starten. Bei einem 3-Server-Cluster müssen Sie möglicherweise 2 Cache-Server neu starten.


Identifizieren Sie den Problemknoten

  • Wenn Sie feststellen, dass sich die Cache-Cluster-Knoten in einem teilweise verbundenen Zustand befinden, wählen Sie den Cache-Server aus, der „Einzelknoten-Cluster“ als Problemknoten angibt. Dies ist ein Split-Brain-Szenario, wie oben in Abbildung 3 dargestellt.
  • OR

  • Wenn es keinen Server mit dem Status „Einzelknoten-Cluster“ gibt, wählen Sie den Serverknoten aus, der die geringste Anzahl an IP-Adressen aufweist, die in der Spalte „Mit Knoten verbunden“ im Cluster-Konnektivitätsfenster davor angezeigt werden. Dies ist ein teilweise verbundenes Cache-Szenario, wie oben in Abbildung 2 dargestellt.
  • UND / ODER

  • Öffnen Sie das Cluster-Zustandsfenster in NCache Monitor-Tool und wählen Sie dann in der Spalte „Clients“ den Knoten aus, der die geringste Anzahl an Clients aufweist.
  • UND / ODER

  • Wählen Sie einen Knoten mit dem geringsten Anforderungs-/Sek.-Zählerwert als andere Knoten aus.

Der Cache wird nur auf diesem Knoten gestoppt

Sobald sich ein Cache-Cluster im teilweise verbundenen Zustand befindet, ist zur Wiederherstellung ein manueller Eingriff erforderlich. Hier sind die Schritte zur Lösung dieses Problems:

  • Sobald der problematische Knoten identifiziert ist, klicken Sie mit der rechten Maustaste auf die IP-Adresse dieses Knotens NCache Manager unter Ihrem Cache-Namen und wählen Sie dann Stoppen, dadurch wird dieser Cache nur auf diesem Knoten gestoppt.
  • Sie können auch unser Befehlszeilentool verwenden Zwischenspeicher Gehen Sie wie folgt vor, indem Sie die IP-Adresse des Knotens verwenden:

  •    C: \ Program Files \NCache\bin\tools>stopcache CacheName /s 20.200.20.102

  • Starten Sie Ihren Cache erneut. Sie können dies in tun NCache Manager, indem Sie mit der rechten Maustaste auf Ihre Knoten-IP unter Ihrem Cache-Namen klicken und die Option „Start“ wählen. Sie können auch unser Befehlszeilentool startcache verwenden, indem Sie den folgenden Befehl unter Verwendung der IP-Adresse des Knotens ausführen.

  •    C: \ Program Files \NCache\bin\tools>startcache CacheName /s 20.200.20.102

  • Überprüfen Sie die Cluster-Konnektivität erneut und prüfen Sie, ob sich der Cluster in einem fehlerfreien Zustand befindet.
  • Befolgen Sie die oben genannten Schritte nacheinander für alle Cache-Server in Ihrer Umgebung, wenn mehr als ein Cache-Server im teilweise verbundenen Zustand gefunden wurde.

Einstellung NCache

  • Stoppen Sie nacheinander alle Caches auf dem Problemknoten erneut.
  • Wiederaufnahme NCache Dienst auf dem Problemknoten.
  • Starten Sie alle Caches nacheinander auf dem Problemknoten erneut, wenn sie nicht so eingestellt sind, dass sie automatisch mit der Verwendung beginnen NCache Cache-Funktion automatisch starten.
  • Überprüfen Sie die Cluster-Konnektivität erneut und prüfen Sie, ob sich der Cluster in einem fehlerfreien Zustand befindet.

Was macht man als nächstes?

© Copyright Alachisoft 2002 - Alle Rechte vorbehalten NCache ist eine eingetragene Marke der Diyatech Corp.