Recuperarse de un clúster de caché parcialmente conectado sin ningún tiempo de inactividad

Clúster parcialmente conectado

La conectividad parcial significa que dos o más servidores de caché están conectados entre sí pero no completamente conectados. Puede ser que la partición activa en un servidor de caché ya no esté conectada a su réplica en otro servidor de caché aunque la partición activa en ese otro servidor esté conectada a su réplica en el servidor original. O bien, podría ser que uno de los servidores de caché esté totalmente desconectado de otros servidores del clúster.

Además, en Partition Replica Cache, cada servidor de caché contiene una partición activa y una partición de réplica. La réplica es pasiva y solo se accede a ella mediante su partición activa. Pero, en la capa de clúster de caché, tanto la partición activa como la réplica se ven como "nodos" independientes. Por lo tanto, un clúster de caché de 3 servidores en Partition-Replica Cache tendrá un clúster de "6 nodos".

Cómo detectar la conectividad parcial

Uso Ver la conectividad del clúster pestaña en NCache Manager

  • Haga clic derecho en el nombre de su caché en NCache Gerente y luego elija Ver la conectividad del clúster opción
  • Esto abrirá otra ventana con el estado de conectividad del clúster. Puede usar esta pestaña para verificar si su clúster de caché está completamente conectado o parcialmente conectado.

Clúster de caché completamente conectado:

En el siguiente ejemplo, muestra un clúster de caché completamente conectado (en buen estado). Hay 3 servidores en el clúster y 6 "nodos". Por lo tanto, se supone que cada "nodo" está conectado a otros 5 "nodos" como se muestra en la columna "Conectado a los nodos".


Dirección de nodo Conectado a Nodos Estado
20.200.20.100 20.200.20.100, 20.200.20.101, 20.200.20.101,
20.200.20.102, 20.200.20.102
Totalmente conectado
20.200.20.101 20.200.20.101, 20.200.20.100, 20.200.20.100,
20.200.20.102, 20.200.20.102
Totalmente conectado
20.200.20.102 20.200.20.102, 20.200.20.100, 20.200.20.100,
20.200.20.101, 20.200.20.101
Totalmente conectado

Figura 1: Clúster de caché totalmente conectado

Clúster de caché parcialmente conectado

En el ejemplo a continuación, es un clúster de caché parcialmente conectado donde 20.200.20.101 perdió la conectividad con su réplica en 20.200.20.102 y le falta una conexión con el nodo 20.200.20.102. Por lo tanto, tiene menos cantidad de nodos que se muestran en "Conectado a columnas" frente a él.


Dirección de nodo Conectado a Nodos Estado
20.200.20.100 20.200.20.100, 20.200.20.101, 20.200.20.101,
20.200.20.102, 20.200.20.102
Parcialmente conectado
20.200.20.101 20.200.20.101, 20.200.20.100, 20.200.20.100,
20.200.20.102
Parcialmente conectado
20.200.20.102 20.200.20.102, 20.200.20.100, 20.200.20.100,
20.200.20.101, 20.200.20.101
Parcialmente conectado

Figura 2: Clúster de caché parcialmente conectado

Clúster parcialmente conectado con cerebro dividido

En el siguiente ejemplo, esta es otra memoria caché parcialmente conectada con un Split Brain, donde 20.200.20.102 ha perdido la conectividad por completo con otros dos nodos y, por lo tanto, muestra el estado del clúster de memoria caché de un solo nodo. Además, 20.200.20.100 y 20.200.20.101 muestran un estado parcialmente conectado y falta 20.200.20.102 en la columna "conectado a nodos".


Dirección de nodo Conectado a Nodos Estado
20.200.20.100 20.200.20.100, 20.200.20.101, 20.200.20.101 Parcialmente conectado
20.200.20.101 20.200.20.101, 20.200.20.100, 20.200.20.100 Parcialmente conectado
20.200.20.102 . . . Clúster de caché de un solo nodo

Figura 3: cerebro dividido en un clúster de caché parcialmente conectado

Cómo arreglar la conectividad parcial

Debe iniciar uno o más servidores de caché para corregir la conectividad parcial. En un clúster de 2 servidores, solo necesita iniciar uno de los servidores de caché. En el caso de un clúster de 3 servidores, es posible que deba reiniciar 2 servidores de caché.


Identificar el nodo del problema

  • Si observa que los nodos del clúster de caché están en un estado parcialmente conectado, elija el servidor de caché que dice Clúster de nodo único como nodo problemático. Este es un escenario de cerebro dividido como se muestra arriba en la Figura 3.
  • OR

  • Si no hay ningún servidor que tenga un estado de clúster de nodo único, elija el nodo del servidor que tenga la menor cantidad de direcciones IP mostradas en la columna Conectado a los nodos en la ventana de conectividad del clúster que se encuentra frente a él. Este es un escenario de caché parcialmente conectado como se muestra arriba en la Figura 2.
  • Y / O

  • Abrir la ventana de estado del clúster en NCache Monitoree la herramienta y luego elija el nodo que tenga la menor cantidad de Clientes en la columna Clientes.
  • Y / O

  • Elija un nodo con el menor número de valores de contador de solicitudes por segundo que otros nodos.

Deteniendo el caché solo en ese nodo

Una vez que un clúster de caché está en estado parcialmente conectado, requiere una intervención manual para recuperarse. Estos son los pasos para resolver este problema,

  • Una vez que se identifica el nodo problemático, haga clic derecho en la dirección IP de ese nodo en NCache Manager bajo su nombre de caché y luego elija Detener, esto detendrá este caché solo en este nodo.
  • También puede utilizar nuestra herramienta de línea de comandos paradacaché para hacer lo mismo de la siguiente manera usando la dirección IP del nodo:

  •    C: \ Archivos de programa \NCache\bin\tools>stopcache Nombre Caché /s 20.200.20.102

  • Inicie su caché de nuevo. Puedes hacer esto en NCache Manager haciendo clic con el botón derecho en su IP de nodo debajo de su nombre de caché y eligiendo la opción Inicio. También puede usar nuestra herramienta de línea de comandos startcache ejecutando el siguiente comando usando la dirección IP del nodo.

  •    C: \ Archivos de programa \NCache\bin\tools>startcache Nombre de caché /s 20.200.20.102

  • Verifique la conectividad del clúster nuevamente y vea si el clúster se formuló en un estado saludable.
  • Siga los pasos anteriores para todos los servidores de caché uno por uno en su entorno si se encontró más de un servidor de caché en estado parcialmente conectado.

Parada NCache de coches

  • Detenga todos los cachés una vez más en el nodo problemático uno por uno.
  • Reanudar NCache servicio en el nodo del problema.
  • Inicie todos los cachés uno por uno en el nodo problemático nuevamente si no están configurados para comenzar a usar automáticamente NCache Función de caché de inicio automático.
  • Verifique la conectividad del clúster nuevamente y vea si el clúster se formuló en un estado saludable.

¿Qué hacer a continuación?

© Copyright Alachisoft 2002 - Todos los derechos reservados. NCache es una marca registrada de Diyatech Corp.