Recuperar de um cluster de cache parcialmente conectado sem qualquer tempo de inatividade

Cluster parcialmente conectado

Conectividade parcial significa que dois ou mais servidores de cache estão conectados entre si, mas não totalmente conectados. Pode ser que a partição ativa em um servidor de cache não esteja mais conectada à sua réplica em outro servidor de cache, mesmo que a partição ativa nesse outro servidor esteja conectada à sua réplica no servidor original. Ou pode ser que um dos servidores de cache esteja totalmente desconectado de outros servidores no cluster.

Além disso, no Cache de Réplica de Partição, cada servidor de cache contém uma partição ativa e uma partição de réplica. A réplica é passiva e acessada apenas por sua partição ativa. Mas, na camada de cluster de cache, tanto a partição ativa quanto a réplica são vistas como "nós" independentes. Portanto, um cluster de cache de 3 servidores no Cache de Réplica de Partição terá um cluster de "6 nós".

Como detectar conectividade parcial

Use Ver conectividade do cluster guia em NCache Novos Negócios

  • Clique com o botão direito do mouse em seu nome de cache em NCache Gerente e, em seguida, escolha Ver conectividade do cluster opção
  • Isso abrirá outra janela com o status de conectividade do cluster. Você pode usar essa guia para verificar se o cluster de cache está totalmente conectado ou parcialmente conectado.

Cluster de cache totalmente conectado:

No exemplo abaixo, ele mostra um cluster de cache totalmente conectado (íntegro). Existem 3 servidores no cluster e 6 "nós". Assim, cada "nó" deve estar conectado a 5 outros "nós", conforme mostrado na coluna "Conectado a nós".


Endereço do Nó Conectado a nós Status
20.200.20.100 20.200.20.100, 20.200.20.101, 20.200.20.101,
20.200.20.102, 20.200.20.102
Totalmente conectado
20.200.20.101 20.200.20.101, 20.200.20.100, 20.200.20.100,
20.200.20.102, 20.200.20.102
Totalmente conectado
20.200.20.102 20.200.20.102, 20.200.20.100, 20.200.20.100,
20.200.20.101, 20.200.20.101
Totalmente conectado

Figura 1: cluster de cache totalmente conectado

Cluster de cache parcialmente conectado

No exemplo abaixo, é um cluster de cache parcialmente conectado em que 20.200.20.101 perdeu a conectividade com sua réplica em 20.200.20.102 e está faltando uma conexão com o nó 20.200.20.102. Portanto, ele tem menos número de nós mostrados em "Conectado a Colunas" na frente dele.


Endereço do Nó Conectado a nós Status
20.200.20.100 20.200.20.100, 20.200.20.101, 20.200.20.101,
20.200.20.102, 20.200.20.102
Parcialmente Conectado
20.200.20.101 20.200.20.101, 20.200.20.100, 20.200.20.100,
20.200.20.102
Parcialmente Conectado
20.200.20.102 20.200.20.102, 20.200.20.100, 20.200.20.100,
20.200.20.101, 20.200.20.101
Parcialmente Conectado

Figura 2: cluster de cache parcialmente conectado

Cluster parcialmente conectado com cérebro dividido

No exemplo abaixo, este é outro cache parcialmente conectado com um Split Brain, onde 20.200.20.102 perdeu completamente a conectividade com outros dois nós e, portanto, mostrando o status do cluster do cache de nó único. Além disso, 20.200.20.100 e 20.200.20.101 estão mostrando o status parcialmente conectado e estão faltando 20.200.20.102 na coluna "conectado aos nós".


Endereço do Nó Conectado a nós Status
20.200.20.100 20.200.20.100, 20.200.20.101, 20.200.20.101 Parcialmente Conectado
20.200.20.101 20.200.20.101, 20.200.20.100, 20.200.20.100 Parcialmente Conectado
20.200.20.102 --- Cluster de cache de nó único

Figura 3: cérebro dividido em cluster de cache parcialmente conectado

Como corrigir conectividade parcial

Você precisa iniciar um ou mais servidores de cache para corrigir a conectividade parcial. Em um cluster de 2 servidores, você só precisa iniciar um dos servidores de cache. No caso de um cluster de 3 servidores, talvez seja necessário reiniciar 2 servidores de cache.


Identifique o nó do problema

  • Se você perceber que os nós do cluster de cache estão no estado parcialmente conectado, escolha o servidor de cache que diz Cluster de nó único como nó problemático. Este é um cenário de cérebro dividido, como mostrado acima na Figura 3.
  • OR

  • Se não houver nenhum servidor com status de cluster de nó único, escolha o nó do servidor que possui o menor número de endereços IP exibidos na coluna Conectado a nós na janela de conectividade do cluster à sua frente. Este é um cenário de cache parcialmente conectado, conforme mostrado acima na Figura 2.
  • E / OU

  • Abra a janela de integridade do cluster em NCache Monitore a ferramenta e, em seguida, escolha o nó que possui o menor número de Clientes na coluna Clientes.
  • E / OU

  • Escolha um nó com o menor número de valor de contador de solicitação/s do que outros nós.

Parando o cache somente nesse nó

Uma vez que um cluster de cache está no estado parcialmente conectado, ele requer intervenção manual para se recuperar. Aqui estão os passos para resolver este problema,

  • Assim que o nó com problema for identificado, clique com o botão direito do mouse no endereço IP desse nó em NCache Manager sob seu nome de cache e, em seguida, escolha Dê um basta, isso interromperá esse cache somente neste nó.
  • Você também pode usar nossa ferramenta de linha de comando stopcache para fazer o mesmo da seguinte forma usando o endereço IP do nó:

  •    C: \ Arquivos de Programas \NCache\bin\tools>stopcache CacheName /s 20.200.20.102

  • Inicie seu cache novamente. Você pode fazer isso em NCache Manager clicando com o botão direito do mouse no IP do nó sob o nome do cache e escolhendo a opção Iniciar. Você também pode usar nossa ferramenta de linha de comando startcache executando o seguinte comando usando o endereço IP do nó.

  •    C: \ Arquivos de Programas \NCache\bin\tools>startcache CacheName /s 20.200.20.102

  • Verifique a conectividade do cluster novamente e veja se o cluster foi formulado em estado íntegro.
  • Siga as etapas acima para todos os servidores de cache, um por um, em seu ambiente, se mais de um servidor de cache for encontrado no estado parcialmente conectado.

Paragem NCache serviço

  • Pare todos os caches novamente no nó problemático, um por um.
  • Reiniciar NCache serviço no nó do problema.
  • Inicie todos os caches por um no nó problemático novamente se eles não estiverem configurados para iniciar automaticamente usando NCache Recurso de cache de início automático.
  • Verifique a conectividade do cluster novamente e veja se o cluster foi formulado em estado íntegro.

O que fazer a seguir?

© Copyright Alachisoft 2002 - . Todos os direitos reservados. NCache é uma marca registrada da Diyatech Corp.