Por César Aguirre
Aposto que você usou o operador SQL LIKE para encontrar uma palavra-chave em um campo de texto. Para grandes quantidades de texto, isso seria lento. Vamos aprender como implementar uma pesquisa de texto completo com Lucene e NCache.
A pesquisa de texto completo é uma técnica para pesquisar não apenas correspondências exatas de uma palavra-chave em algum texto, mas também padrões de texto, sinônimos ou palavras próximas em grandes quantidades de texto.
Para suportar grandes quantidades de texto, a pesquisa é dividida em duas fases: indexação e pesquisa. Na fase de indexação, um analisador processa o texto para criar índices com base nas regras de um idioma falado como o inglês para remover palavras de parada e registrar sinônimos e inflexões de palavras. Então, a fase de pesquisa usa apenas os índices em vez da fonte do texto original.
Leia o artigo completoEm sua página oficial, “Apache Lucene.NET é uma biblioteca de pesquisa de alto desempenho para .NET”. É uma versão C# do Apache Lucene baseado em Java, uma biblioteca de pesquisa “extremamente poderosa” e rápida, otimizada para pesquisa de texto completo.
NCache fornece recursos distribuídos ao Lucene implementando a API Lucene sobre seu cache distribuído na memória. Por aqui, NCache torna o Lucene uma solução de pesquisa de texto completo linearmente escalável para .NET. Para obter mais recursos do Distributed Lucene, verifique NCache Página Lucene distribuída.
Leia o artigo completo