NCache & Recherche en texte intégral

Par César Aguirre

Je parie que vous avez utilisé l'opérateur SQL LIKE pour trouver un mot-clé dans un champ de texte. Pour de grandes quantités de texte, ce serait lent. Apprenons à mettre en place une recherche plein texte avec Lucene et NCache.

Qu'est-ce que la recherche en texte intégral ?

La recherche en texte intégral est une technique permettant de rechercher non seulement des correspondances exactes d'un mot-clé dans un texte, mais également des modèles de texte, des synonymes ou des mots proches dans de grandes quantités de texte.

Pour prendre en charge de grandes quantités de texte, la recherche est divisée en deux phases : l'indexation et la recherche. Dans la phase d'indexation, un analyseur traite le texte pour créer des index basés sur les règles d'une langue parlée comme l'anglais pour supprimer les mots vides et enregistrer les synonymes et les flexions des mots. Ensuite, la phase de recherche utilise uniquement les index au lieu de la source de texte d'origine.

Lire l'article complet

Recherche en texte intégral avec Lucene et NCache

Pourquoi Lucène et NCache?

Depuis sa page officielle, « Apache Lucene.NET est une bibliothèque de recherche hautes performances pour .NET ». Il s'agit d'un port C# d'Apache Lucene basé sur Java, une bibliothèque de recherche « extrêmement puissante » et rapide optimisée pour la recherche en texte intégral.

NCache donne des fonctionnalités distribuées à Lucene en implémentant l'API Lucene au-dessus de son cache distribué en mémoire. Par ici, NCache fait de Lucene une solution de recherche en texte intégral linéairement évolutive pour .NET. Pour plus de fonctionnalités de Distributed Lucene, consultez NCache Page Lucene distribuée.

Lire l'article complet
© Copyright Alachisoft 2002 - . Tous droits réservés. NCache est une marque déposée de Diyatech Corp.