Klasse StandardAnalyzer
Filter StandardTokenizer mit Standardfilter, KleinschreibungFilter und StopFilter, unter Verwendung einer Liste englischer Stoppwörter.
Sie müssen die erforderlichen angeben LuceneVersion Kompatibilität beim Erstellen StandardAnalyzer:
- Ab 3.4 werden Hiragana- und Han-Charaktere nicht mehr fälschlicherweise von ihren verbindenden Charakteren getrennt. Wenn Sie eine frühere Versionsnummer verwenden, erhalten Sie aus Gründen der Abwärtskompatibilität genau das fehlerhafte Verhalten.
- Ab 3.1, StandardTokenizer implementiert die Unicode-Textsegmentierung und StopFilter Behandelt Unicode 4.0-Zusatzzeichen in Stoppwörtern korrekt. Klassischer Tokenizer und ClassicAnalyzer sind die Implementierungen vor 3.1 StandardTokenizer und StandardAnalyzer.
- Ab 2.9, StopFilter behält Positionsinkremente bei
- Ab 2.4, Tokens falsch identifiziert, da Akronyme korrigiert werden (siehe LUCENE-1068)
Geerbte Mitglieder
Versammlung: Lucene.Net.Analysis.Common.dll
Syntax
[Serializable]
public sealed class StandardAnalyzer : StopwordAnalyzerBase, IDisposable
Konstruktoren
Name und Vorname | Beschreibung |
---|---|
StandardAnalyzer(LuceneVersion) | Erstellt einen Analysator mit den Standardstoppwörtern (STOP_WORDS_SET). |
StandardAnalyzer(LuceneVersion, CharArraySet) | Erstellt einen Analysator mit den angegebenen Stoppwörtern. |
StandardAnalyzer(LuceneVersion, TextReader) | Erstellt einen Analysator mit den Stoppwörtern des angegebenen Readers. |
Felder
Name und Vorname | Beschreibung |
---|---|
DEFAULT_MAX_TOKEN_LENGTH | Standardmäßig maximal zulässige Tokenlänge |
STOP_WORDS_SET | Eine nicht veränderbare Menge, die einige gebräuchliche englische Wörter enthält, die für die Suche normalerweise nicht nützlich sind. |
Ferienhäuser
Name und Vorname | Beschreibung |
---|---|
MaxTokenLength | Legen Sie die maximal zulässige Tokenlänge fest. Wenn ein Token erkannt wird, dessen Länge diese Länge überschreitet, wird es verworfen. Diese Einstellung wird erst beim nächsten Aufruf von tokenStream oder tokenStream wirksam. |
Methoden
Name und Vorname | Beschreibung |
---|---|
CreateComponents(String, TextReader) |