Zing-Index- und Suchwörterbuchattribute
Die folgenden Wörterbuchattribute wirken sich entweder auf die Art und Weise aus, wie Zing Tabellen indiziert oder Suchergebnisse anordnet.
Wörterbuchattribute indizieren und durchsuchen
- Indexierungsverhalten
- Rangfolge der Suchergebnisse
- Der BM25-Relevanz-Rangfolgealgorithmus
| Name | Datentyp | Betrifft | Gilt für V3 oder V4 | Beschreibung | Bezeichnung | Muss erneut indiziert werden? | Nur Stammtabelle |
|---|---|---|---|---|---|---|---|
| Attachment_index | boolean | Tabelle | Beides | Bei „wahr“ werden Anhänge in der Tabelle zu Suchzwecken indiziert. | Anhangsindex | WAHR | FALSCH |
| No_Text_index | boolean | Beides | Beides | Dieses Attribut in einem Feld verhindert, dass das Feld in einen Textindex aufgenommen wird. | Kein Textindex | WAHR | FALSCH |
| Text_index _attachment_body _weight | Gleitkommazahl | Tabelle | V4 | Gibt an, wie viel Überlegungen (Gewichtung, Gleitkommawert) berücksichtigt werden sollen, um einen Suchbegriff anzugeben, der im Text eines Anhangs gefunden wurde. Weitere Informationen dazu, wie sich der Gewichtungswert auf die Relevanz der Suchergebnisse auswirkt, finden Sie unter Zing berechnet Dokumentpunktzahlen mit drei Komponenten. | Textgewicht Des Textindex-Anhangs | FALSCH | WAHR |
| Text_index _attachment_displayed | boolean | Tabelle | Beides | Zeigt Anhänge in Textsuchergebnissen an. | Textindexanhang Angezeigt | FALSCH | FALSCH |
| Text_Index_attachment _title_weight | Gleitkommazahl | Tabelle | V4 | Gibt an, wie viel Überlegungen (Gewichtung, Gleitkommawert) berücksichtigt werden sollen, um einen Suchbegriff im Titel eines Anhangs anzugeben. Weitere Informationen dazu, wie sich der Gewichtungswert auf die Relevanz der Suchergebnisse auswirkt, finden Sie unter Zing berechnet Dokumentpunktzahlen mit drei Komponenten. | Textindex-Anhang – Titelgewichtung | FALSCH | WAHR |
| Text_index _Auto_stop | boolean | Tabelle | Beides | Identifiziert automatisch Stoppwörter und indiziert sie nicht. Basierend auf dem in Text_index_Auto_stop_threshold angegebenen Schwellenwert. | Automatisches Stoppen Des Textindex | WAHR | WAHR |
| Text_index_Auto _stop_threshold | int | Tabelle | Beides | Schwellenwert (Ganzzahl, Anzahl der Vorkommen), damit ein Wort automatisch zu einem Stoppwort wird. Siehe Text_index_Auto_stop. | Schwellenwert Für Automatisches Stoppen Des Textindex | WAHR | WAHR |
| Text_index_default _partiell_matching_rule | Zeichenfolge | Tabelle | Beides | Zeichenfolge für Konfiguration der teilweise Übereinstimmungsregel. Die Eingabe muss auf basieren Ändern Sie den Abfragemodus einer indizierten Tabelle . | Standardmäßige Teilabgleichsregel Für Textindex | FALSCH | WAHR |
| Text_index _default_query_Mode | Zeichenfolge | Tabelle | Beides | Zeichenfolge für Konfiguration des Abfragemodus. Die Eingabe muss auf basieren Ändern Sie den Abfragemodus einer indizierten Tabelle | Standardabfragemodus Für Textindex | FALSCH | WAHR |
| Text_index _disable_synonym | boolean | Tabelle | Beides | „WAHR“ deaktiviert die Suche nach Synonymen und dem Suchbegriff. | Textindex – Synonym Deaktivieren | FALSCH | WAHR |
| Text_index _enable_idf | boolean | Tabelle | V3 | „WAHR“ aktiviert TF-IDF Bewertung. | Textindex – IDF aktivieren | FALSCH | WAHR |
| Text_index _Filter_Junk | boolean | Tabelle | Beides | „WAHR“ standardmäßig deaktiviert „FALSCH“ den Junk-Filter für eine Tabelle. Standardmäßig indiziert oder sucht Zing nicht nach zweistelligen Zahlen und einzeiligen Wörtern (es sei denn, sie sind chinesische oder japanische Zeichen). Generieren Sie den Index erneut, nachdem Sie den Junk-Filter deaktiviert haben. Dieses Attribut führt zu einem größeren Tabellenindex. Um eine optimale Leistung zu erzielen, wenden Sie sie nur an, wenn dies erforderlich ist. | Textindexfilter-Junk | WAHR | WAHR |
| Text_index _Filter_query | Eine encodedQuery in der Tabelle | Tabelle | Beides | Verwenden Sie dieses Attribut, wenn Sie die Zeilen indizieren möchten, die bestimmten Filterbedingungen entsprechen. Der Attributwert muss eine encodedQuery in der Tabelle sein. | Indexfilter | WAHR | FALSCH |
| Text_index_filterbar | boolean | Spalte | Beides | Wenn ein Feld mit diesem Attribut auf „wahr“ gesetzt wird, wird die Zeile für die erneute Indizierung ausgewertet (auch wenn das Feld selbst nicht indizierbar ist). | Index Filterbar | WAHR | FALSCH |
| Text_index_include _stop_Word | boolean | Tabelle | Beides | Wenn Sie Stoppwörter in dieser Tabelle indizieren müssen, legen Sie dieses Attribut auf „wahr“ fest. | Textindexeinbindung Stoppwort | WAHR | WAHR |
| Text_index_scorer_bm25_b | Gleitkommazahl | Tabelle | V4 | Dieses Attribut ist der b-Parameter, der im BM25-Algorithmus verwendet wird. Siehe Text_index_scorer_bm25_b . | Bm25_b | FALSCH | WAHR |
| Text_index_scorer_bm25_k1 | Gleitkommazahl | Tabelle | V4 | Dieses Attribut ist der K1-Parameter, der im BM25-Algorithmus verwendet wird. Siehe Text_index_scorer_bm25_k1 . | Bm25_k1 | FALSCH | WAHR |
| Text_index_Tags | Zeichenfolge | Tabelle | Beides | Muss auf bestimmte Zeichenfolge festgelegt werden: Leer/everyone_only/all_Shared, abhängig vom Typ der Tags, die indiziert werden sollen. | Textindex-Tags | WAHR | FALSCH |
| Text_index_Tokenizer_language | Zeichenfolge | Tabelle | Beides | Geben Sie „ja“ (ohne doppelte Anführungszeichen) ein, wenn die Tokenisierung auf Japanisch unterstützt werden muss. | Textindex-Tokenizer-Sprache | WAHR | WAHR |
| Text_index_translations | boolean | Tabelle | Beides | Bei „vorhanden“ oder „wahr“ werden Indizes neu berechnet, wenn übersetzte Zeichenfolgen hinzugefügt werden. Zum Ändern ist die sys-admin-Rolle erforderlich. Wird automatisch für indizierte Felder festgelegt, die übersetzt werden, und für Felder, die eine Übersetzung haben und indiziert werden. Die Systemeigenschaft „Glide.i18n.force_index“, die standardmäßig auf „wahr“ festgelegt ist, überschreibt dieses Attribut. | Textindexübersetzungen | WAHR | FALSCH |
| Text_search_and_or_limit | int | Tabelle | Beides | Fügen Sie das anwenderdefinierte Attribut „Text_search_and_or_limit“ auf Tabellenebene hinzu, das die globale Eigenschaft überschreibt. | Textsuche- Und Or-Grenzwert | FALSCH | FALSCH |
| ts_language | Zeichenfolge | Spalte | Beides | Hinzugefügt, um die Textindizierung nur bestimmter Sprachen zu ermöglichen. | Textsuchsprache | WAHR | FALSCH |
| ts_Multi_value_field _Splitter | Zeichenfolge | Spalte | Beides | Wenn ein Feld ein Feld mit mehreren Werten ist, fügen Sie den Splitter im Feld in diesem Attribut hinzu, um die Indexpositionen der Werte zu verteilen. Um beispielsweise Multi:value zu trennen, geben Sie für dieses Attribut : ein. | Textsuche – Mehrwertfeld-Splitter | WAHR | WAHR |
| ts_weight | int | Spalte | Beides | Steuert die relative Wichtigkeit einer Übereinstimmung im Feld für die Textsuche. Weitere Informationen dazu, wie sich der Gewichtungswert auf die Relevanz der Suchergebnisse auswirkt, finden Sie unter Zing berechnet Dokumentpunktzahlen mit drei Komponenten. Informationen zum Festlegen der Textsuchgewichtung für ein Feld finden Sie unter Legen Sie die relative Gewichtung eines Felds fest. | Textsuchgewichtung | FALSCH | FALSCH |
No_Text_index
Für Kundenservice und Support Richtlinien zum Festlegen von No_Text_index Option für verschiedene Feldtypen siehe KB0859922 Auf der Now Support Website.
Text_index_scorer_bm25_b
Dieses Wörterbuchattribut ist Teil des BM25-Algorithmus. Das Attribut wirkt sich auf die Wichtigkeit der Länge eines Dokuments in Suchergebnissen aus. Wenn dieses Attribut 0 ist, hat die Länge keine Peilung. In diesem Fall wird ein Dokument mit zwei Wörtern gleich als Dokument mit 1000 Wörtern bewertet. Sehr kurze Dokumente werden häufig niedriger gewichtet als längere Dokumente. Der Standardwert ist 0,75.
Text_index_scorer_bm25_k1
Dieses Wörterbuchattribut ist Teil des BM25-Algorithmus. Das Attribut hilft bei der Bestimmung der Merkmale der Sättigung der Begriffshäufigkeit, d. h. wenn der Suchbegriff in einem Dokument angezeigt wird, erhöht sich die Relevanz des Dokuments, die Erhöhung ist jedoch weniger betroffen, wenn die Zahlen steigen. Beispielsweise macht ein Suchbegriff, der 10 Mal in einem Dokument auftritt, ihn relevanter als ein Dokument, das nur ein Vorkommen hat. Ein Dokument mit 100 Vorkommen des Suchbegriffs ist jedoch möglicherweise nicht zehnmal wirkungsvoller als ein Dokument mit 10 Vorkommen. Die Relevanz nähert sich einem maximalen Effekt-asymptoten. Je höher der Attributwert, desto geringer ist die maximale Auswirkung mehrerer Vorkommen. Typische Werte liegen zwischen 1,25 und 2,0.