Zing-Index- und Suchwörterbuchattribute

  • Freigeben Version: Washingtondc
  • Aktualisiert 7. Februar 2024
  • 5 Minuten Lesedauer
  • Die folgenden Wörterbuchattribute wirken sich entweder darauf aus, wie Zing Tabellen indiziert oder Suchergebnisse sortiert.

    Index- und Suchwörterbuchattribute

    Zing verwendet Wörterbuchattribute, die auf Tabellen- oder Feldebene festgelegt werden, um die folgenden Einstellungen zu konfigurieren:
    • Indizierungsverhalten
    • Rangfolge der Suchergebnisse
    • BM25-Relevanzrangfolge-Algorithmus
    Tabelle : 1. Zing-Index- und Suchwörterbuchattribute
    Name Datentyp Betrifft Gilt für V3 oder V4 Beschreibung Bezeichnung Erneute Indizierung erforderlich? Nur Stammtabelle
    attachment_index boolean Tabelle Beides Bei „true“ werden Anhänge in der Tabelle zu Suchzwecken indiziert. Anhangsindex WAHR FALSCH
    no_text_index boolean Beides Beides Dieses Attribut in einem Feld verhindert, dass das Feld in ein Textverzeichnis aufgenommen wird. Kein Textindex WAHR FALSCH
    text_index_attachment_body_weight schweben Tabelle V4 Gibt an, wie viel Überlegung (Gewichtung, ein Gleitkommawert) für einen Suchbegriff im Textkörper eines Anhangs verwendet werden soll. Weitere Informationen dazu, wie sich der Gewichtungswert auf die Relevanz der Suchergebnisse auswirkt, finden Sie unter Zing berechnet Dokumentpunktzahlen anhand von drei Komponenten. Gewichtung des Textindexanhangs FALSCH WAHR
    text_index_attachment_angezeigt boolean Tabelle Beides Zeigt Anhänge in Textsuchergebnissen an. Textindexanhang angezeigt FALSCH FALSCH
    text_index_attachment_title_weight schweben Tabelle V4 Gibt an, wie viel Gegenleistung (Gewichtung, ein Gleitkommawert) für einen Suchbegriff im Titel eines Anhangs verwendet werden soll. Weitere Informationen dazu, wie sich der Gewichtungswert auf die Relevanz der Suchergebnisse auswirkt, finden Sie unter Zing berechnet Dokumentpunktzahlen anhand von drei Komponenten. Titelgewichtung des Textindexanhangs FALSCH WAHR
    text_index_auto_stopp boolean Tabelle Beides Identifiziert automatisch Stoppwörter und indiziert sie nicht. Basierend auf dem in text_index_auto_stop_threshold angegebenen Schwellenwert. Automatisches Stoppen des Textindex WAHR WAHR
    text_index_auto_stop_threshold int Tabelle Beides Schwellenwert (Ganzzahl, Anzahl der Vorkommen), für den ein Wort automatisch zu einem Stoppwort wird. Siehe text_index_auto_stop. Textindex-Schwellenwert für automatisches Stoppen WAHR WAHR
    text_index_default_partial_matching_rule Zeichenfolge Tabelle Beides Zeichenfolge für die Konfiguration der teilweisen Übereinstimmungsregel. Die Eingabe sollte auf „Abfragemodus einer indizierten Tabelle ändern“ basieren. Textindex – Standardmäßige teilweise Übereinstimmungsregel FALSCH WAHR
    text_index_default_query_mode Zeichenfolge Tabelle Beides Zeichenfolge für die Konfiguration des Abfragemodus. Die Eingabe sollte auf dem Abfragemodus einer indizierten Tabellebasieren Textindex-Standardabfragemodus FALSCH WAHR
    text_index_disable_synonym boolean Tabelle Beides Bei TRUE wird die Suche nach Synonymen und dem Suchbegriff deaktiviert. Textindex Synonym deaktivieren FALSCH WAHR
    text_index_enable_idf boolean Tabelle V3 TRUE aktiviert die TF-IDF-Bewertung. Textindex IDF aktivieren FALSCH WAHR
    text_index_filter_junk boolean Tabelle Beides Standardmäßig WAHR, FALSCH deaktiviert den Junk-Filter für eine Tabelle. Standardmäßig indiziert oder sucht Zing nicht nach zweistelligen Zahlen und Wörtern mit einem Zeichen (es sei denn, es handelt sich um Chinesisch oder Japanisch). Generieren Sie den Index erneut, nachdem Sie den Junk-Filter deaktiviert haben. Dieses Attribut führt zu einem größeren Tabellenindex. Um eine optimale Leistung zu erzielen, wenden Sie sie nur an, wenn dies erforderlich ist. Textindexfilter – Junk WAHR WAHR
    text_index_filter_query Eine encodedQuery in der Tabelle Tabelle Beides Verwenden Sie dieses Attribut, wenn Sie die Zeilen indizieren möchten, die bestimmten Filterbedingungen entsprechen. Der Attributwert muss eine encodedQuery in der Tabelle sein. Indexfilter WAHR FALSCH
    text_index_filterable boolean Spalte Beides Wenn ein Feld geändert wird, für das dieses Attribut auf „true“ festgelegt ist, wird die Zeile für eine erneute Indizierung ausgewertet (auch wenn das Feld selbst nicht indiziert werden kann). Index filterbar WAHR FALSCH
    text_index_include_stop_word boolean Tabelle Beides Wenn Sie Stoppwörter in dieser Tabelle indizieren müssen, legen Sie dieses Attribut auf „true“ fest. Textverzeichnis mit Stoppwort WAHR WAHR
    text_index_scorer_bm25_b schweben Tabelle V4 Dieses Attribut ist der Parameter b, der im BM25-Algorithmus verwendet wird. Siehe text_index_scorer_bm25_b. bm25_b FALSCH WAHR
    text_index_scorer_bm25_k1 schweben Tabelle V4 Dieses Attribut ist der im BM25-Algorithmus verwendete K1-Parameter. Siehe text_index_scorer_bm25_k1. bm25_k1 FALSCH WAHR
    text_index_tags Zeichenfolge Tabelle Beides Sollte auf eine bestimmte Zeichenfolge festgelegt werden: empty/everyone_only/all_shared, abhängig vom Typ der Tags, die indiziert werden sollen. Textindex-Tags WAHR FALSCH
    text_index_tokenizer_language Zeichenfolge Tabelle Beides Setzen Sie „ja“ (ohne doppelte Anführungszeichen), wenn die Tokenisierung auf Japanisch unterstützt werden muss. Sprache des Textindex-Tokenisierers WAHR WAHR
    text_index_translations boolean Tabelle Beides Wenn vorhanden oder „wahr“, werden Indizes neu berechnet, wenn übersetzte Zeichenfolgen hinzugefügt werden. Zum Ändern ist die Rolle „sys-admin“ erforderlich. Wird automatisch für indizierte Felder festgelegt, die übersetzt werden, und für Felder, die eine Übersetzung aufweisen und indiziert werden. Die Systemeigenschaft glide.i18n.force_index, die standardmäßig auf „true“ festgelegt ist, überschreibt dieses Attribut. Textindexübersetzungen WAHR FALSCH
    text_search_and_or_limit int Tabelle Beides Fügen Sie das benutzerdefinierte Attribut „text_search_and_or_limit“ auf Tabellenebene hinzu, das die globale Eigenschaft überschreibt. Textsuche und oder beschränken FALSCH FALSCH
    ts_language Zeichenfolge Spalte Beides Hinzugefügt, um die Textindizierung nur für bestimmte Sprachen zu ermöglichen. Sprache der Textsuche WAHR FALSCH
    ts_multi_value_field_Splitter Zeichenfolge Spalte Beides Wenn ein Feld ein Feld mit mehreren Werten ist, fügen Sie den Splitter im Feld in diesem Attribut hinzu, um die Indexpositionen der Werte zu verteilen. Um beispielsweise multi:value zu trennen, setzen Sie für dieses Attribut :. Textsuche-Mehrwert-Feld-Splitter WAHR WAHR
    ts_weight int Spalte Beides Steuert die relative Wichtigkeit einer Übereinstimmung im Feld für die Textsuche. Weitere Informationen dazu, wie sich der Gewichtungswert auf die Relevanz der Suchergebnisse auswirkt, finden Sie unter Zing berechnet Dokumentpunktzahlen anhand von drei Komponenten. Informationen zum Festlegen der Gewichtung der Textsuche für ein Feld finden Sie unter Legen Sie die relative Gewichtung eines Felds fest. Gewichtung der Textsuche FALSCH FALSCH

    no_text_index

    Richtlinien von Kundenservice und Support zum Festlegen der Option no_text_index für verschiedene Feldtypen finden Sie unter KB0859922 auf der Website Now Support.

    text_index_scorer_bm25_b

    Dieses Wörterbuchattribut ist Teil des BM25-Algorithmus. Das Attribut wirkt sich auf die Bedeutung der Länge eines Dokuments in den Suchergebnissen aus. Wenn dieses Attribut 0 ist, hat die Länge keine Bedeutung. In diesem Fall würde ein Dokument mit zwei Wörtern gleich einem Dokument mit 1000 Wörtern bewertet. Sehr kurze Dokumente werden häufig niedriger gewichtet als längere Dokumente. Der Standardwert ist 0,75.

    text_index_scorer_bm25_k1

    Dieses Wörterbuchattribut ist Teil des BM25-Algorithmus. Das Attribut hilft bei der Bestimmung der Häufigkeitssättigung von Begriffen, d. h. wenn der Suchbegriff in einem Dokument angezeigt wird, erhöht sich die Relevanz des Dokuments, aber die Erhöhung ist weniger aussagekräftig, wenn die Zahlen steigen. Wenn beispielsweise ein Suchbegriff zehnmal in einem Dokument vorkommt, ist er relevanter als ein Dokument, das nur einmal vorkommt. Ein Dokument mit 100 Vorkommen des Suchbegriffs ist jedoch möglicherweise nicht zehnmal aussagekräftiger als ein Dokument mit 10 Vorkommen. Die Relevanz nähert sich einer maximalen Effektasymptote. Je höher der Attributwert ist, desto geringer ist die maximale Auswirkung mehrerer Vorkommen. Typische Werte liegen zwischen 1,25 und 2,0.