Zing-Index- und Suchwörterbuchattribute

  • Freigeben Version: Yokohama
  • Aktualisiert 30. Januar 2025
  • 4 Minuten Lesedauer
  • Die folgenden Wörterbuchattribute wirken sich entweder darauf aus, wie Zing Suchergebnisse indiziert oder ordnet.

    Index- und Suchwörterbuchattribute

    Zing verwendet auf Tabellen- oder Feldebene festgelegte Wörterbuchattribute, um die folgenden Einstellungen zu konfigurieren:
    • Indexierungsverhalten
    • Rangfolge der Suchergebnisse
    • Relevanzbewertungsalgorithmus BM25
    Tabelle : 1. Zing-Index- und Suchwörterbuchattribute
    Name Datentyp Betrifft Gilt für V3 oder V4 Beschreibung Bezeichnung Erneutes Indizieren erforderlich? Nur Stammtabelle
    „attachment_index“ boolean Tabelle Beides Bei „wahr“ werden Anhänge in der Tabelle zu Suchzwecken indiziert. Anhangindex WAHR FALSCH
    no_text_index boolean Beides Beides Dieses Attribut in einem Feld verhindert, dass das Feld in ein Textverzeichnis aufgenommen wird. Kein Textverzeichnis WAHR FALSCH
    text_index_attachment_body_gewichtung Gleitkommazahl Tabelle V4 Gibt an, wie viel Berücksichtigung (Gewichtung, Gleitkommawert) ein Suchbegriff im Textkörper eines Anhangs finden soll. Weitere Informationen dazu, wie sich der Gewichtungswert auf die Relevanz von Suchergebnissen auswirkt, finden Sie unter Zing berechnet Dokumentpunktzahlen anhand von drei Komponenten. Textindex-Anhangtextkörpergewichtung FALSCH WAHR
    text_index_attachment_displayed boolean Tabelle Beides Zeigt Anhänge in Textsuchergebnissen an. Textindexanhang angezeigt FALSCH FALSCH
    text_index_attachment _title_gewichtung Gleitkommazahl Tabelle V4 Gibt an, wie viel Berücksichtigung (Gewichtung, Gleitkommawert) ein Suchbegriff im Titel eines Anhangs finden soll. Weitere Informationen dazu, wie sich der Gewichtungswert auf die Relevanz von Suchergebnissen auswirkt, finden Sie unter Zing berechnet Dokumentpunktzahlen anhand von drei Komponenten. Gewichtung des Textindex-Anhangtitels FALSCH WAHR
    text_index_auto_stoppen boolean Tabelle Beides Identifiziert Stoppwörter automatisch und indiziert sie nicht. Basierend auf dem in „text_index_auto_stop_threshold“ angegebenen Schwellenwert. Automatischer Stopp des Textverzeichnisses WAHR WAHR
    text_index_auto_stoppen_schwellenwert int Tabelle Beides Schwellenwert (Ganzzahl, Anzahl der Vorkommen), für den ein Wort automatisch zu einem Stoppwort wird. Siehe text_index_auto_stop. Schwellenwert für automatischen Stopp des Textindex WAHR WAHR
    text_index_default _partial_matching_rule Zeichenfolge Tabelle Beides Zeichenfolge für die Konfiguration der partiellen Übereinstimmungsregel. Die Eingabe sollte auf „Abfragemodus einer indizierten Tabelle ändern“basieren. Textindex-Standard – Partielle Übereinstimmungsregel FALSCH WAHR
    text_index_default_query_mode Zeichenfolge Tabelle Beides Zeichenfolge für die Konfiguration des Abfragemodus. Die Eingabe sollte auf „Abfragemodus einer indizierten Tabelle ändern“basieren Standardmäßiger Abfragemodus für Textindex FALSCH WAHR
    text_index _disable_synonym boolean Tabelle Beides TRUE deaktiviert die Suche nach Synonymen sowie nach dem Suchbegriff. Textindex-Deaktivierungssynonym FALSCH WAHR
    text_index_enable_idf boolean Tabelle V3 TRUE aktiviert die TF-IDF-Bewertung. Textindex für IDF aktivieren FALSCH WAHR
    text_index_filter_junk boolean Tabelle Beides Standardmäßig WAHR, FALSCH deaktiviert den Junk-Filter für eine Tabelle. Standardmäßig indiziert Zing keine zweistelligen Zahlen und Wörter mit einem Zeichen (es sei denn, es handelt sich um Chinesisch oder Japanisch). Generieren Sie den Index erneut, nachdem Sie den Junk-Filter deaktiviert haben. Dieses Attribut führt zu einem größeren Tabellenindex. Um eine optimale Leistung zu erzielen, wenden Sie sie nur an, wenn sie erforderlich sind. Textindex-Filter-Junk WAHR WAHR
    text_index _filter_query Eine encodedQuery in der Tabelle Tabelle Beides Verwenden Sie dieses Attribut, wenn Sie die Zeilen indizieren möchten, die bestimmten Filterbedingungen entsprechen. Der Attributwert muss eine encodedQuery in der Tabelle sein. Indexfilter WAHR FALSCH
    text_index_filterable boolean Spalte Beides Wenn ein Feld geändert wird, für das dieses Attribut auf „true“ festgelegt ist, wird die Zeile für eine erneute Indizierung ausgewertet (auch wenn das Feld selbst nicht indizierbar ist). Index filterbar WAHR FALSCH
    text_index_include_stop_word boolean Tabelle Beides Wenn Sie Stoppwörter in dieser Tabelle indizieren müssen, legen Sie dieses Attribut auf „wahr“ fest. Textindex-Stoppwort einschließen WAHR WAHR
    text_index_scorer_bm25_b Gleitkommazahl Tabelle V4 Dieses Attribut ist der im BM25-Algorithmus verwendete Parameter b. Siehe text_index_scorer_bm25_b. bm25_b FALSCH WAHR
    text_index_scorer_bm25_k1 Gleitkommazahl Tabelle V4 Dieses Attribut ist der K1-Parameter, der im BM25-Algorithmus verwendet wird. Siehe text_index_scorer_bm25_k1. bm25_k1 FALSCH WAHR
    text_index_tags Zeichenfolge Tabelle Beides Sollte auf eine bestimmte Zeichenfolge festgelegt werden: empty/everyone_only/all_shared, abhängig vom Typ der Tags, die indiziert werden sollen. Textindex-Tags WAHR FALSCH
    text_index_tokenizer _language Zeichenfolge Tabelle Beides Geben Sie „ja“ (ohne doppelte Anführungszeichen) ein, wenn die Tokenisierung auf Japanisch unterstützt werden muss. Sprache des Textindex-Tokenizers WAHR WAHR
    text_index_translations boolean Tabelle Beides Wenn vorhanden oder „wahr“, wird die Neuberechnung von Indizes erzwungen, wenn übersetzte Zeichenfolgen hinzugefügt werden. Zum Ändern ist die Rolle „sys-admin“ erforderlich. Wird automatisch für indizierte Felder festgelegt, die übersetzt werden, und für Felder, die eine Übersetzung aufweisen und indiziert werden. Die Systemeigenschaft „glide.i18n.force_index“, die standardmäßig auf „true“ festgelegt ist, überschreibt dieses Attribut. Textindexübersetzungen WAHR FALSCH
    text_search_and_or_limit int Tabelle Beides Fügen Sie das anwenderdefinierte Attribut text_search_and_or_limit auf Tabellenebene hinzu, das die globale Eigenschaft überschreibt. Textsuche Und-Oder-Limit FALSCH FALSCH
    ts_language Zeichenfolge Spalte Beides Hinzugefügt, um die Textindizierung nur bestimmter Sprachen zu ermöglichen. Textsuchsprache WAHR FALSCH
    ts_multi_value_field _Splitter Zeichenfolge Spalte Beides Wenn ein Feld ein Feld mit mehreren Werten ist, fügen Sie den Splitter im Feld in diesem Attribut hinzu, um die Indexpositionen der Werte zu verteilen. Um beispielsweise einen Mehrfachwert zu trennen, geben Sie für dieses Attribut ein. Textsuche-Splitter für mehrwertiges Feld WAHR WAHR
    ts_gewichtung int Spalte Beides Steuert die relative Wichtigkeit einer Übereinstimmung im Feld für die Textsuche. Weitere Informationen dazu, wie sich der Gewichtungswert auf die Relevanz von Suchergebnissen auswirkt, finden Sie unter Zing berechnet Dokumentpunktzahlen anhand von drei Komponenten. Informationen zum Festlegen der Textsuchgewichtung für ein Feld finden Sie unter Legen Sie die relative Gewichtung eines Felds fest. Textsuchgewichtung FALSCH FALSCH

    no_text_index

    Richtlinien Kundenservice und Support zum Festlegen der Option „no_text_index“ für verschiedene Feldtypen finden Sie unter KB0859922 auf der Website Now Support.

    text_index_scorer_bm25_b

    Dieses Wörterbuchattribut ist Teil des BM25-Algorithmus. Das Attribut wirkt sich auf die Bedeutung der Länge eines Dokuments in Suchergebnissen aus. Wenn dieses Attribut 0 ist, hat die Länge keine Bedeutung. In diesem Fall wird ein Dokument mit zwei Wörtern genauso bewertet wie ein Dokument mit 1000 Wörtern. Sehr kurze Dokumente werden häufig niedriger gewichtet als längere Dokumente. Der Standardwert ist 0,75.

    text_index_scorer_bm25_k1

    Dieses Wörterbuchattribut ist Teil des BM25-Algorithmus. Das Attribut hilft bei der Bestimmung der Sättigungsmerkmale für die Begriffshäufigkeit. Das heißt, wenn der Suchbegriff in einem Dokument angezeigt wird, erhöht sich die Relevanz des Dokuments. Diese Erhöhung wirkt sich jedoch weniger positiv aus, wenn die Zahlen ansteigen. Wenn beispielsweise ein Suchbegriff zehnmal in einem Dokument vorkommt, ist er relevanter als ein Dokument, das nur einmal vorkommt. Ein Dokument mit 100 Vorkommen des Suchbegriffs ist jedoch möglicherweise nicht zehnmal effektiver als ein Dokument mit 10 Vorkommen. Die Relevanz nähert sich einer Asymptote der maximalen Wirkung. Je höher der Attributwert, desto geringer ist der maximale Effekt mehrerer Vorkommen. Typische Werte liegen zwischen 1,25 und 2,0.