逆ドキュメント頻度 (IDF) による検索用語のスコアリング

  • リリースバージョン: Zurich
  • 更新日 2025年07月31日
  • 所要時間:1分
  • 用語頻度 - 逆ドキュメント頻度 (TF-IDF) を有効にすると、ドキュメント内では頻繁に表示されるものの、検索可能なドキュメントのコレクション全体ではあまり頻繁に表示されない、検索用語の検索結果スコアが増加します。

    始める前に

    TF-IDF スコアリングを有効にするには、テーブルにテキストインデックスが存在している必要があります。クエリモードを変更する前に、テーブルのテキストインデックス作成が有効であることを確認します。「インデックス作成と検索のためのテーブルの構成」を参照してください。

    必要なロール:ts_admin または admin

    このタスクについて

    アドミニストレーターは、テーブルで TF-IDF スコアリングを有効にして、検索結果を向上させることができます。ナレッジテーブル [kb_knowledge] の TF-IDF スコアリングはデフォルトで有効になっています。

    注:
    このタスクではインデックスを再生成する必要があるため、システムパフォーマンスを考慮して実行する必要があります。インデックスの再生成は、テーブルサイズやその他の要因により、完了するまでに時間がかかる場合があります。システムがインデックスを再生成している間は、パフォーマンスが低下したり、検索結果が不完全になったりすることがあります。

    手順

    1. システム辞書に移動し、目的のテーブルのエントリを開きます。
    2. [属性] 関連リストで、[新規] を選択します。
    3. [属性] フィールドで、[テキスト検索の IDF の有効化 (Text search Enable IDF)] を選択します。
    4. [送信] を選択します。
      これでテーブルのテキストインデックスレコードの [IDF スコアの有効化] チェックボックスを構成できるようになりました。
    5. 移動先 すべて > システム定義 > テキストインデックス.
    6. 目的のテーブルに対して作成されたテキストインデックスを開きます。
    7. [IDF スコアの有効化] を選択します。
    8. [関連リンク]で、[文書の頻度を再生成] を選択します。
      ドキュメント頻度の再生成は、1 回限りの作業です。テーブルに対して TF-IDF スコアリングが最初に有効になったときに、ドキュメント頻度を再生成します。
    9. 目的の通知を構成し、[OK] を選択します。