ソリューションの TF-IDF の構成
用語頻度 - 逆ドキュメント頻度 (TF-IDF) エンコードを、 予測インテリジェンスの分類、クラスタリング、または類似性ソリューションに適用します。
始める前に
注:
ML ソリューションの詳細設定の構成はオプションです。これらの設定のいずれかを構成する場合は、ソリューションで有効にしているテクノロジーについて十分な情報を得ていること、およびテクノロジーが提供するものからメリットを得るユースケースがあることを確認してください。詳細については、「https://www.servicenow.com/community/intelligence-ml-articles/dive-deeper-with-clustering-advanced-parameters/ta-p/2695847」を参照してください。
- 分類、クラスタリング、または類似性ソリューション定義を作成するか、既存の定義を使用します。
- 必要なロール:admin または ml_admin
このタスクについて
予測インテリジェンス 分類フレームワークと類似性フレームワークでデフォルトで段落ベクトル単語埋め込みを使用します。これは、主に人間が判読できるコンテンツで構成されるデータの処理に非常に効果的です。ただし、TF-IDF は、ログファイルのアラートやエラーメッセージなど、マシンで生成されたコンテンツを含むレコードに対して、より良い予測結果を返す場合があります。ソリューションが処理するデータの種類に適した詳細設定を選択します。
注:
TF-IDF を構成する手順はすべてのモデル フレームワークで同じですが、クラスタリング ソリューション定義に対する TF-IDF のサポートは、Professional サブスクリプションがある場合にのみ適用されます。