ソリューションの TF-IDF の構成
用語頻度 - 逆ドキュメント頻度 (TF-IDF) エンコーディングを分類、類似性、回帰、またはクラスタリングのソリューションに適用します。
始める前に
注:
ML ソリューションの詳細設定はオプションです。これらの設定のいずれかを構成する場合は、ソリューションで有効にするテクノロジについて十分な情報が得られていること、およびテクノロジが提供する機能からメリットを得るユース ケースがあることを確認してください。
- 類似性ソリューション定義を作成するか、既存の定義を使用します。
- 分類ソリューション定義を作成するか、既存の分類ソリューション定義を使用します。
- 回帰ソリューション定義を作成するか、既存の定義を使用します。
- Professional サブスクリプションをお持ちで、 で初めてVancouver実装予測インテリジェンスする場合は、クラスタリングソリューション定義を作成するか、既存のものを使用します。
- 必要なロール:admin または ml_admin
このタスクについて
予測インテリジェンスは、分類、類似性、および回帰フレームワークでデフォルトで段落ベクトル単語埋め込みを使用します。これは、主に人間が判読できるコンテンツで構成されるデータを処理するのに非常に効果的です。ただし、TF-IDF は、ログファイルのアラートやエラーメッセージなど、機械で生成されたコンテンツを含むレコードに対して、より適切な予測結果を返す場合があることがわかっています。したがって、ソリューションが処理しているデータの種類に基づいて、ここで選択できます。
注:
TF-IDF を設定する手順はすべてのモデルフレームワークで同じですが、クラスタリングソリューション定義の IF-IDF サポートは、Professional サブスクリプションがあり、 以降で初めてVancouver実装予測インテリジェンスする場合にのみ適用されます。