クラスタリングソリューションの Connect コンポーネントアルゴリズムとレーベンシュタイン距離法の構成
[Connect コンポーネントの構成 (Configure Connect Component)] と [レーベンシュタイン距離 (Levenshtein Distance)] メソッドエンコーディングを適用して、クラスタリングソリューションのトレーニングを最適化します。
始める前に
注:
ML ソリューションの詳細設定はオプションです。これらの設定のいずれかを構成する場合は、ソリューションで有効にするテクノロジについて十分な情報が得られていること、およびテクノロジが提供する機能からメリットを得るユース ケースがあることを確認してください。
- クラスタリングソリューション定義を作成してトレーニングするか、既存のものを使用します。
- 必要なロール:admin または ml_admin
このタスクについて
クラスタリング ソリューションをトレーニングする場合、次の 3 つのオプションがあります。
- 既定の k-means アルゴリズムを使用します。
- オプションの DBSCAN ソリューション パラメーターをユークリッド距離法とともにメトリックとして使用します。
- オプションの [DBSCAN]、[最小近傍数]、および [レーベンシュタイン距離] ソリューション パラメーターを使用します。Connect コンポーネントは、DBSCAN と最小近傍によって有効になり、段落ベクトルベースのテキストとレーベンシュタイン距離ベースのテキストの両方をサポートします。レーベンシュタイン距離法を使用してソリューションをトレーニングする場合、クラスタリングソリューションでワードコーパスを使用する必要はありません。
このシナリオ例では、上記の 3 番目のオプションを使用してソリューション定義をトレーニングします。