クラスタリングソリューションの HDBSCAN の構成
クラスタリング ソリューションに Hierarchical Density Based Spatial Clustering of Applications with Noise (HDBSCAN) エンコーディングを適用することを検討してください。K 平均法は既定のクラスタリング アルゴリズムです。
始める前に
注:
ML ソリューションの詳細設定はオプションです。これらの設定のいずれかを構成する場合は、ソリューションで有効にするテクノロジについて十分な情報が得られていること、およびテクノロジが提供する機能からメリットを得るユース ケースがあることを確認してください。
- クラスタリングソリューション定義を作成するか、既存のものを使用します。
- 必要なロール:admin または ml_admin
このタスクについて
HDBSCAN アルゴリズムを適用すると、どのクラスターにも割り当てられていないデータサンプルをシステムが識別できるようになります。たとえば、HDBSCAN を適用してトピック検出をサポートできます。
予測インテリジェンスは、クラスタリングフレームワークでデフォルトで k-means アルゴリズムを使用します。HSBSCAN は、DBSCAN アルゴリズムに似た別のクラスタリング アルゴリズムですが、最小サイズのクラスタで機能し、より安定した永続的なクラスタを提供するのに役立ちます。HDBSCAN のしくみの概要については、 こちらの記事を参照してください。DBSCAN と HDBSCAN の比較については、 こちらの記事 と こちらの記事を参照してください。
注:
HDBSCAN でトレーニングされたクラスタリング ソリューションは、クラスタの更新をサポートしていません。これらのソリューションの更新は失敗し、ソリューションはml_cluster_detail_tableに記録されません。クラスターの更新を有効にする場合は、DBSCAN または k-means 学習方法を使用します。