クラスタリングソリューションを作成してトレーニングする
類似レコードをクラスターにグループ化して、まとめて処理したり、パターンを判断したりすることができます。
始める前に
必要なロール:ml_admin または admin
重要:
Washington DCこのリリースでは、クラスタリングモデルと類似性モデルでワークフローソリューションが使用されます。これらは事前にトレーニングされているため、新しいソリューションにワードコーパスは必要ありません。ワードコーパスを含む既存のソリューションがアップグレード後に再トレーニングされると、ワークフローソリューションになり、[ワードコーパス] フィールドがフォームから削除されます。
このタスクについて
予測インテリジェンス は、以下の暗号化タイプでソースデータが保護されるトレーニングソリューションをサポートします。
- FDE (フルディスク暗号化)
- Column Level Encryption。Column Level Encryption を使用する場合は、sharedservice.worker ユーザーに、暗号化に使用されたのと同じ暗号化モジュールロールがあることを確認してください。
この手順例では、最近発生した類似のインシデントをグループ化して、重大なインシデントを特定します。
手順
タスクの結果
ソリューションがトレーニングされ、トレーニングが完了するとリアルタイムで通知されます。
[クラスタリングソリューション定義] フォームの [クラスターのビジュアル化] タブにツリーマッププロットが表示されます。プロットには、ソリューションに対してシステムが形成したクラスターが左上隅から右下隅に降順に表示されます。ツリーマップノードのラベルはクラスターの概念であり、クラスターの上位の単語によって作成され、各クラスターで最も目立つコンテンツを確認するのに役立ちます。
注:
クラスターの概念は、処理された入力データの上位の単語を使用し、同じ言語を使用します。言語によっては、クラスターの概念に単語が語根の形式で含まれ、切り取られて表示される場合があります。
そのノードのクラスターの品質に応じて、各ノードが赤から緑に色分けされます。[グループを選択] フィルターは、[クラスタリング定義] フォームで [グループを使用] および [グループ] フィールドを選択した場合にのみ表示されます。クラスターをポイントすると、その Groupby 値、クラスター数、および Groupby のレコードを確認できます。 図 : 1. クラスターのビジュアル化例
クラスターを開くには、クラスターをクリックするか、[すべてのグループを表示] フィルターから選択します。
クラスターのグループ内で、クラスターサイズとクラスター品質に対して 2 つのスライドバーをそれぞれ使用して、結果をさらにフィルタリングできます。[戻る] ボタンをクリックして後方に移動することもできます。このボタンは、クラスタリング階層が存在する場合にのみ表示されます。このレベルでクラスターをポイントすると、[純度] フィールドのパーセンタイル値が [クラスターの概念]、 [品質]、および [サイズ] の値とともに表示されます。図 : 2. クラスターグループ例
クラスターノードをクリックすると、その ML クラスターの詳細がリストビュー形式で表示されます。図 : 3. クラスターの詳細ページ
次のタスク
ソリューションの [ソリューション統計情報] タブでソリューションの出力を確認します。クラスタリングソリューションの結果に満足できない場合は、ソリューションに設定した値を再構成し、結果に満足するまで再トレーニングします。
- [クラスターサマリ] タブで、クラスター ID、品質サイズ、および Groupby 値のリストビューを確認します。
図 : 4. クラスターサマリ例 - [クラスター更新] タブで、ソリューション定義で設定した各クラスター更新間隔について、クラスターに対する変更の概要を確認します。
図 : 5. クラスター更新例