クラスタリングソリューションの Connect コンポーネントアルゴリズムとレーベンシュタイン距離法の構成

  • リリースバージョン: Washingtondc
  • 更新日 2024年02月01日
  • 1 読むのに数分読む
  • [Connect コンポーネントの構成 (Configure Connect Component)] と [レーベンシュタイン距離 (Levenshtein Distance)] メソッドエンコーディングを適用して、クラスタリングソリューションのトレーニングを最適化します。

    始める前に

    必要なロール:admin または ml_admin
    注:
    ML ソリューションの詳細設定はオプションです。これらの設定のいずれかを構成する場合は、ソリューションで有効にするテクノロジについて十分な情報が得られていること、およびテクノロジが提供する機能からメリットを得るユース ケースがあることを確認してください。
    • クラスタリングソリューション定義を作成してトレーニングするか、既存のものを使用します。
    • 必要なロール:admin または ml_admin

    このタスクについて

    クラスタリング ソリューションをトレーニングする場合、次の 3 つのオプションがあります。

    • 既定の k-means アルゴリズムを使用します。
    • オプションの DBSCAN ソリューション パラメーターをユークリッド距離法とともにメトリックとして使用します。
    • オプションの [DBSCAN]、[最小近傍数]、および [レーベンシュタイン距離] ソリューション パラメーターを使用します。Connect コンポーネントは、DBSCAN と最小近傍によって有効になり、段落ベクトルベースのテキストとレーベンシュタイン距離ベースのテキストの両方をサポートします。レーベンシュタイン距離法を使用してソリューションをトレーニングする場合、クラスタリングソリューションでワードコーパスを使用する必要はありません。

    このシナリオ例では、上記の 3 番目のオプションを使用してソリューション定義をトレーニングします。

    手順

    1. 移動先 すべて > 予測インテリジェンス > クラスタリング > ソリューション定義.
    2. トレーニング済みクラスタリングソリューション定義フォームを開きます。
    3. フォームの [関連リンク] セクションにある [ソリューションの詳細設定] タブで、[ 新規] をクリックします。
      この画像は、パラメーターを作成するための [ソリューション パラメーター] オプションを選択する方法を示しています。
    4. パラメーターレコードを作成します。
      1. [ソリューションパラメーター] フィールドで、検索アイコンをクリックします。
      2. [ML ソリューションパラメーター] 画面で、[ レーベンシュタイン距離] を選択します。
      [検索] ボタンを選択し、レーベンシュタイン距離キーの [簡単な説明] を選択して、パラメーターレコードを作成する方法。
    5. [Submit (送信)] をクリックします。

      [詳細ソリューション設定] レコード画面が更新されます。

      アサインした値から作成する新しいソリューションパラメーターレコード。

    6. [Submit (送信)] をクリックします。

      結果: レーベンシュタイン距離は、クラスタリングソリューションに合わせて構成されます。そのソリューションパラメーターは、クラスタリング定義フォームの [ソリューションの詳細設定] タブに表示されます。

      作成したレコードを送信すると、レーベンシュタイン距離ソリューションパラメーターがクラスターリングソリューション定義フォームに表示されます。
    7. 前のレーベンシュタイン距離の例の手順 1 〜 6 を繰り返しますが、今回は [ 最小近傍数][DBSCAN ] ソリューション パラメーターを作成し、これらを組み合わせて [コンポーネントの接続] 機能を有効にします。
      クラスタリングソリューションに追加する必要がある残りの 2 つのソリューションパラメーター。これら 2 つの最終パラメーターにより、コンポーネントの接続機能が有効になります。

      [最小近傍数] ソリューション パラメーターを選択、構成、および送信するときは、必ず [ユーザー入力] フィールドの値を 1 に設定してください。一部のパラメーターにのみ [ユーザー入力] フィールドがあります。

      [最小近傍数] パラメーターの [ユーザー入力] フィールドに値を追加する方法。このシナリオでは、値 1 を入力します。

      結果 :

      Connect コンポーネントがクラスタリングソリューション用に構成されました。その 2 つのソリューション パラメーターが、この手順のステップ 1 〜 6 で構成した [レーベンシュタイン距離] パラメーターと共に、クラスタリング定義フォームの [ソリューションの詳細設定] タブに表示されます。

      クラスタリングソリューションの [ソリューションの詳細設定] セクションで構成した 3 つのソリューションパラメーター。