Webcrawler 外部コンテンツコネクタ
Webcrawler 外部コンテンツコネクタは、公開 Web サイトからページとサブドメインを取得し、そのコンテンツとメタデータを AI 検索 アプリケーションで検索できるようにします。このコネクタは、事前定義された公開 Web ソースまたは独自のカスタム Web ソースからコンテンツをクロールできます。
注:
この外部コンテンツコネクタは、外部コンテンツコネクタアプリケーションスイートアプリケーションには含まれていません。このコネクタを使用するには、個別にインストールする必要があります。インストールの詳細については、「 外部コンテンツコネクタのインストール」を参照してください。
コネクタアドミニストレーターは、コンテンツクロールを実行またはスケジュールして、選択した Web サイトにあるページとサブドメインから更新されたコンテンツを取得できます。スケジュールされたコンテンツクロールは、日次、週次、または月次ベースで実行できます。コンテンツクロールは、インデックス作成のためにデータを AI 検索 にフィードします。
インデックス付きコンテンツとメタデータは、コネクタ固有のインデックス付きソースにレコードとして格納されます。検索アドミニストレーターは、このインデックス付きソースから検索ソースを作成し、それらを検索プロファイルにリンクして、インデックス付きレコードを AI 検索 アプリケーションで検索可能にすることができます。
各 Webcrawler コネクタは、コンテンツクロールの実行時に、ソースシステムから最大 50,000 個のアイテム (URL) を取得できます。
注:
これは、 1,000 万 (10,000,000) アイテムの一般的なコンテンツクロール制限の例外です。
デフォルトでは、カスタム Web ソース用に最大 3 つの Webcrawler コネクタを構成できます。3 つ以上のカスタム Web ソースからアイテムを取得する必要がある場合は、https://support.servicenow.com/now でカスタマーサービス & サポートケースを作成して、Webcrawler コネクタの制限の引き上げを要求できます。