Konfigurieren Sie Durchforstungseinstellungen für einen Webcrawler-Connector für externe Inhalte

  • Freigeben Version: Zurich
  • Aktualisiert 30. Juli 2025
  • 2 Minuten Lesedauer
  • Geben Sie die Seiten und Subdomänen an, die Ihr Webcrawler-Connector für externe Inhalte aus Ihrer angegebenen Webquelle abrufen soll.

    Vorbereitungen

    Ein Administrator muss bereits den Webcrawler-Connector für externe Inhalte erstellt haben, für den Sie Durchforstungseinstellungen konfigurieren möchten. Weitere Informationen zu diesem Verfahren finden Sie unter Einen Webcrawler-Connector für externe Inhalte erstellen.

    Erforderliche Rolle: ais_admin

    Warum und wann dieser Vorgang ausgeführt wird

    Diese Aufgabe ist optional. Standardmäßig durchsucht der Webcrawler-Connector für externe Inhalte alle Seiten und Subdomänen aus dem angegebenen Quellsystem. Sie müssen diese Aufgabe nur ausführen, wenn Sie ein- oder Ausschlussfilter für die zu durchforstenden Unterdomänen oder die abzurufenden Seiten beim Ausführen von Inhaltsdurchforstungen angeben möchten.

    Wichtig:

    Standardmäßig kann ein Connector für externe Inhalte bis zu indizieren Eine Million ( 1.000.000 ) Dokumente aus dem Quellsystem. Wenn ein Connector diesen Grenzwert überschreitet, durchforstet er weiterhin das Quellsystem, sendet jedoch nur Dokumentlöschungen und -Updates an KI-Suche Für die Indizierung, wobei neue Dokumente ignoriert werden. Der Connector protokolliert eine Fehlermeldung für alle 10.000 Dokumente, die er über die Indexierungsgrenze hinaus durchforstet.

    Wenn die Anzahl indizierter Dokumente eines Connectors überschreitet 800.000 , In der UI des Connectors wird eine Warnmeldung angezeigt, die darauf hinweist, dass die Indexierungsgrenze erreicht wird. Wenn der Connector die Indexierungsgrenze erreicht, wird in seiner Anwenderoberfläche eine Fehlermeldung angezeigt.

    Wenn einer Ihrer Connectors die Indexierungsgrenze erreicht, können Sie seine Durchforstungseinstellungen und Dateiein-/Ausschlussfilter aktualisieren, um die Anzahl der abgerufenen Dokumente zu reduzieren. Alternativ, wenn Sie mehr als indizieren müssen 1.000.000 Dokumente können Sie erstellen Kundenservice und Support Fall um https://support.servicenow.com/nowUm eine Erhöhung des Grenzwerts für den Connector anzufordern.

    Prozedur

    1. Navigieren zu Alle > Connectors Für Externe Inhalte > Administrator-Startseite für externe Inhaltean.
    2. Wählen Sie in der Liste Connectors den Datensatz für den Connector für externe Inhalte des Webcrawlers aus, dessen Einstellungen Sie ändern möchten.
    3. Im Connector-Editor Einstellungen Wählen Sie die Registerkarte aus Durchforstungseinstellungen .
    4. Geben Sie auf der Seite „Verbindungseinstellungen“ die Webquelle an, die Sie durchsuchen möchten:
      • Um Seiten und Subdomänen aus einer vordefinierten Webquelle zu durchsuchen, wählen Sie aus Vordefinierte Webquelle Und wählen Sie eine Webquelle aus der bereitgestellten Liste aus.
      • Um Seiten und Subdomänen aus einer Webquelle zu durchsuchen, die nicht in der Liste angezeigt wird, wählen Sie aus Anwenderdefinierte Webquelle .
    5. Wählen Sie Weiter.
    6. Um den Satz der Seiten und Unterdomänen anzugeben, die beim Ausführen von Inhaltsdurchforstungen durchforstet werden, wählen Sie eine der folgenden Optionen aus Inhaltsfilterung Optionen:
      • Wählen Sie aus, um alle Seiten und Subdomänen aus dem Quellsystem zu durchforsten Durchforsten Sie den gesamten Inhalt .
      • Um nur einen angegebenen Satz von Seiten und Subdomänen aus dem Quellsystem zu durchsuchen, wählen Sie aus Nur diese URLs einschließen , Und verwenden Sie dann URL hinzufügen Feld und Hinzufügen Schaltfläche zum Eingeben von URLs für Seiten und Subdomänen, die Sie in die Durchforstung aufnehmen möchten.

        Sie können beispielsweise eingeben https://support.apple.com/ipad Dient zum Einbeziehen nur durchsuchbarer Inhalte aus der angegebenen Subdomäne.

      • Wählen Sie aus, um alle Seiten und Subdomänen außer einem angegebenen Satz von Seiten und Subdomänen aus dem Quellsystem zu durchforsten Schließen Sie nur diese URLs aus , Und verwenden Sie dann URL hinzufügen Feld und Hinzufügen Schaltfläche zum Eingeben von URLs für Seiten und Subdomänen, die Sie von der Durchforstung ausschließen möchten.

        Sie können beispielsweise eingeben https://knowledgebase.paloaltonetworks.com/KCSArticleDetail Zum Ausschließen durchsuchbarer Inhalte aus der angegebenen Subdomäne.

    Ergebnisse

    Der Connector für externe Inhalte des Webcrawlers wird mit Ihren geänderten Durchforstungseinstellungen aktualisiert.

    Nächste Maßnahme

    Um Inhalte aus der öffentlichen Webquelle mithilfe Ihrer geänderten Durchforstungseinstellungen abzurufen, erstellen und führen Sie eine einmalige Inhaltsdurchforstung für Ihren Webcrawler-Connector für externe Inhalte aus. Informationen zum Erstellen und Ausführen einmaliger Inhaltsdurchforstungen finden Sie unter Erstellen Sie eine Inhaltsdurchforstung für einen Connector für externe Inhalte.