Wortkorpus erstellen

  • Freigeben Version: Yokohama
  • Aktualisiert 30. Januar 2025
  • 3 Minuten Lesedauer
  • Erstellen Sie eine Sammlung von Wörtern und Ausdrücken, die als das Vokabular fungiert, das das System zum Vergleichen Ihrer Instanz-Datensätze basierend auf ihrer Text Ähnlichkeit verwendet. Sie können sich den Wortkorpus als ein Wörterbuch vorstellen, das Ihr maschinelles Lernsystem verstehen soll.

    Vorbereitungen

    Erforderliche Rolle: admin oder ml_admin
    Wichtig:
    Im Release Yokohama verwenden Modelle in den Frameworks für Klassifizierung, Clustering und Ähnlichkeit Workflow-Lösungen. Diese sind vortrainiert, sodass für Ihre neuen Lösungen kein Wortkorpus erforderlich ist.

    Nach dem Upgrade werden Ihre vorhandenen Lösungen mit einem Wortkorpus beim nächsten erneuten Trainieren zu Workflow-Lösungen. Außerdem wird das Feld „Wortkorpus“ aus dem Formular entfernt.

    Die folgenden Informationen werden für den Legacy-Kontext bereitgestellt.

    Warum und wann dieser Vorgang ausgeführt wird

    Der Hauptzweck eines Wortkorpus besteht darin, Textdaten zum Trainieren Ihres Modells NLU abzuleiten. Wenn Sie einen Wortkorpus in einer Lösung verwenden, müssen Sie ihn für das Training in der Lösungsdefinitionsphase einer Lösung angeben. Ein trainierter Wortkorpus kann lösungs- und fähigkeitsübergreifend wiederverwendet werden.

    Sie können einen Wortkorpus verwenden, um ähnlichen Datensatztext in einer Tabelle oder über mehrere Tabellen hinweg zu vergleichen. Ein Wortkorpus kann auch in anderen Szenarien hilfreich sein, z. B. beim Clustering, wo ähnliche Datensätze gemeinsam gruppiert werden, um ihre Daten zu analysieren, wiederzuverwenden oder zu überprüfen. Die Elemente, die Sie Ihrem Korpus hinzufügen, sollten unternehmens- und branchenspezifisch sein, damit Sie sie in anderen Ähnlichkeits- oder Clustering-Lösungen wiederverwenden und in verschiedenen Anwendungsfällen einsetzen können.

    In diesem Beispielverfahren arbeiten Sie an Datensätzen für Incidents und suchen nach relevanten Artikeln aus der Knowledge Base (KB), die Lösungen für diese Incident-Fälle enthalten. Ihr Ziel lautet, einen Wortkorpus zu erstellen, den Sie auf eine neue Ähnlichkeitslösung anwenden können, die aktive Incidents mit veröffentlichten KB-Artikeln abgleicht.

    Prozedur

    1. Navigieren zu Alle > Predictive Intelligence > Wortkorpus.
    2. Klicken Sie im Formular „Wortkorpus“ auf Neu.
    3. Konfigurieren Sie diese Felder gemäß der folgenden Anleitung.
      Feld Beschreibung
      Name Ein eindeutiger Titel, der den Inhalt Ihres Korpus beschreibt. In diesem Anwendungsfall können Sie beispielsweise einen Namen wie Aktive Incidents und veröffentlichte KBs eingeben. Der Name weist auf die Tabellen hin, die Ihr Korpus bei der Erstellung Ihrer Lösung durchsucht.
      Aktiv Aktivieren Sie dieses Kontrollkästchen, wenn Sie mehr als einen Wortkorpus gleichzeitig erstellen und deren Detailkomponenten später konfigurieren möchten. Andernfalls lassen Sie das Feld leer, da Sie es in einem späteren Schritt auswählen können.
    4. Wählen Sie Absenden.
    5. Suchen Sie in der Listenansicht „Wortkorpus“ nach dem neuen Wortkorpus, und klicken Sie auf den Wert Name, um den Datensatz zu öffnen.
    6. Klicken Sie im Abschnitt „Wortkorpusinhalt“ auf Neu.
    7. Konfigurieren Sie die folgenden Felder im Formular „Wortkorpusinhalt“ entsprechend den Anweisungen, um eine Inhaltskomponente Ihres Wortkorpus zu definieren.
      Feld Beschreibung
      Name Geben Sie einen Titel ein, der die Daten beschreibt, die Sie Ihrem Korpus hinzufügen möchten, z. B. Geschlossene Incidents der letzten 6 Monate.
      Tabelle Wählen Sie die Tabelle aus, die die Daten enthält, die Sie in Ihren Wortkorpus aufnehmen möchten. Wählen Sie für diesen Anwendungsfall Incident [incident] aus.
      Hinweis:
      Die Anzahl der Datensätze pro Tabelle, die in Ähnlichkeits- und Clustering-Lösungen zur Wortkorpuserstellung verwendet werden, ist auf 300.000 beschränkt.
      Filter Wählen Sie die folgenden Werte für die Filterbedingungen aus: [Abgeschlossen] [ist nicht leer] und [In den letzten 6 Monaten erstellt].
      Feldliste Wählen Sie für diesen Anwendungsfall Kurzbeschreibung, Beschreibung und Auflösungshinweise aus.
      Domäne Das System zeigt automatisch die Benutzergruppe für Ihren Korpus an. In diesem Anwendungsfall wird beispielsweise die globale Benutzergruppe angezeigt. Sie können auch andere Benutzergruppen auswählen.
    8. Wählen Sie Absenden.
    9. Wählen Sie im Abschnitt „Wortkorpusdetails“ Neu.
    10. Konfigurieren Sie diese Felder gemäß der folgenden Anleitung, um eine zweite Inhaltskomponente für Ihren Wortkorpus zu definieren.
      Feld Beschreibung
      Name Geben Sie einen Titel ein, der die Daten beschreibt, die Sie mit ihrer ersten Inhaltskomponente vergleichen möchten, z. B. Veröffentlichte KB-Artikel.
      Tabelle Wählen Sie die Tabelle aus, die die Daten enthält, die Sie mit Ihrer ersten Inhaltskomponente vergleichen möchten. Wählen Sie für diesen Anwendungsfall Wissen [kb_knowledge] aus.
      Hinweis:
      Die Anzahl der Datensätze pro Tabelle, die in Ähnlichkeits- und Clustering-Lösungen zur Wortkorpuserstellung verwendet werden, ist auf 300.000 beschränkt.
      Filter Wählen Sie für die Filterbedingungen folgende Werte aus: [Workflow] [ist] [Veröffentlicht].
      Feldliste Wählen Sie Kurzbeschreibung und Artikeltext aus.
    11. Wählen Sie Absenden.

      Die beiden Wortkorpus-Inhaltskomponenten werden im Wortkorpusformular angezeigt.

      Diese Abbildung zeigt die beiden Inhaltskomponenten, die Sie für Ihren Wortkorpus erstellt haben.
    12. Wählen Sie Aktualisieren.

    Ergebnisse

    Der von Ihnen erstellte Wortkorpus wird im Wortkorpusformular angezeigt und steht in Ihren Definitionsformularen für Ähnlichkeits- bzw. Clustering-Lösungen zur Verfügung.

    Wenn Sie auf Aktualisieren klicken, validiert das System das Hinzufügen der Komponenten, um den Korpuserstellungsprozess abzuschließen.

    Nächste Maßnahme

    Erstellen Sie eine Lösung im entsprechenden -Framework. Weitere Informationen finden Sie unter den Links im Bereich „Zugehöriger Inhalt“ auf dieser Seite.