Aktivieren Sie das anwenderdefinierte Einbettungsmodell für die semantische Indizierung

  • Freigeben Version: Zurich
  • Aktualisiert 31. Juli 2025
  • 1 Minute Lesedauer
  • Fügen Sie der semantischen Indexierungstabelle ein neues Einbettungsmodell hinzu, damit die KI-Suche Retrieval-Augmented Generation( RAG) Die Anwendung kann dieses Modell für die semantische Indizierung verwenden.

    Vorbereitungen

    Erforderliche Rolle: Administrator

    Prozedur

    1. Navigieren zu Alle, Und geben Sie dann ein ais_semantic_embedding_model.list Im Filter, um zu wechseln KI-Suche Tabelle „semantische Einbettungsmodelle“ [sys_generative_ai_config].
    2. Wählen Sie Neu.
    3. In Name Geben Sie einen eindeutigen Namen ein.
      Beispiel: Azure OpenAI Einbettung Von Großem Text.
    4. In Modell-Id Geben Sie eine eindeutige ID ein.
      Eine ID beginnt mit einem Buchstaben oder einer Zahl und kann Buchstaben, Ziffern, Punkte (.) oder Bindestriche (-) nach dem ersten Zeichen enthalten.
    5. In One Extend-Fähigkeitsdefinition Wählen Sie eine BYOM-Fähigkeitsdefinition aus, die Sie erstellt haben, um einen Anbieter für das Einbettungsmodell festzulegen.
    6. In Modellkonfiguration Feld ein Einbettungsmodell auswählen, das bereits konfiguriert ist.
    7. Wählen Sie Aktiv aus.
    8. Wahlweise: Wenn Sie die Batchverarbeitung für Ihr Einbettungsmodell konfigurieren möchten, führen Sie die folgenden Schritte aus:
      Batching hilft dem Einbettungsmodell, mehrere Eingaben gleichzeitig zu verarbeiten. Die Werte für die minimale und maximale Batch-Größe steuern, wie Eingaben gruppiert und verarbeitet werden, um die API zur Einbettungserstellung aufzurufen.
      1. Wählen Sie Aus Batching Unterstützt .
      2. In Minimale Batch-Größe Und Maximale Batch-Größe Geben Sie die erforderlichen Werte ein.
        Beispielsweise beträgt die Mindestanzahl von Eingaben, die in einem einzelnen Batch zulässig sind, 4 und die maximale Anzahl von Eingaben, die zusammen in einem Batch verarbeitet werden können, 16.
    9. In Fehler-Handler-Erweiterungsinstanz Feld eine Fehler-Handler-Instanz auswählen.
      Sie erstellen einen geskripteten Erweiterungspunkt, um Fehler bei der Einbettungsgenerierung zu behandeln, die auftreten, wenn anwenderdefinierte Einbettungsmodelle semantische Vektoren generieren. Weitere Informationen finden Sie unter Erstellen Sie einen Fehler-Handler-Erweiterungspunkt.
    10. Wählen Sie Absenden.

    Nächste Maßnahme

    Fügen Sie Ihr Einbettungsmodell der semantischen Indexkonfiguration hinzu, um die Inhaltserfassung mit diesem Modell zu ermöglichen. Weitere Informationen finden Sie unter Konfigurieren Sie Einstellungen für die semantische Indizierung für eine indizierte Quelle.