Text aus einer horizontalen Datei analysieren

  • Freigeben Version: Washingtondc
  • Aktualisiert 1. Februar 2024
  • 2 Minuten Lesedauer
  • Sie können die Analysestrategie nach Dateityp verwenden, um Text in Dateien der folgenden Formate zu analysieren: .ora (wird von verschiedenen Oracle-Produkten verwendet), .properties (üblich für Java), .xml und .ini. Für vertikale Dateien verwenden Sie stattdessen die Strategie zur Analyse vertikaler Dateien.

    Vorbereitungen

    Grundkenntnisse in der Programmierung sind wünschenswert.

    Erforderliche Rolle: pd_admin

    Warum und wann dieser Vorgang ausgeführt wird

    Sie können diese Parsing-Strategie nur für Textdateien verwenden.
    Warnung:
    Verwenden Sie diese Analysestrategie nicht für Nicht-Textdateien wie Binärdateien.

    Sie können mehrere Extrakte und Variablen definieren. Bei der Identifizierung von Text zur Extraktion in Variablen identifizieren Sie im Grunde die Textposition in einem Kontext.

    Sie können eine der folgenden Methoden verwenden:
    • Im Debug-Modus können Sie die entsprechende Zeichenfolge aus den Dateiinhalten im Textfeld auswählen. Für jede ausgewählte Zeichenfolge werden ihre Position und Trennzeichen im Verhältnis zum Kontext gespeichert. Dadurch können dieselben Definitionen auf andere Dateien mit derselben Struktur angewendet werden, obwohl der Text variiert. Es wird jedoch der gesamte Text in einem Kontext ausgewählt.

      Beispiel: Wenn Sie versuchen, im Textfeld einer XML-Datei mit der folgenden Zeile nur 456 auszuwählen, wird die gesamte Zeichenfolge zwischen den Schlüsselwörtern ausgewählt.

      <ciTypeID>123-456-7890000000</ciTypeID>
    • Im Formular „Erweiterte Analyseoptionen“ (außerhalb des Debug-Modus) können Sie ein Trennzeichen und eine Position zum Identifizieren der Textzeichenfolge angeben. Sie können dieses Formular auch verwenden, um eine genauere Auswahl als im Textfeld zu treffen.

      Beispielsweise können Sie ein Trennzeichen (-) und die Anzahl der Positionen angeben, die nach dem Trennzeichen (3) extrahiert werden sollen, um die Zeichenfolge (456) zu extrahieren.

    Prozedur

    1. Wählen Sie einen der Analysevorgänge aus der Liste Vorgang aus.
    2. Wählen Sie eine dieser Optionen aus der Liste Analysestrategie aus:
      • Oracle
      • JSON-Datei
      • Eigenschaftsdatei
      • XML-Datei
      • LDAP-Datei
      • INI-Datei
    3. Führen Sie im Debug-Mode folgende Schritte aus:
      1. Klicken Sie auf Abrufen oder Dateiinhalte abrufen, um den Inhalt Ihrer Analyse im Ausgabebereich anzuzeigen.
      2. Wählen Sie die Zeichenfolge im Textfeld aus.
        Alle übereinstimmenden Zeichenfolgen im gleichen Kontext werden automatisch ausgewählt.
      3. Weisen Sie im Formular „Variablennamen definieren“ die Zeichenfolge einer Variablen zu, indem Sie einen eindeutigen und aussagekräftigen Namen angeben und OKauswählen.
      4. Klicken Sie auf das Plus-Symbol, um zusätzliche Zeichenfolgen und Variablen zu identifizieren.
    4. Definieren Sie die zu analysierende Zeichenfolge im Debug-Modus oder im Formular „Erweiterte Analyseoptionen“ (außerhalb des Debug-Modus).

      Anzeige des Bereichs „Erweiterte Analyseoptionen“
      OptionBezeichnung
      Außerhalb des Debug-Modus (Formular „Erweiterte Analyseoptionen“)
      1. Klicken Sie auf Erweitert, und geben Sie den Stammpfad an. Der Stammpfad ist der Abschnitt (hierarchische Verzweigung in der Dateistruktur), in dem analysiert wird.
      2. Klicken Sie für jede Zeichenfolge und Variable auf das Plus-Symbol, um diese hinzuzufügen und die Felder entsprechend auszufüllen.
        • Name: Geben Sie den Spaltennamen an.
        • XPath-Abfrage: Geben Sie die XPath-Abfrage für die Zeichenfolge an. Beispiel: appcmd/APP/@APP.NAME
        • Trennzeichen: Geben Sie das Trennzeichen für die Zeichenfolge an.
        • Position: Geben Sie die Position der Zeichenfolge an.
    5. Zum Beenden des Erkennungsprozesses, wenn keine Ergebnisse gefunden werden, aktivieren Sie das Kontrollkästchen Falls nicht gefunden.
    6. Klicken Sie auf Erweiterte Elemente schließen.