Datennormalisierung

  • Freigeben Version: Xanadu
  • Aktualisiert 1. August 2024
  • 1 Minute Lesedauer
  • Bestimmte aus Dokumenten extrahierte Datentypen werden in ein Standardformat konvertiert, sodass sie in allen Feldern gleich angezeigt werden.

    Dieser Prozess erhöht den Nutzen der Daten, indem er eine einfachere Gruppierung und Analyse ermöglicht. Es unterstützt auch die Integration mit anderen -Anwendungen auf Now Platform.

    Feldtypen

    Die folgenden Feldtypen werden konvertiert, um die Datennormalisierung zu unterstützen:

    Feldtyp Beschreibung
    Datum Standarddatumsformat. Beispiel: JJJJ-MM-TT.
    Referenzfeld

    Ein Feld, das ein Feld in einer anderen Tabelle als Standard verwendet. DocIntel gleicht die extrahierten Daten mit dem Standard ab.

    Beispiel: Ein Anwendungsfall besitzt ein Referenzfeld namens Lieferant, das auf die Spalte „Name“ in der Tabelle „Unternehmen“ als Referenz verweist. Bei der Verarbeitung einer Dokumentaufgabe extrahiert DocIntel „DegasDaryproducts, Inc“ aus dem Dokument und füllt das Feld Lieferant mit diesem Wert aus. DocIntel vergleicht den Wert mit den Unternehmensnamen in der Referenztabelle und findet „DegasDaryproducts, Inc“ als Übereinstimmung. In der Dokumentaufgabe wird „DegasDaryproducts, Inc.“ mit „DegasDairprodukte, Inc.“ in der Referenz abgeglichen.

    Ganzzahl Ganze Zahl Beispiel: 12.
    Dezimalzahl Zahl mit bis zu zwei Nachkommastellen. Zum Beispiel 12,5 oder 12,55.
    Gleitkommazahl Zahl mit bis zu sieben Nachkommastellen. Beispiel: 12,0 bis 12,0000000.

    Informationen zum Festlegen des Feldtyps finden Sie unter Erstellen Sie ein Feld für die Datenextraktion.

    Anzeige

    Neben einem abgeschlossenen Datenextraktionsfeld wird der konvertierte Wert angezeigt.

    Ganzzahlfeld für die Datenextraktion und Feld für konvertierten Wert. Datumsfeld für die Datenextraktion und zugehöriges Wertfeld

    Sie können den konvertierten Datumswert anpassen, indem Sie Bearbeitenwählen.

    Hinweis:
    In einigen Fällen liegen die aus dem Dokument extrahierten Daten möglicherweise nicht in einem gültigen Format für die Konvertierung vor. Wenn DocIntel beispielsweise den Buchstaben O anstelle der Zahl 0 in einem Datumsfeld (11.12.2o23) liest, wird dies nicht konvertiert. Bearbeiten Sie in diesem Fall das Feld im richtigen Format.

    Mehrdeutige Daten

    Wenn ein Dokument Daten enthält, die auf mehrere Arten verstanden werden können, interpretiert DocIntel diesen Wert basierend auf dem Standard, der in der Anwendungsfallkonfiguration dafür ausgewählt wurde. DocIntel muss einen mehrdeutigen Wert interpretieren, um ihn genau in das normalisierte Format zu konvertieren.

    Beispiel: Ein Anwendungsfall verfügt über ein Datumsfeld, und Monat zuerst wird als Standardreihenfolge zur Interpretation mehrdeutiger Datumsangaben ausgewählt. Wenn ein Dokument, das das Datum 1.2.2024 enthält, für den Anwendungsfall verarbeitet wird, interpretiert DocIntel dieses Datum als 2. Januar und nicht als 1. Februar, wenn der Wert extrahiert und konvertiert wird.

    In solchen Fällen muss der Benutzer, der eine Dokumentaufgabe abschließt, möglicherweise die Konvertierung mehrdeutiger Werte bestätigen oder korrigieren. Abhängig von der Konfiguration des Felds im Anwendungsfall kann die automatisierte Dokumentverarbeitung unterbrochen werden, um sicherzustellen, dass die Konvertierung korrekt ist.