データ正規化

  • リリースバージョン: Xanadu
  • 更新日 2024年08月01日
  • 所要時間:2分
  • ドキュメントから抽出された特定のタイプのデータは、すべてのフィールドで同じように表示されるように標準形式に変換されます。

    このプロセスにより、データのグループ化と分析が容易になり、データの有用性が高まります。また、 Now Platform上の他のアプリケーションとの統合もサポートしています。

    フィールドタイプ

    次のフィールドタイプは、データの正規化をサポートするように変換されます。

    フィールドタイプ Description (説明)
    日付 標準の日付形式。例:YYYY-MM-DD。
    参照フィールド

    別のテーブルのフィールドを標準として使用するフィールド。 ドキュメントインテリジェンス (DocIntel) は、抽出されたデータを標準と照合します。

    たとえば、ユースケースには、会社テーブルの [名前] 列を参照として指す [ベンダー ] という参照フィールドがあります。ドキュメントタスクを処理する際、 ドキュメントインテリジェンス (DocIntel) はドキュメントから「Degas Dairy Products, Inc」を抽出し、[ ベンダー ] フィールドにその値を入力します。 ドキュメントインテリジェンス (DocIntel) 値をリファレンステーブルの会社名と比較し、一致するものとして「Degas Dairy Products, Inc」を検索します。ドキュメントタスクでは、「Degas Dairy Products, Inc」が参照の「Degas Dairy Products, Inc」と一致しています。

    整数 整数。たとえば、12 です。
    10 進数 小数点以下第 2 位までの数値。たとえば、12.5 や 12.55 などです。
    浮動小数点数 小数点以下 7 桁までの数値。たとえば、12.0 から 12.0000000 です。

    フィールドタイプを設定するには、「 データ抽出用のフィールドを作成する」を参照してください。

    表示

    完了したデータ抽出フィールドの横に、変換された値が表示されます。

    データ抽出整数フィールドとその変換値フィールド。[データ抽出日] フィールドとその変換値フィールド。

    [ 編集] を選択すると、変換された日付値を調整できます。

    注:
    場合によっては、ドキュメントから抽出されたデータが、変換できる有効な形式ではないことがあります。たとえば、 ドキュメントインテリジェンス (DocIntel) 日付フィールド(11.12.2o23)で数字0ではなく文字Oを読み取った場合、変換されません。この場合、フィールドを正しい形式に編集してください。

    曖昧なデータ

    ドキュメントに複数の方法で理解できるデータがある場合、 ドキュメントインテリジェンス (DocIntel) はユースケース構成で選択されたデフォルトに基づいてその値を解釈します。 ドキュメントインテリジェンス (DocIntel) 、あいまいな値を正規化された形式に正確に変換するために、その値を解釈する必要があります。

    たとえば、ユースケースに 日付 フィールドがあり、あいまいな日付を解釈するためのデフォルトの順序として [Month first ] が選択されているとします。2024 年 1 月 2 日の日付を含むドキュメントがユースケースで処理されると、 ドキュメントインテリジェンス (DocIntel) はその値を抽出して変換するときに、その日付を 2 月 1 日ではなく 1 月 2 日として解釈します。

    このような場合、ドキュメントタスクを完了するユーザーは、あいまいな値の変換を確認または修正する必要があります。ユースケースのフィールドの構成によっては、変換が正確であることを確認するために、自動ドキュメント処理が中断される場合があります。