fbpx

ドキュメントの理解に関するガイド

前書き

すべての業界が対処する1つの普遍的な課題がある場合、それは書類処理の蓄積です。Forbesによれば、毎日2.5兆バイトものデータが作成されています。これは処理が必要な大量のデータです。人事(HR)フォームから請求書や契約まで、世界中の企業は数え切れないほどの時間を費やしてドキュメントを読み、それらから情報を引き出し、その情報に基づいて正しいアクションが取られることを確認しています。これは日常業務であり、従業員はビジネス目標と会社の成長を促進するより価値の高いタスクではなく、手動で時間のかかる作業に集中する必要があります。

幸いなことに、そこだソリューション。データ処理の手動の日常的な作業を最小限に抑え、従業員をより価値の高いタスクに戻すことができます。

人工知能(AI)の進歩により、難易度の高いドキュメントを読み取り、必要な情報を引き出し、必要な場所に渡すことができるソフトウェアロボットの開発が高レベルの精度と信頼性で実現されました。これにより、通常は高度に手動の処理を必要とするさまざまなドキュメント集約型の業務の自動化が可能になります。Robotic Process Automation(RPA)は、これらの日常的なビジネスタスクに不可欠な時間とコストを節約して対処できます。次に、インテリジェントドキュメント処理とも呼ばれるドキュメント理解は、RPA業界で最も急速に成長しているセグメントの1つです。特に、ガートナーは、RPAによって財務部門が毎年25,000時間の回避可能な事務処理を節約できると予測しています。

ドキュメント処理の自動化には、多くのビジネスアプリケーションがあります。最も一般的な使用例には、請求書処理、保険金請求、新規患者のオンボーディング、配達証明、および注文フォームが含まれます。また、多言語ドキュメント処理やモバイルキャプチャなど、より高度な形式のデータ処理にも使用できます。

インテリジェントなドキュメント処理には、いくつかの重要な利点があります

  • 運用効率の向上:大量のドキュメント処理に費やす時間とコストを削減し、実際のビジネス投資に費やす時間を増やします。
  • カスタマーエクスペリエンスの向上:卓越したカスタマーエクスペリエンスで顧客の尊敬を勝ち取るために、顧客への対応のスピードを加速します。
  • リスクの軽減:人的エラーのリスクを排除して、関連する損失からあなたとあなたの顧客を救います。
  • 従業員のエクスペリエンスを向上させる:従業員を運用面での問題から解放し、より価値の高いタスクと目的に集中できるようにします。

Everest Group Researchによる最近の発表によると、インテリジェントなドキュメント処理による自動化により、企業は設備やテクノロジーなどの非人的コストを9〜17%削減しています。この調査によると、これは年間20万ドルから40万ドル節約できることを意味します。

この記事では、ドキュメントを理解する方法を学びます:

  • フォームやパスポートなどの構造化文書を読み取り、処理します。
  • 請求書や領収書などの半構造化されたドキュメントから情報を理解して引き出します。
  • 契約書やメールなどの非構造化文書の処理をお手伝いします。
  • 手書き、署名、チェックボックス、表などの特殊要素にも対応します。
  • ドキュメントの処理を自動化し、チームの時間とリソースを節約するだけでなく、人為的ミスのコストとリスクの削減を支援します。
  • 当社の豊富なパートナーエコシステムと統合し、UiPathプラットフォームに組み込まれた最先端のテクノロジーにアクセスできます。

ドキュメント理解とは?

ドキュメントの理解とは、ドキュメントデータの読み取り、解釈、および自動的な操作を説明するために使用される用語です。何最も重要なのは、このすべては、ソフトウェアロボットによって行われます。機械学習機能を組み込んだインテリジェントなドキュメント処理テクノロジーにより、ロボットの人工知能はデジタルアシスタントとしてドキュメントを理解できます。このように、ドキュメントの理解は、ドキュメント処理、AI、RPAの交点で生まれると言えます。

UiPathは、文書の理解を設計しました- 組織が、読んで理解し、自動的に文書内のさまざまな情報を処理するために開発AI-強化ソリューション-ロボットの助けを借りています。このプロセスの自動化がビジネスにどのように多くの利益をもたらすことができるかについて話しましたが、少し深く掘り下げましょう。

ドキュメントが通常どのように処理されるかを考えます。人間もロボットも、それらを読んで内容を理解し、それに基づいて行動する必要があります。一部の文書では、パスポートやシンプルな形のように、それはだデータを発見し、それを処理するのは簡単。人がアメリカ市民権を持っているかどうかを確認する必要がある場合は、パスポートですぐに見つけることができます。しかし、法的書類や銀行取引明細書などの他の文書では、情報の検証が困難で時間がかかる場合があります。ただ、誰も聞いています、それはかかる時間を見直し税や法的形態に持っていましたの!大量のドキュメントや、契約などの固定構造のないドキュメントを処理するのに必要な時間を想像してください。これは、困難で不完全な手動プロセスになる可能性があります。

ドキュメントに保存されている重要な情報がビジネスに与える影響について考えてみましょう。請求書、領収書、契約書、および請求書には、重要で詳細な情報が含まれています。この情報は、当社の収益性と効率に影響を与えます。これは、あらゆるビジネスが直面する可能性のある課題であり、ソリューションを必要としています。これは、このデータの一貫した解釈を可能にし、企業が人材を貴重なタスクに転用できるようにするドキュメント自動化のシステムです。

UiPath Document Understandingは、自動化されたインテリジェンススキルを使用して、ロボットにドキュメントの読み取り、理解、操作を行わせることで、複雑なドキュメント処理に対処し、手動での抽出の頭痛を解消します。これらのロボットは、エラーのリスクを排除し、高速かつ高精度で作業できます。ドキュメントの種類や形式が変わった場合でも、ドキュメントデータの場所を自動的に決定します。ロボットは、ビジネスに必要な精度でドキュメントを読み取ります。

ドキュメントをインテリジェントに処理する

データの抽出と解釈のためのインテリジェントなドラッグアンドドロップスキルを使用してドキュメントを理解するようにロボットを指導します。UiPathは、高速で正確なドキュメント処理のための柔軟なテクノロジーを提供します。

柔軟性

さまざまなアプローチを組み合わせることで、さまざまな種類と形式のドキュメントを処理できます。ドキュメントの形式が変わっても、AIはデータの場所を特定できます。

知性

ロボットは、ドキュメントが回転したり歪んだりしていても、ドキュメントを理解して操作できます。彼らは必要に応じて従業員の検証を要求でき、人間が検証したデータから自動的に学習します。

正確さ

これらのモデルを使用すればするほど、モデルはより訓練され、正確になります。これにより、人的ミスのリスクが排除され、コンプライアンスが確保され、従業員がやり直しに費やす時間を削減できます。

速さ

幅広いドキュメントの大量ドキュメント処理をシームレスに自動化して、エンドツーエンドの自動化でコストと時間を節約できます。

ドキュメント理解フレームワーク

UiPath Document Understandingオートメーションは、以下に示すフレームワークに従って動作します。

  1. 分類をロード
    分類が読み込まれます。ここでは、抽出するファイルとデータを定義および設定します。
  2. デジタル化
    テキストとその場所をデジタル化します。これは、次のステップのドキュメントとデータを標準化するのに役立ちます。
  3. 分類
    ドキュメント理解は、指定されたリストからドキュメントを分類します。
  4. エキス
    ルール、テンプレート、機械学習(ML)モデルを使用して、ドキュメントからデータを抽出します。
  5. 検証
    必要に応じて、従業員が結果を検証または修正する場合があります。
  6. 書き出し
    ドキュメントデータは、ビジネスニーズに応じてさまざまなシステムでさらに使用するためにエクスポートされます。

ドキュメント理解フレームワークの重要なコンポーネントであるドキュメントデータの抽出について詳しく見てみましょう

ドキュメントデータを抽出する場合、3つの異なるアプローチをとることができます。UiPath Document Understandingは、ルールベースまたはモデルベースのアプローチを使用できます。または、それらを組み合わせてハイブリッドアプローチにすることもできます。処理されるドキュメントのタイプに基づいて、さまざまなアプローチが使用されます。たとえば、データの位置が固定されたドキュメント、または後でそれらを「構造化ドキュメント」と呼ぶ場合、ルールベースのアプローチが必要になります。さまざまなテンプレートがあり、構造化されたデータが少ないドキュメント、または「半構造化されていない」ドキュメントには、MLモデルが必要です。ハイブリッドソリューションは、ほとんどが構造化されていないか、特別なアプローチが必要なドキュメント用に作成されます。

ルールベースまたはテンプレートベースのアプローチは、特定のユーザー指定のルールに基づいてアクションを実行します。誰かのメールアドレスをブロックすると、その一人からのメールを受信しないようにすることを考えてください。その「送信者をブロック」ボタンをクリックすると、ルールが作成されます。または、Word文書やPDF などの単純な検索機能でクエリを想像してみてください。クエリが入力されるたびに、これらの検索関数はユーザー指定のルールに基づいて検索を実行します。

一方、機械学習(ML)モデルは、動的な状況に対応する方法を学習します。つまり、静的なルールやテンプレートを適用できない場合に、データを見つけて抽出する方法が教えられます。これは、それらをデータセットに公開し、さまざまな状況でどのように行動するかを伝えることによって行われます。いったん教えられると、MLモデルは、学習したことを予期しないイベントに適用できます。メールの例に戻りましょう。はい、迷惑なメールアドレスをブロックすることは良いことです。しかし、何がさらに良いか知っていますか?スパムブロッカー– MLを使用して、非スパムメールからスパムメールを認識する方法を学習した後、数千ではなくても数百の元のメールを除外する例です。ここで、もう一度検索エンジンのシナリオを想像してみましょう。基本的な検索エンジンはルールに基づいて関連データをスキャンしますが、GoogleやBingのような高度な検索エンジンはMLを使用します。これにより、ユーザーはクエリ、類義語、関連トピックの傾向を識別し、ユーザーに関連するコンテンツを見つけることができますが、ユーザークエリとは異なる場合があります。

実際、MLモデルを学習するには時間が必要です。幸いなことに、一般的なドキュメントとあまり一般的でないドキュメントを処理するように事前トレーニングされた、すぐに使用可能なモデルを利用できます。彼らはまた、カスタムデータに基づいて再訓練することができます- より多くのあなたは、モデルとあなたが買ってあげるより正確な結果を働きます。さらに、UiPathは特定のビジネスニーズに合わせてカスタムモデルを構築するのに役立ちます。

場合によっては、より効果的なデータ抽出を保証するために、ルール、テンプレート、MLモデルを組み合わせる必要があります。これは、ハイブリッドアプローチまたはマルチアプローチと呼ばれます。ハイブリッドソリューションは、構造化データを抽出するために特定の事前定義されたルールを利用する一方で、MLモデルを使用してドキュメントのあまり構造化されていない部分を認識および処理します。同様に、この組み合わせはより高い精度を実現します。ドキュメントごと、またはフィールドごとに別々の抽出プログラムが個別にセットアップされます。以下に示すように、ハイブリッドアプローチでは、ドキュメント理解フレームワーク内で任意のエクストラクターを組み合わせることができます。各ドキュメントまたはフィールドに最小信頼しきい値が設定され、特定のパーツに最適なエクストラクターが定義されます。

一部のデータはルールまたはテンプレートを使用して抽出できないため、一部の構造化ドキュメントでは、ルールベースの方法論だけでは不十分です。同様に、モデルベースの方法だけでは、すべての非構造化および半構造化ドキュメントに対して機能するわけではありません。複雑なドキュメントを処理していて、データ抽出プロセス中に最高レベルの精度を達成したい場合は、マルチアプローチのデータ抽出を使用することを強くお勧めします。

しかし、どのアプローチを使用するか(ルール、テンプレート、MLモデル、またはそれらの組み合わせ)をどのように決定しますか?私たちがきた構造化、半構造化、非構造化-すでに述べたように、すべての文書は、次の3つのカテゴリに分けることができます。これらの各カテゴリの処理には異なるアプローチが必要であるため、両者の違いを理解することが重要です。ドキュメントの理解を進め、ドキュメント処理をインテリジェントに自動化することができます。

ドキュメント処理を自動化する方法

ルールベースのアプローチとモデルベースのアプローチの両方を使用して、さまざまなドキュメント構造のデータを処理できます。ドキュメントの構造タイプは、サンプル間で設定および修正されるドキュメントの量を指します。ドキュメントが構造化されているか、半構造化されているか、または非構造化されているかに関係なく、UiPath Document Understandingはロボットにドキュメントの読み取り、分析、処理を教えることができます。

構造化ドキュメント

構造化ドキュメントでは、ドキュメントの構造とレイアウトが固定され、情報フィールドにラベルが付けられ、位置が一貫しています。診療所で記入したフォームについて考えてください。新しい患者のフォームはすべて同じであり、同じ場所に同じ[NAME]ボックスと[ADDRESS]ボックスがあります。チェックボックスなど、重要なデータにテキストではなく記号やマークが付けられている場合があります。答えだけが異なります。これは構造化文書です。

これらのタイプのドキュメントの場合、推奨されるアプローチは、テンプレートまたはルールを使用して情報を抽出することです。これは最高の精度を提供し、実装が最も簡単です。

ルールベースまたはテンプレートベースのアプローチでは、一連のルールを使用して、どのデータを読み取って収集するかを決定します。たとえば、すべての患者のフォームの最初のボックスが患者の名前になり、右上隅の数字が日付になることをロボットに知らせるルールを確立できます。つまり、特定のルールを設定してテンプレートを作成できます。UiPath Document Understandingを使用する場合、既存のドキュメントテンプレートを使用するか、独自のルールを作成して構造化データを読み取ることができます。

私たちが議論してきた新しい患者形態についてもう一度考えてみましょう。医師のオフィスでは、ドキュメント理解を使用して、新しい患者フォームから情報を取得し、各患者の保険会社に送信するプロセスを自動化できます。患者フォームが構造化されていることを知っているので、保険会社が必要とする情報をどこに見つけ、どのように保険会社に送信するかをロボットに伝えるルールを確立できます。これにより、看護スタッフは、保険の書類を扱う代わりに患者の世話をすることができます。特に、これは繰り返しの事務処理に費やされる時間数を削減することでお金を節約し、患者がオフィスを移動する速さや1日の診察回数を増やすことで収益を高め、人的ミスの可能性を軽減します。

ルールベースのアプローチは、理解しやすく、実装しやすく、ROIを迅速に提供できます。

ルールベースのアプローチは構造化されたデータに最適ですが、構造化されていないドキュメントに苦労しています。ルールベースのソリューションは固定パーツに依存しているため、フォーム構造の小さな変更でもルールが機能しなくなる可能性があります。たとえば、医師の例の保険会社を覚えていますか?保険会社は、数百の異なる診療所から数百の異なる形式で患者情報を取得している可能性があります。ルールベースのツールでは、それをすべて理解するために100の異なるルールが必要になります。これは、実現不可能なレベルの準備です。

そのため、UiPath Document Understandingは、構造化されていないドキュメントを処理するための他のソリューションを提供しています。半構造化されたものから始めましょう。

書類の種類

  • 構造化
    手書きのテキスト、署名、チェックボックス(フォーム、パスポート、ライセンス、タイムシート)を含むことができる、構造化されたテンプレートを備えた反復的なフォームとドキュメント
  • 半構造化
    テーブルなどの固定部品と可変部品を含むドキュメント(請求書、領収書、注文書、医療費、銀行取引明細書、公共料金)
  • 非構造化
    固定形式のない文書(さまざまな契約、契約、電子メール、病気の説明、処方箋、ニュース、音声スクリプト)

半構造化ドキュメント

半構造化文書はすべて同じ情報を持ち、異なる文書の異なる場所に配置されています。従業員が出張で昼食を費やすことができる会社を考えてください。会社が十分に大きい場合、あらゆる種類の国やレストランから毎年何万もの領収書を受け取ることができます。人事部門の従業員は手作業で経費を処理することができますが、それは退屈な低価値の仕事です。あなたは誰かに小数を間違えて、100ドルではなく1,000ドルを払い戻すように頼むだけです。人間だけに頼るのではなく、償還する必要がある金額を読み取るようにロボットを訓練し、償還を行うか、誰かが限界を超えて支出しているかどうかを経営陣に知らせることができます。また、ドキュメントを正しく理解しているという一定の信頼度のしきい値に達した場合にのみ自動的に動作するようにマシンをプログラムすることもできます。信頼レベルがそのしきい値を満たしていない場合、ドキュメントはレビューのためにHRに送信されます。

タスクをロボットに渡すことで、昼食の領収書の読み取りに費やされるHR時間を軽減し、価値を高める活動に費やす時間を解放し、エラーの可能性を減らします。半構造化ドキュメントは、ユーザーテンプレートやルールベースのアプローチよりも少しカスタマイズが必要ですが、そのため、通常、事前トレーニングまたはカスタマイズされたMLモデルが推奨されます。または、ルールとMLモデルの両方を組み合わせて抽出するというハイブリッドアプローチを選択できる場合もあります。

ただし、MLモデルにはいくつかの欠点がないわけではありません。それらは非決定的です。つまり、すべてのドキュメントが正確さまたは信頼スコアで返されます。モデルは学習パターンであるため、具体的なルールを操作するのではなく、修正直後に最初の間違いをする可能性があります。ただし、これらの欠点の解決策は簡単です。MLモデルが処理するサンプルが多いほど、正確さを保証するために学習するパターンが多くなります。

非構造化ドキュメント

非構造化ドキュメントは複雑で、固定構造はまったくありません。半構造化文書と非構造化文書の主な違いは、抽出された値のキーがないことです。キーは、ベンダー名、日付、価格、金額、合計、請求書の通貨など、ドキュメントで検索する一貫したフィールドです。キーは、半構造化ドキュメントのドキュメントごとに位置を変更する可能性がありますが、非構造化ドキュメントでは、検索するキーがまったくありません。

非構造化ドキュメントの例としては、カスタマーサービスリクエストの電子メールがあります。この例では、各メールは一意になります。MLモデルでこれらのメールを正確に処理するには、ロボットは、書かれたテキストを電話番号などの実用的なデータに変換する方法を学ぶ必要があります。構造化文書または半構造化文書では、電話番号は「電話番号」フィールドで識別されます。ただし、構造化されていないドキュメントの場合、モデルは特定の7桁または10桁の番号パターンを電話番号として抽出する必要があることを学習する必要があります。この形式のデータ抽出では、このタスク専用に調整された堅牢なMLモデルが必要です。ドキュメントの一部がより構造化されている場合のハイブリッドアプローチより複雑なケースでは、これがパートナーシップネットワークの出番です。

非構造化ドキュメントの場合、UiPath Document Understandingをパートナーの豊富なエコシステムと組み合わせて、非構造化データ抽出のニーズを満たすことができます。パートナーike Indicoには、クラウドまたはオンプレミスを通じて展開可能な非構造化ドキュメントを処理できるモデルがあります。同様に、ドキュメント理解エコシステムを活用して、ドキュメント処理におけるその他のビジネスニーズをカバーできます。

クイックリファレンスツール

  • ルールベースのアプローチ
    事前定義されたルールまたはテンプレートに基づいてアクションを実行します。これらは数日でセットアップできますが、ニーズが複雑になるにつれて、必要なメンテナンス時間が面倒になる可能性があります。
  • 機械学習モデル
    AIとトレーニング済みのデータセットを使用して、新しい動的な状況に学習を適用します。彼らは、設定に時間がかかるまで、しかし、時間の経過と複雑さが増すにつれてよりスケーラブルです。

手書き、署名、チェックボックス、およびその他の特殊なケース

一部のドキュメントでは、手書き、署名、チェックボックス、表、または非ラテン系のアルファベット文字を特徴とすることで、難易度を一段高くしています。我々はその可能性に備えます。UiPath Document Understandingは、これらの特殊なケースからドキュメントデータを抽出するために使用できるソリューションを提供します。

たとえば、人間の手書きは個人ごとに異なります。これは、入力されたテキストを取得する標準の光学式文字認識(OCR)エンジンに明らかな課題を提示します。これらの場合、UiPath Document Understandingは手書きに特別な組み込みテクノロジーを適用し、文字ごとに抽出できるようにします。このプロセスはより困難で時間がかかる可能性がありますが、高い信頼性と精度でデータを抽出する必要があります。

署名やチェックボックスなどの特別なケースを含むドキュメントの場合、ドキュメント理解は、ドキュメントが署名されたとき、またはチェックボックスがチェックされたときを検出できます。同様に、テキストフィールドと対応する値の間の正しい相関関係を維持しながら、テーブルからデータを抽出できます。

別の特殊なケースは、ラテン語以外のスクリプトまたは日本語や中国語などのアルファベットから文字を識別することです。MLモデルはパターンを見つける前に多くのサンプルに触れる必要があるため、外国語は課題を提示する可能性があります。UiPath Document Understandingは最も一般的な言語で動作し、次のリリースでは日本語と中国語の両方のスクリプトのサポートが期待されています。中東、アジア、またはインドのスクリプトから文字を抽出する必要があるユーザーは、この機能のためにパートナーの多様なネットワークを活用できます。

適切なモデルの選択には多くの変数があるため、ドキュメント処理のニーズに最適なソリューションを選択するための簡単な視覚的なガイドを概説しました。

あなたのビジネスにおける機械学習モデル

ドキュメント理解をデータソリューションとして非常に強力なものにしているのは、AIの多様性をRPAにもたらす能力です。Chevronの例でわかるように、MLモデルはより多くのドキュメントサンプルに遭遇すると学習するため、ドキュメント処理の自動化の速度と正確性は時間の経過とともに悪化します。自動ドキュメント理解により、シェブロンは次のことを実現しました。

  • 長い詳細なドリルレポートの処理時間の短縮。
  • アナリストがより価値の高いタスクに集中するためのより多くのリソース。
  • ビジネスリーダーや意思決定者のためのより多くの利用可能な情報。

世界的な飲料メーカーのUiPath Document Understandingにより、ロボットは飲料やスナック製品のラベルをすばやく読み取り、製品に印刷する前に詳細が正しいことを確認できました。この小さなタスクは、この会社が年間200億以上の製品にラベルを正確に印刷するのに役立ちます。

MLモデルとAIで強化されたドキュメント処理の能力をビジネスにもたらすことで、測定可能な結果と迅速なROIの両方を実現できます。エベレストグループリサーチのSmart RPA Enterprise Playbookによると、AIの強化された自動化を実装する6つの企業には多くのメリットがあります。

1つ目は、総コストの大幅な削減です。プロセスが自動化されているため、施設とテクノロジーのコストは33〜38%も削減できます。従業員の経費も、導入後に27〜40%も削減できます。全体として、実装により、3年間のリスク調整後投資収益率(ROI)が250%、予想される回収期間が12か月に加えて、25〜40%の安定した正味の節約が実現されることがわかりました。

メリットはコストだけではありません。企業はまた、プロセスの正確性の向上、新しいビジネスモデルの作成の改善、顧客体験の向上を報告しました。MLモデリングとAI拡張ドキュメント処理への投資が、短期的および長期的なメリットをビジネスにもたらすことは明らかです。

結論

企業は毎日、ドキュメントデータの読み取り、理解、処理に多くの時間を費やしています。このプロセスを自動化することで、リスクと不確実性を軽減することは言うまでもなく、ビジネスがお金と時間の両方を節約できることを実証しました。UiPath Document Understandingを使用してドキュメント処理のニーズを自動化すると、ビジネスニーズに合わせて慎重に作成されたソリューションが作成されます。

お客様のドキュメントは、構造化、非構造化、半構造化など、さまざまな形式で提供される場合があることを理解しています。手書きやチェックボックスなどの特別な部分がある場合があることはわかっています。また、完全な自動化ライフサイクルを提供するソリューション、またはすぐに使用できるソリューションが必要な場合もあります。UiPathドキュメント理解は、これらすべてのニーズに対処するために構築されました。

さまざまな形式のドキュメントを処理するために、ドキュメント理解では、各ビジネスケースに適したルールベース、MLベース、ハイブリッドのアプローチを提供しています。事前に構築されたどのモデルがドキュメント処理の課題に適合しているかを特定し、すぐに導入できるソリューションを見つけることができます。独自の課題と機会に合わせて、カスタムモデルを一から再トレーニングまたは構築できます。また、構造化されていないドキュメントやあまり一般的でない複雑なケースでは、豊富なパートナーエコシステムを利用して、ルールベースのテンプレートとMLモデルの最高のものを組み合わせることができます。自分の目で確かめてください。ドキュメント理解機能をテストするためにEnterprise Cloud Platformトライアルにサインアップしてください。

SNSでもご購読できます。

コメントを残す

*