揭穿光学字符识别的神话:它是什么以及它如何影响应付账款

e-invoicing

花问题欢迎这篇文章来自贾斯汀霍尔顿,销售副总裁Yooz北美。

OCR:另一个技术术语,我们听到了很多关于这些天。特别感兴趣的在fintech(另一个新词汇,代表“金融技术”),甚至在应付账款更具体地说。但是,它到底是什么呢?更重要的是,什么不是它吗?和它是如何发挥作用的应付账款(美联社)工作流?

OCR代表光学字符识别。的机械或电子转换类型的图片,打印或者手写的文本,到machine-encoded文本。文本可以来自一个扫描文档,文档的照片,一个scene-photo(例如文本标志和广告牌上的景观图),或从字幕叠加在图像上的文本(如从一个电视台播出)。

它看起来像这样1:

简单地说,这是一个电脑看图片或文件,能够识别。和最大的错误就在于此。许多混淆OCR与数据提取。

那么,什么是OCR到底是什么?OCR技术,把图片变成文字。下一层、智能数据提取、理解和处理文本OCR转换成相关数据。你们很多人都正在探索美联社自动化供应商,你可能会问,“你有OCR技术?“这是一个重要的问题。但你真正想知道的是如果解决方案有一个完整的技术,结合光学字符识别,智能数据提取和机器学习。今天,有三个主要类型的萃取技术:

  1. 人类验证或外包提取
  2. Zonal-based提取,利用预定义的模板
  3. 系统基于人工智能(AI)或机器学习。

这些是必要的,作为OCR本身并不知道如何处理它读取的信息。一些供应商可能使用OCR,然后应用人类开采,外包给第三方,也称为第三方验证。OCR萃取层人类验证使用OCR人们把数据读到预定义的字段。在这个场景中数据输入是通过一个外包公司,需要时间作为数据被人,填充通常24 - 72营业时间。

在一个基于模板的数据抽取工具,用户必须预先确定具体文档”,“在一个特定的信息可以发现,“什么”的工具应该做它找到的数据。提取过程可以很快完成;然而,它也可以成为行政负担,作为模板必须改变管理和更新文件。在这种情况下,人类必须不断管理模板——读他们,理解他们,并更新他们。这可能失败的意图向美联社自动化,因为你不是节约时间,并且它甚至可能更多的耗时。甚至在某些方面重复努力。

使用人工智能或机器学习数据提取是能够“理解”需要使用文档和信息,更重要的是,应该做什么和说信息相关数据。例如,利用机器学习技术能够填充发票总额不教或显示的数据。因为该工具已经看到成千上万的例子可以借鉴过去的经验做出的结论。

当谈到一些美联社自动化解决方案、智能数据提取技术利用OCR阅读信息扫描/纸发票或发票的照片图片通过电子邮件收到。然后解释信息,提取相关数据,那么它在应用程序中相应的字段适用于审查和批准。最后,数据导出到ERP。如果有不能解释或读取的数据块,该技术随着时间的推移,学习如何提取这些丢失的部分。这被称为机器学习,是由人工智能

不断增强,没有最终用户参与教学软件。工作人员从手工数据输入和第三方验证简单地回顾数据提取的准确性。如果有一个小姐,内部的评论者可以点击应用程序快速正确,国旗小姐利用机器学习的优化,系统将随着时间的推移变得更加智能,减少错误。

今天的组织正在关注速度、效率,利用技术来解决业务问题。看选项时,先花时间去设置你的业务目标和确定需要解决的挑战。然后找到一个解决尽可能多的解决方案或全部的关键需求。当然,你可以问:“你有OCR吗?“但不要停止。继续挖,直到你有一个完整的理解每个解决方案你正在考虑,更重要的是,什么最适合您的业务。

1惠普企业发展资讯。2018年。检索2018年6月29日https://dev.havenondemand.com/apis/ocrdocument概述

在Procurious分享

讨论:

你的电子邮件地址将不会被发表。

这个网站使用Akismet来减少垃圾邮件。学习如何处理你的评论数据