文档识别开发零门槛 合合信息智能文字识别技术助推人工智能产业化落地 焦点播报
(资料图片仅供参考)
本报记者施露
6月27日,在元脑生态框架下,合合信息将智能文字识别技术与浪潮信息AI服务器、浪潮信息AIStation智能业务生产创新平台优势相融合,联合推出一站式智能OCR(光学字符识别)解决方案,帮助柳州银行等金融机构提升票证录入效率,节省人力资源成本。这也是继签署《元脑生态战略合作协议》后,合合信息与浪潮信息以生态力量助推人工智能产业化落地的典型实践。
银行票证的录入是简单重复却十分耗费人力成本的基础性工作。OCR技术能够将图像文件上的字符快速转换成数字化文本,具有高速、准确、低成本等优势,在业务系统中应用广泛。
随着银行业务数字化转型提速,票证录入智能化的需求也随之高涨,银行对OCR模型的开发周期、识别准确率、识别速度等要求也越来越高。银行需要构建面向各类涉及内容识别的场景的开发平台,针对特定单据快速开发定制化模型并进行模型迭代,同时解决样本初始化不足、缺少人工标注、凭证版式复杂、模型训练门槛高等问题。
合合信息智能解决方案事业部总经理李明表示,银行票据智能化系统搭建面临“两难”的现实困境:
一方面,银行业务流程中存在大量种类繁多的定制文档、不固定版式票证单证,常规的信息识别与抽取模型已经无法满足业务需求;另一方面,出于用户数据安全考虑,数据样本不允许离开银行网络环境,因此,定制模型的所有数据标注、训练生成与打磨,都必须在行内完成,对银行的科技能力提出了高要求。
传统的OCR技术普遍存在文档图像质量退化、文字检测及版面分析困难、非限定条件文字识别率低、结构化智能理解力差等缺陷。在AI技术的加持下,合合信息智能文字识别技术可有效解决上述问题,准确提取和识别背景复杂、清晰度不高、角度倾斜的票证图片中的文字,简化下游文档处理任务,提升银行票据的文字识别效率与准确性。
在与浪潮信息的元脑生态战略合作基础之上,合合信息共享浪潮信息在AI计算、资源与算法方面的全栈能力,并基于智能文字识别技术,联合打造了一站式智能OCR解决方案。据悉,该方案目前已在柳州银行等金融机构落地。具体实施中,柳州银行借助智能OCR解决方案实现了OCR开发“零门槛”,开发者基于几十张票证小样本,即可完成OCR模型开发;方案也大幅缩短了模型开发和迭代周期,使得模型训练时间从2天缩短为4小时,部署时间从2天缩短为5分钟。
(文章来源:证券日报)
关键词: