OCR识别平台

OCR Recognition Platform

需求背景:

深度学习OCR版本通过深度神经网络技术,不依赖于模板方式定位文字,而是直接整行识别文字,并返回文字的位置信息。它仅用三个工序即可完成整个识别过程:文字区域定位、整行识别、结构化输出。定位与识别均采用卷积神经网络CNN、循环神经网络RNN、长短期记忆网络LSTM技术实现,可在灰度图像上实现文字区域的自动定位和正行文字的OCR识别。尤其是后者,彻底弥补了传统OCR技术中单字识别技术无法借助上下文来判断形似字的问题。这些因素在低质量图片的抗干扰能力与识别准确率两方面得到了显著的提升,供业务流程自动化(RPA)项目使用。

业务目标:

1、封装OCR识别引擎的对外服务通讯接口,为行内各类业务应用的OCR识别需求提供标准OCR识别服务;本业务范围支持:柜面支付、银承、同城、账户业务的客户端调用业务需求;银行支票业务、银企对账业务、单证中心。

2、为扫描控件提供OPR版式及OCR识别结果。

3、深度学习接口供业务流程自动化(RPA)项目。

网络结构图:

实施效果:

1、对图像文件进行自动识别,能够高效、快捷的完成录入和分类;

2、提升后台处理效率,大大提升客户体验;

3、持续人工智能技术的相关应用,全面赋能各项业务快速发展,从而加速全行的数字化转型步伐。