场景背景 OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。 在过往40余年的技术发展历程中,OCR始终具备很强的产业应用背景,是计算机领域里少数几个一开始就由工业界和学术界双轮驱动的领域。 近年来,在"智能手机+深度学习"这两个因素共同助推下,OCR技术的研发迎来了三个新的热点方向,分别是: OCR与智能文本处理(常称为IDP,Intelligent Document Processing)相结合,不仅识别文字本身,而且理解文字的版面、结构、表格元素、段落内容等,从而完成文本要素信息的还原和结构化抽取工作。 OCR与专业领域的符号识别相结合,如数学公式符号、物理公式、化学分子结构图、建筑图纸等等。 OCR与开放场景的文字识别相结合(常称为STR,Scene Text Recognition),例如路牌、店面招牌、商标文字、户外广告识别等。 业务难点 某大型国有通信基础设施服务企业数字化程度低,内部管理普遍偏弱。企业希望以报销环节为核心,通过对财税管理的数字化升级,提升员工报销体验,加强费用合规性,同时为领导层提供数据分析支持。 该企业财税管理涵盖了费用申请、消费、报销、对账、入账以及归档的各个环节。在报销环节中,报销单据难以识别、票据种类多数量大、票据处理时效性要求高、不同票据根据业务要求抽取字段不同等难点,导致财务稽核人员需熟记每类票据所需字段,不仅加大了工作量,还容易出错。 方案介绍 得帆云自开发OCR组件,支持用户根据实际业务需求来配置参数,便于获取相关 需要OCR识别内容 。用户可以依据自身需要完善组件设计,开发 同类型应用复用相关组件 。 可适用的业务场景包括且不限于: 财税报销 多余种常见税务发票、差旅票据自动分类、识别、录入,快速对接国税平台进行增值税发票验真,适用于企业税务核算及内部报销。 身份认证 自动识别录入用户身份/企业资质信息,可用于金融、政务、保险、电商、直播等行业,对用户、商家、主播进行实名身份认证。 文档电子化 识别提取各类办公文档、合同文件、企业年报、法律卷宗等纸质文档中的文字信息,并基于位置信息进行比对、结构化处理。 交通出行 卡证、车辆信息的快速录入,提升比对效率,适用于司机身份核验、车主信息管理、智慧停车、卡口通行、车辆维修保养等场景。 快递物流 综合应用多项OCR技术,实现快递分发全链路智能化升级,满足身份核验、智能寄件下单,运输车辆管理、面单信息提取等需求。 医疗保险 识别患者身份信息/各类医疗票据/医疗仪器盘数据,提升信息录入效率,助力提高保险理赔整体时效,并辅助病患管理、健康监测、处方单电子化等。 防疫申报 应用OCR防疫场景文字识别,实时识别健康码、核酸证明、通信行程卡内的关键信息,精准判断是否符合通行/考勤条件,助力疫情防控。 本期案例中,得帆云将 财务税票 和 OCR自开发组件 结合,只需简单配置,即可实现OCR识别功能,高效进行文字转换处理。 企业员工在报销、财税核对时,只需要提交税票截图,OCR就能识别出票据上相应的信息,并填报到系统中。财务人员也可快速完成影像附件与报账信息比对工作,大大提升工作效率。 操作步骤 后台配置 1.在「后台管理」的「拓展功能」中找到「自开发管理」。 2. 点击新增按钮,上传「web端自开发组件」的自开发文件,并备注相应说明。 3. 点击新增按钮,上传「后端自开发模板」的自开发文件,并备注相应说明。 4. 从「后台管理」——「应用管理」点击应用名,进入OCR测试应用中。 5. 进入「应用详情」后,点击「高级设置」,找到自开发配置。 6. 接下来,打开编辑抽屉页,添加自开发资源。 7. 找到之前在自开管理中添加的前后端的自开发包,分别添加。 添加成功后,会显示对应备注说明文字。 8. 然后我们关闭抽屉页,启用自开发配置。 9. 新建自开发OCR测试菜单。 10. 进入编辑菜单页,拖动自开发OCR组件到配置区域后,选择对应的识别类型。 11. 接下来,从常用组件中拖动需要识别的组件,修改对应的标题名称,再将需要识别出的字段赋值给对应已经创建的组件。 12. 以增值税发票识别为例,配置后样式如下。 13. 最后,保存该设置,关闭页面。 前台使用 1. 点击应用访问地址电脑端。 2. 进入应用前台,点击新增。 3. 点击上传区域后,上传需要识别的发票图片。 4. 系统即可识别该发票的相关信息并显示。 该发票支持预览,点击上传区域的眼睛icon即可预览。 项目总结 近年来人工智能理论和技术日益成熟,其应用领域也不断扩大,以OCR为代表的新一代智能技术发展给财务管理带来了新的发展契机。 全球财务行业都面临着来自科技革命的挑战, 智能财务 正在逐渐成为新的发展趋势。自开发OCR组件抽取关键票据信息及影像附件与报账信息进行比对,把财务人员从重复性的工作中拯救出来,有效促进财务人员向业务财务、专家财务、战略财务转型,全面支持企业整体转型升级。 面对不同的业务场景中不同的OCR识别需求,企业可以 自定义符合需求的OCR组件,一次开发,多次使用 。自开发OCR识别组件只是得帆云aPaaS自开发组件能力中的冰山一角,后续我们也会不断更新自开发组件,更好地为企业赋能。