人工智能技术在档案OCR工作中的应用(四)
基于人工智能技术的OCR
近年来,随着计算机视觉、自然语言理解、知识图谱等人工智能技术在OCR中的实际使用,OCR的性能和效率都得到了很大提升。通过深度学习的自适应学习驱动方式,能够更好地应对传统OCR产生的一些问题,简化参数预处理的流程,实现端到端的处理,提高OCR识别率。目前,基于人工智能技术的OCR在简体印刷文字方面的识别率已达98%以上。
人工智能OCR技术还能应用于具有多样性和复杂性的识别场景。如,不同大小、字体、颜色、亮度、对比度的文字,排列和对齐方式不相同的文字,图像的非文字区域与文字区域存在相似的纹理,低对比度、模糊断裂、残缺文字等。因此,人工智能OCR不仅能应用于文档的识别,还可应用于自然场景文字图像的识别。此外,人工智能OCR还能提高工作效率、节省大量成本。
基于此,将人工智能OCR应用在档案工作中,具有重要的作用和意义,必将成为支撑档案行业数字转型、智能升级、融合创新的重要基础。
人工智能OCR工作流程主要包括图像输入、文本检测、文本识别、人工确认、人工干预等。
首先,将需要识别的纸质档案数字化副本图像单个或批量导入OCR系统中。
其次,进行文本检测。文本检测主要是定位文字在数字图像中的位置,并进行位置标注。文本检测的方法主要有基于候选框的文本检测、基于语义分割的文本检测,以及基于两种方法的混合方法等。基于候选框的文本检测是先预生成若干候选框,之后再回归坐标和分类,最后经过NMS(非极大抑制)算法得到最终的检测结果;基于语义分割的文本检测是通过FPN(特征金字塔网络)直接进行像素级别的语义分割,并处理得到相关的坐标。
【来源:安源区人民政府_部门动态】
声明:此文版权归原作者所有,若有来源错误或者侵犯您的合法权益,您可通过邮箱与我们取得联系,我们将及时进行处理。邮箱地址:jpbl@jp.jiupainews.com
全新帝豪L造型曝光能量风暴新设计夺眼球近日,吉利公布一组全新帝豪L的黑棚官图。新车首次何用能量风暴新设计风格。酷炫的未来科技感,以全新的设计风格进一步满足数字化时代年轻消费群体的个性化多元化需求。从曝光图来看,帝豪L的
30万MPV破局者,第四代嘉华正式上市第四代嘉华为破局而来。国内中高端MPV一直被别克GL8统治,虽有艾力绅威然等后来者,也有即将上市的赛那,但都没有真正撼动过GL8的地位。作为起亚品牌焕新的全新车型,第四代嘉华以跨界
别克威朗家族焕新入门款12。99万元拥抱Z世代,向阳而生,无处不乐!9月10日,全新别克威朗家族焕新上市,新车共推出3款威朗Pro和2款威朗ProGS,售价12。99万15。89万元。新车搭载全新1。5T发动机,配备
潮流单品,不一样的大众ID。3更讨年轻人喜欢8月29日,大众ID。3在成都车展亮相并开启预订。300元购车意向金可享300元意向金抵扣3000元车款权益。ID。3由上汽大众出品,定位于打造品质与乐趣兼具的纯电跨界车。ID。3
大众洽购江淮工厂为什么引起一汽上汽强烈不满?01hr9月13日,业内曝出,大众正在展开收购江淮第二家工厂的谈判,此举引起一汽集团和上汽集团的不满。为什么会不满?两年前,大众汽车集团CEO迪斯在德国单方面表态,希望可以尽快的和
被低估的比亚迪汽车安全除了电池,还有从知行合一,向新而行开始,比亚迪的价值将被重估。01hr比亚迪,中国第一汽车股。因为容易被看见,所以比亚迪汽车等于比亚迪。事实并非如此,除了汽车,比亚迪还有手机代工云轨交通和储能等
河北制定碳达峰行动方案上市公司捷足先登加快布局证券日报自碳达峰碳中和目标提出以来,绿色低碳已成为中国能源发展的大趋势。对于河北省来说,由于历史原因,化石能源生产较为集中,自身产业结构偏向于钢铁等重化工业,属于碳排放输入型省份。
基建计划从4万亿到48万亿由于疫情在全球的蔓延,尤其是在意大利日本韩国美国等的出现和传播,给未来全球经济蒙上了巨大的阴影,美联储高规格超预期降息,引发了各国央行的跟随,包括澳大利亚巴西等先后宣布降息,全球开
天津市政府关于市城投集团转型升级方案的批复将城投集团改组为国有资本投资公司,定位为城市综合运营服务商,主要职责为(一)优化国有资本布局。以市场为导向,通过整合集聚资源创新投融资模式资本(股权)运作产(股)权管理,将资本布局
盘点2020年中国大陆十大晶圆代工公司晶圆(Wafer)是指硅半导体集成电路制作所用的硅芯片,由于其形状为圆形,故称为晶圆。晶圆是生产集成电路所用的载体,一般意义晶圆多指单晶硅圆片。单晶硅圆片由普通硅砂拉制提炼,经过溶
5G8K迎ampampquot拐点ampampquot创维电视一站式端到端解决方案抢布局先机在刚刚结束的创维电视2020年秋季新品发布会上,深圳创维RGB电子有限公司董事长兼总裁王志国正式宣布创维已经完成5G8K从前端到终端的端到端布局,将打造5G8K一站式解决方案。继近