中电金信智能ICR解决方案立足于解决金融领域的各类影像单据的字符识别,即借助自主研发的AI模型,以AI+OCR的方案解决文字高精度识别,文本内容高质量检测,结构化信息高准确度输出,从而满足文字录入、证照识别、单据识别、合同识别与对比等各类金融业务场景。
单据分类 | 可对用户上传的各类型单据进行快速分类和归档,并根据分类结果进行结构化处理。
图像预处理 | 采用印章检测、印章消除、角度矫正、降噪等技术进行图像预处理,如歪斜、褶皱和印章干扰票据。
文本检测 | 通过预训练专属行业的文本检测模型,实现高精度的有效文本位置检测。
版面分析 | 对于一些有固定表格的票据,通过版面分析的辅助判断,大大提升结构化识别准确率。
文字识别 | 该产品文字识别模型包括400种常见的印刷体,字符集覆盖GB18030的一二级常用字符和生僻字符集以及大量手写字体样本,且能识别中英文混合的文字。
结构化输出 | 能对版式不一的各类合同、凭证进行分析,以最优的方式进行结构化处理,从而得到较高的结构化准确识别率。
该方案借助AI技术,构建出四大核心模型:
-
ICR识别模型
自主知识产权的模型,利用机器学习算法和开源框架进行深度定制开发,并通过大量文本样本和真实单据样本进行训练,识别快且准确度高,可进行二次开发和再训练。
-
文本监测模型
用于识别单据影像资料的文字,如角度倾斜、变形等,需要使用基于深度学习的方法进行文字检测,文本定位模型的算法和训练数据完全自有,也可进行二次开发和再训练。
-
印章检测/识别/去除模型
金融机构的单据上有一些印章覆盖在待识别的内容上,需要对印章进行检测,并识别其中的环形文字,再去除,避免意向被覆盖内容识别。
-
二值化模型
二值化就是为了自动生成二值化阈值,将图片像素灰度设置成0和1两个值。以便取得最理想的图像分析效果,从而提升文本识别率和检出率。
-
智能陪练系统
打造模拟真实业务场景的人机对练,以“学、练、考、评”一站式闭环模式,循序渐进,高效渗透,让学员真正掌握、有效沟通,并以数据化运营提升培训管理的科学性
体验产品 -
智能双录系统
提供智能录音、录像标准一体化解决方案
体验产品 -
鲸Bot RPA
鲸Bot RPA作为数字化劳动力产品解决方案,基于界面元素识别和视觉反馈技术,融合模法师机器学习平台、鲸图知识图谱平台能力,实现企业业务流程自动化,提升企业经营管理的水平
体验产品 -
源启AI开发与服务平台
高效开发、低门槛、开放安全的一站式企业级AI中台,采用业内领先技术,打造的全链路、端到端的AI算法开发套件和工具,实现复杂模型研发和服务一体化平台,满足全栈机器学习、深度学习和大模型训推一体的全生命周期管理。通过企业级AI中台能力,帮助企业实现“管好算力、建好模型、用好服务”的需求。
体验产品