用友在 ICDAR 发表论文,AI 实力获国际顶级学术会议认可
在大语言模型热潮席卷全球的当下,人工智能领域的每一次技术突破都备受关注。近日,全球文档图像分析识别领域公认的权威学术会议 ICDAR 传来好消息:来自中国公司用友的智能化团队所撰写的论文《一种基于多粒度半监督学习的文字识别方法》,凭借着在半监督文字识别算法方面的创新,获得正式发表。
ICDAR 全称国际文档分析与识别会议(International Conference on Document Analysis and Recognition),由国际文献识别与文本处理委员会(IAPR)主办,是国际文档分析与识别领域最新学术成果的展示平台和前沿应用发展趋势的风向标。在 ICDAR 发表论文,需经由多个相关领域的专家(大学教授、公司知名专家)匿名评审,并最终决定是否录用。在 ICDAR 上发表论文,也标志着用友所代表的中国公司的 AI 能力获得国际顶级学术会议的认可。
在论文中,用友智能化团队介绍了一种新颖的半监督文字识别算法:通过基于单词(word)和字符(character)两种粒度的半监督学习,来提升文字识别的效果。具体来讲,用友智能化团队提出了一种单词粒度的动态聚合自学习框架,用来提升伪标签的质量和稳定性,其中在字符粒度方面提出使用一个单词到字符转换模块,并结合对比学习,使得算法可以学习到字符粒度的表征信息。
根据公开测评数据,基于该算法的 OCR 识别技术可大幅提升传统 OCR 识别的准确率,提升数据使用效率,并创造更大价值:
在财税领域
这项技术可显著减少人工数据处理工作量,提高工作效率,同时降低了由人为错误引发的税收和会计问题的风险,还支持未标记数据的文本识别,实现更快速的财务数据获取和分析;
在人力领域
该技术可以大幅简化招聘流程,自动识别和整理求职者的简历、申请表,提高招聘效率,同时加速员工档案(包括合同和培训证书等)的处理,确保员工数据合规性,降低法律风险,特别适用于大量文件处理的人力部门;
在供应链领域
OCR 技术的能力提升可以改进库存管理,提高供应链透明度和效率,尤其适用于需要跟踪和记录库存和订单信息的场景。此外,它还能够加速订单处理,提高订单准确性,降低交货周期,提升客户满意度,从而改进整个供应链的运作。
当前,以大语言模型为代表的新一代 AI 技术作为推动科技跨越发展、产业优化升级、生产力整体跃升的驱动力量,正在加速赋能甚至重塑千行百业。不同行业的企业与公共组织也都在积极探索 AI 的落地应用。
用友作为全球领先的企业数智化软件与服务提供商,研究布局 AI 已久,不仅在数年前就于业界率先提出了“数智化”(数字化+智能化)、“数智企业”的概念,还战略研发了使能企业数智化的企业服务产品群-用友 BIP(用友商业创新平台),其中就包含业界首个企业服务大模型-YonGPT。YonGPT 契合了企业基于数智技术实现业务与业务、业务与财务、业务与管理融合创新的时代需求,是更懂企业服务的大模型。截至目前,用友已推出基于 YonGPT 的数十种智能应用,并签约了中化集团、徐工集团等一批客户。
论文《一种基于多粒度半监督学习的文字识别方法》发表后,相关算法将用于包括 YonGPT 及用友所有与文字识别(OCR)相关的产品、服务、解决方案之中,并依托于用友 BIP,使能更多企业与公共组织推进数智化转型升级,拥抱 AI 普及应用时代。
评论