写点什么

基于深度学习的表格检测与识别技术的优势

  • 2023-02-21
    上海
  • 本文字数:2169 字

    阅读完需:约 7 分钟

引言:

信息时代的高速发展导致数据的大量产生与频繁传输,单单依靠人力很难处理这些数据。依托于人工智能的兴起与发展,数据的利用变得更加高效。表格作为数据的一种重要载体,是人们为了让数据的组织形式更加标准和结构化而使用的一种数据类型。

 

表格的特点:

信息高度精炼集中,方便信息的检索和比较。表格被广泛用于表示结构和功能信息,它们出现在不同种类的文献中,包括报纸、研究论文和科学文件等。表格使读者能够快速地比较、分析和理解文件中出现的事实。表格识别的目的是获取图像中的表格并访问其数据,是文档分析与识别领域的一个重要分支。

 

表格在生成或存储过程中往往以图片或 PDF(Portable Document Format)文件的形式存在,会丢失易于计算机理解的原有结构信息。若是采用人工手段对表格进行重新处理录入,会面临效率低下、数据量大导致出错等问题。因此,如何高效地从文档或图像中找到表格区域,同时有效地提取表格中的结构信息和数据内容,成为了一个亟待解决的问题。

 

表格识别的发展历程:

早期对于表格的识别大多是针对比较简单或者模板化的表格。从表格的布局结构出发,抽取表格线条或抽取文本块,然后使用规则方法进行分析,但这些方法往往泛化能力较差,且难以处理复杂表格。后来随着深度学习的发展,无论是机器视觉方向还是自然语言处理方面都获得了巨大的进展,各种表格识别的方案被提出,并有研究者开始尝试对自然场景下的表格进行处理。

 

传统的机器学习方法可以实现表格识别和检测,但是它有一定的性能局限,特别是在解决复杂的表格识别和检测的技术要求上有一定的局限性。深度学习技术已经成为计算机视觉、自然语言处理等领域具有极高表现能力的新型机器学习方法,近年来,基于深度学习的表格识别与检测技术也受到了广泛关注,它可以提供较高的准确率和完整性,起到较好的优化解决方案。

 

表格识别与检测通常分为三个基本步骤:表格位置定位、单元格分割和内容提取。


基于深度学习的表格检测与识别,将多层神经网络应用到解决表格问题上,概括地说,

其特征在于几个方面:

(1)深度学习具有高精度强大的表示能力,能够有效处理复杂的数据,如图像和自然语言。

(2)深度学习的特征通常是自动学习的,不需要人工标注信息,同时它能够准确地从不同的数据中学习新特征,能够更好地处理一些模糊,复杂和非线性的数据

(3)深度学习能够捕获表格的复杂结构信息,并能够从图像获得更多更有用的技术特征。

 

与传统的机器学习方法相比基于深度学习的表格检测识别有以下几点优势:

(1)数据集种类

基于机器学习的检测识别方法主要面向标注了表格位置的数据集,使用这类数据来训练模型,从而可以获得较高的检测识别精度;而基于深度学习的检测识别方法则面向标注了表格元素位置的数据集,这类数据可以更详细地描述文档中的表格,可以有效抵挡干扰。

(2)模型准确度

从模型准确度上来看,基于机器学习的表格检测识别方法主要依赖于模型的改进,因而能够在模型准确度上把控较高的水准,即使对于较小的数据集来说;而基于深度学习的表格检测识别方法则更加取决于数据的种类基于更加详细的数据描述,可以使模型的精度提升到更高的水准。

(3)数据探索

从数据探索的角度来看,基于机器学习的表格检测识别方法主要针对已有数据对模型进行训练,以提高检测识别的效率;而基于深度学习的检测识别方法则能够在完整的文本中探索出详细的表格信息,从而获取更多的有用技术特征。

(4)时间开销

从时间开销上来看,基于机器学习的表格检测识别方法常常比较容易受到训练数据和模型规模等因素的影响,而基于深度学习的表格检测识别方法则更加容易进行识别和检测,所需时间大大缩短。


对比结论: 

1 因其可以解决数据量小、模型效果不理想等问题,基于机器学习的方法依赖于模型的提高.

2 而基于深度学习的方法可以提供完整的特征描述以及更强大的抗干扰能力,从而使检测识别的效果大大提升。

 

目前,基于深度学习的表格识别与检测技术已经在科研和实际应用方面取得了一定的成就,常见的表格检测和识别技术常常与基于深度学习的其他技术结合起来,进行系统设计。根据瞭望智库的数据,基于深度学习的表格检测与识别技术的市场规模目前已经从 2016 年的 46600 万美元增长到了 2018 年的 9800 万美元,其中,自然语言处理(NLP)、计算机视觉(CV)和图像处理等技术将有望引领下一步的增长动力。

 

合合信息认为,现今基于深度学习的表格检测与识别技术仍然处于有限,大龄化和繁杂之中。从技术质量角度讲,早期研究大多数临时性,难以涉及客观分析。然而,在过去几年中,随着技术的不断成熟,许多研究开发了和实现了各种深度学习模型,提高了表格检测与识别技术的准确性和有效性。在普适表格识别和检测中,深度学习算法是有利的,但它仍有挑战需要解决。未来研究可能集中在强化表格检测和深度学习的运行速度,应用表格检测到现实世界的任务,灵活的处理新表格,更多地考虑端到端方法以及学习式表格识别。

 


 

参考文献:

  • Kong L J, Bao Y C, Wang Q W and Li H K. 2021. Summary of table detection and recognition algorithms based on deep learning. Computer & Network,47(02):65-73

 

  • Gao L C, Li Y B, Du L, Zhang X P, Zhu Z Y, Lu N, Jin L W, Huang Y S, Tang Z . 2022. A survey on table recognition technology. Journal of Image and Graphics, 27(6): 1898-1917.

 

发布于: 刚刚阅读数: 3
用户头像

上海合合信息科技股份有限公司人工智能团队 2022-08-01 加入

在上海市领军人才合合信息董事长镇立新博士带领下,于复杂场景文字识别、智能图像处理、自然语言处理等人工智能领域拥有10 余年研发创新与技术积累,具备专业的行业理解与技术成果。

评论

发布
暂无评论
基于深度学习的表格检测与识别技术的优势_人工智能_合合技术团队_InfoQ写作社区