写点什么

文字识别

0 人感兴趣 · 34 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/6b/6b4f14d6a0e8dfc4356b647d1c572c2f.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

上海市静安区财政局领导带队调研合合信息,政企共话科技创新

近日,上海市静安区财政局副局长应文婷一行赴市北高新园区,实地走访科技企业上海合合信息科技股份有限公司(简称“合合信息”),了解公司技术创新成果及产业布局,倾听企业在发展过程中的政策需求。

https://static001.geekbang.org/infoq/23/23cbc78107ffe12282f1d42e07c0ec9a.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

常用的表格检测识别方法 - 表格内容识别方法

基于整个表格内容进行的表格分类、单元格分类、以及表格信息抽取等任务,这是当前表格识别研究的热门领域之一

https://static001.geekbang.org/infoq/96/96e9f0a1f1497b0d108c42487dfe287d.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

常用的表格检测识别方法——表格结构识别方法 (下)

论文提出了一种新的表格结构识别方法,它包含两个有效的组件:一个基于SepRETR的分割线预测分割模块和一个基于关系网络的用于跨行单元格恢复的单元格合并模块......

https://static001.geekbang.org/infoq/fb/fb5486e45eb76da1c324b8c1e55686f4.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

常用的表格检测识别方法 - 表格区域检测方法(下)

本文介绍了一种利用可变形transformer对文档图像进行表格检测的半监督方法。该方法通过将伪标签生成框架集成到一个简化的机制中,减轻了对大规模注释数据的需要,并简化了该过程.......

https://static001.geekbang.org/infoq/d4/d4f41e41f2bf50b7b6ba2d86a878c48e.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

常用的表格检测识别方法 - 表格区域检测方法(上)

​表格检测识别一般分为三个子任务:表格区域检测、表格结构识别和表格内容识别。本章将围绕这三个表格识别子任务,从传统方法、深度学习方法等方面,综述该领域国内国外的发展历史和最新进展,并提供几个先进的模型方法。

https://static001.geekbang.org/infoq/8a/8a62d319259828b49aa689392c033c29.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

合合信息新推出反光消除技术,助力手写文字识别更精准

在手写识别场景中,反光会导致部分区域的文字无法被准确识别,给后续的文字识别和理解工作带来了很大的挑战。合合信息反光消除技术能够根据手写板笔迹的风格进行特征提取,并对手写文字进行特征编码,助力文档图像中反光区域文字的提取。

OCR 文字识别工具:OCRKit Pro 中文激活版

OCRKit Pro 中文激活版它可以将扫描或照片中的文字转换成可编辑的文本。它支持多种语言和格式,包括PDF、JPG、PNG等。使用OCRKit Pro可以大大提高文本识别的准确率和效率,特别是在处理大量文本时。

https://static001.geekbang.org/infoq/41/41c919714cdbba092c680981154eb48b.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

最佳实践|用腾讯云智能文字识别实现网约车信息管理

安全合规地收集管理网约车的信息可以有效的保障乘客的安全,面对海量的信息处理,AI技术如能助力网约车平台提质增效呢?

https://static001.geekbang.org/infoq/79/798cd9485bb8bda68acc469dfae52edc.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

带你读 AI 论文丨针对文字识别的多模态半监督方法

本文提出了一种针对文字识别的多模态半监督方法,具体来说,作者首先使用teacher-student网络进行半监督学习,然后在视觉、语义以及视觉和语义的融合特征上,都进行了一致性约束。

https://static001.geekbang.org/infoq/79/79193d17d47aa8c46f0c9d899fb79aac.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

论文解读丨【CVPR 2022】不使用人工标注提升文字识别器性能

本文提出了一种针对文字识别的半监督方法。区别于常见的半监督方法,本文的针对文字识别这类序列识别问题做出了特定的设计。

https://static001.geekbang.org/infoq/3c/3ca0bbdd394858dc6d3cb75f7db6daa2.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

CTPN+CRNN 算法端到端实现文字识别的实战开发

本文主要为大家带来在ModelArts中体验CTPN+CRNN实战项目开发。

https://static001.geekbang.org/infoq/7f/7fe5135bbfbefdd4b371c47a12024e99.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

最佳实践|用腾讯云 AI 文字识别对混贴票据识别

在企业经营活动中,一直伴随着种类繁多的票据,在财务做归档整理过程中,使用手工方式对多张混贴票据信息进行统计和整理也一直是一项非常繁重的工作,而且非常容易出错。

https://static001.geekbang.org/infoq/8a/8ac5fe4602f783f4ee896921ef0dc458.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

CRAFTS:端对端的场景文本检测器

场景文本检测器由文本检测和识别模块组成。许多研究已经将这些模块统一为一个端到端可训练的模型,以获得更好的性能。一个典型的体系结构将检测和识别模块放置到单独的分支中,通常使用RoI pooling来让这些分支共享一个视觉特征。

【文本检测与识别白皮书 -3.2】第一节: 基于分割的场景文本识别方法

基于分割的识别算法是自然场景文本识别算法的一个重要分支(Wang 等,2012;Bissacco 等,2013;Jaderberg 等,2014),通常包括3 个步骤:图像预处理、单字符分割和单字符识别。基于分割的自然场景文本识别算法通常需要定位出输入文本图像中包含的每个字符的所在

https://static001.geekbang.org/infoq/44/4443af51e9cd062bdfd4e85422ca4dd6.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

【文本检测与识别白皮书】第三章 - 第三节:算法模型 2

CTPN,全称是“Detecting Text in Natural Image with Connectionist Text Proposal Network”(基于连接预选框网络的文本检测)。CTPN直接在卷积特征映射中检测一系列精细比例的文本建议中的文本行。CTPN开发了一个垂直锚定机制,可以联合预测每个固定宽度提

https://static001.geekbang.org/infoq/5a/5acba6936a6cb04c21ae9dec0700a8c6.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

【文本检测与识别白皮书】第三章 - 第三节:算法模型

2014年论文《Rich feature hierarchies for accurate object detection and semantic segmentation Tech report》提出R-CNN模型,即Regions with CNN features。这篇论文可以算是将CNN方法应用到目标检测问题上的开山之作。

https://static001.geekbang.org/infoq/ae/ae5ca235652a6bf97e736a000b627e16.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

在云南,我用华为云 AI 开发出千万级用户的应用

创造无限,当“燃”是开发者,华为云1024程序员节,陶新乐和大家分享独立开发者的自由之路。

https://static001.geekbang.org/infoq/5a/5acba6936a6cb04c21ae9dec0700a8c6.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

文本识别与检测 -【技术白皮书】第三章 - 第二节: 基于分割的场景文本检测方法

基于分割的自然场景文本检测方法主要是借鉴传统的文本检测方法的思想,先通过卷积神经网络检测出基本的文本组件,然后通过一些后处理的方式将文本组件聚集成一个完整的文本实例。此类方法可以进一步划分为像素级别的方法(基于分割的方法)和文本片段级别的方法

常用的文本检测与识别方法 - 第一节【文本检测与识别 - 白皮书 - 第三章】

随着深度学习的快速发展,图像分类、目标检测、语义分割以及实例分割都取得了突破性的进展,这些方法成为自然场景文本检测的基础。基于深度学习的自然场景文本检测方法在检测精度和泛化性能上远优于传统方法,逐渐成为了主流。图1 列举了文本检测方法近几年来

【文本检测与识别 - 白皮书】第二章:文本检测与识别技术发展历程

俗称光学字符识别,英文全称是Optical Character Recognition(简称OCR),它是利用光学技术和计算机技术把印刷体或手写体文本进行读取识别,转化成计算机和人都能够识读的格式。此间OCR技术是关键一环。OCR技术中,印刷体的文本识别是最成熟的一个,因其开展最

【文本检测与识别 - 白皮书】第一章:技术背景

OCR全称Optical Character Recognition,即光学字符识别,最早在1929年被德国科学家Tausheck提出,定义为将印刷体的字符从纸质文档中识别出来。现在的OCR,狭义上指对输入扫描文档图像进行分析处理,识别出图像中文本信息。而随着OCR技术的日益发展,人们已不

文本纠错:提升 OCR 任务准确率的方法

摘要:错字率是OCR任务中的重要指标,文本纠错需要机器具备人类水平相当的语言理解能力。随着人工智能应用的成熟,越来越多的纠错方法被提出。

https://static001.geekbang.org/infoq/4f/4f121d13c29d9103e038fc564b2f9475.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

不需要服务器,教你仅用 30 行代码搞定实时健康码识别

自打疫情发生以来,几乎所有人的生活都受到了影响,还好现在已经是数字化的时代,为了防控疫情,健康码成了我们的通行证,已经在最大程度上减少了疫情对我们出行的限制。

https://static001.geekbang.org/infoq/3c/3ca0bbdd394858dc6d3cb75f7db6daa2.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

跟我读论文丨 Multi-Model Text Recognition Network

语言模型往往被用于文字识别的后处理阶段,本文将语言模型的先验信息和文字的视觉特征进行交互和增强,从而进一步提升文字识别的性能。

https://static001.geekbang.org/infoq/49/4990d7428a08c16c136a7d378ec0456c.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

最佳实践 | 用腾讯云 AI 文字识别从 0 到 1 实现通信行程卡识别

疫情防控常态化下,学校为了保证孩子身体健康和安全,要求所有入校人员提供通信行程码并审核。但是通过人工审核的方式,不仅工作量极大且容易出错。作为一名软件开发工程师,我开始思考并着手调研,希望可以通过更智能的方式来解决。

论文解读丨表格识别模型 TableMaster

摘要:在此解决方案中把表格识别分成了四个部分:表格结构序列识别、文字检测、文字识别、单元格和文字框对齐。其中表格结构序列识别用到的模型是基于Master修改的,文字检测模型用到的是PSENet,文字识别用到的是Master模型。

文字识别:关键信息提取的 3 种探索方法

摘要: 如何通过深度学习模型来从文档图片中自动化地提取出关键信息成为一项亟待解决的挑战,受到学术界和工业界的广泛关注。

文字识别_文字识别技术文章_InfoQ写作社区