写点什么

OCR

0 人感兴趣 · 38 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/07/07cf4ca032acfd485d3db760ac105b8a.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

再升级!PP-OCRv4 多场景平均精度提升 5%!

PaddleOCR主打的PP-OCR系列模型,在去年五月份推出了v3。最近,飞桨AI套件团队针对PP-OCRv3进行了全方位的改进,重磅推出了PP-OCRv4

https://static001.geekbang.org/infoq/6b/6b774d7a82f42de2ce1e0b271242107a.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

企业内容管理升级 3.0: 构建生态协同, 助力合规成长

企业内容管理3.0基于开放平台与生态理念,连接内外部系统,实现内容共享和协作。它打开了企业边界,释放内容价值,为企业带来机遇与收益。

https://static001.geekbang.org/infoq/ef/ef22d6fa64cd85f515d3620961ba0c34.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

深度学习应用篇 - 计算机视觉 -OCR 光学字符识别 [7]:OCR 综述、常用 CRNN 识别方法、DBNet、CTPN 检测方法等、评估指标、应用场景

OCR(Optical Character Recognition,光学字符识别)是指对图像进行分析识别处理,获取文字和版面信息的过程,是典型的计算机视觉任务,通常由文本检测和文本识别两个子任务构成。

https://static001.geekbang.org/infoq/49/4987f05f45a321bd04c545baddbcb52c.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Marior 去除边距和迭代内容矫正用于自然文档矫正

作者提出了一种简单而有效的方法,Marior,以从粗到细的方式为变形文档图像矫正。作者提出的方法不仅在DocUNet [25]和OCR_REAL [23]基准数据集上取得了最先进的性能,而且成功地解决了具有大边缘区域的情况和没有边缘区域的情况,

https://static001.geekbang.org/infoq/b5/b56d5375098aeeda3f21d2fadff1bc29.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

一文上手文档智能 Document Mind

什么是文档智能?文档智能(Document Mind),是基于阿里巴巴达摩院多年技术积累打造的多模态文档识别与理解引擎,为用户提供通用文档智能、行业文档智能和文档自学习能力,可满足各种场景下的智能文档处理需求。

https://static001.geekbang.org/infoq/5e/5e5006e23fe2fa152c4d41d06aabfb17.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

基于 OCR 进行 Bert 独立语义纠错实践

本案例我们利用视频字幕识别中的文字检测与识别模型,增加预训练Bert进行纠错。

https://static001.geekbang.org/infoq/70/7046e8fd5f4767ff45eab3624812a9d2.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

一个基于序列的弱监督视觉信息抽取学习框架

论文提出了一个统一的弱监督学习框架TCPN用于视觉信息提取,它引入了一种有效的编码器、一种新的训练策略和一种可切换的解码器。该方法在EPHOIE数据集上显示出了显著的提高和在SROIE数据集上的竞争性能,充分验证了其有效性。

OCR 文字识别工具:OCRKit Pro 中文激活版

OCRKit Pro 中文激活版它可以将扫描或照片中的文字转换成可编辑的文本。它支持多种语言和格式,包括PDF、JPG、PNG等。使用OCRKit Pro可以大大提高文本识别的准确率和效率,特别是在处理大量文本时。

PreSTU:一个专门为场景文本理解而设计的简单预训练模型

在视觉与语言(V&L)模型中,阅读和推理图像中的文本的能力往往是缺乏的。我们如何才能学习出强大的场景文本理解(STU)的V&L模型呢?

https://static001.geekbang.org/infoq/7f/7fe5135bbfbefdd4b371c47a12024e99.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

最佳实践|用腾讯云 AI 文字识别对混贴票据识别

在企业经营活动中,一直伴随着种类繁多的票据,在财务做归档整理过程中,使用手工方式对多张混贴票据信息进行统计和整理也一直是一项非常繁重的工作,而且非常容易出错。

5 款宝藏办公软件,高质量打工人必备!

用户头像
淋雨
2022-11-10

秋招接近尾声,又有一大批的人走入职场。在职场摸爬滚打这么多年,我也积累了许多办公神器,这下不私藏了,通通分享出来,希望能助各位职场人一臂之力!

双 11 就要到了,是时候给你的电脑来点硬货了!

用户头像
淋雨
2022-11-04

双11就要到了,不知道你的购物车里添加了些什么东西呢?你的电脑作为一位“老朋友”,是时候添置一些好用的软件了。双11期间,很多付费软件都有不同程度的优惠措施,哪些软件值得你入手呢?话不多说,一起来看一看有没有你观望了很久的软件吧!

【文本检测与识别 - 白皮书】第二章:文本检测与识别技术发展历程

俗称光学字符识别,英文全称是Optical Character Recognition(简称OCR),它是利用光学技术和计算机技术把印刷体或手写体文本进行读取识别,转化成计算机和人都能够识读的格式。此间OCR技术是关键一环。OCR技术中,印刷体的文本识别是最成熟的一个,因其开展最

文本纠错:提升 OCR 任务准确率的方法

摘要:错字率是OCR任务中的重要指标,文本纠错需要机器具备人类水平相当的语言理解能力。随着人工智能应用的成熟,越来越多的纠错方法被提出。

https://static001.geekbang.org/infoq/b2/b29c3d2964faab6daab87a75b20560f5.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

OCR 技术用于在线身份认证的运营效果分析

用户头像
2022-02-17

当前线上身份认证,主要依赖的仍是OCR技术,即光学字符识别。然而依托于这一技术的在线身份认证服务过程中,用户流失可能十分严重,这是为什么呢?本篇文章就OCR技术应用于在线身份认证过程中的运营效果做了分析,一起来看看吧。

https://static001.geekbang.org/infoq/88/882ebf2ac98665924a94ec837589624c.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

LabVIEW OCR 实现车牌识别(实战篇—3)

OCR(光学字符识别)是指机器自动从图像中识别文本字符的过程,OCR机器视觉系统可用于对被测件的识别和分类。常见的识别应用包括:药品包装标签识别、IC芯片编码读取、冲压零件上的字符识别、汽车零件编码读取以及车牌识别等。

https://static001.geekbang.org/infoq/a2/a200e1c8ae356ee0b43d557a3cb5dedb.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

蚂蚁自研移动端 xNN-OCR 技术演进与能力开放

本文以广泛使用的文字识别技术(OCR)为例,介绍蚂蚁自研移动端OCR技术(xNN-OCR)的技术演进之路。

https://static001.geekbang.org/infoq/35/35ae743dd985df0ee6cf984a958b4f34.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

再添神器!Paddle.js 发布 OCR SDK

OCR(Optical Character Recognition,光学字符识别)是文字识别的统称,不仅支持文档或书本文字识别,还包括识别自然场景下的文字,又可以称为 STR(Scene Text Recognition)。

迎接 10 亿快递高峰,看百度 OCR 如何助力物流企业提速

用户头像
百度大脑
2021-11-12

一年一度的双十一电商“大战”拉开帷幕,剁手党 “买买买”,商家配货、消费者抢购的双手不停歇,背后无形的运输网络悄然启动,物流行业的速度站正式打响。

https://static001.geekbang.org/infoq/90/905ae84e29fdce4dc20ef334ef7d428f.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

使用 OpenCV 和 Python 识别数字

用户头像
AI浩
2021-11-09

本文演示如何使用 OpenCV 和 Python 识别图像中的数字。

https://static001.geekbang.org/infoq/b4/b42a7f260c489027c22e26d40754ae9e.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

如何快速应对井喷下的 OCR 需求?

用户头像
鲸品堂
2021-11-09

在技术落地的基础上,更多的是寻求在实际场景的低误差应用,以及如何高速高效保质保量地应对。

https://static001.geekbang.org/infoq/76/7644711ed43f03b4008b62bf93ef7151.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

OCR 的工作原理和应用场景

用户头像
澳鹏Appen
2021-11-03

光学符号识别,即OCR (Optical Character Recognition)

强大的 OCR 技术 + 多元的用户场景 口碑型 App 白描的开发之路

用户头像
百度大脑
2021-08-26

现实中,你可以轻松无障碍的阅读各类平面印刷文字以及身边的一切,或许你未曾想过,视障人群该怎么办呢?

https://static001.geekbang.org/infoq/47/47cc35232ac6ee8559f62d4af66b2d0f.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

OCR 开发者福音:PDF 提取 Excel 文件算法开源啦

只要稍微会一点 Python 代码,这个开源项目神器拯救你。

OCR_OCR技术文章_InfoQ写作社区