写点什么

文本识别

0 人感兴趣 · 6 次引用

  • 最新
  • 推荐

ABCNet:端到端的可训练框架的原理应用及优势对比

ABCNet(Adaptive Bezier Curve Network)是一个端到端的可训练框架,用于识别任意形状的场景文本。直观的pipeline如图所示。采用了单点无锚卷积神经网络作为检测框架。

FOTSL: 端到端的文本检测与识别方法的原理方法与优势

导言: 基于深度学习的可端到端训练的自然场景检测与识别算法(text spotting)由于其简洁高效且统一的结构,逐渐取代了过去将检测与识别分阶段训练然后拼接在一起的方案,成为自然场景文本检测与识别的主流研究方向之一。

论文解读丨文本行识别模型的再思考

​​摘要:本文研究了两个解码器(CTC[1]和 Transformer[2])和三个编码器模块(双向LSTM[3]、Self-Attention[4]和GRCL[5]),通过大量实验在广泛使用的场景和手写文本公共数据集上比较准确性和性能。

https://static001.geekbang.org/infoq/76/7644711ed43f03b4008b62bf93ef7151.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

OCR 的工作原理和应用场景

用户头像
澳鹏Appen
2021-11-03

光学符号识别,即OCR (Optical Character Recognition)

带你读论文丨基于视觉匹配的自适应文本识别

​​摘要:ECCV2020 通过视觉匹配的方法来做文本识别,解决文档识别中的文本识别多样性和泛化性问题

文本识别_文本识别技术文章_InfoQ写作社区