0 人感兴趣 · 6 次引用
ABCNet(Adaptive Bezier Curve Network)是一个端到端的可训练框架,用于识别任意形状的场景文本。直观的pipeline如图所示。采用了单点无锚卷积神经网络作为检测框架。
导言: 基于深度学习的可端到端训练的自然场景检测与识别算法(text spotting)由于其简洁高效且统一的结构,逐渐取代了过去将检测与识别分阶段训练然后拼接在一起的方案,成为自然场景文本检测与识别的主流研究方向之一。
基于时序连接序列(CTC)的自然场景文本识别算法。
摘要:本文研究了两个解码器(CTC[1]和 Transformer[2])和三个编码器模块(双向LSTM[3]、Self-Attention[4]和GRCL[5]),通过大量实验在广泛使用的场景和手写文本公共数据集上比较准确性和性能。
光学符号识别,即OCR (Optical Character Recognition)
摘要:ECCV2020 通过视觉匹配的方法来做文本识别,解决文档识别中的文本识别多样性和泛化性问题
让技术不再枯燥,让每一位技术人爱上技术
人生享受编程,编程造就人生!
大丈夫生于天地之间,岂能郁郁久居人之下
靠敲代码在北京买房的程序员
百度官方技术账号