0 人感兴趣 · 11 次引用
2022年最后一个月,12月1日,今天杭州下着小雪。
怎样轻轻松松节省几十万?如何使用100多款的AI产品?
本文通过场景文字从人类知识库(Wikipedia)中挖掘其背后丰富的上下文语义信息,并结合视觉信息来共同推理图像内容。
人脸识别作为计算机视觉领域中时间最久远、应用最广泛的研究课题之一,近些年也在深度学习的加持下在性能方面获得了大幅提升,并在实际的生活场景中得到了广泛的应用。
摘要:本文提出了一个概念简单但对卷积神经网络非常有效的注意力模块。
摘要:本文提出了一个用于无监督视觉表征学习的动量对比方法(MoCo)。从将对比学习作为字典查询过程的角度来看,本文构建了一个由队列和移动平均编码器组成的动态字典。
摘要:ECCV2020 通过视觉匹配的方法来做文本识别,解决文档识别中的文本识别多样性和泛化性问题
摘要:文档版式分析任务中,文档的视觉信息、文本信息、各版式部件间的关系信息都对分析过程具有很重要的作用。本文提出一种融合视觉、文本、关系多模态信息的版式分析架构VSR。
视觉生产技术入门篇
又到了喜闻乐见 悲痛欲绝的周日晚上了,明天又要开始上班了。
以DOTA遥感影像数据集为例,选用R3DET算法为例子
让技术不再枯燥,让每一位技术人爱上技术
人生享受编程,编程造就人生!
大丈夫生于天地之间,岂能郁郁久居人之下
靠敲代码在北京买房的程序员
百度官方技术账号