CV
0 人感兴趣 · 13 次引用
- 最新
- 推荐




恒源云 (Gpushare)_FAIR CVPR2022 新作 DVT 是个啥?
文章来源 | 恒源云社区 该论文介绍了可变形视频Transformer(DVT),它根据运动信息动态预测每个查询位置的一小部分视频Patch,从而允许模型根据帧间的对应关系来决定在视频中查看的位置。




论文解读丨 LayoutLM: 面向文档理解的文本与版面预训练
摘要:LayoutLM模型利用大规模无标注文档数据集进行文本与版面的联合预训练,在多个下游的文档理解任务上取得了领先的结果。
【JDD 京智大咖说】AI 未来,路在何方?NLP、CV 技术的探索与展望
在即将于 11 月 25 日召开的京东全球科技探索者大会上,京东智联云将携多个人工智能黑科技亮相,持续为各个行业输出全栈 AI 能力。