深兰科技的征途,AI 的赛场与战场
在顶尖学术会议中成功“刷榜”,一直被看做是AI企业实力的绝对证明。尤其是在AI研究创新涌现、几大顶会迎来“论文大爆炸”的背景下,学术竞争也愈加激烈,想要“出人头地”,真不是件容易的事。
最近在全球计算机三大顶级会议之一ECCV 2020上一举拿下8个赛事冠亚季军大奖的深兰科技,彰显实力。
而且,深兰科技也在Kaggle平台上举办的ECCV挑战赛Google Landmark Retrieval 2020上斩获金牌,在计算机视觉模式识别会议CVPR2020中斩获了12项冠亚季军,在国际计算机视觉大会ICCV2019竞赛中拿下“四冠四亚一季”的成绩……各种优异成绩的井喷,显然不是偶然。
我们知道,计算机视觉是当前人工智能学术界非常活跃的研究领域,而ICCV、CVPR、ECCV这计算机视觉方向的三大顶级会议,更是云集了谷歌、斯坦福、BAT等等科技巨头,被中国计算机学会评为最高级别学术会议。
在这样的“学术修罗场”能够拿下挑战赛的大满贯、取得多个第一的战绩,深兰科技的技术底蕴与含金量不容小觑。
初看结果,读者们可能会很诧异,深兰科技到底做了哪些创新,又对当下乃至未来一段时间的AI研究带来怎样的影响?
沿着这些问题思考,或许我们能对AI技术与产业逻辑,有更深一层的理解与认知。
深兰科技的创新成绩单
既然是硬核学术会议,自然还是成绩说话。我们先来看看深兰科技在三大顶会拿奖到手软的各种创新算法,究竟都在做什么。
就以此次ECCV为例,深兰科技获得双冠的GigaVision 2020挑战赛,是由清华大学基于其新推出的数据集PANDA而组织的。
PANDA是全球首个十亿像素级别视频数据集,在如此大规模的数据集上完成图像多类别目标检测,既要保证算法能够在目标尺度变化、拥挤遮挡的复杂情况下准确地识别出行人和车辆这两种不同的目标,还要保证足够高效,在十亿像素级别分辨率下快速完成。
显然,这一任务的完成,能够对大规模现实场所中的行人检测、动作识别、异常检测等带来技术上的飞跃,让人脸识别、无人驾驶、监控安防等应用结果更准、效率更高。
而针对技术上的难点,深兰科技DeepBlueAI团队在检测赛道将任务解耦为多个子任务,把难点独立出来重点解决,并根据以往检测经验,通过所积累的模块和方法,使得结果有了进一步的提升。最终以领先第二名2.6个百分点的成绩强势获得冠军。
在其他类目的挑战赛中,深兰科技DeepBlueAI团队相继完成了基于部分MSCOCO数据集来进行80个类别目标检测的小样本学习任务;在不使用任何预训练模型从头开始训练的限制下,在ImageNet的子集上获得最高的准确率;运用优化数据增强方法、特征提取器、后处理等方法,对无人机视角拍摄的图片,完成车辆、行人等目标的定位分类……
上述成绩,都只是深兰科技2020年研究成果的一部分,也是其技术积淀和底蕴的又一次佐证。
实际上,在ICCV 2019,深兰科技就曾在VisDrone Challenge (无人机视觉挑战赛)中,运用Cascade RCNN+DCN+FPN+DoublueHead检测器,以及IOU Tracker+ KCF+Tracklet vote的跟踪算法,来解决部分目标过小、数据分布影响预训练效果等难题,最终以领先4个多百分点的巨大优势获得两项冠军。
CVPR 2020的NightOwls 检测挑战赛,也为参赛者们设置了不小的难题。现有的视觉检测算法不能很好滴解决夜间场景图片中的行人,这无疑会给无人车夜间行驶的可靠性、监控安防的安全性能等都带来了一定的限制。
所以NightOwls就开展了相应的比赛,而深兰科技也顺利在 “单帧行人检测”和“多帧行人检测”两个赛道中拿下了冠军。夜间行人检测与白天行人检测相结合,能够打造适用于不同天气条件、全天候的行人检测系统,让现实世界的出行安全更有保障。
关于深兰科技在数个AI顶会上的创新表现,我们就不在此一一枚举。可以肯定的是,深兰科技作为中国AI企业的代表,在顶会竞赛中大放异彩,不断向全球传达和证实着中国AI力量的实力,达到了世界领先水平。
深兰科技的学术+产业“双循环”模式
大家可能会好奇,在计算机视觉这一竞争激烈的赛道上占据技术上的多方位领先,深兰科技到底做了些什么?
这恐怕就要从深兰科技的业务逻辑说起了。
我们知道,2017年开始的人工智能资本热潮,带动了一大批AI企业的涌现,大致可以归为两类:
一种是专研算法的技术型企业。其核心资产是算法、数据等能力,需要引入深度学习领域的高级人才,大量投入底层算法研发与创新,常常需要跟谷歌、微软、Facebook这样的科技巨头“抢人”。尽管投入巨大,但也正是这一类企业推动了人工智能底层技术的不断精进,而一旦达到规模效应,就很容易占据行业领军者的位置。
而另一种则是产业升级的应用型企业。商业逻辑也很清晰,就是向算法供应商购买技术,通过自己的工程师团队将其打磨成体验良好的成熟AI产品,借助自身的服务能力与销售渠道将解决方案售卖出去。
而有意思的是,深兰科技走出了一条独特的路。
借用2020年十分火爆的一个关键词“双循环”来形容,深兰科技一边在各种AI顶会上寻求技术上的系统性、基础层面的领先,一边带动AI技术落地应用、服务民生,开辟了一个“基础技术+产业联动”的双循环模式。
举个例子,前面提到深兰科技在CVPR 2020各个挑战赛中提出的多项检测与分类算法,就被落地应用在了智能熊猫公交车等产品上,让公交车自主制动和运行,为城市公共交通提供了新的选择;乘客扫手就能上车,体验和效率都大大提升;智能机器人还能感应驾驶员和安全员的实时状态,最大程度地保障乘车安全;借助关键点检测打造“异常行为识别系统”,车厢内有人摔倒、偷盗等情况都可以及时告警……
再比如,智慧城市建设中部署的许多商业化摄像机,难以在恶劣天气下保持比较稳定的识别准确率,给城市管理带来了很多隐患。深兰科技夺冠的“挑战赛雾天条件下的(半)监督目标检测任务”,恰好就针对这类问题,让摄像机在恶劣天气环境或光照条件较差的情况下,依然能够很好地完成任务,让深兰科技的客户或集成其算法的企业能够更好地使用AI。
今年春节期间,面对防疫工作中的测温刚需,深兰科技快速上线的AI热感视觉行为监控系统——猫头鹰,就融合了多种世界冠军级技术,采用了红外热成像技术和自主研发的机器视觉算法,深度融合红外和可见光图像,人们只要进入被测温范围就能实时测出体温,无需停留,在防疫的同时大大方便了出行。而能如此快速地打造出服务社会的刚需产品,显然离不开深兰科技将长期的技术积累与产业需求深度整合的能力。
正是这种底层研发突破与产业标准化落地的双重效应,让深兰科技在学术竞赛中彰显实力的同时,也很快将先进算法落地,借由产业化的规模效应实现商业价值,再进一步推动AI技术的进步,进入自身发展的良性循环。
行稳致远,未来可期
一边是技术创新,一边是应用落地,深兰科技显然选择了一条更难走的道路。大部分人可能会问,有必要吗?
比如直接售卖算法或者解决方案,深兰科技始终坚持基础研究和应用开发双落地的模式,可能并不讨巧,却成为中国AI形成差异化优势的关键巨助力。
将视角放在全球技术竞赛的大背景下,会发现中国AI依然需要在基础研发上加速追赶。
北京智源人工智能研究院发布的《人工智能下一个十年》中就提到,在AI全领域,2009-2020年期间全AI领域被45个顶会和顶刊录取论文数据显示,中国学者量和论文量都约为美国的1/3,十年间美国AI论文量超出中国4万多篇。
想要拿下全球顶尖的技术桂冠,最根本的是要提高自身的创新能力。从这个角度看,像深兰科技这样不断向基础研究发起冲锋的科技企业,正在建构起中国AI未来十年的竞争“天顶”。
另一方面,如火如荼的新基建热潮背后,要解决各行各业、不同场景下对算法精度、性能的要求,在信息化不足、数据缺失等传统行业完成智能化改造,更需要领先算法来保驾护航,完成与产业端的深度整合。
如果说技术能力是舟,那么对产业应用的重视与探索就是桨,帮助AI更平稳地驶向大海。
舟楫相配,得水而行——或许是深兰科技带给我们对未来最美好的想象。
评论