王世杰:读博被美国拒签之后
王世杰,一流科技研发工程师(实习)。目前他在华中科技大学读研,研究方向是计算机视觉。爱好有很多,篮球、乒乓球、游泳等等都能玩。
一纸禁令,曾让他的学业生涯遇到一个大拐弯。按照本科时赴美读博的设想,他跟大部分准备留学的学生一样,刷 GPA、考托福和 GRE、申请学校,走完所有流程后终于拿到了 offer。就在准备踏上新征程之际,出于“技术敏感”的原因,美国政府将部分来自中国高校的理工科留学生拒之门外,而他不幸就是其中一员。留学梦碎,但他的科研路依然在继续,他相信,一切都是最好的安排。
以下是王世杰自述。
2016 年,我在华中科技大学读的本科,考虑到要去国外读博,所以也需要刷 GPA 成绩。国内的本科教育拿高分其实非常简单,只要会考试就可以了,和这门课学的怎么样相关性不是非常大,我基本上平时上课听讲,考前一到两周复习下就可以,毕业时我的 GPA 成绩排名年级第三。
不过,当时我的编程能力非常一般,甚至有一点畏惧,做过的实践项目很杂。当时感觉做前端非常酷炫,就加入了学校的团队一起学前端技术做网站,另外我们电子信息工程专业做硬件的也挺多,就跟着同学做一些硬件开发板上的集成系统,后续还做过微信小程序的导航系统等等。这些项目让我接触了很多不同技术栈,知道了它们具体做什么的,怎么做的,主要是锻炼了 coding 能力。
我一心想出国读博做科研,所以本科阶段就跟着本校一位老师做了一些有关视觉攻击的研究,还水了一篇 IEEE 会议,因此有一定的计算机视觉研究的基础。
暑研是出国深造必须要做的,我就直接联系了南洋理工大学的老师,打电话交流之后就过去当研究助理,去了之后眼界大开,知道了很多计算机视觉的研究方向,也发掘了自己对这一领域的兴趣,并且决定深耕这一方向。我自己也参与了一些研究项目,但当时还很菜,没有非常专注努力,就没有做出很好的科研成果。
不过,为了出国读博,我刷 GPA,考托福、GRE,做科研,参加了各种 Phd 的面试,后来拿到了美国 Northeastern University 的 offer,觉得很不容易,但十分遗憾的是,由于技术敏感的原因最终被拒签了。不过,我相信一切都是最好的安排,将来有机会还是想出国去看一看。
现在,我在华中科技大学读研,科研的话是 all in 的状态,玩命儿思考,玩命儿做实验,基本上每天 90%的工作时间都要分配给科研。
MIMDet 是我正在做的一个新项目(https://github.com/hustvl/MIMDet),探索了掩码图像建模预训练的 ViT 高效地应用于实例预测(dense prediction)的新框架,利用掩码图像建模预训练的优势,只利用部分输入进行高效地训练,同时摆脱分层 Transformer 的限制,利用 plain VIT 进行更好地扩展, 我们在 COCO 数据集上使用 ViT-Base & Mask R-CNN 达到了 box mAP=51.5,mask mAP=46.0。
当然,在校生要提升自己的能力,直接去公司实习,参与真实的项目开发,提升是最快的。我身边参与开源项目的同学不多,不过参与开发像 OneFlow 这样的项目是一件很酷的事,如果能全职做开源,那简直太幸福了。
2020 年初,考虑到自己的 coding、工程能力不太行,想找一些底层开发的实习,看到袁老师发了招人信息就直接联系的他,OneFlow 做的是深度学习框架,觉得不错,也比较符合自己之前的经历,聊过之后就来了。
在 OneFlow,我主要负责模型库开发,同时参与很多算子开发以及相关测试,还有 API 开发等等。基本上,我一个人负责 OneFlow Detection 模型,参与了 flowvision 的开发(https://github.com/Oneflow-Inc/vision/tree/main/flowvision),也是在 OneFlow 真正学会了怎么用 CUDA 写算子,这对日后的研究工作帮助非常大,工作日常基本就是开发模型->修系统 bug->修 bug->训练模型->修系统 bug,如此循环。
在 OneFlow 实习期间,技术氛围浓厚,时间相对自由,最关键的是支持远程办公。在这里学到了很多,包括开源项目的开发流程、分布式系统开发、CUDA 编程,测试代码等等。未来的话,暂时也会先考虑去业界工作。感谢泽康、晓雨、天和、建浩、迎港、露阳、迟哥、德澎、新奇、袁老师等同事。
其他人都在看
欢迎下载体验 OneFlow v0.7.0 最新版本:https://github.com/Oneflow-Inc/oneflow/
评论