层出不穷的机器学习框架到底在“卷”什么?
如今,机器学习在图像识别、多媒体创作、自然语言处理、搜索广告推荐等领域都有着广泛的应用和不俗的表现。面对日益繁杂的应用场景,机器学习框架有助于节省编写大量底层代码的精力,也能省去部署和适配环境的烦恼,更聚焦业务场景和模型设计本身,因而被越来越多的行业接受。
全世界最为流行的深度学习框架有 Tensorflow、PyTorch、Caffe、Theano、MXNet、Torch、PaddlePaddle 等,这些开源框架均表现出色,各有各的优势和特色。随着深度学习技术的普及,各家框架的成熟化,深度学习技术的门槛会越来越低。
但对于像小红书这样业务发展迅速的产品而言,双列场景和以 UGC 内容分发为主的特点,对系统的高时效性和稀疏内容表达提出了更高的要求,数据的处理挑战与日俱增。因此,开发符合自身业务需求的机器学习框架往往是更好的选择。
与此同时,在机器学习框架的实际应用中也诞生了许多共性的问题:
掌握一个深度学习框架,开发者需要做哪些准备?
深度学习框架能“包治百病”吗?是否适用于所有应用场景需求?
如何充分利用 CPU、GPU 的硬件能力提升机器学习效果?
工业界的深度学习框架会有什么不同?
就在 10 月 19 日 19:00,小红书技术 REDtech 邀请到了国内的深度学习框架初创公司 One Flow 的创始人袁进辉,与小红书智能分发部负责人瑞格带来新一期【REDtech 来了】技术直播。他们将围绕机器学习框架在工业界实际应用的挑战与前景展开精彩分享。
袁进辉,2008 年于清华大学计算机系获得工学博士学位(优秀博士学位论文奖),2008~2011 年在清华大学计算机系从事计算神经科学方面的博士后研究,原微软亚洲研究院主管研究员。于 2017 年创立北京一流科技有限公司,致力于打造新一代深度学习框架 OneFlow。目前,他还兼任之江实验室天枢开源开放平台架构师,北京智源人工智能研究院大模型技术委员会委员。
瑞格,小红书智能分发部负责人,在小红书搭建了支持超大规模参数的在线学习训练框架,支持搜广推个性化模型学习,通过前沿算法的不断探索显著提升了分发效果。曾在百度凤巢从事超大规模分布式训练算法研究,实践了如万亿特征 LR、GBDT、大规模稀疏离散 DNN 等模型工业界应用,并在工业界广泛应用。在百度研发了适用于搜索广告相关性问题的半监督学习算法,显著提升了广告相关性。
详细日程
直播收看攻略:
时间:2022 年 10 月 19 日(周三)19:00-21:00
直播平台:关注【小红书技术 REDtech 】视频号,预约直播,不见不散。(直播也将在抖音与 B 站同步进行,搜索“小红书技术 REDtech ”)
扫描下方二维码进入直播交流群,将第一时间获取直播链接及开播提醒。
我们将在微信群内发布嘉宾演讲精华和抽奖活动, 参与互动提问还有机会被嘉宾 pick 解答哦。
版权声明: 本文为 InfoQ 作者【小红书技术REDtech】的原创文章。
原文链接:【http://xie.infoq.cn/article/79951e5a0dd1a3a8c87f42742】。文章转载请联系作者。
评论