2 篇论文入选 KDD 2022!腾讯广告持续探索效果提升新思路
8 月 14 日至 18 日,被誉为全球数据挖掘最高级别学术会议、反映最前沿数据领域研究风向的 ACM SIGKDD 2022 (下称 KDD 2022)正式举行。腾讯广告共有 2 篇论文被 KDD 2022 收录,彰显了腾讯在数字广告领域的前沿视野与以技术探索效果边界的行动力。
如何进一步革新广告技术,才能得到投放效果的最优解?这始终是平台方持续探索的命题。
随着各大平台流量增长放缓,亟需以技术为驱动,提升对商品、人、场景的理解维度与深度,促成高效精准的匹配。以提升用户体验,腾讯广告致力于提升品牌与用户每一次相遇的效率与体验,实现品牌和平台、用户多方共赢。
从去年开始,腾讯广告展开了从基建到算法的技术探索,对广告系统进行持续升级。一方面,依托底层太极机器学习平台,系统打造广告大模型,提升在召回、粗排、精排等竞价环节的匹配效率,持续优化广告投放全链路;另一方面,系统基于行业知识和数据提炼特征进行建模,持续优化算法,提升每一次投放的转化效率和效果。
本次被 KDD2022 收录的两篇论文,就分别从用户画像和合约广告发力,探索更高效的广告效果转化:
录用论文 1:
《 Mixture of Virtual-Kernel Experts for Multi-Objective User Profile Modeling 》
在广告和推荐系统等工业应用中,多样化和准确的用户画像可以极大地帮助改进个性化体验。当前,深度学习广泛应用于从用户标签建设,即通过历史交互行为挖掘含有实际意义的标签,例如对广告的点击、转化等行为动作可以挖掘出表达用户兴趣/意向的标签。通常采用的方法是,面向多个动作(action)时,每次以单个动作为建模目标,引入多套独立的双塔模型(由于标签众多,单塔复杂性高)来预测用户对标签发生该动作的可能性(看作对标签的 CTR 或 CVR 预估),预估出高得分的标签可以用来表示用户的喜好(兴趣/意向)。然而,多个独立的模型之间不能互补地学习,当某些动作的样本比较稀疏时也不能很好地支持模型学习。此外,由于双塔之间往往缺乏信息融合,这类设计无法很好地预估用户对各种不同主题下标签的喜好程度。
该研究摒弃了业界常用的双塔结构模型算法,独辟蹊径采用了创新型的多虚拟核专家混合模型(MVKE),用于统一联合学习用户对各种不同动作和主题的喜好。在 MVKE 中,我们提出了虚拟内核专家的概念,该概念侧重于对用户喜好的一个特定方面进行建模,并且所有这些方面都在统一协调地学习。此外,MVKE 中使用的 Gate 结构在两个塔之间构建了一座信息融合桥梁,提高了模型的性能并保持了仍然保持了双塔具备的较高的效率。我们将该模型应用于腾讯广告系统,在线和离线评估表明,与基线方法相比,我们的方法具有更好的表现,并对实际广告收入产生了明显的提升。
录用论文 2:
《CONFLUX: A Request-level Fusion Framework for Impression Allocation via Cascade Distillation》
合约广告与效果广告构成了广告平台的两条平行利润流。由于广告主不同的诉求(品牌效应或短时影响力),导致了不同的广告售卖模式(批量售卖或竞拍售卖)和定价方式(固定单价或波动竞拍)。随之而来的问题,是如何通过合理的分配用户曝光打破两类广告市场的中间壁垒。通过在全局最高点售卖曝光,提升平台的总体收益。这种融合两类市场的分配过程使得合约广告和效果广告之间,以及定向重合的合约广告之间的竞争关系更加复杂。此外,非平稳的用户流量模式和效果广告出价分布使得上述曝光分配构成无监督问题,且难以衡量每次分配的效果优劣。显然,已有的静态或者粗粒度的建模方案都不足以很好的解决该问题。
该研究提出了一种创新的请求级融合排序框架 CONFLUX,通过在两种不同业务逻辑的广告市场,即合约和效果广告之间合理的分配曝光以提升平台总体收益并保证广告投放效果。该框架基于级联式的结构设计:首先通过线性规划生成分配范式,将原问题有监督化。然后利用复杂深度学习模型在请求级粒度上建模广告之间的竞争关系,并将范式提炼为可供轻量级模型学习的经验信息。在线上服务阶段,为了缓解模型衰退并适应线上分布迁移,本文引入时序蒸馏损失。通过在新旧模型之间保留有用信息,周期性的微调线上服务模型同时防止过拟合现象的发生。这一工作流程类似于化学中的级联蒸馏并因此得名。CONFLUX 算法被实际部署于腾讯广告系统并运行超过六个月。线上 A/B 测试以及与基线方法的对比都表明本文提出的方案能在保证广告投放效果的同时,显著提升平台总体收益,实现广告主和平台的共赢。
KDD 作为数据挖掘领域历史最悠久、规模最大的国际顶级学术会议,由美国计算机学会(ACM)数据挖掘及知识发现专委会(SIGKDD)主办,迄今为止已举办了 28 届,被中国计算机学会(CCF)推荐为 A 类国际学术会议,云集了数据领域最前沿、最顶尖的技术趋势与成果。吸引了数据挖掘、机器学习、大数据、AI 等领域的多位顶级学者与从业人员、学生慕名投递论文。
KDD 论文非常看重论文的 “落地应用性”,选拔标准极高。据悉,今年共计接收到 2448 篇投稿,仅有 449 篇被录用,接收率仅为 18.3%。本次入围,不仅是对上述两篇论文的前沿性及突破性予以认可,更是对腾讯广告技术实力的再次肯定。
围绕技术增效的恒久命题,腾讯广告亦将围绕在机器学习平台、大模型算法等领域进行搜广推的持续探索和深耕。
评论