广告拍卖模拟器 AuctionGym 获最佳论文奖
广告拍卖模拟环境
全球范围内的网页广告展示机会通常通过实时广告拍卖进行销售,每天发生数十亿次。某中心赞助展示等产品代表广告客户参与拍卖时,需学习帮助广告主实现目标的竞价策略。过度竞价会导致展示机会成本过高,而竞价不足则会错失机会。理论对此提供的指导有限,实践中需要大量试错。
在今年的 ACM 知识发现与数据挖掘会议(KDD)计算广告研讨会上,关于 AuctionGym 的论文获得最佳论文奖。该模拟环境支持对在线广告拍卖的强盗算法和强化学习方法进行稳健且可重复的评估。
技术实现
论文将竞价学习问题形式化为离策略反事实估计与学习,指出现有方案多遵循基于价值的范式——即对特定拍卖中的投标结果建模并用于实时决策。研究还提出基于策略和双重稳健反事实估计器的替代方案,这些方法能消除单一拍卖结果建模产生的偏差,提供无偏的策略价值预估。
拍卖机制由广告交易平台实施,决定竞价获胜者及其成本。尽管经济学文献对激励相容拍卖(如 VCG 拍卖和 Myerson 拍卖)有深入研究,但实践中仍存在许多开放问题。例如,对于两件商品和两个投标人的简单场景,收入最大化拍卖机制仍未解决。
实证挑战
在线广告拍卖的异质性和复杂性使理论分析变得困难,实际实现往往仅部分参考理论成果。而实验数据获取成本高昂,观察性数据能回答的问题范围有限。此外,现代广告拍卖设计可能鼓励策略性竞价,但学术界难以获取评估替代策略所需的数据集,离线评估方法也存在局限。
AuctionGym 通过端到端模拟重复拍卖轮次(从展示机会到最终转化)来改善对拍卖动态的理解。投标人拥有包含广告、目标及其私有估值的目录,这些估值可来自预设分布或真实数据。该工具内置多种标准拍卖机制,支持追踪拍卖方收入、投标人福利、广告支出回报率(ROAS)等多项指标。
开源与扩展
项目代码已公开,旨在帮助研究者(涵盖计算机科学、机器学习、经济学等领域)深入理解拍卖动态,并开发解决领域开放问题的新方法。详情可访问开源仓库。更多精彩内容 请关注我的个人公众号 公众号(办公 AI 智能小助手)公众号二维码

评论