写点什么

基于偏置图采样的关联产品推荐优化

作者:qife
  • 2025-08-06
    福建
  • 本文字数:847 字

    阅读完需:约 3 分钟

在电子商务平台中,向用户推荐与查询相关的产品(如为购买手机的顾客推荐手机壳)是常见场景。产品关联关系通常用有向图表示,其中边的方向性至关重要:推荐手机壳给买手机的顾客合理,但反向推荐则不合逻辑。


在去年欧洲机器学习会议(ECML)发表的论文中,已证明通过为每个图节点建立双重嵌入(作为推荐源和推荐目标的向量表示),图神经网络能有效捕捉产品相似图的方向性。今年在 ACM 网络搜索与数据挖掘会议(WSDM)上,该研究得到进一步扩展——提出根据节点连接度(与其他节点的连接数量)定制嵌入过程的新方法。这种方法既能利用高连接度节点的中心性,又能通过更长的连接链收集稀疏连接节点的信息。


实验在六个公开数据集上进行,比较新模型与三种前沿模型的性能,测试每次查询推荐 5/10/20 个产品的情况。通过命中率和平均倒数排名衡量,新模型全面优于其他模型,相对次优模型的优势幅度从 4%到 230%不等。


图神经网络工作机制图神经网络(GNN)以图作为输入,输出每个节点的嵌入表示,这些嵌入不仅包含节点自身信息,还包含其与其他节点的关系信息。GNN 嵌入是迭代进行的:首轮基于节点关联信息(如产品信息)生成初始嵌入,后续轮次结合自身及其连接节点的嵌入进行更新,该过程可重复直至覆盖整个图。


对于具有大量密集连接(高连接度)节点的图,在嵌入过程中对所有邻居节点进行采样可能不切实际。传统 GNN 实现存在两个局限:固定采样邻域范围(通常 1-2 跳),以及采用均匀采样策略(所有邻居具有相同采样概率)。


BLADE 方法创新提出的 BLADE(偏置局部自适应方向感知)方法解决了这些局限。其核心创新包括:


  1. 根据被嵌入节点的入度(入向边数量),使用幂律分布动态计算邻域范围

  2. 在嵌入过程中,通过综合考虑邻居节点的出入度来加权采样概率


除公开数据集外,在两个大型内部数据集上的测试显示,该方法相对次优模型的改进幅度达 40%-214%。该方法使高连接度节点能发挥其信息中心性优势,同时为稀疏连接节点扩展信息收集范围,从而显著提升推荐系统性能。更多精彩内容 请关注我的个人公众号 公众号(办公 AI 智能小助手)公众号二维码


办公AI智能小助手


用户头像

qife

关注

还未添加个人签名 2021-05-19 加入

还未添加个人简介

评论

发布
暂无评论
基于偏置图采样的关联产品推荐优化_图神经网络_qife_InfoQ写作社区