深度解析：如何善用大模型构建推荐系统的最新范式

2024-11-19
北京
本文字数：4351 字
阅读完需：约 14 分钟

在当今数字化时代，推荐系统已成为众多在线平台的核心组件，深刻影响着用户体验和业务效益。随着人工智能技术的迅猛发展，大模型的出现为推荐系统带来了前所未有的变革机遇。2024 年 10 月底，EARL 工作坊组织召开了第 18 届 ACM 推荐系统会议，此次研讨会由百度参与支持，作为展示推荐系统这一广泛领域的新研究成果、系统和技术的顶级国际论坛，会议汇集了来自学术界和工业界的研究人员和从业人员，讨论在一系列创新应用环境中提供推荐组件的新趋势和挑战。今天，笔者将就这次大牛云集的研讨会展开探讨，分析当下的大模型能力是如何构建推荐系统的最新范式的。

一、数据缺失难题的破局

推荐系统的精准性依赖于海量数据，但数据缺失一直是个棘手的问题。传统的数据填补方法往往难以捕捉数据中的复杂关系，导致推荐效果不尽人意。大模型，尤其是深度学习领域的预训练大模型，凭借其强大的表示学习能力和泛化能力，在处理复杂数据关系上展现出了前所未有的潜力。这些模型通过在大规模、多样化的数据集上进行预训练，能够学习到数据之间的深层次、非线性关系，这对于弥补数据缺失带来的信息损失至关重要。

在推荐系统中，大模型可以通过以下几种方式有效应对数据缺失问题：

1.特征嵌入与自监督学习：大模型能够学习用户和物品的高维特征嵌入，这些嵌入向量能够捕捉到用户和物品之间的潜在联系，即使某些直接交互数据缺失，也能通过相似特征的用户或物品进行信息补全。同时，利用自监督学习技术，模型可以从无标签的数据中学习有用的表示，进一步丰富数据的内在信息，提高推荐的准确性。

2.图神经网络（GNN）的应用：将用户-物品交互视为图结构中的边，用户和物品作为节点，大模型结合图神经网络可以高效地在这种复杂网络结构中传播信息。即使某些节点（用户或物品）的直接连接信息缺失，GNN 也能通过其他路径间接传递信息，填补数据空白，提升推荐系统的鲁棒性（指系统在面对不确定性和干扰时，仍然能够维持其功能和性能的能力）。

3.多任务学习与迁移学习：大模型支持多任务学习框架，可以同时优化多个相关任务，如评分预测、点击率预测等，通过共享底层表示来增强模型对数据的理解能力。此外，迁移学习允许模型将从源域（如其他相关数据集）学到的知识迁移到目标域（当前推荐系统），即使目标域数据稀疏，也能利用外部知识提升性能。

4.生成模型的应用：基于大模型的生成对抗网络（GANs）或变分自编码器（VAEs）等生成模型，可以生成高质量的伪数据来填补缺失值。这些模型能够学习数据的分布，并据此生成看似真实的新数据点，从而在一定程度上缓解数据稀疏性问题。

5.注意力机制与记忆网络：大模型中的注意力机制能够动态地聚焦于输入数据中最相关的信息，即使这些信息在原始数据中并不显眼或分散。结合记忆网络，模型可以存储并检索过去的信息，有效应对序列数据中的缺失问题，特别是在时间序列推荐或会话推荐中表现尤为突出。

在这些能力的加持下，大模型可以较好的弥补推荐系统数据缺失的难题，提高推荐准确性，减少信息损失的可能。

二、推荐系统的最新范式

对于网页推荐系统来说，不仅要解决数据问题，还要应对如何提供高质量推荐的挑战。与传统的多阶段过滤和基于匹配的推荐不同，现在可以根据用户的个性化输入直接生成推荐项目，进行简单的单阶段推荐。这种范式转变不仅提高了推荐准确性，还通过单阶段推荐提高了效率，并根据自然语言提示为用户提供了更好的可控性。本次演讲将从多个角度介绍生成式推荐，包括推荐的基础模型、项目表示、文本 ID 学习、项目索引方法、多模态推荐、提示生成以及推荐基础模型的可解释性。

1.突破传统定位：拓展推荐系统的边界

（1）超越传统编码器与打分器

传统推荐系统中，编码器主要负责将用户和物品信息转化为低维向量，打分器则基于这些向量计算用户对物品的偏好得分。然而，大模型凭借其强大的语义理解和生成能力，突破了这一局限。通过直接处理文本、图像等多模态数据，无需复杂的特征工程即可理解用户和物品的语义信息。例如，在推荐新闻文章时，大模型可以直接解析文章内容，理解主题、情感倾向等关键特征，而不仅仅依赖于预先定义的结构化特征。这种能力使得大模型在特征提取方面更加灵活和全面，能够捕捉到传统方法难以发现的深层次信息。

（2）涉足特征工程领域

特征工程是构建有效推荐系统的关键环节，但传统方法往往耗时且依赖领域专家知识，大模型的出现改变了这一局面，它可以自动生成有意义的特征表示，通过对大量数据的学习，挖掘出用户和物品之间隐藏的关联模式。例如，在电商推荐中，大模型可以从用户的浏览历史、评论等文本数据中提取出诸如购买意图、风格偏好等复杂特征，为推荐系统提供更丰富、精准的输入。这不仅减少了人工特征工程的工作量，还提高了特征的质量和多样性，从而增强了推荐系统的泛化能力。

（3）掌控推荐流程控制

传统推荐系统的流程相对固定，缺乏灵活性和适应性。大模型通过其逻辑推理和指令跟随能力，实现了对推荐流程的动态控制没，根据用户的实时反馈、上下文信息以及业务规则，灵活调整推荐策略。例如，在旅游推荐中，如果用户在搜索过程中表达了对特定目的地的偏好，大模型可以立即调整推荐流程，优先推荐符合该偏好的景点、酒店等相关内容，实现更加个性化、情境化的推荐服务。这种动态控制能力使得推荐系统能够更好地应对复杂多变的用户需求和业务场景。

2.重塑推荐流程：实现一体化与高效精准

（1）逻辑推理驱动一体化

大模型具备逻辑推理能力，因此能够在推荐系统中实现端到端的一体化处理。从用户需求理解到物品筛选、排序，大模型可以在一个统一的框架内完成。

以在线教育平台的课程推荐为例，大模型可以根据用户的学习目标、历史学习记录以及当前的知识掌握程度，通过逻辑推理确定最适合用户的课程类别和具体课程。在这个过程中，无需多个独立模块之间的繁琐交互，减少了信息传递过程中的损失和延迟，提高了推荐流程的效率和准确性。

（2）指令跟随提升效率与准确性

大模型能够理解和遵循自然语言指令，这为推荐系统带来了全新的交互方式和更高的效率。用户可以用自然语言表达自己的需求，如 “推荐一本适合初学者的编程书籍，要涵盖数据分析方面的内容”，大模型直接根据指令进行精准推荐，这种指令跟随能力不仅提升了用户体验，还使得推荐系统能够快速响应复杂的查询需求。同时，大模型在生成推荐结果时可以综合考虑多种因素，如用户偏好、物品质量、实时热点等，通过深度推理和权衡，提供更加准确、符合用户期望的推荐内容，有效避免了传统推荐系统中常见的过拟合或欠拟合问题。

（3）优化推荐流程的迭代与创新

大模型的引入还促进了推荐流程的持续优化和创新。通过对大量用户行为数据和反馈信息的学习，大模型可以不断改进推荐算法和策略。例如，根据用户对推荐结果的点击率、停留时间、购买转化率等反馈指标，大模型可以自动调整推荐模型的参数，优化物品的排序规则，甚至发现新的推荐模式和关联。这种基于数据驱动的迭代创新能力，使得推荐系统能够与时俱进，适应不断变化的市场需求和用户行为模式，保持在竞争中的优势地位。

以百度云智能推荐为例，其技术架构师基于用户数据、行为数据、物料数据多方数据源训练三段式”召回-排序-融合“推荐算法，依托百度高性能高可靠的工程架构保障，助力构建全链路推荐系统，实现了推荐、内容和搜索三位一体模式，通过搜索推荐行为融合相互补强，达到个性化推荐的效果。

综上所述，大模型在推荐系统架构中的重塑作用是全方位、深层次的。它突破了传统推荐系统的角色限制，向更广泛的领域扩展，同时通过重塑推荐流程，实现了一体化、高效精准的推荐服务。随着技术的不断发展，我们有理由相信，大模型将继续推动推荐系统向更加智能化、个性化的方向演进，为用户和企业创造更大的价值。

三、案例演示

上文提到的百度云的智能推荐系统，利用大模型，打造搜索推荐双引擎一体化，赋能内容分发和消费增长，其工作逻辑如下图：

全链路个性化策略：召回机制、排序模型以及运营策略规则均支持个性化配置，显著提升运营的灵活性；
丰富多样的特征挖掘：多维立体的用户画像标签；基于相似用户的兴趣以及交互记录进行个性化推荐；
完整的效果优化工具链：通过 AB 实验可快速验证策略和模型的效果，以提升整体业务目标；在展现控制环节，分发规则可控可人工干预。

因其搜索推荐一体化的特性，使得百度云可以构建简单可依赖的端到端的智能推荐引擎，包括接入简单、使用简单和维护简单；提供多场景推荐 api，含猜你喜欢、相关推荐、热门推荐开发接口；内置多种机器学习、深度学习模型，通过简单的无代码化配置完成 ai 模型调用，屏蔽复杂性；全方位的服务监控，含接口调用、接口异常、服务健康度、用户交互等统计，监控无死角；预置百家号内容物料数据，无需接入开箱即用。

四、应用场景

1.信息流推荐

在全渠道内容管理中，大模型（LLM）凭借其强大的语义理解和学习能力，能够深入分析用户的历史行为数据，包括浏览记录、购买历史、搜索关键词等。通过对这些数据的挖掘，大模型可以识别出用户的长期兴趣偏好以及短期行为变化趋势。例如，在音乐推荐平台上，大模型可以从用户长期收听的音乐类型中判断其对某种音乐风格（如古典、流行、摇滚等）的偏好，同时根据近期频繁收听的特定歌手或歌曲，捕捉到用户当前的兴趣热点，从而为用户行为预测提供丰富的信息基础。通过对用户行为预测的深入分析，利用先进的数据分析工具和技术，结合用户标签和行为数据，快速优化内容的分发策略，精准推送用户期待的内容，以满足其需求和兴趣，从而提高终端用户在站内的活跃度和粘性。

场景优势：

推荐策略适配度高：根据用户标签和行为数据，可以定制符合用户兴趣和需求的推荐策略，适配度高，降低企业开发与试错成本。
精准获取用户心智：通过对用户标签和行为数据的深入分析，可以更准确地了解用户需求和兴趣，精准获取用户心智，从而提升用户粘性与活跃度。

2.商品推荐

根据用户属性、历史行为、兴趣偏好等多维度指标，结合先进的算法模型，为用户在 APP 首页、相似商品页、购物车页等关键场景进行精准个性化推荐。

场景优势：

用户浏览时，根据实时行为数据推荐相关商品、兴趣商品，提高用户购买意愿，从而提升商品销售转化率；
在相关页面，通过智能推荐系统提供的猜你喜欢与相关推荐功能，增加产品曝光量，进一步挖掘用户的潜在购物需求，提升整体销售效果。

总而言之，大模型深刻变革推荐系统架构与算法，可精准预测用户行为、实现个性化与多样化推荐、解决冷启动问题。未来，其有望进一步提升推荐精准度与效率，但面临数据隐私、模型可解释性等挑战，需持续探索以释放更大潜力。

参考资料

研讨会信息：

https://earl-workshop.github.io/

发布于: 刚刚阅读数: 5

爱AI的猫猫头

关注

还未添加个人签名 2024-04-30 加入

还未添加个人简介

发布

暂无评论

创作场景