京粉智能推广助手 -LLM based Agent 在联盟广告中的应用与落地
一、前言
拥有一个帮你躺着赚钱的助手,听起来是不是有点心动?依托于京东联盟广告平台,借助 AIGC 大语言模型出色的理解、推理、规划能力,我们推出了京粉智能推广助手机器人,帮助合作伙伴拥有自己的智能助理,为京东联盟的推客提供更加智能的一站式经营服务。1、京东联盟是什么?
《京东联盟》是联合广大媒体合作伙伴帮助京东推广商品、扩大品牌知名度的合作平台。 经京东许可的任何个人或公司加入京东联盟后,获取相应推广代码或链接进行推广,当用户完成有效购买行为时,京东联盟会员即可获得佣金。2、为什么要做京粉智能推广助手?
业务上,京粉 App 是京东联盟的客户端产品,有日均百万的合作媒体和个人推客用户每在京粉上推广商品赚取佣金,在推广助手推出之前,经过联盟业务近些年的发展,有越来越多的功能和玩法活动加入进来,推客如何选品、推广、参加活动以及经营数据的分析都分散在各个功能模块中,用户学习经营的成本越来越高,问题也越来越多,人力维护成本也会越来越高,如果有一个助手可以帮助推客,随时解答用户问题、利用数据分析指导用户如何进行选品推广、什么时间该参加什么类型的活动,那么将会有更多的用户愿意加入进来帮助京东进行推广。
技术上,随着大语言模型技术的不断成熟,助手类应用也更加容易落地,借助 AIGC 大语言模型出色的理解、推理、规划能力,使用自然语言的交互形式,充分理解推客的个性化经营诉求,深度结合了广大推客的实际推广链路,从智能选品、推广建议、素材生成、经营指导等多方面为推广者带来经营升级,解决了传统被动交互形式中需求差异巨大及获取信息效率低等问题。
二、如何做?
京粉智能推广助手集合了知识问答、素材创作、选品推广、经营数据分析等一系列功能,几乎涵盖了助手类应用的所有应用场景,仅仅依赖通用大模型的能力是不够的,这里就需要一个强大的智能体(Agent)进行规划、决策和执行,同时让智能体拥有记忆和使用工具能力,用户通过自然语言多轮对话的方式进行交互,重点将从以下三部分来介绍:•Agent 架构:分为两部分,一部分是通过对模型的训练提升 Agent 的核心大模型识别工具的准确性,另一部分要设计一个可扩展并安全可控的 Agent 架构来填充和扩展业务能力。•记忆:多轮对话应用中如何组织、存储和检索记忆来提升大模型对用户的理解。•快捷回复:利用快捷回复做用户意图的路径规划,实现业务目标。
下面我们对实际应用落地中的一些经验进行分享和探讨。
三、实战 1-AI Agent1、为什么要用 Agent?
联盟场景有很多自有知识、活动、和数据,大部分都有现成的接口来提供这些数据,由于大模型本身对于垂类场景专业知识不足、知识的时效性差、容易出现幻觉等因素,直接使用大模型来和用户做交互很容易出现问题,需要大模型来理解用户的意图并能够利用联盟已有的工具才能更准确的回答用户的问题,但是大模型本身是无法与外部环境进行交互的,所以要用 Agent 来解决。2、挑战•工具的识别:通过实验发现,市面上开源大模型对于外部工具使用能力只有 Chat GPT-3.5/4 以上的准确率才能符合要求,但是成本很高,在企业应用中需要训练自己的大模型学会如何更准确的识别工具。•Agent 架构:当前 Agent 仍处于发展的初级阶段,从应用场景来看,从智能客服->智能创意->推荐系统->自动驾驶->智能机器人到一个复杂的城市智能规划系统,所需要感知与交互的环境因素越来越复杂、所要决策的事项也越来越困难,所面对的风险程度和安全级别也差异很大,所以目前没有一种通用的 Agent 适合在所有场景使用,每种应用场景都需要根据其特点、成本、效率、风险相结合来设计 Agent 架构。3、技术方案
京粉智能推广助手的业务主要需求:功能
知识问答
经营分析
推广选品
·目标模糊的(过年送长辈的礼物)·无目的
对于推荐的商品,要有推荐理由、同品/相似品多维度对比(佣金、价格、销量、评论等)分为简单任务和复杂任务。复杂任务可以通过特定的任务流实现
文案生成
...
从功能需求来看,既有简单任务,又有复杂任务,而且随着时间的推移,增加的任务会越来越多,同时业务的定制化内容越来越复杂,对 Agent 的难度会增加很多,为了平衡从业务、安全、成本、效率考虑,最终我们通过自定义任务流与 agent 自主决策相结合的方式,兼容了动态规划、自主决策执行任务流与业务的可定制化、可扩展性。
4、业务效果
四、实战 2- 记忆
对于多轮对话形式的大模型应用来说,上下文信息对于模型理解人类需求有很大的帮助,如果没有记忆,在多轮对话中,大模型的表现会比较割裂,长期的记忆也会让模型对用户的习惯、偏好有更好的认知。1、挑战
1.1.由于大模型 token 的限制,和系统内存的限制,无法将用户的所有历史信息进行存储和加载到模型中。
1.2.如何模拟人类大脑记忆和检索方式,构建长/短期记忆。
1.3.多轮对话中的垂类领域知识的结构化记忆。2、技术方案
五、实战 3-快捷回复
从线上实践的数据分析来看,快捷回复功能在整个系统或用户交互上都是使用率最高的,所有的用户都存在选择困难,特别是在一个全新的应用场景中,用户在首次使用时,用户都喜欢使用一些给定的功能,所以如何利用好快捷回复的能力,通过快捷回复引导用户朝着业务目标路径执行,这个也是比较有意思的点。快捷回复的三种实现方案
1.通过历史信息和用户的当前输入,利用大模型总结续写能力,生成一些用户可能继续输入的内容。
2.结合应用的功能预设一些常用问题。
3.重点:可以根据应用的业务目标,来规划用户使用路径图,使用户按照快捷回复的路径最终达成我们需要的业务目标,在实际业务中可以结合 1、2 点,既有用户想输入的,又有我们想让用户看到的功能。
比如京粉智能推广助手的最终业务目标是帮助推客选品并推广,那么所有的功能点最终都要导向帮助推客生成推广文案和推广链接并分享。
六、总结与展望:
本文主要总结了开发大模型应用的一些实战经验,通过对 AI Agent + 工具 + memory+快捷回复可以解决通用大模型应用的常见问题。时至今日,京粉智能推广助手已经服务了近百万的推客,产生了上亿的 GMV。当然,在应用的实际开发中还有很多需要优化的地方,我们也在不停的迭代升级中,未来还需要从以下几个方面持续优化:
1、垂类领域用户意图的理解:结合垂类业务的特点,通过自然语言沟通交流的方式,更加精准更快速的识别用户的意图,模型上需要大量的真实可靠的业务数据来进行训练,机制上需要对 Agent 进行升级,多个更加专业的助理进行协作,例如 multi Agent 的应用。
2、生成式推荐技术:对现有推荐系统进行技术变革,从召回、排序、重排固有的推荐链路演变成直接生成用户所需的内容或商品。
3、成本效率:大语言模型虽然很强大,但是其应用也带来巨大的成本和效率上的考验,如何在垂类领域采用较小的模型实现大模型的效果,如何对模型推理加速,提高计算利用效率,降低机器成本,也是我们长期需要考虑和优化的地方。
在这里也欢迎各位在该领域有兴趣的有志之士加入或合作,利用技术让我们的业态更加丰富与有趣。
版权声明: 本文为 InfoQ 作者【京东科技开发者】的原创文章。
原文链接:【http://xie.infoq.cn/article/27cefcc593239755a85bdacec】。文章转载请联系作者。
评论