大模型 + 搜索:一盘跳棋和三位选手
我们都知道,大模型必须诞生应用才有价值。那么,哪种应用才能最快发挥出 AI 大模型的价值潜力,成为大模型落地的第一站?提起这个问题,很多人会首先回答:搜索。
这一方面是因为,在 ChatGPT 爆火之后,“大股东”微软首先就将其能力融入到 Bing 搜索中,并且一度宣布要凭借大模型优势,把行业老大哥谷歌挑落马下。那么在中国 AI 圈大规模复刻大模型的背景下,在应用侧也自然会想到首先推进搜索+大模型。
另一方面,搜索引擎天然有着与 AI 深度结合的优势。早在 2014、2015 年,百度和谷歌这些传统搜索引擎巨头就开始将深度学习、知识图谱等 AI 技术融入搜索当中,以此提升搜索引擎对用户指令的理解能力,增强搜索结果的内在关联性。
由此可见,大模型+搜索,可谓是天时地利人和。经过近一年时间的探索,中国 AI 行业的大模型+搜索应用也逐渐丰富了起来。虽然大模型带给搜索的改变并没有彻底浮现出来,但已经形成了较为多样化的探索思路。
为了能让大家更生动了解大模型+搜索的目前进展,理解不同思路的差异化。我们想了一个比喻:大模型+搜索,就像一盘跳棋。各位选手手里的棋子都是一样的,即大模型技术与搜索技术。而他们的最终目标是一致的,即孵化大模型时代的第一个爆款应用。
但在下棋的过程中,各自的棋路却有不同。目前来看,它们分为三个流派。
选手一:大模型作为搜索引擎的增强插件
搜索,是互联网时代人与信息之间最为频繁的接触场景。搜索引擎既需要理解用户意图,也需要理解海量信息。作为信息与人之间的枢纽,搜索引擎提升智能水平的需求是永无止境的。
而大模型为搜索引擎带来的差异在于,它不仅能够加强传统搜索引擎的体验,还能够通过 AIGC 模式带来各种对用户意图与搜索结果的内容生成能力。
举个例子,大模型不仅能够提高搜索精准度,还可以把搜索出的多个结果合并生成到一个内容框里,节省用户时间。这相当于在传统的搜索框架外,给用户了一些额外的搜索工具。
基于这种思路,业界开始探索大模型+搜索的第一种模式:把大模型能力,当做搜索引擎的增强插件。在国内市场上,这个流派的代表是百度。
搜索业务,可以说是百度通过文心大模型能力进行产品改造的第一站。目前阶段,百度已经在搜索引擎中添加了两种基于 AIGC 能力的“增强插件”。
首先,是在首条回答中进行信息聚合。
在 AI 技术与搜索结合的过程中,百度非常强调“首条搜索结果即满足用户需求”的理念。而大模型能力,可以将搜索结果进行关键信息的聚合,从而生成内容摘要。基于这种模式,百度在搜索引擎中更新了首条回答能力,其覆盖范围不仅是文字信息,还可以通过大模型对视频进行理解从而归纳摘要。在这种模式下,加入用户想要搜索的结果在视频内容中,用户就可以不再去观看视频,而是通过首条回答直接得到视频内容的总结归纳。
百度公布的数据显示,过去首条搜索满足率只有 40%左右,而在加入大模型能力后,这一比率达到了 70%。可见大模型能力作为搜索引擎插件,是收获正向反馈的。
另一种“增强插件”式的大模型结合搜索,是在搜索栏之外专门提供一个 AI 对话栏,也就是百度搜索在今年 5 月移动生态大会上推出的“AI 伙伴”能力。
AI 伙伴可以与用户进行 AIGC 问答,帮助用户在使用搜索引擎时完成诸如答案标记、提供信息来源、总结文档概要等能力,同时还支持其他工具和服务的调用。
也就是说,百度在搜索引擎界面内,以及搜索引擎之外,都提供了基于大模型能力的 AIGC 插件,从而让搜索引擎获得多个角度的大模型重构。无独有偶,这一思路与谷歌将 Bard 聊天机器人整合到搜索引擎中非常相似
可见具有搜索引擎传统优势的厂商,更倾向于将大模型作为增强插件,多角度融入传统搜索引擎这种“1+1 大于 2”的思路。
选手二:类 ChatGPT 的搜索应用
在增强传统搜索引擎能力之外,大模型还带来了另一个问题:是否有可能绕开传统搜索形态,直接基于 AIGC 能力产生新的搜索产品?
在这种可能性上也出现了一些探索。ChatGPT 本身即具备语义理解、多轮问答、内容生成等能力,从某种程度上看,这也可以看作是一种“搜索”。只不过搜索的内容从关键词变成了提问和需求,搜索结果从网页变成了直接生成文字内容。
于是,中国 AI 行业中出现的一种新型搜索产品,可以被称为类 ChatGPT 搜索。其中具有代表性的“参赛选手”,是昆仑万维推出的天工 AI 搜索。
这种搜索引擎完全以 AIGC 作为产品核心逻辑。用户通过自然语言来表达需求意图,随后搜索界面反馈出相关答案,而不再像传统搜索引擎一样展现大量网页链接。
相对来看,天工 AI 搜索的一个创新点在于信源索引。在使用 ChatGPT 等 AIGC 平台时,我们经常会面临一个问题,就是 AI 回答内容的不确定性。极多问题大模型都无法给出正确答案,甚至会胡乱编造论据、文献出处、新闻源等,也就是广受吐槽的“AI 一本正经地胡说八道”。
而天工 AI 搜索则强调了生成答案的同时给出参考信息源,从而确保用户能够追溯信息的可参考性,极大规避了 AIGC 平台的信任难题。并且其参考信息源也相对丰富,包含了新闻网站、知识问答平台、视频等。
但在目前阶段,类 ChatGPT 搜索与 AIGC 平台的界限还难以区分,用户对其认知还不明确。这种模式有待于进一步的市场普及与用户检验。
选手三:大模型落地垂类搜索
在搜索引擎格局相对稳定之后,曾经出现过这样一种产业思路:通用搜索机会不大之后,搜索引擎可以在垂直搜索领域发力,从而夯实对该领域有持续搜索需求的用户群。搜狗搜索、夸克,都曾经在垂直搜索领域发力。其中夸克凭借垂直搜索能力,在年轻用户群中获得了不错的成绩。
大模型+搜索的第三种思路,是将大模型率先落地在垂直搜索当中。以此强化具体搜索领域的自然语言理解能力与信息检索体验。在这个领域,目前的代表选手是夸克。11 月 14 日,阿里巴巴智能信息事业群发布了夸克大模型。立足于自身的差异化定位,夸克大模型应用会优先落地在专业搜索等信息服务领域。而除了基础的大语言模型之外,夸克大模型还将衍生出医疗、教育等垂类模型,可见夸克对专用知识领域的重视程度。
目前来看,医疗、教育、人文社科,是大模型落地垂直搜索的几个主要方向。这几个方向都对信息源有着极强的要求,并且存在关键词模糊、有效信息较少、逻辑性较强等特点,相比于通用类搜索来说,更加适合大模型发挥出自己的特性。同时,优先将大模型与垂直搜索进行结合,也可以很好地降低产品成本,提升大模型的应用于搜索领域的整体效率。
事实上,还有一种垂类搜索与大模型结合的变体,就是各家网盘目前都在上线具备自然语言理解能力的搜索功能。可以通过模糊描述、形容词等关键信息来检索网盘资料,尤其是对图片、视频等内容进行搜索。
都是超级应用的跳板
那么问题来了,到底哪种模式才是大模型+搜索的正确解答呢?
不好意思,答案只能是虚席以待。
大模型+搜索,是一个在逻辑上非常具有前景的大模型落地场景。因此在 ChatGPT 刚刚开始爆火后,微软就将大模型能力打造为 BingChat,并对谷歌搜索放出了诸多狠话。但时间过去了快一年,微软已经将很多 AI 能力剥离出了搜索业务,而谷歌的市场霸主地位也没有受到什么影响。可见这一场景从理论到实践,还有不断的路要走。
回望国内市场,会发现三种探索模式还各自为战,并没有产生太多交锋,在用户侧也没有掀起对大模型+搜索的普遍认知,甚至其落地程度远不如类 ChatGPT 的对话应用本身。究其原因,可以发现三点:
1.这三种大模型+搜索的尝试,都没有完成产品形态从 0 到 1 的突破。而生在此前的搜索引擎、AI 对话产品上进行加强和补完,因此不具备非常引人关注的产品爆发点。
2.目前阶段,大模型对搜索体验的提升在大众用户端体验感不强。其更多只能作为学术、IT 等领域的专业工具。
3.除此之外,大模型+搜索的商业化空间并不明晰。加入大模型技术之后,搜索产品的商业模式与商业化水平都没有发生较大的变化,因此受到资本市场的关注不足。
长远来看,大模型+搜索的最终目标,一定是形成大模型时代的超级应用。如同互联网时代搜索引擎的出现一样,彻底改变人们的信息获取与交互模式。
而如果以此为目标,今天的大模型+搜索探索必然还是棋子行进路上的跳板。也只有让棋子持续跳下去,未来某个节点才可能发生质变。
只要能让大模型和搜索互为动力,持续跳向前方,那么前景中的光明依然远大于黑暗。
版权声明: 本文为 InfoQ 作者【脑极体】的原创文章。
原文链接:【http://xie.infoq.cn/article/236b72d82ae3884a719e27a8c】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论