狂奔的荣耀,稳健的苹果:AI Agent 手机竞速赛
每一次技术革命,都需要一个技术落地的锚点,比如燃油革命时代的汽车,信息革命时代的 PC 与手机。而这一次以预训练大模型为主导的 AI 技术爆发中,被认为最有可能成为智能技术落地锚点的,就是 AI Agent,或者称为智能体。
从技术逻辑上看,AI Agent 是一种能够感知环境、进行决策并执行动作的智能实体。它在思考与行动方式上和人类极其相似,又与此前的数字化系统具有天翻地覆的差异。所以很多人认为,AI 时代的终局是得 AI Agent 得天下。
这一点也在得到越来越多科技企业与科技领袖的认同,比如比尔·盖茨就认为,“谁能主宰 AI Agent,那才是大事。因为你将永远不用去搜索网站或者亚马逊”。
通俗地理解,AI Agent 就是能感知、能理解、能行动的全职助手,而这种能力与手机的结合可谓天命所归,因此在所有 AI Agent 的落地路径里,手机是最关键,也是最受期待的一条。
曾几何时,我们会理所当然地认为,像 AI Agent 手机这种富有变革力的创新将由苹果来完成。但有趣的是,故事的走向打破了所谓“常识”的束缚。
9 月 6 日,荣耀 CEO 赵明在 2024 德国柏林消费电子展(Internationale Funkausstellung Berlin,)首次向外界透露荣耀 AI Agent 相关创新成果。他向全球发布了业界首个跨应用开放生态智能体,同时宣布荣耀 AI Agent 将在下一代荣耀全能旗舰荣耀 Magic7 系列上落地商用。
这意味着,发布首款 AI Agent 手机的并不是苹果,而是荣耀。
尤其值得注意的是,在苹果也将打造 AI Agent 手机的背景下,荣耀带来的是开放给所有第三方服务,不设置应用边界的“真智能体手机”。
这个关于 AI 时代手机创新的故事,究竟在何时更改了剧本?
让我们向前回溯两家公司,乃至不同科技力量为 AI 时代所做的准备,梳理荣耀先于苹果落地 AI Agent 的逻辑。
最终我们或许会发现,天命之争,在于朝夕之进取。对于荣耀,对于整个中国 AI 产业来说都是如此。
当 AI 裹挟着巨大的技术想象力来到手机,带来了手机底层交互逻辑的变革。
智能手机的基本交互逻辑是点划操作,所有的服务与功能都需要用户在层层点击与滑动之后才能找到。但 AI Agent 却可以听懂、看懂用户的诉求,甚至预判用户的想法,从而代替用户触达服务与功能。这种交互逻辑的改变,就将手机从“人找服务”,变成了“服务找人”。
由此一来,手机也将在 AI Agent 的帮助下,成为最贴近科幻文化中对人工智能进行想象的科技形态。
手机行业的有识之士,纷纷看到了这次变革的意义。于是我们能够看到,荣耀与苹果所代表的手机产业前瞻性力量,对 AI 手机与 AI Agent 技术的布局是高度相似的。
在不久之前的苹果开发者大会(WWDC24),苹果推出了 Apple Intelligence,宣布将 AI 技术与 iOS 操作系统进行深入融合,系统级提升用户的 AI 体验。此时大家会惊奇地发现,苹果提出的 AI 战略路径,与更早之前荣耀提出的平台级 AI 和 AI 四层架构不谋而合。二者都高度强调 AI 之于手机,不能停留在单一应用、单一服务的表层,而是必须深入系统架构,用 AI 技术打通并实现全局化的能力升级。
如果说,打造系统级、平台级的 AI 技术以及意图识别框架,是为真正的 AI 手机打好了地基,那么地基上盖起的房子,就应该是 AI Agent。
不少专业人士预测,苹果推出 Apple Intelligence 的目的即打造 AI Agent 手机。而最有可能成为其发布节点的,就是 9 月 10 日的苹果新品发布会。
然而就在这样一个时间节点上,荣耀率先官宣了开放生态下跨应用的 AI Agent 体验,并预告荣耀 AI Agent 将在荣耀 Magic7 系列落地商用,从而使其成为行业首款真正意义上的智能体 Al 手机。
虽然在 AI 手机的整体战略目标上,荣耀与苹果高度一致,但实现快慢上却已经产生了差距。
在时间差之外,还有更值得注意的一点,那就是 AI Agent 手机的开放性。目前,Apple Intelligence 只作用于苹果第一方应用,并不向第三方开放。这意味着接下来苹果推出的 AI Agent 能力,必然也将局限于第一方生态。
与此同时,荣耀却宣布并不认同苹果将 AI Agent 锁在围墙花园封闭生态里的做法。荣耀的 AI Agent 不仅打通了所有系统自带服务,还将向所有第三方服务开放。
这种开放能力差异,可以从两方面来理解。一方面是苹果并没有做好技术上的充分准备,无法呈现出难度更大的 AI 能力开放策略;另一方面,这也展现了苹果多年以来的保守态势,并不轻易让利于第三方服务,也不执行超过“标准”的创新突破。
无论是哪种原因,抑或兼而有之,从中都可以看到苹果与荣耀,虽然在 AI 手机的战略目标上高度重合,但在执行方案、执行界面与执行能力上却大相径庭。
与苹果的保守态度相对,荣耀选择积极与全球产业链协作,决心将用开放打破封闭的战略执行到底,成为业界首个在开放生态下落地 AI Agent 的智能终端厂商,将全面整合包括第一方与第三方在内的 AI 应用与服务,最终为用户打造出一个“时刻在线的 AI 个人助理”。
平行对比之下,可以看出在 AI Agent 手机的目标下,荣耀与苹果的不同:
苹果的战略质量很高,但行动能力较差。就像苹果应对 XR、5G 芯片、汽车等风口一样,整体力求稳健,价值导向也倾向于保守,不希望与其他软件厂商搭建新的合作链路,也不希望进行过多的技术投资。
但荣耀在保证了高质量战略的前提下,选择在最早的时机,用最开放的姿态,尽全力抢跑,也正是这种狂飙突进的策略,才让荣耀跑赢了庞然大物的苹果,在下一个路口给出了关于 AI Agent 手机、用户和伙伴更希望看到的那张答卷。
手机智能体的天命之争,或许开启于同一个远见,却决胜于能否在每一步都用尽全力。
面向 AI 手机的大势,面向 AI Agent 落地的目标,荣耀与苹果的战略执行方式,究竟在什么时候开始出现了差异?
出乎绝大多数人的意料,答案应该是在八年之前。换句话说,在苹果刚刚向全世界宣布决定面向 AI 之路做出改变的时候,荣耀已经在这条路上整整奔跑了八年。
2016 年,那时候 Alpha Go 还没有赢下围棋冠军,科技界对 AI 的想象大多停留在科幻电影。但荣耀却在这个时刻,已经看到了 AI 的潜力,看到了“从人找服务,变成服务找人”的必然性。
在这一年,荣耀发布了 Magic 一代手机,在业内首次提出手机 AI 的概念。记得荣耀 Magic 的理念,是开启手机智慧之门。这扇被推开的门,不仅是荣耀 Magic 系列将 AI 技术与手机产品进行融合的探索,更是在平台级、系统级 AI 赛道的长期持续投入。荣耀在 AI Agent 上最终实现的领先,来自以八年为跨度的战略预判,也来自以八年为周期的持续研发投入。
2018 年,荣耀 Magic2 发布,这一代产品在计算机视觉、自然语言处理、决策系统、推荐系统等 AI 上更加炉火纯青。尤其值得注意的是,荣耀 Magic2 在业界率先搭载了具备自进化、自学习的智慧生命体 YOYO。
如今回头来看,会发现 YOYO 的产品逻辑与 AI Agent 达到了天衣无缝般的一致。二者虽然有多年跨度,但在功能目标、技术路径以及服务实现方法等层面毫无区别。这种预判能力,让荣耀成功预演了未来。而在彼时,预训练大模型的概念甚至还没有被提出。
在产业界有这样一个逻辑,你可以先修好足够结实的路,然后等待汽车的速度越来越快。到时候,你自然就拥有了全世界第一条高速公路——YOYO,就是手机与 AI Agent 时代间的高速公路。
2022 年,荣耀最早在业界提出了平台级 AI 的理念,宣布从底层构筑 AI 操作系统,并在 2022 年底发布 AI 使能的个人化全场景操作系统 MagicOS 7.0。在这个时间节点上,受到大模型之风的吹拂,手机行业开始集体向 AI 掉头,而荣耀则已经远航到了下一片群岛。
2023 年,荣耀在业界首次提出将把 AI 大模型引入端侧。接下来到 2024 年开年,荣耀正式将 LLM 大模型引入到了产品中,并且在荣耀魔法 OS 8.0 中带来了行业首个基于意图的智能终端交互新范式——意图识别人机交互(Intent-based UI)。
至此,将 AI Agent 作为个人助理,带进手机与生活的准备终于做完。荣耀每一步都实现了业界领先,每一步都拿出了非常激进的技术路径与开放的生态方案。
用冲刺的方式,跑这场长达八年的马拉松,或许是跑向 AI 时代的唯一方案。
我们知道,即使发展到今天,手机中也有大量操作复杂繁琐、让人摸不着头脑的服务与功能,比如说,取消付费订阅。
即使是资深手机用户,也很难找到取消订阅的具体方法,更遑论老人、儿童等。而在此次 IFA 期间,荣耀展示了通过 AI Agent 来取消订阅的操作。用户可以通过智能体实现一键关闭自动续费。同时,智能体还可以带来一键点饮品、一键旅行规划与订票等多项颠覆性 AI 体验。
见微知著,从目前荣耀展示的 AI Agent 能力中,我们可以发现其至少已经具备三个显著特征:
1.具有完整的技术差异化体系。
相比于处在概念阶段,或者仅有单一能力的所谓“AI Agent”。荣耀搭建了完整的 AI Agent 技术能力体系,其具备四大技术特征:它必须具备自然语义理解和计算机视觉;必须理解并学习用户行为习惯,能够进行场景环境感知;它必须具备意图识别和决策能力;它必须能够在应用内和跨应用执行操作。
通过多年积累,荣耀不仅达成了高度成熟的 AI Agent 能力,同时更为这条赛道的未来发展奠定了标准化基础。
2.解决了“安全性”这个最大顾虑。
如果什么都交给 AI 助手了,那我如何确保其不出错,并且足够安全?这个安全性难题,是 AI Agent 技术路径上用户的最大顾虑,也是业界更多厂商不敢轻易尝试的主要阻碍。为此,荣耀已经构筑了完整的 AI Agent 安全性保护流程。从演示中看,在开启智能体后,用户界面会以视觉动效的形式提醒 AI Agent 已启动并接管手机;在理解意图后,荣耀 AI Agent 将提示在操作哪些应用,及其操作步骤,确保每个步骤的状态可知;在整个工作流中,AI Agent 随时可以被人工接管进行下一步操作;涉及取消自动续费等重要决策,AI Agent 会把决定权归还用户,用户必须手动进行确认。
这样一套流程机制,确保了 AI Agent 具有足够的安全性。
而安全性是可用性的前提,也是 AI Agent 能够长期稳健发展的基础。
3.打造了巨大的延展空间。
可以预见,具备完整、成熟 AI 技术框架的荣耀,未来将把越来越多的功能和服务接入荣耀 AI 智能体。比如在工作场景中,帮助用户处理邮件、整理文件、安排日程等;在生活场景中,智能体可以进行美食推荐、出行规划、娱乐活动建议等服务;在学习场景,智能体能够协助用户快速查询资料、制定学习计划、解答疑难问题。
每一个场景,每一个功能的深耕,都可能带来巨大的用户体验升级,为产业生态构筑新的流量与商业红利。AI Agent 的可探索性,在今天才刚刚开启。
荣耀 Magic7 系列将成为 AI Agent 的首秀舞台,也会成为荣耀在 AI 之路上的新起点。
或许在科技市场上,从来没有什么“常识”,没有人可以规定创新一定要由谁完成,没有人能确定谁比谁更领先。
有的,只是看准了方向就尽力奔跑。一步更快,未来更近;不留余力,便得天命。
荣耀如此,时代亦然。中国 AI,或许就将这样快天下一步。
版权声明: 本文为 InfoQ 作者【脑极体】的原创文章。
原文链接:【http://xie.infoq.cn/article/75e9e2988f9c0e3eb369edc42】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论