华为大咖说丨关于 AI 大模型发展的商业思考
本文作者:方茂元(中国区ICT咨询规划部首席专家)全文约2606字,阅读约需7分钟
由于工作原因,我对 AI 大模型战略有一定的研究,对此我认为我们需要跳出技术本身来思考产业发展规律,原因如下:
AI 不改变世界,只是加速世界变化(就像汽车相对于马车,世界有了更快的交通工具);AI 需求层次与马斯洛需求层次理论模型非常像,从生理需求出发,人首先是个动物,AI 首先需要算力;
安全感是人在吃饱穿暖后的下一个诉求,而我们需要算力来解决工商业过程中的突出问题;
大模型遵从尺度定律,智慧来源于见多识广;但有知识与智慧不一定能干好打仗这件事,商业领袖才能干好打仗这件事,因此小模型才是金字塔尖;
对商业节奏的把握:泛化性是基础、专业性是抓手、经济性是追求。
从商业角度驾驭 AI 是很多企业需要思考的,我试图从马斯洛需求层次理论来理解大模型,结果如下图所示:
马斯洛需求层次理论模型与 AI 大模型需求层次比对
01 马斯洛需求层次与 AI 大模型需求层次的五层类比
第一层:生理需求与算力平台变现
GPU 作为实现计算加速的主要硬件,其市场需求持续增长。
具体到变现途径,一方面,随着人工智能领域的竞争加剧,高性能 GPU 的需求不断增加。例如,英伟达的 A100 GPU 成为数据中心专用的主流选择,其高性能使得它在训练大型语言模型等方面发挥着关键作用。另一方面,随着算力需求的增加,高性能 GPU 的价格也随之上涨,这为持有者提供了通过出售或租赁 GPU 来变现的机会。
近期,我接触了比较多工业软件中的求解器,多数都寄希望 GPU 加速,这不正是 AI 时代的生理需求吗?
第二层:安全需求与 AI 时代软件生态
在生理层次上,人的安全性需求有相对舒服、钱、工作等。对于 AI 大模型来说,安全需求体现在哪些方面呢?我这里通过 CUDA Toolkit(NVIDIA 提供的一套开发工具)的例子来给大家说明一下。CUDA Toolkit 包含了编译器、调试器和性能分析工具,为 CUDA 编程提供了基础环境。CUDA 的生态系统不仅吸引了大量的开发者,还推动了 GPU 的销量和市场份额的增长。CUDA 的存在使得英伟达的 GPU 不仅仅是硬件产品,更是一个强大的计算平台,这在很大程度上巩固了英伟达在人工智能和高性能计算领域的领导地位。
与此类似,Intel 作为开源领域的积极参与者,尤其是红帽(一家领先的开源解决方案提供商)的重要支持者,其软件生态的蓬勃发展亦对硬件芯片的销售产生了积极的反哺作用。这种软硬件相互促进的良性循环,恰似社会中稳定且舒适的工作岗位,不仅满足了基础的安全与发展需求,还成为推动社会整体进步的重要力量。
第三层:爱和归属需求与通用大模型
从这一层次开始,人有了超出动物本能的更高需求,这一层次的需求主要包括两个方面:
一是友爱的需要,即人人都需要伙伴、同事之间的关系融洽或保持友谊和忠诚;人人都希望得到爱情,希望爱别人,也渴望接受别人的爱。
二是归属的需要,即人都有一种归属于一个群体的感情,希望成为群体中的一员,并相互关心和照顾。这种需求属于较高层次的需求。
通用大模型通常基于广泛的公开文献和网络信息来训练,旨在提高泛化能力,以适应多样化的任务场景。通用大模型的优势在于其广泛的适用性和灵活性,能够在多个任务和场景中发挥作用,降低了研究者和开发者在选择具体任务和场景时的成本。然而,由于信息中可能存在错误、谣言或偏见,以及专业知识与行业数据积累不足等问题,通用大模型的行业针对性与精准度可能不够。
通用大模型就像一位特别会聊天的邻家大叔,天上道理懂一半,地上道理全都懂,但他的道理都是“战狼系列”,没有变现能力,还是穷困潦倒。
第四层:尊重需求与行业大模型
尊重需求是指人们对自尊和被尊重的需求,包括自尊心、自信心、权力、地位等。人们需要感到自己有价值,受到他人的尊重和认可。对于个人而言,满足尊重需求可以增强自尊心和自信心,让人们更加自信地面对生活中的挑战。而一个人要想被尊重,就意味着要拥有专业能力、权力、地位等。
行业大模型专注于特定领域的训练,以提高在该领域的泛化能力,更适应特定行业的需求,通过专业知识和数据的训练,能够更高效地为用户提供精准服务;同时模型参数较少,训练和推理成本更低,优化也更容易。此外,通过私有化部署等方式,行业大模型还能更好地保护企业数据,避免敏感信息泄露。
第五层:自我实现需求与小模型
自我实现需求是指人们对自我实现和自我超越的需求,包括实现自己的理想、发挥自己的潜力、追求自我完善等。人们需要感到自己在不断进步和成长,实现自己的价值和理想。对于个人而言,满足自我实现需求可以带来成就感和满足感,让人们更加充实和幸福。
自我实现需求映射到 AI 大模型领域,行业大模型往往被视为技术专家与管理精英,小模型则更接近于商业领袖的角色,它们超越了个人利益的局限,聚焦于更广泛的社会价值与经济影响,从而在自我实现的层面上达到了新的高度。
02 AI 时代的魔鬼三角
魔鬼三角定律无处不在:
婚姻段子中的魔鬼三角:帅气、多金、忠诚的男友基本上是骗子;
新能源中的魔鬼三角:安全可靠、经济可行、绿色低碳;
投资中的魔鬼三角:高收益、低风险和高流动性;
区块链中的魔鬼三角:安全性、可扩展性、去中心化;
项目管理领域中的魔鬼三角:时间、成本、质量;
AI 模型中的魔鬼三角则依次是:泛化性(通用性)、专用性、经济性。
过往 1-2 年,我接触了一些大模型(ChatGPT 等),体会如下:
大模型具有泛化性:我在给客户进行数字化咨询的过程中需要个业务助手(类似于一个初级医生),但是大模型反馈出来的唠唠叨叨的文档(排版也不错)就是没有干货(例如:客户最想看到业界最佳实践,但大模型反馈出来的基本没有)。
行业数据库:行业数据库需要咨询师作二次加工,对客户需求确实比较专用,但无法通用。
经济性:我个人喜欢古文风对联,但怀疑是否存在这样一个汉语大模型,即使能够干出来,商业闭环也是个问题。
华为曾经向业界宣誓:我们的大模型只干事、不写诗。我这样理解干事与写诗:
干事代表在 2C 和 2B 侧帮助客户解决问题。基于盘古大观模型在 2C 侧干事好理解,无非帮助 2C 客户翻译、查找、识别通用信息,C 端需求相对比较通用。
写诗其实不难,但是在经济社会中,风花雪月根本就没有人关心,没有人付费更没有人评价,因此没啥用。
B 端干事不好理解。你做钢铁大模型,你炼过钢吗?你做气象大模型,你懂气象动力学方程吗?所有 2B 模型基本上都遵从工商业知识萃取后进行表达,才能成为人工智能,否则就是人工智障。
结论:从大模型出发,以商业变现为重点,这才是让大模型干事还是写诗的底层逻辑。
伙伴们,你们对 AI 大模型的发展有什么思考吗?欢迎在评论区交流。
(文章内容 10%左右来自大模型的支撑)
评论