钛媒体专访|对话澜舟科技周明:大模型炒作过热,创业公司要选好赛道
周明表示,“企业用户对千亿模型是用不起来的,推理也慢,代价成本太高。”
每当国外兴起一个新技术,国内蜂拥而上开始各式各样的创业,这在过往已经不甚新鲜,如今的大模型面临着相似的问题。
在由 51CTO 主办的 WOT 全球技术创新大会期间,谈及大模型是否炒作过热的话题,澜舟科技创始人兼 CEO 周明对钛媒体 App 表示,从正面看,说明中国对新技术的追求和自驱能力较强,但是行业需要注意泡沫问题。
“花很大的功夫训练一个不好不赖的模型,对厂商自己是一个学习锻炼的过程,但对社会可能不一定有用。哪怕创业,可能白白浪费了很多创业资本和投入”,周明说。
澜舟科技成立于 2021 年 6 月,是由创新工场孵化的一家从事 AI 2.0 大模型研发的认知智能公司。以自然语言处理(NLP)技术为基础,提供新一代认知智能平台,其主要产品是基于“孟子大模型”核心技术打造的一系列能力平台和垂直场景应用。
3 月份,澜舟科技对外宣布完成了 Pre-A+轮融资。该轮融资由北京中关村科学城公司领投,斯道资本和创新工场跟投。不到一年时间内,澜舟科技融资总额达到了数亿元。
大模型要选好赛道
大模型带来了认知智能技术的跨越式发展。AI 大模型从 1.0 到 2.0,从简单能力+针对具体任务的专用模型,到复杂能力+面向泛任务的通用模型,大模型推动着语言理解、多轮对话、问题求解进入了基本可用时代。
另外,大模型的发展还有效解决 NLP 任务碎片化问题,大幅度提高研发效率,这也标志着 NLP 进入工业化可实施阶段。
在周明看来,大模型将成为各行各业的基础模型,通过云计算、本地部署和端,成为企业服务中枢。以金融行业为例,周明在分享中介绍了“孟子金融大模型”如何帮助金融客户通过大模型实现业务创新。
他认为,行业厂商要根据自己的能力,选好不同的赛道,比如 To C 是一个赛道,To B 是一个赛道,To Developer 可能也是一个赛道。不同的公司、不同的团队、不同的基因,企业要根据自身基因来选择不同的赛道。
“如果服务 To B 客户,可能训练一个百亿到千亿的模型,因为 To B 主要依赖的是大模型的语言理解能力。To C 的话或者是跟 OpenAI 对标,一定要做到很强的 AGI(通用人工智能)能力,这就要求更多的 GPU 卡,比如说一两千块 GPU 卡可能都少了,五千到一万块 GPU 卡可能最有竞争力”,周明表示。
据了解,澜舟科技未来将推出 300 亿或 500 亿参数的模型,但是会比较慎重地去做千亿模型。“企业用户对千亿模型是用不起来的,推理也慢,代价成本太高。对我们来讲,训练一个开源模型大概要投入一个亿左右,任何一个大模型团队都要谨慎”,周明说。
澜舟科技坚定选择了 To B 赛道,聚焦于金融、营销、文化创意、机器翻译等场景。周明表示,做 To C 客户是“千军万马过独木桥”,跟大家水平一样是不行的,还要比别人做得更好,实际上是一个“军备竞赛”。
而 To B 企业客户的需求相对稳定,因为他们的重点不在大模型本身,而是如何跟企业和行业结合。大模型对算力的要求趋缓,厂商可以花很大的精力研究行业数据,与客户合作做好最后一公里的场景,建立相应的护城河。
基础模型不会一家独大,生态至关重要
有观点认为——“全中国只需要一个基础模型”,周明表示,现在做任何判断还比较早,但是一个基础模型的状态不会实现。
“无论是技术能力还是威望,让老百姓放心的安全的各种方面,中国目前并不存在这样一个公司或者是企业。此外,不同的大公司都有自己的不同生态,也不会用其他公司的生态。比如一家公司的社会关系网络做得好,大概不会用某个搜索公司的大模型,或者电商做得好的人,也不愿意将自己的模型提供给有竞争关系的公司使用,反之亦然。”周明说。
“中国不太注重生态,一般都是把别人全‘灭’了、全‘杀’了,其实自己也没有发展起来。”周明认为,未来将是多生态共存,每个生态至少有某一个基础模型。
鉴于过去互联网包括移动互联网的发展历史,在这次大模型时代,行业厂商应该有一种平和的心态,无论是各行各业的大中小型企业,无论是开发者和用户,最好能够形成建立生态的共同认知,使大家都能在大模型时代受益。
周明举例道,以 To B 场景为例,To B 就像一个汪洋大海,每一个涓涓细流都可以养一些鱼,鱼都可以很自由地在那里游泳活下来,甚至活得很滋润。
“微软与 OpenAI 也无法把所有每一个细分的行业、每一个具体的任务、每一个场景都做到最好。第一,它没那么强的能力,人手有限。第二,它也没必要这么做,做生态让上下游有所受益,整个生态繁荣,就是它自己的贡献,也是它从中获益的渠道。”他说。
To B 存在很多新的创业机会,包括对客户、行业的理解,客户与大模型团队的互动,形成某种意义上的战略合作伙伴,或者形成所谓数据飞轮、功能飞轮,做得越深,相应的壁垒就越高。任何一个公司进入到该领域,包括巨头公司,都要花同样的功夫进行积累。
“相较于传统互联网,大模型蕴藏着十倍、百倍的机会,它解决了人工智能的问题,智能就覆盖所有事情,社会生产力将得到多大的提高?又有多大的机会?现在仅仅是开始。”周明展望未来表示。
评论