写点什么

搜狐科技专访 | 澜舟科技 CEO 周明:不过度追求 AGI,更看重大模型语言理解能力和应用落地性

  • 2023-07-28
    北京
  • 本文字数:2560 字

    阅读完需:约 8 分钟

近日,由中国科协科学技术传播中心与清华大学求真书院主办的基础科学与人工智能大会在北京国家科技传播中心召开。

大会开场前,围绕通用大模型与垂直大模型谁能走的更远,以及从技术研究人员到“硬科技”创业者身份的转换需要具备哪些条件等问题,搜狐科技与澜舟科技创始人兼 CEO、中国计算机学会 CCF 副理事长、创新工场首席科学家周明进行了对话。

周明表示,通用大模型和垂直大模型两者都很重要,通用大模型像是底座,提供未来的可能性,而垂直大模型是在通用的基础上,加入行业的知识和规则,然后融入到通用大模型中。他认为,以上两种大模型的潜力还没有被完全发掘出来,一切还只是开始。

很多人认为垂直大模型只是将行业数据灌入大模型,周明否定了这种说法,他解释道,“行业中的很多东西不是完全用数据实现的,况且很多数据也不一定是那么充分。行业模型与通用模型混合训练时还有很多未解决的问题。”

周明强调,“由于现在还无法评定什么是最好的通用模型和行业模型,理论研究和具体实践的结合体系尤为重要。比如训练大模型的人如果无穷无尽地追求 AGI(通用人工智能),容易半天落不了地。做行业大模型的人如果比较短视,想做出个模型赶紧挣钱,那么长期发展时会遇到问题,这两方面都应该尽量去避免。”

“通用和行业大模型我都在做,通用的话,我是强调未来落地的程度,不追求太多的 AGI,而追求的是语言理解的能力,落地的时候我追求跟行业伙伴把最后一公里做起来。”

周明补充解释道,“‘最后一公里’指的是大模型最后落地的关键阶段,无论大模型前期做得多好,参数多大,最后还是要具体落地到企业,因此 AI 专家与行业专家并肩作战是非常有必要的。”

他认为,科学研究大模型的道路是无止境的,神经网络在很多方面的能力值得去不停地推动,包括推理能力、建模能力、可解释能力、幻象消解能力以及认知能力等。

谈及从技术研究员到创业者身份转换的感受,周明感叹道,“创业挺难的,‘天时地利人和’都是成功的关键,‘天时’是指外部环境的变化和趋势,‘地利’是指创业者的自身条件和能力,‘人和’是指创业者的个人素质和人际关系。


以下为对话实录(经整理编辑)

搜狐科技:在您看来,未来垂类大模型和通用大模型哪个会走的更远,您所在的团队目前更着重于研发哪种类型的大模型?

周明:谢谢提问,这两者都非常重要,通用大模型像是底座,提供未来的可能性,而垂直大模型是在通用的基础上,加入行业的知识和规则,然后融入到通用大模型中。

行业大模型的潜力还非常大,现在由于大家都忙着做通用的,垂类的做的相对少,而且如果做也是浅尝辄止的。有好多人认为拿到行业的数据往大模型中一灌就是行业大模型,不是这样的,行业里面的好多东西不是完全用数据进行实现的,再加上很多数据也不一定是那么充分的。一些行业模型跟通用模型混合训练的时候,还有很多未解决的问题。

谈及这两者哪一个更重要,不同的公司站在不同的角度会有不同的选择。比如做通用大模型的肯定强调通用性,认为模型的底座重要。做偏应用的人,他就强调利用通用模型把模型建好,追求能快速落地,形成一个闭环,将来再有机会改善通用举措也有可能。

通用和行业大模型我都在做,通用的话,我是强调未来落地的程度,不追求太多的 AGI,而追求的是语言理解的能力,落地的时候我追求跟行业伙伴把最后一公里做起来。“最后一公里”是指大模型最后落地的关键阶段,无论大模型前期做得多好,参数多大,最后还是要具体落地到企业。从通用大模型到行业大模型,除了 AI 领域的人才,还需要真正懂行业的专业人士加入并肩作战,这样才能做出更专业好用的行业大模型。

由于现在还无法评定什么是最好的通用模型和行业模型,理论研究和具体实践的结合体系尤为重要。比如训练大模型的人如果无穷无尽地追求 AGI(通用人工智能),容易半天落不了地。做行业大模型的人如果比较短视,想做出个模型赶紧挣钱,那么长期发展时会遇到问题,这两方面问题都应该尽量去避免。

科学研究大模型的道路是无止境的,原来的神经网络没有太强调内在的推理知识,输出的答案很多被认为是蒙出来的,无法解释,那现在一点点看出了效果,比如能开始应对一些专业性强的推理测试。神经网络在很多方面的能力值得去不停地推动,包括推理能力、建模能力、可解释能力、幻象消解能力以及认知能力等。

搜狐科技:据了解,您曾在微软亚洲研究院工作了 21 年,后加入创新工场,再后来是什么动力使您下定决心走向创业的道路?

周明:这个问题很好,我原来是清华的老师,在清华工作了 8 年,中间出了一次国,回来之后就加入到了微软亚洲研究院,再到后来开复的创新工场成立我就直接过去了。到了之后我立了 2 个目标,第一是我们研究组要努力走到世界前沿去,第二是帮助国家把自然语言处理技术提升至世界前沿水平,我们一直讲,要推动中国 NLP 走向国际。

直到 2020 年底,我这两个目标真的达成了,我就想做一些不同的事,前面做的事情更偏科研,我思考未来能不能跳出来站在社会的角度,做一个大模型的公司赋能社会。尤其是那会儿大模型方兴未艾,很多人还没意识到大模型的潜力,我是第一批感知到的,因为我在微软就做大模型,意识到这将来可能是国民经济的基础设施,未来还有很大的发展潜力。

于是,我就在两年前开始筹备大模型公司,但是先选择了到开复的创新工场担任首席科学家,学习创业的经验,也结识到了很多朋友,直到 2021 年 6 月份的时候,真正开始筹办公司。

我的志向是做出一个通用基础大模型适用于各个行业,赋能于企业或者个人,提高他们的工作生产效率。所以希望把我过去二三十年的经历融合在一起,比如研究经历、产品经历、再加上创业的经历、自己的知识才华和各专业领域的人脉都集于一身,通过大模型的方式来帮助客户,这是我未来的目标。

搜狐科技:您认为硬科技创业需要具备哪些条件?

周明:创业挺难的,“天时地利人和”都是成功的关键。

天时是指外部环境的变化和趋势,我在 2020 年预见大模型将来会成为风口,因此从微软出来孵化和创办了聚焦大模型的澜舟科技公司。

地利是指创业者的自身条件和能力,包括资金、技术、人才和管理等,这些要素是创业的基础,也是决定创业成功与否的关键因素。

人和是指创业者的个人素质和人际关系。创业者需要有坚定的信念和强烈的责任感,同时要有良好的人际交往能力和广泛的社交网络。只有这样,才能够吸引优秀的人才加入团队,建立良好的合作伙伴关系,共同实现创业目标。

用户头像

还未添加个人签名 2022-06-09 加入

一起探索自然语言处理(NLP)领域的前沿技术!官网:langboat.com,关注公众号「澜舟科技」加入孟子开源社区。

评论

发布
暂无评论
搜狐科技专访 | 澜舟科技CEO周明:不过度追求AGI,更看重大模型语言理解能力和应用落地性_澜舟孟子开源社区_InfoQ写作社区