国内“谁”能实现 chatgpt,对 MOSS、ChatYuan 给出关键技术简评,一文带你深入了解宏观技术路线| 社区征文
1.ChatGPT 简介【核心技术、技术局限】
ChatGPT(全名:Chat Generative Pre-trained Transformer),美国 OpenAI 研发的聊天机器人程序 ,于 2022 年 11 月 30 日发布 。ChatGPT 是人工智能技术驱动的自然语言处理工具,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文 等任务。
1.1 核心竞争力
ChatGPT 受到关注的重要原因是引入新技术 RLHF (Reinforcement Learning with Human Feedback,即基于人类反馈的强化学习)。RLHF 解决了生成模型的一个核心问题,即如何让人工智能模型的产出和人类的常识、认知、需求、价值观保持一致。ChatGPT 是 AIGC(AI- Generated Content,人工智能生成内容)技术进展的成果。**该模型能够促进利用人工智能进行内容创作、提升内容生产效率与丰富度。 **
1.2 技术局限性
ChatGPT 的使用上还有局限性,模型仍有优化空间。ChatGPT 模型的能力上限是由奖励模型决定,该模型需要巨量的语料来拟合真实世界,对标注员的工作量以及综合素质要求较高。ChatGPT 可能会出现创造不存在的知识,或者主观猜测提问者的意图等问题,模型的优化将是一个持续的过程。若 AI 技术迭代不及预期,NLP 模型优化受限,则相关产业发展进度会受到影响。此外,ChatGPT 盈利模式尚处于探索阶段,后续商业化落地进展有待观察。
2.国内外 ChatGPT 发展情况
2.1 国内外 ChatGPT 技术布局
上述图为引用图片,如有侵权请联系。
2.2 目前已知产品
文心一言(英文名:ERNIE Bot)是百度基于文心大模型技术推出的生成式对话产品,将于 2023 年 3 月完成内测,面向公众开放
Bard 是谷歌在一个大型语言模型基础上,推出的聊天机器人
MOSS 是复旦大学自然语言处理实验室发布的对话式大型语言模型。
2023 年 2 月 20 日,解放日报·上观新闻记者从复旦大学自然语言处理实验室获悉,MOSS 已由邱锡鹏教授团队发布,邀公众参与内测。2 月 21 日,该平台发布公告,感谢大家的关注,同时也指出,MOSS 还是一个非常不成熟的模型,距离 ChatGPT 还有很长的路需要走
ChatYuan:元语智能团队
首个中文版 ChatGPT——ChatYuan 即在人工智能社区引发了广泛的讨论。如今 ChatYuan 又迎来了升级版本,支持中英双语交互、多次编辑、上下文关联交互、模拟情景设定等多种新功能。
国产自研功能对话大模型元语 ChatYuan 于 2022 年 12 月发布测试版本后,引起社会各界人士的广泛讨论,并且收到了用户的大量反馈和宝贵建议。元语智能团队已于近日对元语 ChatYuan 进行了模型效果优化和版本功能升级,现已开放内测。
3.简评 ChatGPT 技术路线以及目前公测产品
对于 ChatGPT 实现首先从要素上介绍
3.1 ChatGPT 技术实现要素
简单认为以下三点比较重要:
充足的数据集(已标注)
具备大模型能力(公司、实验室)
丰富的算力机器
算法技术能力
首先针对数据集问题:先天优势的是百度、字节跳动等公司;其次才是各大公司研究室。细化一下就是百度、字节跳动有高质量数据集(信息量足,结构化等优势)简化标注数据获取环节,有利于模型训练得到高质量模型。
其次具备大模型能力(公司、实验室)在 NLP 领域 AI 大模型能力也是有所共见,开创新纪元。所以拥有自己的大模型是至关重要的(千亿参数量)
再者丰富的算力机器模型训练依赖算力,没有充足 AI 加速卡,时不待我啊。
最后也就是具备先进的算法技术能力这个是至关重要的,1.针对数据集其他公司可以通过爬虫方式拿到部分原生数据再加工,也算解决数据集问题吧。2.针对大模型因为目前业界开源了很多 NLP 各个领域的大模型任何一个人都可以获取某个领域的多任务预训练大模型。3.算力嘛,花钱可以解决,只要你足够富有。但是回归到先进的算法技术能力这里就是要出差距了,做一个“ChatGPT”外壳产品难度不大,但是要做一个真正 ChatGPT 难度很大。
3.2 ChatGPT 技术宏观实现路径
下面从宏观实现路径进行简单讲解
3.2.1.堆砌式(封闭)模型:级别一
框架大致如下:
ChatGPT(智能问答)
任务分类大模型分类(把问题分到到对应模型去处理)
信息抽取大模型
推荐系统大模型
生成代码大模型
智能问答大模型(单轮多轮对话)
等等
主要以语义搜索推荐系统技术下给到你索引答案,只是包装了一个前端展示(对话形式)
3.2.2.堆砌式(开放)模型:级别二
ChatGPT(智能问答)
任务分类大模型分类(把问题分到到对应模型去处理)
信息抽取大模型
推荐系统大模型
生成代码大模型
开放式智能问答大模型(单轮多轮对话)
等等
引用:Datafun 图片
开放域对话技术属于人机对话的一种。除了开放域对话,人机对话还包括面向任务的对话和问答对话。面向任务的对话类似于订票、查天气等,这也是大家用得比较多的一种。
问答就是有明确的需求,用户直接询问系统找答案。
开放域对话与前面两者不同,前两者用户要么有明确的需求、要么有明确的场景。但开放域对话是在一个很开放的场景中进行拟人的对话,可以进行任意的对话。同时,要求对话系统有人设、有人格和情感。
可以简单理解为 AI 模型更智能,算法技术更厉害了。
3.2.3.基于 RLHF 的 AIGC 的堆砌式模型:级别三
简介:RLHF (Reinforcement Learning with Human Feedback,即基于人类反馈的强化学习) RLHF 解决了生成模型的一个核心问题,即如何让人工智能模型的产出和人类的常识、认知、需求、价值观保持一致。**AIGC(AI- Generated Content,人工智能生成内容)**技术进展的成果。该模型能够促进利用人工智能进行内容创作、提升内容生产效率与丰富度。
ChatGPT(智能问答)
任务分类大模型分类(把问题分到到对应模型去处理)
RLHF 多智能体强化学习
信息抽取大模型
推荐系统大模型
生成代码大模型
开放式智能问答大模型(单轮多轮对话)
等等
讲一下级别三和级别二的区别:RLHF 多智能体强化学习级别二的各个大模型之前是独立的,级别三通过强化学习算法把各个模型耦合起来,同时模型的产出和人类的常识、认知、需求、价值观的模型。控制产出好坏也就是奖励模型决定,答案满意给出正向反馈,反之给出负分。这个设计难度也很大。
总结一下就是技术上升级了,模型更加智能输出结果更佳贴近用户。具体用户侧感受就是你可以“调教 chatgpt”,产生个性化定制。当然这种和搜索推荐系统给到的个性化也是不一样的。
3.2.4.基于 RLHF 的 AIGC 的多任务完美模型模型:终极形态
ChatGPT(智能问答)
基于 RLHF 强化学习的多任务完美模型模型
简单来说就是所有任务一个模型都能解决,下游任务兼容性完美! 期待一手!
3.2.5 小结
从上面四个级别可以看出,难度一次上升。个人认为 openAI 的 chatgpt 应该是第三种方案,因为终极形态相比级别三来说,难度难以想象(一个模型完成所有任务,只能说太强了)。换一个角度,我们作为用户从产品侧看是很难感知出两者区别,从目前的业界开源模型情况来看 方案三更加靠谱,落地也会更快,但技术难度还是很大的!
下面通过分析一下国内目前公测的 MOSS 和 ChatYuan
4.对 MOSS、ChatYuan 给出简评
4.1 ChatYuan
它具备的功能:
1.【支持多次编辑】第一次输入后,可以进一步提出要求,修正生成内容,快速更新所需内容。
2.【支持上下文关联交互】支持多轮次交互,提升上下文关联理解能力,更加自然的人机交互模式。
3.【模拟情景设定】支持模拟情景设定,如模拟对话、模拟小说背景、模拟人物性格。
4.【基础代码 / 表格生成】初步实现生成代码功能,代码结构相对完整,部分代码逻辑持续优化中,表格生成能力初步实现。
5.【支持中英文交互】支持中英切换交互,如输入中文可以回复英文内容
6.【基础生成任务效果提升】内容生成效果显著提升,写公文、写故事、写论文提纲、写特定主题含关键词的诗歌等,效果较之前有比较明显的提升。
官方开源:链接隐去发文限制
码源:链接隐去发文限制
在这个 notebook 中我们将使用 transformers 库结合 GPU 训练 ChatYuan 模型,使用的是 pCLUE 多任务提示学习数据集。
首先从这个开源项目中,使用的数据集是 pCLUE: Large-scale Prompt-based Dataset for Multi-task and Zero-shot Learning in Chinese
pCLUE:基于提示的大规模预训练数据集,用于多任务学习和零样本学习
数据集情况:
预测任务输出情况
从训练数据集以及处理的下游任务可以看出这是在做一个多任务学习的自然语言模型,关于生成式模型以及生成式多轮智能对话大模型基本不太沾边,我觉得是我在第三节里讲的级别一!
这里也就是展现了算法技术的瓶颈,当然也不排除只是对方没开源。但从目前获取信息来看,肯定没有用到强化学习算法技术,距离真正 AI 还有差距。
当然第三节提到的四种方案,从用户侧来看相对比较难感受到的,毕竟国内语义搜索智能推荐等算法很发达,通过前端包装好。用户还是很难发现的,最多会觉得 “这个 AI 有点不太聪明呀”
4.2 MOSS
网上看了很多测评,暴露问题和 chatyuan 一样,就不在赘述了。
5.未来应用和期待
5.1 未来应用
结合 ChatGPT 的底层技术逻辑,有媒体曾列出了中短期内 ChatGPT 的潜在产业化方向:归纳性的文字类工作、代码开发相关工作、图像生成领域、智能客服类工作
5.2 期待
个人比较期待百度的文言一心以及字节跳动,在通用领域优势比较大,同时技术也比较前沿,百度飞桨在开源方面做的也比较好,值得期待。希望实现的是级别三的方案。
版权声明: 本文为 InfoQ 作者【汀丶】的原创文章。
原文链接:【http://xie.infoq.cn/article/16be9fe1bf3a1b543704831cb】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论