中国 GPT 用户的第三阶段:揭秘你不知道的道与术
摘要:这篇文章分析回顾了国内外主要大语言模型的发布时间线,目的是站在国内普通用户的角度,从怎么用得上、怎么挑得好、如何用得溜这三个方面去选择和认识大语言模型,达到能够驾驭它们的目的。
前言
在 2022 年和 2023 年,多家公司发布了各自的大型语言模型,如 OpenAI 的 ChatGPT、谷歌的 Bard、Meta 的 LLaMA、Anthropic 的 Claude 等。但对于中国的用户来说,由于政策限制,他们无法正常注册和使用这些外国的大模型。
直到 2023 年 7 月,Meta 发布了 LLaMA2 并宣布全球开源可商用,阿里云随后宣布支持 LLaMA2,成为首家支持的中国企业。到了 2023 年 8 月,得益于中国政府和各大企业的写作,中国国内也有多家公司发布了自己的大语言模型,如百度的文心一言、智谱华章的智谱清言、百川智能的百川大模型等。这为中国用户提供了更多的选择。
但如何选择最适合自己的模型成为了一个问题。豆茉君为此写过几篇文章,对各大模型进行了评测和比较。总的来说,虽然有很多选择,但用户需要理解这些工具的本质,提高自己的认知,才能更好地利用它们。
正文
阶段一:怎么用得上
2022 年 11 月,OpenAI 发布 ChatGPT (GPT-3.5);(全球 160 个国家可用,不包括中国)
2022 年 12 月,ChatGPT 用户破百万;
2023 年 2 月,ChatGPT 月活破一亿;
2023 年 2 月,谷歌发布 Bard;(支持中文,中国不可用)
2023 年 2 月,Meta 发布 LLaMA;
2023 年 3 月,Anthropic 发布 Claude;(仅限美国、英国用户)
2023 年 3 月,OpenAI 发布 GPT-4;(全球 160 个国家可用,不包括中国)
2023 年 7 月,Anthropic 发布 Claude 2;(159 个国家可用,不包括中国)
对于国内的普通用户来说,虽然 ChatGPT 早在去年 11 月就破圈发布,不到 3 个月月活破了一亿,但是通过正常渠道,是无法注册使用的。不光是 ChatGPT,包括谷歌的 Bard,Anthropic 的 Claude 这些最主流的大模型,国内用户都是不能正常注册使用的,也不支持国内正常的支付方式付费使用。
2023 年 7 月 21 日,Meta 发布 LLaMA2;(全球开源可商用)
到了 7 月 21 日,Meta 发布了 LLaMA2,并宣布全球开源可商用,很快阿里云于 2023 年 7 月 26 日宣布成为首家支持 Llama 的中国企业。这是第一个可以被中国企业和个人正常使用的美国大模型。但是这个模型官方的应用很粗糙,早期中文支持也很糟糕,普通用户很难用得顺手。
在上面这个时期,一些国内外开发者开发了一些小应用,把以上各种官方大模型的 API 包了进去,供国内的普通用户付费使用,这注定是被割韭菜的,因为这些小应用面临着非常大的政策风险。
2023 年 7 月 13 日,《生成式人工智能服务管理暂行办法》(以下称《办法》),由国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局七部门联合公布,自 2023 年 8 月 15 日起施行。
很快《办法》施行半个月后,据 8 月 31 日凌晨消息,将有 11 家国产大模型陆续通过发《生成式人工智能服务管理暂行办法》备案,首批将在 8 月 31 日起将陆续像全社会公众开放服务(以前都是内测)。
2023 年 8 月 31 日,百度发布文心一言;
2023 年 8 月 31 日,智谱华章发布智谱清言;
2023 年 8 月 31 日,百川智能发布百川大模型;
2023 年 9 月,陆续发布的国产大模型还会有:抖音(云雀大模型)、中科院(紫东太初)、商汤科技(商量 SenseChat)、MiniMax(ABAB 大模型)、上海人工智能实验室(书生大模型)、华为(盘古大模型)、腾讯(混元大模型)和科大讯飞(星火大模型)等。
可以说,自《办法》发布以来,经过一个半月的努力,中国的大模型实现了向社会公众的开放,这是政策制定、商业推荐和技术实现三位一体积极协同、努力追赶的结果,这让国内的普通用户能幸福的用上国产的大模型产品,这着实是一件大好事。
阶段 2:怎么挑得好
但是,作为普通用户的我们,又开始面临新的问题。国内的各大厂你追我赶,市场上突然多出了 10 多种国产 GPT 供君选用。这咋选嘛?
首先,大家很自然地想给这些国产大语言模型排个序,到底谁最厉害。
其次,大家很自然地想把头部的国产大模型拿去和美国的头部大模型进行比较,看看有没有差距,有多大差距。
豆茉君也是这么个心情,所以一连肝了 3 篇文章,去找答案:
如果光比较大模型本身的素质能力,豆茉君推荐一个专家团队给出的答案:
但是,作为普通用户,用不用得顺手、爽也很重要,于是豆茉君重点比较了文心一言和 ChatGPT 的两个版本,得到如下答案:
综合模型表现和产品功能来看,目前对于普通用户来说,值得使用的国产 GPT 前三名是百度的文心一言、科大的讯飞星火和百川大模型。
虽然百川大模型的技术指标比其他两者高,但是文心一言和讯飞星火凭借更完善的产品功能、多端应用触达等易用性,带给普通用户的使用体验更棒。其中,文心一言还有面向开发者的插件市场,嫁接上百度的搜索业务和大厂的运营能力以后,是非常有潜力提供更细致、更贴心的服务的。
阶段 3:如何用得溜
当选好产品以后,接下来作为一个用户,我们考虑的问题是如何能够最大程度地激发 AI 的能力,自己问出问题后能得到最好的答案。
对于这个问题,豆茉君一直在思考。我认为,想要用得溜,要从两个方面下功夫,即道和术。所谓道,指的是要理顺自己和 AI 的关系,要提高对 AI 的认知,更要提高对自己的认知;所谓术,指的是使用技巧,包括如何写提示词,该用什么插件等等。
1、道
为什么要理顺自己和 GPT 的关系?GPT 不就是个工具吗,人和工具的关系当然是利用和被利用,有什么好理的。嗯,说得没错,的确是这样。
在《吴恩达说了什么,百度又做了什么?2023年AI趋势你读懂了吗?》这篇文章中,豆茉君谈到:“生成式 AI(Generative AI),也就是 ChatGPT、文心一言这种大语言模型,也不过是监督学习的映射关系的大规模应用罢了,通过前面的已知内容(A),一步步地推测出下一个输出内容(B)。这本身并不神奇,但神奇发生在量变引起质变,即当这种简单映射的参数量达到以万亿计的时候,AI 突然就涌现出了泛化能力。”
说到底,大家不要被目前 GPT 涌现出的泛化智能能力吓到,说到底它还是一个概率机器,还是一个工具。关于如何判断 GPT 是不是个工具,豆茉君在《打工人要的安慰,GPT 给不了》这篇文章中给出了答案,即工具是没有自我意识更没有主观能动的。
但是,GPT 绝对不同于人类以往发明的任何普通工具:
a) 通用属性:普通工具都是服务于特定任务的,像瑞士军刀那种多用途工具就算是很有创新了;但是 GPT 不同,它不是为某个特定任务发明的,即特定的任务不是 GPT 这个工具设计制造的前置条件,你想让它干啥都可以,它都能给出你文字答案;
b) 博学属性:普通工具大多数不会被内置海量的数据、信息和知识,即使内置了也不会是被吸收、消化过。而 GPT 打一出生就饱读了人类巨大的知识宝库,实时连接上互联网以后,这个家伙可以做到对通识和专业知识了如指掌。
c) 辅助认知属性:普通工具大多数都是用于改造世界的,用于认识世界的很少(离子对撞机等试验工具)。而 GPT 的产出是文字,这恰恰是它最大的特征。语言文字不光是人类智慧的结晶,更是人类思维的载体。善于收发、处理自然语言的 GPT,完全可以用于跟人类大脑同频,低成本、易触达地帮助人类进行思维活动,从而帮助人类认识世界。
这三点直接导致我们不能只把 GPT 这种工具当普通工具看,我们对这种新兴工具的认知需要提升,才能够完美的驾驭它。
豆茉君在《万字全面评测(下篇):文心一言 vs ChatGPT》中谈到:
“如果说外化的文字,是给我们大脑外接了一台显示器,以达到反复加强从眼睛看到脑袋想再到眼睛看的这个循环过程,以达到刺激大脑思维产出的效果,即形成大脑和自我外化的一部分镜像快照形成沟通交流的回路。
那么大语言模型 AI 则更像是给大脑联通了一个外挂,它能让大脑快速触达人类巨量的智力成果,而不要求大脑预先进行学习、记忆,这极大的释放了人脑的学习压力(虽然人脑长期记忆容量是惊人的,但是学习效率太低),增加了人脑的工作容量(人脑的工作容量非常有限,一次激活加载的记忆区域不超过 7 个)。”
人是有自我意识的,是有主观能动的,大脑只是工具,而不是主人,人的意识才是主人。同理,GPT 也是工具,基于 GPT 的通用属性、博学属性和辅助认知属性,在工具层面它和人类大脑非常相似,只不过在博学属性、短期记忆、数据计算等很大方面都远远超过人脑的表现。
顺着这个逻辑,豆茉君画了张图总结一下:
在豆茉君看来,作为工具,碳基人脑和硅基 GPT 是处于相似的位置的,它们都要被人的意识驱动,根据各自的优势能力互补分工。
由于 GPT 跟人脑一样,能够跟意识之间用自然语言(提示词)沟通,这将大大降低人脑在两者沟通过程中的辅助载荷(例如:学习编程、写代码等),使得主观意识更有独立性,在认识世界和改造世界的过程中,实现给人脑和 GPT 分工,从而发挥它们各自的专长。
因此,人的主观意识必须要得到强化,并刻意地与人脑进行功能性剥离,同时去嫁接 GPT。
这种感觉,就好像没有 GPT 的时候,计算 324312432 除以 21321 需要手算、心算、找到计算器按照规定交互方式输入指令让它算或者编写代码让计算机算,而现在你会直接分派给 GPT,告诉它:帮我计算 324312432 除以 21321,它会立刻给你答案。你细品一下这中间,意识、大脑和工具的分工的区别在哪,意识是如何一步步与大脑功能性剥离的。
2、术
关于术,就是指从技术和操作层面,如何选择好的 GPT、运用好的使用技巧。豆茉君在日后也会分享一些这样的内容,这里就不展开了。
值得注意的是,量子位的最新文章《大模型靠“深呼吸”数学再涨8分!谷歌DeepMind发现AI自己设计提示词效果胜人类》解读了一篇 9 月 7 日发表的论文,谷歌 DeepMind 的研究人员通过实验论证出:
这个结论之前豆茉君是凭感觉猜的,因为精心撰写的结构化提示词,在 GPT-4 运行效果很好,搬到文心一言就完全不同了。
这个结论很重要,在术的层面它告诉我们:
1、选择一个基础好、发展有潜力的 GPT 很重要,因为你最好长期和它相处;
2、你要去积累、尝试更多的技巧,磨练出跟它的最佳对话风格;
3、同样的技巧可能不适用于其他 GPT,所以第 1 点很重要;
结语
今天,国内的普通用户已经可以用上多个优秀的国产 GPT 了,如果想真正的把 GPT 转化成自己的生产力工具,需要做的是挑选一个最适合自己的产品,然后持续使用,在过程中领会道和术,逐步摸清产品的秉性,最后实现人机合一。
版权声明: 本文为 InfoQ 作者【豆茉君】的原创文章。
原文链接:【http://xie.infoq.cn/article/df5ba5b103a33d10cd179d810】。未经作者许可,禁止转载。
评论