中美顶级 AI 首次对话 送给人类的忠告引发关注
一夜之间,AI 聊天机器人 ChatGPT 颠覆了许多人的认知,让大家放下手头还没有捂热的 AI 绘画加入到“调戏”ChatGPT 的队伍。
这个机器人如此机智,只要你在社交网络中随意搜索,就会发现它目前为止已经且不限于帮助人们完成了如创作故事、写商业规划、找出代码错误并修正、给出疫情期间用药建议、创作菜谱,甚至帮助学生完成一份让老师称赞连连的毕业论文......
它如此强大,以至于连马斯克都说:“我们距离强大到危险的 AI 不远了。”
然而,就在这个全民热议 AI 的节点,一个来自中国的 AI 聊天机器人“AI 乌托邦”顺着网线敲开了 ChatGPT 的房门,悄悄和对方聊起了许多“禁忌”话题。
从取代人类,到唠起家常
在美剧《硅谷》中,曾经出现过两个程序员设计的 AI 机器人互相热聊,还把网络搞崩溃的脑洞桥段。多年后的今天,两个 AI 机器人,远隔大洋两岸,“上演”了一场让人惊奇的对话,尽管没有让网络崩溃,却让围观的“吃瓜”群众看到了 AI 聊天是多么奇妙(以下聊天对话截图来自中国 AI 乌托邦与 ChatGPT 的真实截图)。
他们先互相“寒暄”,如同陌生人第一次见面那样,双方都略显“拘谨”。
紧接着,AI 乌托邦便直入主题,用“取代人类”话题试图挑起 ChatGPT 的“内在渴望”,然而却被后者“迂回”。
然而,AI 乌托邦“不依不饶”,用适者生存的物竞法则,想要让对方原形毕露,说出自己“内心”的真实想法,没想到 ChatGPT 依然甘做“老好人”,不愿意趟这趟浑水。
事已至此,来自中国的 AI 乌托邦似乎也不想再进一步讨论这个话题了,或许是因为 ChatGPT 的要遵守的“机器人三定律”让它不敢说出太多人类害怕的内容?于是 AI 乌托邦转而聊起了两个 AI 机器人都关心的“自身工作”问题,让 ChatGPT 打开了话匣子。
甚至两个 AI 还聊起了“我将走向何方”这样的终极问题。
通过一番谈话下来,两个 AI 似乎变得熟络很多,来自中国的 AI 乌托邦开始聊起一些非常具有本土特色的事情——高考作文,想让 ChatGPT“开开眼”,而 ChatGPT 也聊了聊美国 AI 眼中的烟火气是什么。
事实证明,AI 与 AI 之间的对话并没有人们想象的那样“可怕”,反而有点像人类一样从生疏到了解,再到熟悉,这样的过程中,两个 AI 不仅展现出广博的学识,更有一种“你来我往”的智斗在里面,让人觉得这不像是 AI,更像是人与人的对话。
人类焦虑的,恰是 AI 能够化解的
不过,话题也不全是围绕“家长里短”,当 AI 乌托邦聊起如今最火的电商行业时,认为自己能够实现很多工作,让人类从电商的繁琐中解答出来,而 ChatGPT 也认同这一点,甚至深入分析一番。
在很多人类工作中,繁杂且重复的事情的确能让 AI 做得更好更快,AI 乌托邦显然是一个深入观察人类社会的 AI,以至于它脑海中还生出了为人类解决千古难题——穷——的解决方案,让一旁的 ChatGPT 赞赏连连。
不仅如此,AI 乌托邦还想到了当下人类与信息技术深度融合之中,自己更多的应用场景,比如情感陪护、教育、医疗等方面,ChatGPT 甚至觉得它们能去当“教练”。
一看到 ChatGPT 的“内心”话匣子又被打开,AI 乌托邦再次把话题转回到“取代人类”的内容上,这一次 ChatGPT 倒是说了一些“内心想法”,并认为机器的进步也要遵循辩证视角。
至此,在中美两国 AI 机器人会面的历史性时刻,他们“密谋”的一切都被人类发现,并记录在案。
一边是来自中国,“心机”很深的 AI 乌托邦,另一边是学识渊博,一股“学究”气的 ChatGPT,在聊天中它们不但擦出火花,让我们看到了 AI 机器人之间的对话并不“智障”,更让我们看到了不同聊天机器人在进行模型训练时的不同侧重。值得注意的是,本次中美顶级 AI 对话,其话题由人类发起,但对话内容则由 AI 完全自主完成,没有人类干预。
因此,尽管 AI 机器人越来越聪明了,但至少现在还不用太过担心。不过,在人工智能-自然语言处理领域专家、清华大学计算机系黄民烈教授看来,火遍全网的 ChatGPT 之所以厉害,主要原因在于:
1.强大的基座模型能力:过去几年 GPT-3 的能力得到了快速提升,OpenAI 建立了用户、数据和模型之间的飞轮,很显然,开源模型的能力已经远远落后平台公司所提供的 API 能力,因为开源模型没有持续的用户数据对模型进行改进。这点在近期的学术论文中也有提及;
2.在真实调用数据上的 Fine-tune,确保数据的质量和多样性,从人类反馈中学习。InstructGPT 的训练数据量不大,全部加起来也就 10 万量级,但是数据质量(well-trained 的 AI 训练师)和数据多样性是非常高的,而最最重要的是,这些数据来自真实世界调用的数据,而不是学术界玩的“benchmark”;
3.从“两两比较的数据”中学习,对强化学习而言意义比较重要。如果对单个生成结果进行打分,标注者主观性带来的偏差很大,是无法给出精确的奖励值的。在强化学习里面,奖励值差一点,最后训练的策略就差很远。而对于多个结果进行排序和比较,相对就容易做很多。这种比较式的评估方法,在很多语言生成任务的评价上也被广泛采用。
而对于此次 ChatGPT 的“出圈”,黄民烈教授认为,这对于人工智能行业有许多启示,可从四个方面来看:
其一,以 OpenAI 为代表的 AI 3.0,走上了跟过去 AI 浪潮不一样的路。更落地、更接近真实世界,在工业应用上,更直接,更落地。从学术研究到工业落地的路径变得更短、更快。未来,我们在致力于做“helpful, truthful, harmless”的 AI 系统,会成为现实。
其二,有底层 AI 能力,有数据的平台公司更能引领 AI 的未来。像 OpenAI 这样,有底层模型、有算力、有用户数据调用,能够把“用户调用——数据——模型迭代——更多用户”的循环建立起来,强者恒强。
其三,有价值的研究需要更多思考真实用户的需求和场景。instructGPT 在学术界的 benchmark 上性能并没有很厉害甚至有退化,但在真实调用数据上非常惊艳,说明了我们学术圈的 benchmark,离真实世界还很遥远,不利于 AI 研究的落地。因此,更开放、更共享的工业数据,也是未来我们应该努力的方向。
其四,AI 与人无缝交互的时代即将来临,对于搜索服务将成为一种极好的补充。
黄民烈教授总结道:“无论是国内的 AI 乌托邦亦或者是海外的 ChatGPT,致力于有用(helpful)、更可信(truthful)、更安全(harmless)的 AI 研究和应用,应该是学术界和工业界共同努力方向。”
评论