写点什么

GPT-4:不了不了,这些我还做不到

  • 2023-03-16
    山东
  • 本文字数:1827 字

    阅读完需:约 6 分钟

GPT-4:不了不了,这些我还做不到

ChatGPT 的余波未平,GPT-4 的风波又起。这次 GPT-4 的全新升级,再一次突破了技术的壁垒,很快受到众人的追捧:

  • 有人说 GPT-4 的出现是场变革,但也许只是对人工智能的过度炒作;

  • 有人说 GPT-4 可以直接生成好莱坞电影,但也许是对 GPT-4 的期望值过高;

  • 有人说 GPT-4 能改变世界,但接下来的发展是什么,还不一定……


GPT-4 到底能做什么?又做不到什么?


纵观 GPT 系列模型的发展史:

第一代模型 GPT-1,开始探索模型对语言的理解力;

第二代模型 GPT-2,找到了“多任务学习者”的方向;

第三代模型 GPT-3 以及在此基础上微调的 GPT-3.5,也是 ChatGPT 的前身,能够通过数据的喂养,实现智能问答交流。


而此次 GPT-4 的发布,又让人眼前一亮。

问题来了:GPT-4 比前几代模型到底好在哪?


ChatGPT 是这样回答的:

01:GPT-4 能识别图片


“GPT-4 可以接受图像作为输入并生成说明、分类和分析,”这意味着只要你想识别,GPT-4 就能识别图像并输出文本内容。GPT-4 开始能“看到”世界。


这一功能的出现,对于有视觉障碍的人群来说,无疑为提高他们的生活便捷打下了坚实的基础。GPT-4 在这一方面也有了具体的应用:一款名为 Be My Eyes 的 APP 正在开发 GPT-4 驱动的虚拟志愿者,希望能为盲人、低视力群体提供视觉帮助。

不过据官方宣布图像输入仍然是研究预览,并未公开。关于这一功能的更多信息,我们不得而知。只能期待在下一次的版本中,能带给我们更多的惊喜。

02:创作能力得到强化:长篇小说不是梦


OpenAI 表示:“GPT-4 能处理超过 2.5 万字的文本,它比以往任何时候都更具创造力和协作性。


对 GPT-4 来说,它可以生成文字内容并进行编辑,甚至可以进行作曲、写剧本或模仿使用者的写作风格。OpenAI 的联合创始人 Greg Brockman 也通过直播展示了 GPT-4 惊人的创作能力——对长篇文章做核心总结、写代码、创作诗歌……

可以看出,GPT-4 不再局限于“chat”,不再定位于聊天机器人,而是朝着提高生产率、“多栖”方向出发。

03:GPT-4 更智能、更聪明


相较之前的版本,GPT-4 能更好地理解上下文语境及相应的文本关系。OpenAI 也给出了 GPT-4 与 GPT-3.5 参加各种考试的成绩。在模拟律师考试结果中,GPT-4 的最终分数在应试者的前 10%左右,而 GPT-3.5 的得分大概在倒数 10%左右。两个模型版本之间,差异也较为明显。

在这场涉及了“人性”“伦理道德”的考试中,GPT-4 取得了不错的成绩,显然比 GPT-3.5 表现得更为出色。

04:GPT-4 的安全性也得到提升


“GPT-4 及后续模型有可能以有益和有害的方式对社会产生重大影响。”OpenAI 表示,团队也在对 GPT-4 不断地迭代,就安全性这一问题做出了很多努力,包括对数据的选择和过滤、评估和专家参与、模型安全性的改进以及监测、执行等。


针对 GPT 一类的模型会生成不良建议、有 Bug 的代码或不准确的信息等风险问题,团队也聘请了 50 多位来自人工智能对齐风险、网络安全、生物风险、信任和安全以及国际安全等领域的专家,对 GPT-4 的这些高风险行为进行对抗性测试。这些专家的反馈和数据为 GPT-4 的改进提供了依据。

GPT-4 自发布以来,话题热度只增不减,一些网友也玩出了新花样:


“天呐!GPT-4 竟然能雇佣一名人类工作人员为它解决验证码问题,并说服人类与它合作。”

(图源 Yosarian2@YosarianTwo)


用户 @ GauravDungriyal 给 GPT-4 拍了一张自家冰箱的照片,并让其提供菜谱:

但,GPT-4 就没有任何问题吗?


GPT-4 与前几代模型相比,回答的内容更精确、也更丰富,但也出现了一些问题:

1、回复变慢

猜测原因可能有以下方面:

  • 首先是流程更复杂。GPT-3 有 1750 亿参数,而 GPT-4 有 100 万亿参数,什么概念?这与人类大脑神经元数量相当!因此非常消耗算力;

  • GPT-4 的提问是有限制的,每四个小时内不能超过 100 条消息。由此可见,它的处理能力更加多样化;

  • GPT-4 是个多模态大模型,由原来的文本处理,到支持图像输入等,整体运作也更为复杂了。

2、 仍存在一些漏洞

尽管此次发布,GPT-4 比之前模型的安全性有所提升,但它依旧具有局限性:它有时也会犯简单的推理错误,或在接受用户明显的虚假陈述时过于轻信。有时它也会像人类一样在难题上失败,比如也会在它自己生成的代码中引入安全漏洞。

3、 时间数据采集没有拓宽

在数据采集上,GPT-4 依旧缺乏 2021 年 9 月之后发生的事件数据。这意味着,在时效性上,GPT-4 无法做到及时同步,它无法回答 21 年之后发生的事件,更无法从其经验中吸取教训。


AI 对我们的影响,取决于我们如何定义它。在人类与 AI 的故事中,与其在科技发展浪潮中战战兢兢,不如成为 AI 的创造者,创造下一个 GPT-X!


往期文章推荐:

996已明确违法,从此拒绝精神内耗!

​ ​关于ChatGPT,我们到底在担心什么?​​

发布于: 刚刚阅读数: 3
用户头像

还未添加个人签名 2020-04-30 加入

禅道是一款专业的国产开源研发项目管理软件,可提供全生命周期项目管理解决方案、自动化测试解决方案和DevOps解决方案。

评论

发布
暂无评论
GPT-4:不了不了,这些我还做不到_GPT_禅道项目管理_InfoQ写作社区