ChatGPT 看技术发展趋势| 社区征文
一、ChatGPT 发展的现状
ChatGPT 是美国人工智能研究实验室 OpenAI 开发的一种全新聊天机器人模型,借助其最先进的深度神经网络技术架构,能更拟人化与人类交流互动,甚至能生成诗歌小说、电影剧本、论文、代码等。中国科学院大学人工智能学院教授、亚太人工智能学会执行主席雷渠江接受经济日报记者采访时表示,ChatGPT 具有巨大的创新性,在很多方面都可以成为人们工作和生活的强有力助手。
ChatGPT 借助其核心技术之一“Transformer 神经网络架构”,极大增强了人工智能的能力,它利用从大型文本语料库中所学到的内容,可以自主生成文本,帮助用户找到问题的答案。ChatGPT 除了能够模拟自然对话外,还能够执行写邮件、视频脚本、文案、翻译等任务。
1、ChatGPT 的发展
ChatGPT 是一种预训练的语言大模型,采用大量的参数和大量的数据进行训练,基于人类反馈的强化学习算法,将 NLP 技术和机器学习结合,极大地提升了模型算法的效率和能力。随着 ChatGPT 的热度不断攀升,多家科技公司都开始布局 ChatGPT 相关技术领域,NLP 技术有望迅速进入平民化应用时代。
2、ChatGPT 的使用
官方网站:>>>点击这里进入<<<
进行注册,需要一个国外手机号,如果没有可以找万能宝。如果提示“不能在当前国家服务”,则需要更改自己的 IP,如果搞不定,同样建议找万能宝。
3、ChatGPT 的功能
更精准:当你输入你的问题以后,它会很精准的给你你想要的结果,而不是还需要你像传统的搜索一样还要自己对搜索结果进行筛选。
更智能:你可以和它聊天,对话,更像是你和一个知识渊博的人在聊天一样,而且它还很有逻辑,它和你聊天的时候也会联系到你上面和它聊天的内容,让你真正能感受的到,它是真的理解你和它的聊天内容。
更实用:比如说你想写一篇新闻稿,你只需要输入时间地点大概的事件,它就能通过自己海量的数据库,寻找所有与这个事件相关的内容,给你生成一篇你想要的的新闻稿,同时还能保持真实性与唯一性。当然它的用途肯定不仅限于这一个行业。
二、ChatGPT 带来的影响
ChatGPT 具备强大的对话能力和生成能力,可以回答后续问题、承认错误、挑战不正确的前提、拒绝不适当的请求,这意味着 ChatGPT 能够颠覆搜索行业,在智能客服、游戏、虚拟人等领域也将得到广泛应用,从 ChatGPT 到 AIGC,AI 已经成为新时代新的生产力。
ChatGPT 带动 AIGC(AI-Generated Content)的革新。AIGC 指利用人工智能技术自动生成的内容,与此前 Web1.0、Web2.0 时代的 UGC(用户生产内容)和 PGC(专业生产内容)相比,代表人工智能构思内容的 AIGC,是新一轮内容生产方式变革,而且 AIGC 内容在 Web3.0 时代也将出现指数级增长。ChatGPT 模型的出现对于文字模态的 AIGC 应用具有重要意义,未来,与图形模态的 AIGC 相结合,有望打造从文字描述到图片生成的 AI 创作辅助工具,对 AI 产业上下游产生重大影响。
1、ChatGPT 的应用场景
国外生成式 AI 产品应用方向多样,现象级产品迅速获取大量用户。根据知名创业组织 Antler 的统计,截止 2022 年年底,海外生成式 AI 产品数量达到 190 余个,包括视频、音频、游戏、数据、搜索等多种类型应用。同时,2022 年年底图片生成应用 Midjourney 官方 Discord 中的关注人数超过百万,ChatGPT 上线后一周内用户数量已近百万。
生成式 AI 产品在交互设计中,更注重用户体验。目前生成式 AI 产品形态包含插件、API 网页交互、客户端等。其中,API 网页交互无需下载安装产品,在云端即可获得生成内容,如用户可在百度的“文心 ERNIE 3.0”产品网页中输入提示词生成内容。同时,生成式 AI 技术与搜索产品融合后,匹配内容、意图理解表现更好。例如,用户使用论文阅读助手 SciSpace 时,无需指定关键词即可搜索和查找相关论文,可提升阅读论文效率。
2、ChatGPT 的影响
ChatGPT 强大的内容生成能力,引起了业界普遍关注,也加速了人工智能行业从决策式/分析式 AI(Discriminant/Analytical AI)到生成式 AI (Generative AI)的演化。
随着生成式 AI 技术的不断进步,生成模态不断更新,呈现多元化格局。 按照生成模态划分,生成式 AI 产品分为文本生成(以 ChatGPT 为代表)、图片生成、代码生成和音频生成多个方向。2022 年 9 月 Meta 发布自研视频生成大模型 Make-A-Video;2022 年 11 月,NVIDIA 公司发布了 3D 模型生成工具 Magic3D;同月 WebAR 软件平台解决方案商 Geenee AR 发布了 AI WebAR 内容创造套件 RT3D AI SDK。生成模态的多元也推动了生成式 AI 的多行业应用。
三、ChatGPT 引发的思考
自 1947 年以来,AI 领域取得的关键进展,(如 Eliza、AlphaGo 和 chatGPT 的发布),都是由西方主导,美国在 AI 技术发展的过程中不断进行颠覆性技术创新,尤其是最近十多年,更是建立先发优势和累加优势,逐步拉大中美在 AI 领域的差距。
1、国外的发展历程
以 chatGPT 的发展历程为例: 2015 年 12 月,OpenAI 成立,探索大模型路线。
2017 年 6 月,Google 发布 Transformer 论文。
2018 年 6 月,OpenAI 发布 GPT-1,参数量 1.17 亿,预训练数据量 5GB。
2019 年 2 月,OpenAI 发布 GPT-2,参数量 15 亿,预训练数据量 40GB。
2020 年 5 月,OpenAI 发布 GPT-3,参数量 1750 亿,预训练数据量 45TB。
2022 年 11 月,OpenAI 发布 chatGPT。
2023 年 2 月,Google 发布 Bard。
2、国内的发展历程
国内也在追赶 AI 的热潮,在 ChatBot 方面快速跟进:
2015 年,科大讯飞发布了 AIUI,定义为人机交互服务新界面。
2016 年,百度发布了 DuerOS,定义为对话式人工智能操作系统。
2017 年-2019 年,小米发布了水滴平台,阿里发布了天猫精灵,腾讯发布了小微,微软发布了小冰,思必驰发布了 DUI,这段时间的补贴竞争就是“百箱大战”。
2019 年,声智发布了 Azero 2.0,定义为多模态与多技能的 AI 开发框架并对外开放。
2023 年,百度将发布“文心一言”,预计三月份完成内测面向公众开放,未来或将接入百度搜索。京东宣布推出产业版“ChatJD”,应用路线图包括一个平台、两个领域(零售和金融)、五个应用(内容生成、人机对话、用户意图理解、信息抽取、情感分类)。字节跳动 AI 实验室也在开展类似 ChatGPT 和 AICG 相关研发,未来或为 PICO 提供技术支持。阿里类 ChatGPT 产品目前也处于内测阶段,会与钉钉产品结合。
虽然国内科技巨头和垂类成长型 AI 公司在努力布局,但是,回到大模型这个主题,从 2022 年 12 月 chatGPT 发布时候的大模型现状来看,美国的进展更加迅猛和稳健。
综上来看,我们要充分认识到我们在算法、模型、数据、算力等方面与美国的差异,这是几十年积累的差距,并有逐渐拉大的趋势,值得我们思考和警惕。
四、ChatGPT 相关的建议
虽然生成式 AI 行业发展迅速,覆盖数据模态不断扩展,生成内容愈发具有创造力、多元化。但是另一方面,生成式 AI 的产品能力仍存在不足,预计仍需要 3~5 年时间的监督学习才会真正对生产力产生根本性影响,当然数据合规性、安全性也需进一步规范。
另外,国内开源生态和应用研究将面临挑战。OpenAI 在 GPT-3 之后所有的应用都不再开源,而是提供 API,这对于国内跟随研究将产生直接影响。OpenAI 这种 API 方式带动了国外创业公司的生态发展,并且非常重视对真实世界数据调用的迭代和反馈,这种飞轮对于国外公司是闭环提升,对国内产业则是潜在隐患,国内公司若基于 OpenAI 进行迭代,则会加速国外的研究和产业进展,并且始终让我国受制于美国公司,从而形成新一轮卡脖子问题。
充分认识差距,保持战略定力。 充分认识到我国人工智能基础研究相对于美国的差距,要在质疑和焦虑等各种噪声中保持战略定力。人工智能自从诞生以后,每次浪潮都由欧美引领,自从 2010 年以后则由美国特别是企业研发机构引领,我国基本都是跟随研发而并没有重大创新突破,我们要对这种追赶并且挑战的现状充分认识,不能盲目自大也不能丢失信心,在各种噪声中保持对人工智能引领的数字经济信心。
加强大模型研究,探索多技能路线。 持续加强对人工智能基础研究机构的改革、整合和支持,参考美国人工智能的产品导向思路加强大模型的联合攻关,同时鼓励探索大模型之外的更多技术路线。面对当前我们国内在数据多样性、一致性和标注质量方面的差距,以及算力等数字基础设施的不足,应该鼓励以小模型为基础的多技能技术路线更多落地场景。这样大模型和多技能至少两个技术路线同步并进,从各个方面来缩小与美国的差距。当然我们也要看到,美国主流的这两个技术路线之外,在基础研究方面更是探索小样本学习等更多技术路线。
加快数据基建,推动数据共享。 美国面向全球多传感数据和非结构化数据采集的能力,以及美国科技公司相比较我国科技公司数据采集的多样性,是美国人工智能领先的关键因素。我国科技公司主要关注于用户画像的采集和分析,并将此作为商业变现模式,反而在人工智能关注的声、光、电、热、力、磁等多传感数据以及程序代码等非结构化数据方面缺乏积累。
健全数据标准,规范数据治理。 建立国家多传感数据和非结构化数据的标准体系,鼓励各个行业数据采集系统之间的互联互通,消除国内各行业之间的数据孤岛现象和数据不一致的问题。
五、ChatGPT 应用
ChatGPT by OpenAI. 项目采用接口方式实现。
最新实现在:https://github.com/AIGCT/EASY*ChatGPT* 下载即可使用。
问题 1
问题 2
版权声明: 本文为 InfoQ 作者【向阳逐梦】的原创文章。
原文链接:【http://xie.infoq.cn/article/6e757341542bb011485cb340f】。文章转载请联系作者。
评论