实力爆表,日日新成为 AI 领航者
上周五,阿里发布大模型通义千问,正式开始邀请内测。本周一,人工智能巨头商汤科技正式发布“日日新”大模型体系,全面丰富的产品体系,多个功能表现超预期,亮点多多。
正式发布
4 月 10 日,商汤科技董事长兼 CEO 徐立在商汤技术交流日上发布“日日新”大模型体系,取自《礼记·大学》,汤之盘铭:苟日新,日日新,又日新。“日日新”大模型体系包含自然语言生成、照片生成服务、感知模型预标注、模型研发。商汤发布中文语言大模型应用平台“商量”,1800 亿参数中文大语言模型支持超长文本知识理解,支持问答、理解与生成等中文语言能力,可实现多轮对话、逻辑推理、语言纠错、内容创作、情感分析等。
自建算力
商汤历时五年,建设了业界领先的 AI 大装置,大装置上总共有 27000 块的 GPU 芯片卡,可以输出 5.0 exaFLOPS 的总算力,是亚洲目前最大的智能计算平台之一。基于大装置的能力,商汤目前已构建了计算机视觉、自然语言处理、AI 内容生成、多模态、决策智能等多个领域的大模型,持续演进能力并广泛支持各种应用。
不得不说,27000 块 GPU 芯片,这是一个大手笔。为了创建和维持 ChatGPT 所需的人工智能分析数据的庞大数据库,OpenAI 使用了 10000 个英伟达的 GPU 进行相关的训练,而为了支持实际应用,满足服务器的需求,OpenAI 已使用了约 2.5 万个英伟达的 GPU,随着需求的增加未来预计还会增加。
单以数量论,商汤已经达到了 OpenAI 的量级。当然,“日日新”大模型体系所涉及功能目前是多于 ChatGPT 的,ChatGPT 主要功能需求在于语言生成训练,图像生成处于起步阶段,在如此多芯片的支撑下,语言生成所得到的资源支撑比其他 ChatGPT 类产品多。商汤 27000 块 GPU 芯片是供整个大模型体系使用的,功能繁多。自建基础算力,就如同电解铝生产企业自建发电厂,可以有效降低算力成本,并做到算力支持稳定可靠,支持大模型持续迭代优化训练。
SenseChat
“日日新 SenseNova”此次推出了语言大模型“商量 SenseChat”。作为千亿级参数的自然语言处理模型,“商量 SenseChat”使用大量数据训练,并充分考虑了中文语境,能够更好地理解和处理中文文本。
从这个表态我们可以看出,SenseChat 与文心一言一样,都是在中文下表现更好,紧密贴合国内市场需求,不约而同的将国内市场作为发展的首要选择,在国际市场已经有 ChatGPT 和 Bard 作为行业标杆的情况下,避其锋芒,先内再外的策略有助于企业前期发展。
虽然 SenseChat 与文心一言是我们认为的最好技术对手,但这次 SenseChat 明显技高一筹。文心一言缺乏联系上下文的能力,只能单问单答是最被大家诟病的。活动现场,“商量 SenseChat”展示了出色的多轮对话和超长文本的理解能力,与 ChatGPT 一样,SenseChat 具有了阅读理解的能力,用户可以通过多轮提问纠正答题方向,知道获得符合心意的答案。
此外,商汤还展示健康咨询助手,为用户提供个性化的医疗建议;PDF 文件阅读助手,能轻松从复杂文档中提取和概括信息。
编程能力
本次现场演示,SenseChat 根据输入的“计算最大公约数”、“求两个数是否互质”等指令写出了简短的代码。同时商汤此次展示了语言大模型下的创新应用————编程助手,可帮助开发者更高效地编写和调试代码。编程核心功能包括代码补全、扩写、翻译、重构、修正,以及注释生成代码、复杂度分析、测试用例生成等。徐立表示,内部实测代码编写效率提升 62%,HumanEval 测试集一次通过率 40.2%。同时预测下一代软件开发范式是 AI for AI,代码=80%AI 生成+20%人工。
按照这个预测,代码 80%AI 生成,只有 20%需要程序员去完成,即使加上项目设计和测试的任务,人工在项目中最多占据 50%的工作量就够了,意味着 50%的开发人员面临着极大的失业风险,更何况,将来项目设计和测试的一些人工也可以依靠 AI 来完成。如果从项目需求开始,就让 AI 进入全程参与,AI 将是身手卓尔不凡的项目成员,可以监控项目风险、设计方案初稿、代码生成与跟踪,进行 Bug 管理等。这个时代正在成为程序员消灭程序员的时代,将寒冬传递给每一个人。
图像生成
商汤此次还展示了“日日新 SenseNova”的各种 AI 文生图创作、2D/3D 数字人生成、大场景/小物体生成等一系列生成式 AI 模型及应用:
“秒画 SenseMirage”文生图创作平台,展现了光影真实、细节丰富、风格多变的强大的文生图能力,可支持 6K 高清图的生成;客户还可根据自身需求训练生成模型。
“如影 SenseAvatar”AI 数字人视频生成平台,仅需一段 5 分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。
“琼宇 SenseSpace”和“格物 SenseThings”3D 内容生成平台,可以高效低成本生成大规模三维场景和精细化的物件,为元宇宙、虚实融合应用打开新的想象空间。
看到上面这些展示和介绍,我们第一反应就是利好虚拟数字人和元宇宙。借助于日日新大模型,普通企业甚至于个人就能生成虚拟数字人视频,人人皆可制作“柳夜熙”,短视频赛道将风云再起,借助于虚拟数字人来运营积攒流量,依靠流量变现。话说前面谈到代码 AI 生成导致程序员失业,现在失业的程序员可以考虑考虑利用 AI 生成实现再就业了。
数字人通常具有三个核心要素——形、动、神。除了拟人外观,还需要具有用语言、表情和肢体等表达的能力,最后拥有比拟人的思想,具有识别外界环境、并能与人交流互动的能力。这次展示体现了在形和动两方面已经做的非常优秀了,这也是现今专业虚拟数字人的普遍阶段,第三阶段大多处于起步发展阶段,通过 GPT 这一类模型的多轮对话能力,有望加速神这一段的发展。
100 平方公里城市级生成,“琼宇”用时 2 天,具有厘米级重建精度,还原场景的真实细节和光照效果,应用场景涵盖城市及园区数字孪生、建筑设计、影视创作、文旅和电商等。
琼宇造城,格物造物,如影造人,一座充满活力和生机的现代化城市即将展现在我们眼前,元宇宙妥妥的离我们越来越近了。
后言
“坚持原创,让 AI 引领人类进步”,日日新大模型的发布让大家看到了埋头攻关的商汤体现出的领先技术实力,如同以前的 OpenAI 一样低调发展实力出众。
从文心一言到通义千问和传闻不断的华为盘古,再到日日新,国产 ChatGPT 类产品正在奋起直追,日新月异。
版权声明: 本文为 InfoQ 作者【柒号华仔】的原创文章。
原文链接:【http://xie.infoq.cn/article/e297ab864f62e4aa3a18f4906】。文章转载请联系作者。
评论