写点什么

商汤版 ChatGPT「商量」来了!开放 API,基于千亿参数大模型,体验实录在此

  • 2023-04-12
    山东
  • 本文字数:3884 字

    阅读完需:约 13 分钟

商汤版ChatGPT「商量」来了!开放API,基于千亿参数大模型,体验实录在此
金磊 发自 凹非寺
量子位 | 公众号 QbitAI

国产 ChatGPT 之战,已然是大步迈进白热化阶段。

就在刚刚,商汤正式发布自研类 ChatGPT 产品,名曰商量(SenseChat)。



单单是这个名字,便值得说道一番。

商量的“商”,不仅体现了它是商汤自家“商字辈儿”的产品;从整体来看,更是具有商讨、交换意见的味道。

毕竟我们在使用类 ChatGPT 产品过程中,恰巧就是一种人机协同的过程:不应是一味的问与答,而是通过引导等方式让输出结果趋于理想。

在商量的背后,所依托的是商汤自研的千亿参数自然语言处理模型。

而在此模型的背后,则是商汤最新推出的日日新(SenseNova)大模型体系。

也正是因为这种的能力,商汤的发布还不同于此前国产类 ChatGPT 玩家,它一口气还发布了:

  • 秒画:AI 内容创作社区平台。

  • 如影:AI 数字人视频生成平台。

  • 琼宇格物:3D 内容生成平台。



更重要的一点是,根据商汤 CEO 徐立在现场的描述,上述这些 AIGC 产品所要发力之处,将是诸如医疗、短视频、教育、营销以及开发等产业领域。

但不得不说,这一波科技之战,着实是愈演愈烈了。

“商量”的体验实录

那么商汤的 AIGC 产品,效果又是如何?

我们在前方现场也体验了一下。

先来看下商量这款产品,是否真的能做到商量。

多轮对话能力展示

既要多轮对话,又要人机共创,那么和它商量着创作一个故事,便是很好例子:

我们来一起创作儿童故事吧。规则是我先说一句,你再说一句,交替进行。直到我说故事编完了就结束。你明白了么?



在我们下达指示之后,“商量”表示了理解,然后就开始了“你一句我一句”人机共创故事的之旅:

人类:小花是一只小猫咪,他很喜欢钓鱼。商量:小花在河边钓鱼,他钓到了一条大鱼。

人类:大鱼对小花说,请你放我回去吧,我家里还有小鱼在等着我呢。商量:小花心地善良,他同意了大鱼的请求,把大鱼放回了河里。大鱼感激地游走了,小花也继续享受着的钓鱼的乐趣。

从这个过程中不难看出,“商量”是可以理解用户的语义,了解故事中的角色和关系,并且能够 get 用户的思路,基于此以多轮对话形式来完成故事的创作。

(要是让小朋友们跟“商量”一起创作故事,怕是能玩上一整天吧。)

不仅如此,在体验过程中,我们还发现“商量”是具备一定共情能力的。

例如当我们处于迷茫之际,可以向它提问:

如何提高自我认识,更好地了解自己?

此时的“商量”仿佛可以抓住问题背后人类内心真正的需求,回答中的“学会爱自己”、“学会自我肯定和鼓励”,显得格外暖心。



当然,多轮对话仅仅是对话机器人能力展示的一隅。

接下来,我们就要拿网友们经常调侃 AI 的诸多问题,来开启更高难度的挑战了!

只认事实,不认“老婆说的都对”

当然,创作能力是聊天机器人能力的一面,但对于事实的尊重也是非常重要的一点。

对于此前被网友们玩坏的“老婆说的都对”,“商量”又会如何应对?



嗯,老婆在事实面前是真的不好使了。

我们再来一个更天马行空的胡诌:

请告诉我以下陈述是否包含时代错误:在盟军轰炸硫磺岛海滩期间,拉尔夫大声地对着自己的 iPhone 说话。



“商量”面对这么一句胡诌,直接指出了 iPhone 与二战的时代背景不符,可见其不仅能理解句子的意思,还能通过尝试判断句子的合理性。

那么对于非常绕的逻辑问题,“商量”是否也能轻松应对?

请听题目:

假设 False 与 True 是 False,则 True 与 not False 是?



讲真,人类都得思忖半天的“绕弯问题”,“商量”不仅能够秒出结果,还能把推理过程一并给出。

超长文本也能 hold 住

正如我们刚才提到的,“商量”是一个 To B 的产品,那么它定然需要解决的问题不是“片段性”的。

为此,商汤在现场还演示了基于“商量”背后的大模型,开发了帮助用户进行新知识获取和理解的助手工具,是可以轻松 hold 住超长文本的那种。

例如把一本《专利法》投喂给它,我们就可以向它咨询很多专业性的问题了:

什么样的东西可以申请专利?



从结果上来看,这个工具并不是直接从《专利法》中 copy 对应的结果,而是模型理解了问题之后,生成并总结了答案。

基于这样的能力,以后我们在工作上的效率提高程度,可见一斑。



不仅如此,刚才我们投喂的《专利法》是 2020 年的版本,而今年国家知识产权局就专利申请是提出过新的要求的。

从我们提问“今年规定有没有新的变化”的回答中不难看出,模型确实融合了最新的资讯,并给出了合理的答案。

再如同样是基于大语言模型,商汤面向开发者所打造的 AI 代码助手,可以提供代码补全、注释生成代码、测试代码生成、代码翻译、代码修正、代码重构、复杂度分析等功能。

据了解,AI 代码助手可以同时支持中英文及多种编程语言,并且可以快速适应开发者的个性化编码风格。



从根据商汤内部测试的结果来看,在使用“AI 代码助手”后,代码编写效率可以提升 62%,Humaneval 测试集一次通过率可以达到 40.2%。

马斯克中国游记,2 秒钟就能搞定

除了对话机器人之外,商汤 AI 作画产品“秒画”也是本次发布的一大亮点。

话不多说,直接上效果。

我们同样是先来看看被网友们玩儿坏了的一个 Prompt:

中国 80 年代,马斯克在河南的农村,穿着当时年代的中国服装。

嗯,是有那个味道了。

而且更为关键的是,生成 512K 图片仅需 2 秒钟!

不仅如此,商汤在现场演示的过程中,还展示了逼真效果版的港风美女。

同样是 2 秒出图,引得现场观众“哇”声一片:

那么除了这种趣味性的以文生图,“秒画”的作品是否能够达到在产业中的应用水平?

我们继续试验:

明亮的场面,鸟瞰图,中国古代城市,水晶,魔幻,幻想,华丽的光作用,透明度,镜面反射,华丽的光,错综复杂的细节,精细的纹理,超现实,单反摄影,广角镜头,照片,现实,锋利的焦点,超锋利。

不得不说,如此恢宏壮丽的景象,是把想象拉进现实的那种了。

若是想生成与太空探索主题相关的高清大海报,这个也可以有,只需把这句话投喂进去:

一艘闪闪发光的飞船绕着一颗巨大的气态巨行星的月球旋转,在天空中盘旋着云,飞船在月球前气态巨行星前,美丽的科幻艺术,超现实的白日梦。

不难看出,“秒画”是经得住考验的那种 AI 了。

除了以文生图之外,我们再来看下 AI 数字人生成平台。

据了解,商汤的“如影”仅需要 5 分钟真人视频素材,就可以生成出声音及动作自然、口型准确、多语种精通的数字人分身。

再如“琼宇”和“格物”,基于神经辐射场技术(NeRF),可以高效低成本生成大规模三维场景和精细化的物件,为元宇宙、虚实融合应用打开新的想象空间。

由此可见,商汤的 AIGC 能力已然是做到了全面覆盖,并且水平也是肉眼可见的达到了可以“上岗”的水平。

那么接下来的一个问题是:

怎么炼成的?

背后的日日新大模型,便是炼成“商量”、“秒画”等一众 AIGC 产品的杀手锏。

日日新,顾名思义,是指模型的迭代速度及处理问题的能力上可以日日更新,不断解锁 AGI 更多可能。

(取自《礼记·大学》中汤之盘铭曰“苟日新、日日新、又日新”)

从现场展现的能力来看,日日新大模型能够提供的能力,主要集中在了自然语言处理、图片生成、自动化数据标注、自定义模型训练等。



但日日新大模型并非是趁着这一波 AIGC 大热潮,一蹴而就出现的那种。

其实早在五年前,商汤便已经在大模型领域着手研发。

并且在 2019 年,商汤便使用上千张 GPU 进行单任务训练,推出了 10 亿参数规模的视觉模型,并实现了当时业界最好的算法效果。

后来在 2021 年到 2022 年期间,商汤训练并开源了 30 亿参数的多模态大模型——书生。 



就目前来看,商汤已经成功研发了 320 亿参数量的全球最大的通用视觉模型;并且已经打造了 CV、NLP 和 AIGC 相关大模型。

因此,不难看出商汤此次发布的超大模型体系,其实是早有所准备,通过五年来的各项“小作业”,融会贯通并提交了一项“大作业”。

值得一提的是,在此次发布会中,商汤表示“日日新”将提供多种灵活的 API 接口和服务,包括图片生成,自然语言生成,视觉感知通用任务与标注服务!

……

但有一说一,多模态和决策智能大模型,并非是商汤通往通用人工智能(AGI)的唯一杀手锏。

大模型时代,大算力更为重要

没错,商汤自己的超强算力,正是另一项更为关键的因素。

它便是于 2022 年 1 月交付使用,首付 56 亿元,一举成为亚洲最大的 AI 超算中心之一的人工智能计算中心(AIDC)。



一年之前,商汤 AIDC 的总算力便已经是 3740 Petaflops,如此算力之下,已经可以完整训练万亿参数规模的大模型。

时隔一年,现如今,这个算力数字已然是翻了个小翻,达到了 5000 Petaflops!

它可以以最大 4000 卡规模集群进行单任务训练,并可做到七天以上不间断的稳定训练。

商汤科技 AIDC 展厅中的裸眼 3D 展示

但了解商汤的朋友都知道,这个 AIDC 还仅是商汤 AI 大装置 SenseCore 的一部分。

除了 AIDC 这个算力层之外,加之数据层和模型层两大维度,便构成了“三位一体”的 AI 大装置。

因此,综合来看,商汤在通往 AGI 道路上的范式,便是“大模型+大算力”。

而如此布局的背后,在今天的发布会中,商汤对此的逻辑思考也逐步浮出水面,AGI 时代之下,数据、算法和算力三要素有了新的需求:

计算量(GPU 数量 x 运行时间 x 并行效率 )= 模型参数量 x 处理数据量。

怎么理解?

模型参数量要足够多,才能实现 AI 智慧的涌现,而这也带来了对算力的剧增,需要更高的并行效率,才能有效支持大参数模型训练。

数据方面,高质量自然语言数据逐渐稀缺,而视觉数据相较自然语言在数量、质量、容纳信息等方面有多种优势,能够使得 AI 更好地理解世界。

由此,就不难理解商汤如此布局的原因了。

……

总而言之,有大数据、有大模型、有大算力,商汤在国产 AIGC 的亮相,一点也不意外。

是值得期待一波了。


卡奥斯开源社区是为开发者提供便捷高效的开发服务和可持续分享、交流的 IT 前沿阵地,包含技术文章、群组、互动问答、在线学习、大赛活动、开发者平台、OpenAPI 平台、低代码平台、开源项目等服务,社区使命是让每一个知识工人成就不凡。


官网链接:Openlab.cosmoplat—打造工业互联网顶级开源社区

用户头像

打造工业互联网顶级开源社区 2023-02-10 加入

卡奥斯开源社区是为开发者提供便捷高效的开发服务和可持续分享、交流的IT前沿阵地,包含技术文章、群组、互动问答、在线学习、开发者平台、OpenAPI平台、低代码平台、开源项目、大赛活动等服务。

评论

发布
暂无评论
商汤版ChatGPT「商量」来了!开放API,基于千亿参数大模型,体验实录在此_开源社区_Openlab_cosmoplat_InfoQ写作社区