写点什么

「天工大模型 3.0」将于 4 月 17 日发布 同步开源 4000 亿参数 MoE 超级模型

作者:新消费日报
  • 2024-04-01
    云南
  • 本文字数:2671 字

    阅读完需:约 9 分钟

2023 年 4 月 17 日,昆仑万维发布自研双千亿级大语言模型「天工 1.0」正式奠定了国产大模型崛起之路。

在即将到来的 2024 年 4 月 17 日,在「天工」大模型一周年之际,昆仑万维重磅宣布,「天工 3.0」正式开启公测!


1711940466111148.png


「天工 3.0」采用 4 千亿级参数 MoE 混合专家模型,并将同步选择开源,是全球模型参数最大、性能最强的 MoE 模型之一。相较于上一代「天工 2.0」MoE 大模型,「天工 3.0」在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过 20%,数学/推理/代码/文创能力提升超过 30%。

同时,「天工 3.0」新增了搜索增强、研究模式、调用代码及绘制图表、多次调用联网搜索等能力,并针对性地训练了模型的 Agent 能力,使得「天工 3.0」能够独立完成规划、调用、组合外部工具及信息,以精准高效地完成产业分析、产品对比等各类复杂需求,带来全新的颠覆式人工智能体验。

同时,「天工 3.0」也是全球首个多模态“超级模型”(Super Model),其集成了 AI 搜索、AI 写作、AI 长文本阅读、AI 对话、AI 语音合成、AI 图片生成、AI 漫画创作、AI 图片识别、AI 音乐生成、AI 代码写作、AI 表格生成等多项能力,是大模型时代的“超级应用”。

其中,「天工 3.0」AI 音乐生成大模型 SkyMusic 还将在 4 月 2 日(明日)面向社会开启邀测。

四大创新 颠覆升级

MoE 混合专家模型是全球技术最领先、性能最强大的基座模型(Foundation Model)技术路径,相较于其他模型,MoE 大模型应对复杂任务能力更强、模型响应速度更快、训练及推理效率更高、可扩展性更强。

在上一代「天工 2.0」MoE 大模型的领先基础上,「天工 3.0」更是实现了全面的性能升级,其采用 4000 亿级参数 MoE 混合专家模型架构,是目前全球模型参数最大、性能最强的 MoE 模型之一。

「天工 3.0」的模型能力提升体现在以下四大方面:

1、逻辑推理能力更强:更聪明

逻辑推理能力的提升对于大模型解决复杂问题至关重要,「天工 3.0」的数学与推理能力均提升超过 30%,强大的逻辑推理能力使其能够在实际应用中更加准确和高效地处理信息。例如,在「天工 3.0」AI 搜索的研究模式中,模型能够围绕用户的某个简单指令进行相关问题的延伸,并实时判断该段落信息是否需要联网搜索,能够实现如对某个行业进行细致的拆解分析,总结相关事件、拆解产业链地图等复杂功能,并以结构化或思维导图的形式进行最终展示,让模型更“聪明”。

2、语义理解能力更强:更懂你

「天工 3.0」能够更好地理解和处理用户自然语言 Query 中的复杂语义信息,包括隐喻、多义词等。例如,在「天工 3.0」AI 搜索的增强搜索中,模型能够针对用户的复杂 Query 进行拆解、细化、并进行追问、信息理解与补全,使其在自然语义理解方面性能更强,面对不确定性知识时表现更好,能够更精准、高效地满足用户需求。

3、专项 Agent 训练,应对复杂需求能力更强:更全能

大模型时代,AI Agent(智能体)已经成为大模型技术的主流落地方向。「天工 3.0」针对模型独立规划、调用、组合外部工具及信息的能力进行了专项训练,使其能够独立生成并调用代码,完成包括产业研究、产品横评、信息分析、图片生成、图表绘制等多种复杂用户需求,并成为具备多个领域专业知识和能力的全能专家,以强大的语义理解及逻辑推理能力对用户需求进行深度理解,并把任务拆解成细分环节,发到不同的最优模型去处理,最大程度提升模型性能。同时,针对 B 端用户,「天工 3.0」也在知识库能力、任意工具调用能力、复杂角色指令追寻能力等领域进行了全面升级,企业用户可以通过上传知识文档构建专属知识库及 Agent,并实现自动调用制定工具、完成复杂指令遵循 Agent 构建等实用能力。

4、内容创作能力全面升级:多才多艺

内容创作能力一直是「天工」系列大模型的强项,在上一代「天工 2.0」大模型的基础上,「天工 3.0」更是进行了全面的内容创作能力升级,其不仅能实现 AI 音乐生成、AI 语音、AI 对话、AI 二次元漫画生成等强大的内容创作能力,更是通过专项 Agent 训练实现了在对话中结合文本需求实时生成图片、结合文本需求实时内容分析及图表构建等能力,成为真正能搜、能写、能读、能聊、能听、能说、能画、能看、能唱的超级模型,带来全新的颠覆式 AI 体验升级。

全球首个“超级模型”

「天工 3.0」是一款集自然语言处理、计算机视觉、多模态、AI 搜索、AI 智能体等多项尖端技术于一体的人工智能大模型,更是全球首款多模态“超级模型”。

“超级模型”(Super Model)的概念诞生于“超级应用”(Super App)。互联网时代,超级应用是一种集成了多种服务的应用程序,用户能够在一个平台上享受通信、支付、购物、社交、出行等多种功能,这些服务能够相互连接、交互,最大程度地满足用户的综合体验。

超级模型是大模型时代必然的发展方向,也是昆仑万维天工系列大模型一直以来坚持认定的战略。昆仑万维董事长兼 CEO 方汉表示,“超级模型”是大模型时代发展的必然,未来,行业内将出现不止一个“超级模型”,昆仑万维也将持续朝着这一方向不断努力,持续为用户提供更智能、更高效、更可靠的人工智能服务。

想了解更多「天工 3.0」的全新 AI 功能升级,欢迎持续关注昆仑万维集团公众号,并锁定 4 月 17 日下载新版“天工 AI 助手”App,享受超级模型的震撼 AI 体验。

All in AGI 与 AIGC

自 2023 年 4 月 17 日发布自研双千亿级大语言模型「天工」后,昆仑万维围绕自研「天工」系列大模型,打造了一系列颠覆性的前沿 AI 产品:

2023 年 8 月,昆仑万维推出国内第一款 AI 搜索产品天工 AI 搜索;9 月,昆仑万维推出多模态大模型 Skywork-MM,在多模态大语言模型测评 MME 中综合得分排名第一;10 月,昆仑万维开源百亿级大语言模型天工 Skywork-13B 系列;12 月 1 日,昆仑万维发布国内领先的 AI Agent 开发平台天工 SkyAgents;2024 年 2 月,天工基座大模型更是迎来了推出以来的最大版本更新天工 2.0,成为国内首个搭载 MoE 架构并面向全体 C 端用户免费开放的千亿级参数大语言模型 AI 应用。

当前,昆仑万维天工系列大模型在技术、产品、合作、社会认可、奖项荣誉等方面均取得了显著成就,获得了来自社会各界的多方认可。基于天工系列大模型,昆仑万维已构建起 AI 大模型、AI 搜索、AI 音乐、AI 社交、AI 动漫、AI 游戏等 AI 业务矩阵,是国内模型技术与工程能力最强、布局最全面的人工智能企业之一。

在 2024 年 4 月 17 日的一周年之际,昆仑万维「天工 3.0」的震撼发布,不仅将实现 AI 技术的重大突破,更将深刻影响 AI 大模型行业的发展方向,引领 AI 产业迈向新的里程碑。在 “All in AGI 与 AIGC” 战略的推动下,昆仑万维始终致力于 AI 技术的创新和开拓,不断降低用户的 AI 学习使用门槛,持续推动 AI 业务迈向新高度,提高多款 AI 产品的用户体验,与广大用户携手探索未知世界、创造美好未来。

用户头像

还未添加个人签名 2022-09-22 加入

还未添加个人简介

评论

发布
暂无评论
「天工大模型3.0」将于4月17日发布 同步开源4000亿参数MoE超级模型_新消费日报_InfoQ写作社区