AI 日报|国内大模型迅速崛起!赶超美国第一!阿里云发布全球性能最强的开源模型!
文章推荐
AI日报|文生语音大模型国内外均有突破,Pika完成6亿新融资,视频大模型也不远了!
⭐️搜索“可信 AI 进展“关注公众号,获取当日最新 AI 资讯
阿里云发布全球性能最强的开源模型 Qwen2-72B!性能超越美国最强开源模型 Llama3-70B
6 月 7 日,阿里云通义千问发布全球性能最强的开源模型 Qwen2-72B,性能不仅超过美国最强的开源模型 Llama3-70B,也超过文心 4.0、豆包 pro、混元 pro 等国内闭源大模型。火爆外网!
并且阿里云宣布,开源模型 Qwen2 从今日起,免费下载!
在预训练语言模型的评估中,对比当前最优的开源模型,Qwen2-72B 在包括自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的模型,如 Llama-3-70B 以及 Qwen1.5 最大的模型 Qwen1.5-110B。
开源模型 Qwen2 亮点:
持续投入提升 Qwen 的代码及数学能力
在代码方面,成功将 CodeQwen1.5 的成功经验融入 Qwen2 的研发中,实现了在多种编程语言上的显著效果提升。
在数学方面,大规模且高质量的数据帮助 Qwen2-72B-Instruct 实现了数学解题能力的飞升。
长文本处理
Qwen2 系列中的所有 Instruct 模型,均在 32k 上下文长度上进行训练,并通过 YARN 或 Dual Chunk Attention 等技术扩展至更长的上下文长度。
并且开源了一个智能体解决方案,用于高效处理 100 万 tokens 级别的上下文。
安全
下图展示了大型模型在四种多语言不安全查询类别中生成有害响应的比例。测试数据来源于 Jailbreak,并被翻译成多种语言进行评估。
Qwen2-72B-Instruct 模型在安全性方面与 GPT-4 的表现相当,并且显著优于 Mixtral-8x22B 模型。
下载地址:https://modelscope.cn/organization/qwen
中国首个自研视频大模型 Vidu 重大更新:时长延至 32 秒,首次支持
音视频合成
中国首个长时长、高一致性、高动态性的自研视频大模型 Vidu,近期完成三个重大技术迭代,实现国内视频模型更大一步技术跨越。更新如下:
一键生成 32s 视频;
支持音视频合成;
支持 4D 生成,可以从单一视频生成时空一致的 4D 内容;
值得关注的是,Vidu 正朝着“更长时长”和“更多模态”的方向进化,在视频生成之后,音频生成或将成为 Vidu 迭代的重点方向。
据介绍,Vidu4D 支持从单个生成的视频中精确重构出 4D(即序列 3D)。通过提升 3D 一致性,来增强视频生成对世界的真实模拟。
https://mp.weixin.qq.com/s/zOsgAm8v-C44qWhz-TSUsw
对标 Sora,快手推出视频生成大模型「可灵」
快手 AI 团队自研结合多项创新技术,宣布推出可灵大模型,并且采用类似 Sora 的技术路线。
具有以下优势:
能够生成大幅度的合理运动;可灵采用了 3D 时空联合注意力机制,能够更好地建模视频中的复杂时空运动;
能够模拟物理世界特性;得益于自研模型架构及 Scaling Law 激发出的强大建模能力;
具备强大的概念组合能力和想象力;得益于模型对文本-视频语义的深刻理解和基于 Diffusion Transformer 架构学到的强大概念组合能力;
生成的视频分辨率高达 1080p,时长高达 2 分钟(帧率 30fps),且支持自由的宽高比。得益于高效的训练基础设施、极致的推理优化和可扩展的基础架构。
业内首个中文原生的 DiT 架构文生图开源模型——腾讯混元:开源模型生图时间缩短 75%!
腾讯混元文生图大模型(混元 DiT)开源不足一月,Github 收获 2.1k 星标,位列同类项目前茅。
作为首个中文原生 DiT 架构的开源商用模型,腾讯快速响应开发者需求,推出了加速库更新:生图生成时间缩短 75%,速度提升 4 倍。
加速器具有两大亮点:
通过降低扩散模型迭代的步数实现加速,使用蒸馏权重后,生成同等质量的图像,迭代步数减半。
TensorRT 通过工程优化,减少冗余计算、合并层次、精简精度,让模型更快处理数据,并且 TensorRT 还支持与模型权重解耦。
https://mp.weixin.qq.com/s/zyTzP6Q9lNORwprPBIc1FA
博查 AI 搜索首发多模态搜索和智能体搜索能力,引入抖音高质量内容和 AI 智能体
博查 AI 搜索发布 6.6《鲤跃龙门》版本,首发多模态搜索(Media Search)和智能体搜索(Agent Search)能力,引入抖音高质量内容和 AI 智能体,进一步增强 AI 搜索的通用性和结果丰富性。
其亮点如下:
多模态搜索 (Media Search)
在搜热点、搜短剧、搜视频、搜图片等场景下,除了 AI 总结的文本,从高质量视频、图片中可以获得更直观、更丰富的答案。
智能体搜索 (Agent Search)
在专有领域内容搜索和复杂任务搜索等场景下,通过 AI 智能体可以达到更优的搜索效果。博查会识别用户搜索需求,并匹配相应的智能体进行作答。
联网搜索 API (Web Search API)
博查与国内顶尖搜索引擎厂家合作,第一个正式开放提供内容合规、价格实惠、搜索结果更适合 AI 使用的联网搜索 API。博查搜索引擎基于 MoE 架构,可以识别用户搜索意图,路由至专家领域进行搜索,并提供高质量的正文文本。
版权声明: 本文为 InfoQ 作者【可信AI进展】的原创文章。
原文链接:【http://xie.infoq.cn/article/70c3e38b3fe6e4df977c061cb】。文章转载请联系作者。
评论