基于 Groq 和 Cartesia 的高速 AI 语音助手发布;xAI 将自行打造超级计算机丨 RTE 开发者日报
开发者朋友们大家好:
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
本期编辑:@JLT,@鲍勃
01 有话题的新闻
1、xAI 将自行打造超级计算机 3
马斯克昨日在 X 平台宣布,其名下人工智能初创企业 xAI 已经结束了与甲骨文扩大现有合作的协议。
此外,他还表示,xAI 正打造一台拥有 10 万块英伟达 H100 GPU 的超级计算机,目前正在进行微调和修复,最快在下个月就可以发布。
马斯克称,xAI 现在打造的这台超级计算机「将成为全球范围内功能最强大的训练集群,并且领先优势巨大」。同时他还表示「我们的核心竞争力在于比任何其他的人工智能公司都更快,这是缩小差距的唯一途径」。(@爱范儿)
2、清华团队开发 CharacterGen,单图高效生成 3D 角色
清华大学研究团队开发的 CharacterGen 框架在 3D 角色生成领域取得重大突破。该技术能从单张图像创建具有一致姿势和高质量外观的 3D 角色模型,并支持后续骨架绑定和动画制作。CharacterGen 采用基于图像的多视角扩散模型校准姿势,结合变换器的稀疏视图重建模型创建详细 3D 模型。
研究团队还开发了特殊的纹理生成策略和专用训练数据集。实验结果表明,CharacterGen 在生成高质量 3D 角色方面表现出色,为游戏和动画制作等领域带来新的可能性。该项目将于 SIGGRAPH 2024 发布,相关代码和数据集也将开源。(@AI 科技评论)
3、Stability AI 重磅更新:一键无痕 P 图抠图,3 分钟整首歌曲直接生成
Stability AI 发布了 Stable Assistant 的两项新功能:图片编辑中的搜索和替换,允许用户无缝替换图像中的对象;以及 Stable Audio,能够生成长达 3 分钟的高质量音乐曲目。
这些功能基于 Stable Diffusion 3 技术,提供了包括图像放大、视频创建等多样化的图像编辑工具,旨在赋能创意专业人士,目前 Stable Assistant 提供 3 天免费试用。(@智东西)
4、夸克 AI 搜索迎来全新升级,推出一站式 AI 服务
7 月 10 日,夸克宣布升级「超级搜索框」,推出以 AI 搜索为中心的一站式 AI 服务。同时还为用户提供从检索、创作、总结,到编辑、存储、分享的一体化信息服务价值。
用户在打开夸克 7.0 版搜索框后,输入问题即可体验智能回答,还有 AI 写作、文件总结、视频总结、拍题讲解功能。一个「超级搜索框」集纳了智能回答、智能创作和智能总结三大能力。
夸克 App 产品负责人郑嗣寿表示,夸克会加速效果迭代和产品升级,给用户更快更准的搜索体验。在多模态交互、内容生态建设、多端一体等方面,夸克将进一步加快产品创新节奏,为用户创造无处不在的信息服务价值。(@爱范儿)
5、ai-ng/swift:新一代 AI 语音助手项目亮相
ai-ng/swift 项目是一款基于 Groq 和 Cartesia 技术的高速 AI 语音助手。该项目利用 Groq 进行快速推理,结合 OpenAI Whisper 进行语音转录和 Meta Llama 3 生成文本响应。同时,它采用 Cartesia 的 Sonic 语音模型实现快速语音合成,并将合成的语音流式传输到前端。
项目还整合了语音活动检测技术,能够精确捕捉用户的说话时机。整个应用程序使用 TypeScript 编写,基于 Next.js 框架开发,并已成功部署到 Vercel 平台。(@AI 科技评论)
6、急追英伟达,AMD 以 6.65 亿美元现金收购 AI 模型开发商 Silo AI
7 月 10 日,据媒体报道,AMD 已同意以 6.65 亿美元现金收购人工智能模型开发商 Silo AI,希望此举帮助 AMD 缩小与英伟达之间在 AI 方面的差距。AMD 表示,Silo AI 团队将加入该公司人工智能集团,现任 CEO 将继续领导团队。受此消息影响,AMD 周三美股早盘一度大涨 5.7%。
根据 AMD 周三公布的声明,Silo AI 总部位于赫尔辛基,该公司自称是欧洲最大的私营人工智能实验室,客户包括安联集团、联合利华、和宝马旗下的劳斯莱斯。AMD 表示,Silo AI 的联合创始人兼首席执行官彼得·萨林将继续领导他的团队,该团队将成为 AMD 人工智能集团的一部分。
目前,AMD 被认为是英伟达在快速增长的 AI 硬件市场上最有可能的竞争对手,两家公司主营的显卡已被证明是训练大型语言模型最有效的手段。(@华尔街见闻)
02 有态度的观点
1、谷歌 DeepMind CEO:当前 AI 综合智力还不如普通家猫
7 月 10 日,谷歌 DeepMind 首席执行官戴密斯・哈萨比斯(Demis Hassabis)表示,当前人工智能(AI)的 IQ 智力还没有达到猫的水平。
哈萨比斯出席全球变革研究所组织的「2024 年英国未来会议」,在和英国前首相托尼・布莱尔(Tony Blair)的公开讨论中表示:如果将 AI 作为通用系统来衡量,其 IQ 智商水平甚至没有超过猫。不过,随着巨额现金和计算投资的推动,相关研究进展很快。一些人预计未来 5 年时间,AI 智力可以超过人类。
哈萨比斯表示 DeepMind 的工作重点不是人工智能(AI),而是通用人工智能(AGI)。(@IT 之家)
写在最后:
我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。
对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。
素材来源官方媒体/网络新闻
评论