Meta SAM 2:实时分割图片和视频中对象;Apple Intelligence 首个开发者测试版发布丨 RTE 开发者日报
开发者朋友们大家好:
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
本期编辑:@JLT,@鲍勃
01 有话题的新闻
1、Meta SAM 2 登场:首个能在图片和视频中实时分割对象的统一开源 AI 模型
Meta AI 宣布推出新一代的 Segment Anything Model (SAM) 2,能够在视频和图像中实现实时的可提示对象分割。
SAM 2 可以快速、精确地在任何视频或图像中选择对象。它不仅能在图像中分割对象,还能在视频中追踪对象,即使这些对象在训练时从未见过。该模型支持实时互动,非常适合各种实际应用,比如视频编辑和互动式媒体内容制作。
对象分割:它可以在图像或视频中识别出一个特定对象,并将该对象的像素与背景区分开来。例如,在一张包含多个物体的图片中,模型可以准确地找出并标记出某一个物体的轮廓。
实时性:模型能够在视频播放的过程中快速处理每一帧,立即识别并分割、跟踪出特定对象。这样可以实现如视频编辑、特效制作等需要快速反馈的应用。
可提示:是模型可以根据用户提供的提示(如点击某个物体、框选某个区域等)来进行分割。这种交互方式使得用户可以更精确地控制哪些对象需要被分割。(@小互 AI)
2、英伟达「AI 盒子」升级发布软件和服务,黄仁勋打造物理世界的数字副本
快科技 7 月 30 日消息,在顶尖计算机图形大会 SIGGRAPH 2024 上,NVIDIA 展示了其在渲染、仿真和生成式 AI 领域的最新进展,其中最引人注目的是 NVIDIA NIM 的全新升级。通过这一平台,用户可以在几分钟内构建 AI 应用,大大简化了 AI 模型的开发和部署过程。
黄仁勋将 NIM 形容为「AI-in-a-Box」,即盒子里的人工智能,这次升级通过标准化 AI 模型的复杂部署,进一步优化了性能,使得英伟达在 AI 领域的领导地位更加稳固。
英伟达还宣布,Hugging Face 推理即服务平台现在由 Nvidia NIM 提供支持,在云端运行,进一步扩展了 NIM 的应用范围。
此外,NVIDIA NIM 微服务通过增强 OpenUSD(通用场景描述)语言的理解,使得各行各业都能够构建基于物理的虚拟世界和数字孪生。(@快科技)
3、波形智能发布私人语言模型「Weaver 2.0」,聚焦个性化与自适应技术
人工智能初创公司波形智能近日正式发布了新一代多模态无限式长内容生成的个性化自适应私人语言模型「Weaver 2.0」。
据介绍,「Weaver 2.0」在技术上实现了多项优化升级,包括千人千面的个性专属、数据为核的自适应/自进化,以及端云结合的高效部署。这些特性使得该模型能够根据用户的个性化需求和使用习惯进行动态调整,从而提供更加精准、高质量的内容生成服务。
为了实现模型的持续进化和自我优化,波形智能自研了以数据为核心的可「自主进化」的智能体框架——AIWaves Self-Evolving Agents。这一框架不仅集成了 1.0 版本的可控性能力,还采用 Symbolic Learning 方式,让 Agent 可以在不断更新的数据环境中解析自身的性能表现,并根据用户习惯和反馈定期或主动进行调整。
此外,在隐私保护方面,「Weaver 2.0」采用端云结合的高效部署方案,可以根据需求在不同环境下打造「本地私钥」,以确保用户数据的安全性和隐私性。(@环球网科技)
4、苹果发布 iPhone AI 首个预览版:暂时向开发者开放
据外媒报道,苹果周一发布了 Apple Intelligence 的第一个版本,这是一套人工智能功能,可以改进 Siri、自动生成电子邮件和图像并对通知进行排序。这款名为 Apple Intelligence 的新软件在 iOS 18.1 的开发者测试版中发布。iPad 和 Mac 也有类似的版本。目前,它只对注册的 Apple 开发者开放。
此外,用户更新后必须在 Apple 的设置应用中注册候补名单才能访问该服务,这涉及 ping Apple 服务器以处理更复杂的请求。今年晚些时候,它将向公众发布,但 18.1 版本号表明 Apple Intelligence 不会与新 iPhone 硬件一起发布,预计新 iPhone 硬件将于秋季推出运行 iOS 18 的版本。
Apple Intelligence 是苹果的一项重要举措。投资者希望人工智能与苹果操作系统的紧密结合能够在未来几年引发一波大规模升级,尤其是考虑到该系统仅适用于 iPhone 15 Pro、iPhone 15 Pro Max 及更新版本。(@鞭牛士)
5、OpenAI 旗下 AI 搜索引擎 SearchGPT 官方演示被曝翻车
近期,OpenAI 宣布旗下 AI 搜索引擎 SearchGPT 开放内测,但该公司上演了谷歌 Bard 出糗的一幕,SearchGPT 的官方演示被曝出低级错误。据外媒,在回答「8 月在北卡罗来纳 Boone 举办的音乐节」的相关问题时,SearchGPT 出现了幻觉。
报道称 OpenAI 发言人已承认了这个错误,但表示「这仅是初始的原型,我们将不断改进。」此外,有参与内测的科技外媒还揭开了 SearchGPT 的搜索机制,与当前 ChatGPT 提供的通用 Bing 搜索功能不同,SearchGPT 更擅长提供实时信息。(@每日经济新闻)
02 有态度的观点
1、多名院士专家谈人工智能:中国发展 AI 不能靠「堆芯片」
多名院士专家在 2024 中国算力发展专家研讨会上讨论了中国人工智能发展问题。他们认为,中国 AI 发展不能简单模仿美国「堆芯片」模式,而应结合国情,发展具有自主知识产权的「主权级大模型」。专家们提出,智能计算应参考人类智能,从基础理论突破,实现低能耗高智能的计算模式。同时,应重视大模型的算力需求,利用中国在超算领域的技术积累,研发专用超算,克服算力瓶颈。(@环球网)
写在最后:
我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。
对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。
素材来源官方媒体/网络新闻
评论