斯嘉丽·约翰逊指控 OpenAI 非法使用其声音;微软推出 AI 工具「回顾」(Recall)丨 RTE 开发者日报 Vol.208
开发者朋友们大家好:
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real Time Engagement) 领域内「有话题的 新闻」、「有态度的 观点 」、「有意思的 数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
本期编辑:@CY,@JLT,@鲍勃
01 有话题的新闻
1、微软推出 Copilot+ PCs,发布「过目不忘」的「回顾」(Recall)功能
5 月 21 日,微软公司于北京时间凌晨 1 点举办的 Build 开发者前瞻大会上,微软首席执行官萨蒂亚・纳德拉上台演讲,提出了「Copilot+ PCs」宣传名称,并将其描述为「新一类 Windows PC」。
这次 Copilot+PC 上增加了一个惊艳的「回顾」(Recall)功能,类似于「时光倒流」,这也是此次发布会的最大亮点。AI 可以找到你曾经在电脑上做的「任何事」,只要屏幕显示过的内容,AI 就能帮你找到。
Copilot+ PCs 的一项硬件要求是不依赖云,可以在本地处理生成式 AI Copilot 进程,这就需要配备神经处理单元(NPU)的芯片组。高通公司等制造商已经通过骁龙 X Elite 等芯片奠定了基础。微软正在采取合作伙伴优先的方式制造 Copilot+ PC。除了 AMD、英特尔和高通等芯片制造商,宏碁、华硕、戴尔、惠普和联想等主要原始设备制造商也加入了进来。
微软表示已经重构 Windows 11 系统,Copilot+ PC 相比配备 M3 处理器的最先进 MacBook Air 快 58%,而且续航时间超过 1 天时间。微软还透露,它的 Copilot+个人电脑现在将在 OpenAI 的 gpt-4o 模型上运行,允许助手通过文本、视频和语音与你的电脑互动。用户还可以与 Copilot 共享他们的屏幕,并与该应用程序进行自然对话。(@IT 之家、@智东西)
2、斯嘉丽·约翰逊指控 OpenAI 非法使用其声音并要求下架
国际著名影星斯嘉丽-约翰逊指控 OpenAI 的 ChatGPT,非法使用其声音并要求下架。
目前,ChatGPT 的语音模式一共有 Breeze、Cove、Ember、Juniper 和 Sky 五种声音,斯嘉丽指责的是其中的「Sky」模式,听来和她本人的声音相似度高达 90%以上。
OpenAI 最新发布 GPT-4o 语音模式的配音和斯嘉丽也很像。而斯嘉丽正是 2013 年著名科幻 AI 电影《Her》的女主 AI 配音,这也是 OpenAI 首席执行官 Sam Altman 最喜欢的电影之一。
斯嘉丽在社交平台发布了一篇长文,把整个事情的来龙去脉说了一遍。她表示,2023 年 9 月,ChatGPT 推出语音模式时,OpenAI 曾找过她希望为其配音,由于个人原因拒绝了。
就在产品发布会的前两天,OpenAI 还曾试图说服斯嘉丽,再次遭到拒绝。但在真正发布时,斯嘉丽听到其中的「Sky」和她本人声音太像了,很可能是找人模仿了她的声音。
此外,Sam Altman 在 GPT-4o 发布时在社交平台上只发了一个词「Her」,这明显是在暗示斯嘉丽的声音。(@AIGC 开放社区)
3、GPT-4o 发布后,OpenAI 移动端订阅收入创历史记录!单日净收入达 90 万美元
上周,OpenAI 推出了最新旗舰模型 GPT-4o,这也带动了 OpenAI 移动端收入实现有史以来最大增长。根据 Appfigures 数据,GPT-4o 正在推动更多用户升级到 付费订阅。
GPT-4o 可以处理文本、语音和视频,并提供实时响应和一系列情感语音选项,使其成为比以前提供的模型更强大的模型。如果移动用户想尝试 OpenAI 最新推出的产品,必须升级到每月 19.99 美元的订阅 ChatGPT Plus。
Appfigures 指出,ChatGPT 移动应用净收入在 GPT-4o 发布当天首次跃升 22%,并在接下来的几天里继续增长。上周二,其净收入高达 90 万美元,几乎是日均收入 49.1 万美元的两倍。
ChatGPT 移动应用在上周 App Store 和 Google Play 上净收入为 420 万美元,是该应用迄今为止最大收入增幅,收入大幅增长表明用户确实有尝试最新 AI 体验的需求,尤其是在移动设备上,即使它比 Netflix 订阅更贵。(@有新 Newin)
4、NetBSD 禁止 AI 生成代码
BSD 发行版项目 NetBSD 禁止使用 ChatGPT、Copilot 等 AI 工具生成代码。BSD 更新了它的 commit 指南:如果代码非开发者本人编写,那么需要仔细检查代码的许可证是否允许导入到 NetBSD 的源代码库,允许自由分发。开发者需要联络原代码的作者,确保他们是代码的唯一作者,并验证确保没有拷贝其它代码。由 GitHub/Microsoft Copilot,OpenAI ChatGPT 或 Facebook/Meta Code Llama 等大模型生成的代码被认为很可能拷贝自不同许可证授权的代码,BSD 要求未经核心团队批准不得递交这些 AI 工具生成的代码。( @CSDN)
5、京东支付与微信支付实现互联互通
近日,京东支付和微信支付实现互联互通,成为行业首家同时打通微信个人码和商家码的第三方支付机构。
据介绍,用户可以通过京东金融 App 扫微信收款码,商家提供的微信收款二维码都可以扫,付款时还可享受立减优惠,最高可减 30 元。
京东支付也补充表示,微信收款二维码指微信的个人码、商家码,此次互联互通是在网联清算公司统一业务规则和技术标准下的接入。(@爱范儿)
02 有态度的观点
1、何小鹏:2025 年在中国实现类 L4 级智驾体验,智驾技术开始走向全球
5 月 20 日,在小鹏汽车 520 AI DAY 上,小鹏汽车董事长、CEO 何小鹏发表演讲。他表示,上个 10 年,是新能源汽车时代;下个 10 年,是智驾汽车时代。
发布会上,他宣布小鹏端到端大模型在国内首个量产上车,智驾能力提升 2 倍。他表示,小鹏端到端大模型 2 天迭代 1 次,智驾能力 18 个月提升 30 倍。
何小鹏还透露,2024 年第三季度,NGP 不仅全国都能开,而且全国每条路都能开。2025 年城区智驾比肩高速智驾体验。另外,2025 年在中国实现类 L4 级智驾体验,智驾技术开始走向全球。
他还公布了小鹏以智驾为核心的 AI 技术投入:2024 年智能研发投入 35 亿元,每年算力训练投入 7+亿元,2024 年新招募人员 4000 人。(@新浪科技)
2、张亚勤:我对人工智能发展的六大趋势判定和三大风险预警
2024 为 AI 应用爆发元年,这个论断,似乎已经开始成为 AI 产业的某种共识。大模型经过一年多狂飙式发展,模型能力已经基本可以支撑应用的爆发,AI 走入产业、甚至走入普通人生活的速度正在加快。在这个时间节点,行业已经从对大模型能力的惊叹、惊喜及技术追赶的焦虑中,切换到了理性看待这项技术的发展,冷静分析未来的技术演进趋势与潜在风险。
在 2024 年 5 月 19 日举办的 C3 安全大会上,中国工程院院士、清华大学智能产业研究院院长 张亚勤发表了以「AI 大模型机遇和风险」为主题的演讲。张亚勤认为,大模型是 AI 时代的操作系统,正在孕育新的生态。
「人工智能正在从多个模型多算法,走向相对单一的框架、多模态、大一统的模型。」在演讲中,他总结了大模型生成的六大趋势、三大风险(信息、物理和生物世界的风险),并针对这三大风险,提出了五个具体建议。(@AI 未来指北)
写在最后:
我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。
对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。
素材来源官方媒体/网络新闻
评论