写点什么

马斯克称首位受试者可凭思维操控鼠标;字节低调推出视频模型丨 RTE 开发者日报 Vol.148

作者:声网
  • 2024-02-21
    四川
  • 本文字数:2623 字

    阅读完需:约 9 分钟

马斯克称首位受试者可凭思维操控鼠标;字节低调推出视频模型丨 RTE 开发者日报 Vol.148


开发者朋友们大家好:


这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE (Real Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。


本期编辑:@CY

01 有话题的新闻

1、马斯克表示第一位 Neuralink 患者可以通过思维控制电脑鼠标


2 月 20 日消息,伊隆·马斯克在社交媒体平台 X 上的 Spaces 活动中透露,脑机接口公司 Neuralink 的首位人类受试者「似乎已完全康复,并能仅凭思维在电脑屏幕上移动鼠标」。


Neuralink 是这位亿万富翁的初创公司,该公司表示已开发出一种大脑植入物,旨在帮助人类利用神经信号来控制外部技术。该公司的目标是恢复视力、运动功能和言语等丧失的能力。


据一篇博客文章称,Neuralink 在 5 月份获得美国食品和药物管理局批准开展这项研究后,于秋季开始招募患者进行首次人体临床试验。此次人体临床试验标志着 Neuralink 在商业化道路上迈出了一步。医疗器械公司必须经过多轮密集的数据安全收集和测试,才能获得 FDA 的最终批准。(@CNBC)



2、字节跳动低调推出视频模型 Boximator,尚无法作为完善产品落地


2 月 20 日消息,在 OpenAI 发布 Sora 之前,字节跳动低调推出了一款视频模型产品 Boximator。Boximator 可以通过文本控制生成视频中人物或物体的动作。


对此,字节跳动相关人士回应称,Boximator 是视频生成领域控制对象运动的技术方法研究项目,目前还无法作为完善的产品落地,距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。


字节跳动从去年开始布局 AI,并于去年 11 月成立专注于 AI 创新业务的新部门 Flow。一位接近字节跳动的知情人士对界面新闻表示,去年一年,字节跳动创始人张一鸣的全部时间都花在 AI 上了,从其精力分配上也可以看到字节跳动对 AI 业务的重视程度。(@界面新闻)



3、苹果 AirPods 团队大洗牌:Gary Geaves 卸任,苹果 AirPods 团队换帅


根据外媒报道,长期担任声学副总裁的 Gary Geaves 离职,苹果 AirPods 产品线迎来新的掌舵者 Ruchir Davé。古尔曼在推文中表示使用了“shuffles”(洗牌)来形容,表明苹果公司的音频产品团队管理层出现了较大规模的调整。


据了解,苹果公司的声学小组拥有约 300 名成员,为 AirPods、HomePods 和其他苹果设备开发音频技术。该团队负责创建空间音频,即 AirPods、Vision Pro 和其他设备内置的 3D 音效功能。据去年 12 月报道,当月苹果产品设计副总裁 Tang Tan 离职,而他还负责监督配件设计和开发 AirPods 的声学团队,因此他的离职牵动了苹果硬件业务的连锁反应。(@IT 之家)


4、传言称苹果 Vision Pro 主要人员已被调往可折叠 iPhone 开发团队工作


2 月 20 日消息,早前有传言称,苹果已经停止了可折叠 iPhone 的研发工作,因为显示屏的耐用性存在问题。现在,有最新消息称,这家科技巨头依然正在积极开发这款设备,而且实际上已经重新指派了苹果 Vision Pro 团队的一些关键人员来开发这种新的外形。


一位接近苹果内部计划的人士向 Alpha Biz 透露,该公司正在积极努力推出可折叠 iPhone。这位不愿透露姓名的人士还提供了该产品的预计上市时间表,同时提到苹果 Vision Pro 的主要成员已被指定参与该设备的开发。


「据我所知,大量 Vision Pro 核心人员已经被调往可折叠手机开发团队,用于开发可折叠手机。除非情况有变,否则苹果可折叠手机将于 2026 年 9 月开始销售。」(@cnBeta)


5、谷歌 Gemini Advanced 更新,可直接在线编辑和运行 Python 代码


2 月 20 日消息,根据谷歌官方更新公告,Gemini Advanced 订阅用户可直接在 Gemini 界面中编辑和运行 Python 代码,从而帮助开发者快速验证实验代码,确保代码可预期运行,而且可以立即查看代码修改后的结果。


谷歌于 2 月 8 日宣布将 Bard AI 聊天机器人更名为 Gemini,并推出专门的安卓 App,其中搭载 Gemini Ultra 1.0 模型的版本需要注册 Gemini Advanced 订阅,其在逻辑推理、执行指令、编程和创意协作等方面更胜一筹。此次新功能目前仅适用于 Gemini Advanced 高级用户,Gemini 免费版本不可用。


根据谷歌的说法,这项功能可主要用于以下两方面:一是学习,有志于成为程序员的人可以使用 Gemini 试验代码片段,观察修改的影响,并更深入地理解编码原理。二是验证,开发人员可以使用 Gemini 快速验证 AI 生成的 Python 代码的功能,然后再将其集成到他们的项目中。(@IT 之家)


6、微软发布 Visual Studio 2022 17.10 首个预览版更新:改进 GitHub Copilot、自动安装推荐组件


据微软官方新闻稿,微软目前发布了 Visual Studio 2022 17.10 首个预览版本,该版本号称重点改进了 GitHub Copilot,并对设置、扩展组件等方面进行了一系列更新。微软宣称,GitHub Copilot 在 Visual Studio 2022 17.10 中从“聊天机器人”升级到了“开发伙伴”,在该版本中,Copilot 能够“更好地从项目中收集信息”,进一步为开发者当前的开发环境提供更有意义的答案,同时开发者还能够直接在项目中与 Copilot 互动并获取建议,并“轻松获取生成式 AI 应用开发建议”。(@CSDN)

02 有态度的观点

1、周鸿祎回应 AI 十大预言:已实现 4 个


2 月 20 日,在接受采访时被问到现在怎么看年初提出的 AI 十大预言时,周鸿祎回应称已经实现 4 个了。分别是开源大模型爆发、大模型运行在终端、文生图和文生视频取得突破性进展、多模态成为大模型标配。周鸿祎认为,特别是 Sora 的出现让他感到很意外,发展得很快。


十大预测分别是:大模型无处不在,成为数字系统标配;开源大模型爆发;"小模型"涌现,运行在更多终端;大模型企业级市场崛起,向产业化、垂直化方向发展;Agent 智能体激发大模型潜能,成为超级生产力工具;2024 年是大模型应用场景之年,To C 出现杀手级应用;多模态成为大模型标配;文生图、文生视频等 AIGC 功能突破性增长;具身智能赋能人形机器人产业蓬勃发展;大模型推动基础科学取得突破。(@中国企业家杂志)


写在最后:


我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。


对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。



素材来源官方媒体/网络新闻

用户头像

声网

关注

还未添加个人签名 2021-02-05 加入

声网(NASDAQ:API)成立于2014年。开发者可通过声网API,在应用内构建多种实时音视频互动场景。使用声网服务的包括小米、陌陌、斗鱼、哔哩哔哩、新东方、小红书、HTC VIVE 、Yalla等遍布全球的巨头、独角兽企业。

评论

发布
暂无评论
马斯克称首位受试者可凭思维操控鼠标;字节低调推出视频模型丨 RTE 开发者日报 Vol.148_声网_InfoQ写作社区