写点什么

谷歌发布世界模型,能生成可交互虚拟世界;华为发布全球首个 5.5G 智能核心网丨 RTE 开发者日报 Vol.152

作者:声网
  • 2024-02-27
    四川
  • 本文字数:3306 字

    阅读完需:约 11 分钟

谷歌发布世界模型,能生成可交互虚拟世界;华为发布全球首个 5.5G 智能核心网丨 RTE 开发者日报 Vol.152


开发者朋友们大家好:


这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE (Real Time Engagement) 领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。


本期编辑:@CY

01 有话题的新闻

1、因禁用 PWA 应用,欧盟正考虑对苹果发起反垄断调查


欧盟委员会可能对苹果禁止在欧盟市场使用渐进式 Web 应用程序(PWA)的行为展开调查。苹果表示,为了遵守数字市场法(DMA),从下个月开始将在欧盟禁用 PWA,称其存在安全和隐私风险,但此举也被视为阻止开发商规避苹果 30% 的税收。欧盟竞争监管机构已向开发商询问这一变化的影响,并已向苹果和应用开发者发送信息请求。(@CSDN)


2、SpaceX 首次通过星链 从太空向社交平台 X 上发帖


2 月 26 日,伊隆·马斯克旗下太空探索技术公司 SpaceX 宣布,该公司已成功地通过「星链」卫星网络,从太空向社交平台 X 上发布了第一个帖子。


这一次的发布,是通过手机卫星服务——「卫星直连蜂窝网络」(Direct to Cell)技术来实现的。在没有手机讯号的地方,可经由手机和卫星之间的通讯网路传送讯号,但不需经过地面基站。对于这一成就,马斯克也给予了祝贺,并强调 SpaceX 的这条消息「是从一部普通手机直接发到 SpaceX 卫星上的,中间没有特殊设备!」


这是一个里程碑事件。就在几周前,该公司从太空向手机发送了首条短信,并计划在未来一年内将其手机直连卫星服务推向市场。


SpaceX 的「星链」服务表示在手机信号微弱或根本没有信号的地区提供短信服务,但 SpaceX 高级质量系统工程经理凯 Kate Tice 表示,SpaceX 将能够提供语音和数据服务。(@新浪科技)



马斯克在 X 平台发帖庆祝 | 图片来源:X


3、谷歌发布基础世界模型:11B 参数,能生成可交互虚拟世界


谷歌推出了全新范式生成式 AI:生成式交互环境(Genie),通过单张图像提示生成可玩的交互式环境。Genie 是一个 110 亿参数的基础世界模型,由三个部分组成:潜在动作模型,视频 tokenizer 和动态模型。Genie 模型可以在没有动作标签时自我学习控制,并可能成为培养下一代创作者的工具,同时被认为是实现通用智能体的关键。尽管主要数据来自 2D 游戏和机器人视频,但 Genie 方法适用于多个领域。(@机器之心)


4、英伟达推出 RTX 500/1000 Ada AI 显卡 适用于笔记本电脑和工作站


2 月 26 日消息,英伟达推出了 RTX 500 和 RTX 1000 系列全新一代笔记本电脑显卡,主要适用于笔记本电脑和移动工作站,内置神经网络计算单元 (NPU) 用于轻型本地 AI 计算,如果要进行复杂的 AI 计算则会使用 GPU 芯片处理。


这些显卡基于 Ada Lovelace 架构,共有这些型号:RTX 500、RTX 1000、RTX 2000、RTX 3000、RTX 3500、RTX 4000 和 RTX 5000。本次推出的新显卡中,RTX 500 和 RTX 1000 是面向消费者设备和入门工作站的,其中 RTX 500 的 TOPS 为 154、RTX 1000 则为 193。如果用户希望利用 AI 实现高级渲染、数据科学和深度学习,则可以考虑 RTX 2000~5000 系列,这些显卡提供更强大的性能。


这些新显卡的亮点之一包括全部配备了神经网络计算单元,内置适用于 AI 处理的张量核心,其中 NPU 主要负责处理轻型 AI 任务,而 GPU 芯片将为要求更高的 AI 工作流提供额外的 AI 性能。


英伟达称与纯粹使用 CPU 相比,RTX 500 可以为稳定扩散等模型提供 14 倍的生成式 AI 性能,利用 AI 进行照片编辑的速度提高 3 倍,3D 渲染性能提高 10 倍。(@蓝点网)



英伟达芯片 | 图片来源:英伟达官网


5、脑机接口中国新突破:高位截瘫患者用意念控制电脑光标


近日,北京天坛医院神经外科贾旺教授团队联合清华大学洪波教授团队,利用微创无线脑机接口帮助高位截瘫患者成功实现意念控制光标移动,这也意味着中国在脑机接口领域迎来突破性进展。


去年 12 月,贾旺团队为该患者成功实施微创无线脑机接口 NEO 植入手术,经过两个月康复训练,患者实现通过意念活动驱动气动手套抓握水瓶等脑机接口运动辅助功能,并且仅凭意念就可以控制电脑屏幕上的光标移动。团队将进一步训练患者通过意念活动控制电子书翻页、光标点击确认等,增强患者与电子设备的交互性。(@凤凰网科技)


6、高通推出 AI 中心 允许开发人员在其应用程序中无缝实施模型


高通 2 月 26 日发布了人工智能中心(AI Hub)。它将帮助开发人员在其应用程序中快速实现人工智能和生成式人工智能功能,而无需处理太多复杂的问题。


高通公司声称,人工智能中心基本上是应用程序开发人员的一个中心位置,在这里他们可以访问由该公司量化和验证的设备上人工智能模型。在撰写本文时,该中心支持超过 75 种人工智能模型。


开发人员现在就可以可以在网站上选择您要实施的人工智能模型,然后选择目标平台,还可以进一步选择特定的设备,这使得 AI Hub 成为帮助开发人员成功、无缝地将人工智能应用到其应用程序中的同类产品之一。


完成上述步骤后,Qualcomm AI Hub 将引导您找到正确的模型。该公司提到,开发人员只需几行代码就能将优化模型集成到他们的工作流程中。这些模型将涵盖图像分割、图像生成、图像分类、物体检测、超分辨率、文本生成、弱光增强和自然语言理解。


至于 AI Hub 是否能在非骁龙芯片上运行,似乎也是可以的。不过,非骁龙芯片组将无法充分利用专用 AI 芯片的优势,这最终意味着开发人员必须付出更多努力,才能在非骁龙芯片组的设备上实现这一功能。(@cnBeta)


7、GPT-4、Gemini 同时被曝重大缺陷,逻辑推理大翻车


谷歌 DeepMind 和斯坦福研究人员合作发现,逻辑推理大模型的性能受前提条件呈现顺序显著影响,打乱顺序可使准确率下降 30%。实验结果展示各大模型(如 GPT 系列)在顺序变动后推理能力大减,揭示了大模型推理存在的弱点。研究还发展了 R-GSM 基准测试,进一步确认模型对信息顺序的敏感性。(@新智元)

02 有态度的观点

1、华为李鹏:全球 5G 用户数已突破 15 亿,今年是 5G-A 商用元年


2 月 26 日消息,日前,华为公司高级副总裁、ICT 销售与服务总裁李鹏在世界移动通信大会 2024 上表示 5G 商业成功正在发生,商用五年来,全球 5G 用户规模已经突破 15 亿,相当于 4G 九年的发展成果,同时,5G 用 20%的全球移动用户占比,贡献了 30%的移动流量与 40%的移动业务收入,2024 年是 5G-A(5.5G)商用元年,结合云和 AI 技术的发展,运营商商业增长的潜力巨大。(@钛媒体)


2、奥尔特曼回应筹资 7 万亿美元造芯片:“如果要纠正每个报道的错误,我将无法完成我的工作”


此前,奥尔特曼被曝出正从中东地区筹集总计高达 7 万亿美元的资金,以支持 OpenAI 的一项半导体计划,并与英伟达展开竞争。当地时间 2 月 21 日,英特尔 CEO 帕特·基辛格(Pat Gelsinger)和 OpenAI CEO 山姆·奥尔特曼 (Sam Altman) 在美国加利福尼亚州圣何塞会议中心进行了对话。在对谈中,基辛格也向奥尔特曼问出了这个备受关注的问题:“7 万亿(美元)是怎么想的?”


奥尔特曼说:如果我只能坐在那里纠正媒体报道中的每一个错误,我将无法完成我的工作。他随后表示:核心是我们认为世界将需要更多的人工智能计算(芯片),这将需要全球大量的投入,超出我们的想象。我们现在还没有一个具体数字。奥尔特曼称:“我预计 AI 计算的市场会是另一种商品,它更像是能源,在某种价格下有一定数量的需求,在更高的价格下需求更少,在更低的价格下需求更多。”(@澎湃新闻)


3、Gartner 预测:搜索引擎流量遭生成式 AI 抢夺,2026 年下降 25%


Gartner 发布新闻稿表示,深信人们将从现在搜索引擎如 Google 转拥抱生成式 AI 助理如 ChatGPT、Claude,代表搜索行销策略将发生天翻地复的巨大变化。Gartner 进一步预测,2026 年传统搜索引擎流量下降 25%,搜索行销失去市占率,被 AI 聊天机器人和其他虚拟代理取代。(@CSDN)


写在最后:


我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。


对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。



用户头像

声网

关注

还未添加个人签名 2021-02-05 加入

声网(NASDAQ:API)成立于2014年。开发者可通过声网API,在应用内构建多种实时音视频互动场景。使用声网服务的包括小米、陌陌、斗鱼、哔哩哔哩、新东方、小红书、HTC VIVE 、Yalla等遍布全球的巨头、独角兽企业。

评论

发布
暂无评论
谷歌发布世界模型,能生成可交互虚拟世界;华为发布全球首个 5.5G 智能核心网丨 RTE 开发者日报 Vol.152_声网_InfoQ写作社区