写点什么

OpenAI 曝新项目「草莓」,提升 AI 推理能力;智谱 AI 开源视频理解模型丨 RTE 开发者日报

作者:声网
  • 2024-07-15
    四川
  • 本文字数:2294 字

    阅读完需:约 8 分钟

OpenAI 曝新项目「草莓」,提升 AI 推理能力;智谱 AI 开源视频理解模型丨 RTE 开发者日报


开发者朋友们大家好:


这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。


本期编辑:@JLT,@鲍勃

01 有话题的新闻

1、代号「草莓」,OpenAI 被曝研发新项目:将 AI 推理能力提至新高度


路透社发布报道,称 OpenAI 公司正在研发代号为「草莓」的全新项目,进一步延伸去年 11 月宣布的 Q* 项目,不断提高 AI 推理能力,让其更接近人类的智力。该媒体报道称,「草莓」项目会自主、高效地扫描互联网,并可靠地执行 OpenAI 所描述的「深度研究」,让其能够大规模解决更复杂的现实世界问题。


一位内部知情人士透露:「我们希望我们的人工智能模型能够像我们一样看待和理解这个世界。不断研究新的人工智能能力也成为业界共识,我们都相信,这些系统的推理能力会随着时间的推移而不断提高」。


「草莓」项目的目标是在现有 AI 模型基础上进行更广泛的「post-training」分析,实现更接近于人类的反应。「草莓」项目目前仍在开发阶段,尚不清楚距离正式发布还有多长距离。报道称「草莓」项目的工作原理,即便是在 OpenAI 内部也严格保密,没有太多人了解其细节。


一些业内人士认为该项目是一项技术突破,可以开发出「更强大的人工智能模型」。(@IT 之家)


2、Amazon 推出 Rufus AI 购物助手



在经过了五个月的测试后,Amazon 面向所有美国客户推出了 AI 购物助手 Rufus。


Amazon 介绍,通过点击 Amazon App 的相关图标,购物者可以调出一个文本聊天界面,并可以向 Rufus 提出一系列问题,例如识别某些产品的型号,询问某些商品的详细细节,比较不同的商品和获取订单更新。


除了网购方面的更新,Rufus 还能实现类似 ChatGPT 等聊天机器人的功能,例如生成名人传记、旅游建议或者写一篇短篇小说。(@爱范儿)


3、智谱 AI 开源视频理解模型 CogVLM2-Video,可回答时间相关问题


智谱 AI 宣布,训练了一种新的视频理解模型 CogVLM2-Video,并将其开源。


据介绍,当前大多数的视频理解模型使用帧平均和视频标记压缩方法,导致时间信息的丢失,无法准确回答与时间相关的问题。一些专注于时间问答数据集的模型过于局限于特定格式和适用领域,使得模型失去了更广泛的问答能力。


智谱 AI 提出了一种基于视觉模型的自动时间定位数据构建方法,生成了 3 万条与时间相关的视频问答数据。基于这个新数据集和现有的开放领域问答数据,引入了多帧视频图像和时间戳作为编码器输入,训练出 CogVLM2-Video 模型。


智谱 AI 表示,CogVLM2-Video 不仅在公共视频理解基准上达到了最新的性能,还在视频字幕生成和时间定位方面表现出色。(@IT 之家)


4、OpenAI 被举报限制员工报告 AI 风险


据报道,有人向美国证券交易委员会举报,OpenAI 非法禁止员工向监管机构报告其技术可能对人类构成的严重风险,举报人要求对 OpenAI 进行调查。


举报人表示,OpenAI 向其员工发出了过于严格的雇佣、遣散费和保密协议,协议表示「未豁免向美国证券交易委员会披露证券的违规行为」,并要求员工在向有关部门披露机密信息前获得公司的同意,这可能会导致向监管机构报告 OpenAI 潜在问题的员工受到处罚。


OpenAI 的发言人表示,他们的举报人政策保护员工进行受保护披露的权益,OpenAI 也认为针对 AI 技术的严格讨论是必不可少的,目前 OpenAI 已经对其离职流程进行了更改,取消保密协议中的不诋毁条款。


此前,OpenAI 曾曝出离职保密协议,员工在离职后不能向外界批评 OpenAI,否则将会受到处罚。(@爱范儿)


5、230 亿美元收购 Wiz!谷歌或迎来有史以来最大规模收购


谷歌正与网络安全初创公司 Wiz 就一笔可能达到 230 亿美元的收购案进行深入谈判,这将成为谷歌历史上最大规模的收购。Wiz 专注于提供云计算网络安全软件,由在 2015 年将前初创公司 Adallom 以 3.2 亿美元卖给微软的 Assaf Rappaport 创立。Wiz 的总部位于纽约,与多家顶级云计算公司合作,包括亚马逊、微软和谷歌。公司成立不久便实现了显著的年度经常性收入增长,并获得了硅谷顶尖风险投资公司的支持。


此次收购将加强谷歌在云计算领域的业务,尤其是在网络安全方面,这是其 Google Cloud 服务相对落后的领域。谷歌一直在积极扩展其云计算业务,去年收入增长了 26%,并首次实现营业利润。Wiz 的加入可能会带来先进技术和专业团队,帮助谷歌云在与 AWS 和 Azure 的竞争中迎头赶上。(@有新 Newin)

02 有态度的观点

1、复旦教授:AI 在新闻业只能扮演助理角色,难以完成调查性报道


近日,复旦大学新闻学院教授、博士生导师邓建国接受了中新社采访,谈到了 AI 技术和新闻学的关系。


邓建国表示,由于目前的虚拟 AI 缺乏实体,无法与客观世界进行直接互动,且其数据基础可能存在时效性限制,这在一定程度上制约了其在调查性新闻中的应用。


邓建国主张,将 AI 视为新闻报道工具箱中的可用但并非核心的工具之一:「它们俩(AI 和人)并不是很对立矛盾的,而是以人类为主,AI 为辅。AI 不是完全替代人类,AI 是一个聪明的助理,助理肯定不是代替记者做新闻的内核。AI 能够做的是帮我们做前期调查。」(@爱范儿)


写在最后:


我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。


对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。



素材来源官方媒体/网络新闻

用户头像

声网

关注

还未添加个人签名 2021-02-05 加入

声网(NASDAQ:API)成立于2014年。开发者可通过声网API,在应用内构建多种实时音视频互动场景。使用声网服务的包括小米、陌陌、斗鱼、哔哩哔哩、新东方、小红书、HTC VIVE 、Yalla等遍布全球的巨头、独角兽企业。

评论

发布
暂无评论
OpenAI 曝新项目「草莓」,提升 AI 推理能力;智谱 AI 开源视频理解模型丨 RTE 开发者日报_声网_InfoQ写作社区