写点什么

百度发布 AI 眼镜:全球首搭中文大模型,支持边走边问;OpenAI 联合创始人宣布回归,主抓重大技术创新丨 RTE 开发者日报

作者:声网
  • 2024-11-13
    四川
  • 本文字数:3598 字

    阅读完需:约 12 分钟

百度发布 AI 眼镜:全球首搭中文大模型,支持边走边问;OpenAI 联合创始人宣布回归,主抓重大技术创新丨 RTE 开发者日报


开发者朋友们大家好:


这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。


本期编辑:@SSN,@鲍勃

01 有话题的新闻

1、百度发布小度 AI 眼镜:全球首搭中文大模型,支持边走边问


在 2024 百度世界大会上,百度正式发布了小度 AI 眼镜,称该产品为「全球首款搭载中文大模型的原生 AI 眼镜」。据百度官方介绍,小度 AI 眼镜具备第一视角拍摄、边走边问、卡路里识别、识物百科、视听翻译、智能备忘等功能。


具体配置方面,该眼镜重量 45 克,搭载 16MP 超广角摄像头,支持 AI 防抖算法;标称待机续航 56 小时,支持超 5 小时连续聆听,可 30 分钟充满电;搭载四麦克风阵列识别声音,采用开放式防漏音扬声器设计。小度 AI 眼镜将于明年上半年正式上市。(@极客公园)


2、Rokid Glasses 推出新预告片,引入光波导,推出实时翻译+随身抓拍+智能导航等功能


Rokid Glasses 将于 11 月 18 日在 Rokid Jungle 2024 合作伙伴暨新品发布会上发布。(@Rokid)


3、AI+AR 迎来「百镜大战」,智能眼镜距离「下一代计算平台」还有多远?丨播客《编码人声》


随着出货量突破 100 万台的 Ray-Ban Meta 智能眼镜的成功,加上愈加成熟的语音 AI 和视觉理解能力的加持,国内外各大厂和创业公司纷纷进场智能眼镜,「百镜大战」一触即发。


本期节目,嘉宾将从 AR 眼镜从业者、AI Agent 构建者和空间计算开发者的不同视角,分享实践中看到的新机会。


有嘉宾认为,软硬结合的垂类 AR 眼镜解决的是手机无法满足的场景,解决问题就能让用户用钱投票。随着上下游生态链的成熟,现在正是轻型 AR 眼镜创业的黄金时代。


智能眼镜还推动了开发者对下一代人机交互界面 LUI(语言用户界面)的探索,端侧模型能力和与低延迟的实时 AI 互动也会变得更加重要。


智能眼镜距离成为下一代计算平台还有多远?云端结合的计算的未来会是什么样子?开发者该如何面对「每天醒来就是一个新弯道」的世界?


本期嘉宾各抒己见,但至少达成了一个共识:一款的好的智能眼镜,首先是一副好的眼镜。


👂收听入口:



4、阿里通义千问开源 Qwen2.5-Coder 全系列模型,号称代码能力追平 GPT-4o



阿里通义千问于昨日(11 月 12 日)开源 Qwen2.5-Coder 全系列模型,其中 Qwen2.5-Coder-32B-Instruct 成为目前 SOTA 的开源代码模型,官方号称代码能力追平 GPT-4o。


Qwen2.5-Coder-32B-Instruct 作为本次开源的旗舰模型,在多个流行的代码生成基准(如 EvalPlus、LiveCodeBench、BigCodeBench)上都取得了开源模型中的最佳表现,官方称达到和 GPT-4o 有竞争力的表现。


阿里通义千问此前开源了 1.5B、7B 两个尺寸,本次开源带来 0.5B、3B、14B、32B 四个尺寸,覆盖了主流的六个模型尺寸。


Qwen2.5-Coder 0.5B / 1.5B / 7B / 14B / 32B 模型均采用 Apache 2.0 许可证,3B 模型使用 Research Only 许可。(@IT 之家)


5、OpenAI 联合创始人布罗克曼宣布回归,主抓重大技术创新


今天凌晨 5 点,OpenAI 联合创始人兼总裁 Greg Brockman 宣布结束数月长假,重回 OpenAI。


而在最近 OpenAI 受到了严重的离职风波影响的背景下,Greg 的回归多少有些受命于危难之际的意思。


Greg 表示,他一直在与首席执行官 Sam Altman 合作商议,为自己设立一个新职位,专注于重大技术创新和挑战。网友对 Greg 的回归相当期待,说 OpenAI 的技术竞争力基石又回来了。


Greg Brockman 是 OpenAI 最初的联合创始人之一,他在 OpenAI 的发展中扮演了至关重要的角色,与 Sam Altman、Ilya Sutskever、Mira Murati 合称「OpenAI 四大天王」。


Greg 曾在互联网支付平台 Stripe 并担任 CTO,帮助团队实现了从 4 人到 250 人的增长。2015 年,Greg 离开 Stripe,与 Sam Altman、马斯克等人共同创立了 OpenAI,旨在推动 AI 技术的发展。


Greg 作为 OpenAI 重要技术人员,他与首席科学家 Ilya Sutskever 主导了 OpenAI 的技术创新,参与开发了 GPT-1、GPT-2、GPT-3、GPT-4、GPT-4o 等众多知名项目。Greg 曾被《时代》周刊评选为全球 100 AI 领导者之一。(@AIGC 开放社区)


6、百度世界 2024 大会重磅发布文心 iRAG 和无代码工具 「秒哒」



百度世界 2024 大会上,百度创始人李彦宏发表了题为《应用来了》的演讲,发布了两项新技术 —— 检索增强的文生图技术(iRAG)和无代码工具 「秒哒」。李彦宏表示,过去 24 个月,AI 行业发生了显著变化,尤其是大模型在生成内容时已大幅减少幻觉现象。


文心 iRAG 技术旨在解决大模型在图像生成中存在的幻觉问题,提升 AI 生成内容的实用性。与传统生成模型不同,文心 iRAG 通过结合百度海量图片资源,能够生成更加真实的图像。


这一技术特别适用于品牌宣传、影视制作和其他创意产业,极大地降低了创作成本。李彦宏在演讲中展示了用文心 iRAG 生成的图像,强调了其无幻觉、超真实的效果。


除了文心 iRAG,李彦宏还介绍了无代码工具 「秒哒」。


这一工具使用户无需编写任何代码,便能轻松实现各种应用设想。它具备无代码编程、多智能体协作及多工具调用等特点,用户只需通过自然语言描述需求,就能完成复杂的系统搭建。


李彦宏现场演示了如何利用 「秒哒」 快速构建一个活动报名系统,展示了多智能体协作的能力。


李彦宏指出,智能体将是未来 AI 应用的主要形态,能够大幅提升企业的营销和服务效率。目前,文心智能体平台已经吸引了大量企业和开发者参与,展现出强大的市场潜力。(@AIbase 基地)


7、谷歌 DeepMind 开源 AlphaFold3:诺奖化学模型,助力药物研发!


谷歌 DeepMind 近日意外发布了 AlphaFold3 的源代码和模型权重,标志着一个可能加速科学发现和药物开发的重大进展。这一消息传出仅几周后,系统的创造者 Demis Hassabis 和 John Jumper 便获得了 2024 年诺贝尔化学奖,以表彰他们在蛋白质结构预测方面的贡献。


与前一版本 AlphaFold2 相比,AlphaFold3 的技术能力有了质的飞跃。AlphaFold2 只能预测蛋白质的结构,而 AlphaFold3 则可以建模蛋白质、DNA、RNA 及小分子之间复杂的相互作用,这是生命的基本过程。


这一进展至关重要,因为理解这些分子相互作用是现代药物发现和疾病治疗的核心。传统的研究方法往往需要数月的实验室工作和数百万的研究资金,并且并不保证成功。


AlphaFold3 的发布让其从一个专用工具转变为研究分子生物学的综合解决方案。这一更广泛的能力为理解细胞过程开辟了新路径,包括基因调控和药物代谢等,达到以前无法实现的规模。


尽管 AlphaFold3 的发布为科学研究提供了新的动力,但其时机也突显出现代科学研究中的一个重要矛盾。尽管在今年 5 月 AlphaFold3 首次亮相时,DeepMind 选择暂时不发布代码,并仅通过网络界面提供有限访问,这一决定引发了研究者们的广泛批评。此次开放源码的发布试图在科学与商业利益之间找到一个平衡点。虽然代码在创意共享许可证下可以自由获取,但使用关键模型权重仍需获得谷歌的明确许可,这一做法引发了一些研究者的质疑。


尽管如此,AlphaFold3 在药物发现和开发方面的影响仍然是巨大的。尽管商业限制目前限制了其在制药领域的应用,但这次发布所带来的学术研究将提升我们对疾病机制和药物相互作用的理解。系统在预测抗体 - 抗原相互作用方面的准确性提高,有望加速治疗性抗体的开发,这是制药研究中越来越重要的领域。(@AIbase 基地)

02 有态度的观点

1、微软 AI CEO 苏莱曼清华大学演讲:AI 的成功最终取决于实际生活中的应用,始终与真实生活息息相关


近日,微软 AI CEO 穆斯塔法·苏莱曼(Mustafa Suleyman)在清华大学的演讲中,分享了他对人工智能未来发展的深刻洞见。


苏莱曼提出了三个对于 AI 的核心观点:


1)发展人工智能的目标应当是服务人类并对社会产生积极影响,而不仅仅关注技术性能的比较;2)人工智能应被用于解决全球面临的最紧迫社会挑战,如气候、环境问题等,将 AI 的能力扩展到更广阔的应用领域;3)负责任地发展人工智能的重要性。


在苏莱曼的新书《浪潮将至:技术、权力与未来的冲击》中,他围绕技术浪潮所带来的风险,讨论了一系列发人深省的问题。他指出:「人工智能既极具价值,又充满危险,因为它正是人性最好与最坏的延伸。」


在人工智能、生物技术和量子计算等领域的推动下,我们正站在人类历史的一个关键节点上,这个节点将塑造我们未来的走向。人工智能已经渗透到我们生活的方方面面,预示着一切都将发生变革。(@有新 Newin)


写在最后:


我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。


对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。



用户头像

声网

关注

还未添加个人签名 2021-02-05 加入

声网(NASDAQ:API)成立于2014年。开发者可通过声网API,在应用内构建多种实时音视频互动场景。使用声网服务的包括小米、陌陌、斗鱼、哔哩哔哩、新东方、小红书、HTC VIVE 、Yalla等遍布全球的巨头、独角兽企业。

评论

发布
暂无评论
百度发布 AI 眼镜:全球首搭中文大模型,支持边走边问;OpenAI 联合创始人宣布回归,主抓重大技术创新丨 RTE 开发者日报_声网_InfoQ写作社区