写点什么

今晚 8 点直播:Alexa+ 让 6 亿终端瞬间获得 AI 能力!端侧智能都有哪些开发者机会?丨 RTE Dev Talk

作者:声网
  • 2025-02-27
    四川
  • 本文字数:904 字

    阅读完需:约 3 分钟


如果您正在开发具备语音对话、视觉识别等多模态能力的 AI Agent,或者对探索下一代人机交互方式充满热情,欢迎你预约并收看 27 日(周四)晚八点的 RTE Dev Talk!


昨晚 Amazon 发布了新一代 Alexa+,6 亿台智能设备终端瞬间获得了新一代 AI 的能力。


现场演示中,Alexa+ 可以根据用户的语音指令切换播放设备,让音乐、视频在不同房间流转;能与安防摄像头联动,自主调出与用户指令相关的视频片段,如「遛狗了吗」等;可以完成各种复杂指令,如根据家庭成员的习惯选择餐厅、预定餐厅,叫出租车去机场接客人,然后实时同步出租车信息等。


将 AI 融入端侧的公司远不止 Amazon,2025 年,三星、苹果等巨头将 GenAI 融入智能手机,而小米等智能音箱等家用设备、各家汽车智能座舱也将全面拥抱 GenAI—— 生成式 AI 开始真正地走进千家万户。


那么,GenAI 目前在端侧的技术发展到什么程度?又蕴藏着哪些值得开发者关注的机遇?


今晚(27 日周四) 8 点 ,RTE 开发者社区邀请到了来自 智谱、TEN 和声网 的多位实时多模态 AI 专家,一同探讨其中的挑战和机遇。


GenAI 已经从文本框交互迅速走向更自然、更拟人的多模态实时互动,期待和你一起探索和成长。


RTE Dev Talk 嘉宾和主持人

  • 贾世坤,智谱开放平台 BigModel 产品负责人。

  • Plutoless,实时语音 Agent 开源框架 Ten Framework 联合发起人。

  • 李忻玮(主持人),声网大语言模型实验室高级研究员,RTE 开发者社区布道师。


时间:2 月 27 日(周四) 20:00~21:15pm


地址:线上直播,欢迎提前预约,接收开播提醒


活动主办:RTE 开发者社区


社区伙伴支持:BigModel、TEN Framework、智谱




更多 Voice Agent 学习笔记:


多模态 AI 怎么玩?这里有 18 个脑洞


AI 重塑宗教体验,语音 Agent 能否成为突破点?


对话 TalktoApps 创始人:Voice AI 提高了我五倍的生产力,语音输入是人机交互的未来


2024,语音 AI 元年;2025,Voice Agent 即将爆发丨年度报告发布


对话谷歌 Project Astra 研究主管:打造通用 AI 助理,主动视频交互和全双工对话是未来重点


这家语音 AI 公司新融资 2700 万美元,并预测了 2025 年语音技术趋势


语音即入口:AI 语音交互如何重塑下一代智能应用


Gemini 2.0 来了,这些 Voice Agent 开发者早已开始探索……



用户头像

声网

关注

还未添加个人签名 2021-02-05 加入

声网(NASDAQ:API)成立于2014年。开发者可通过声网API,在应用内构建多种实时音视频互动场景。使用声网服务的包括小米、陌陌、斗鱼、哔哩哔哩、新东方、小红书、HTC VIVE 、Yalla等遍布全球的巨头、独角兽企业。

评论

发布
暂无评论
今晚 8 点直播:Alexa+ 让 6 亿终端瞬间获得 AI 能力!端侧智能都有哪些开发者机会?丨 RTE Dev Talk_声网_InfoQ写作社区