写点什么

线上活动丨主动式语音 AI:全双工、对话轮次管理、VAD 技术交流会丨 RTE Meetup

作者:声网
  • 2025-06-24
    四川
  • 本文字数:1970 字

    阅读完需:约 6 分钟

线上活动丨主动式语音 AI:全双工、对话轮次管理、VAD 技术交流会丨RTE Meetup

一同探索语音驱动的下一代人机交互界面,voice agent builder 的小规模深度交流会。


当用户走在街上时,AI 可以主动提醒他们注意未察觉的来车或骑行者,甚至推荐附近不为人知的特色咖啡馆。

同样,如果系统检测到用户持续表达消极情绪,并沉溺于负面想法中,它可以主动介入,推荐一项专门定制的、有助于平静心绪的活动,而非被动等待用户寻求帮助。

……这种能力使 AI 超越了被动工具的定位,转变为值得信赖的伙伴和队友,能够无缝融入我们的日常生活。

——摘自 Viola 技术报告,Viola 是一款开源端到端全双工语音模型


新一期 RTE Meetup 来了!在本周六 28 日上午 10:00,线上举办!


魔鬼藏在细节里,而让 Voice Agent 像人一样自然对话的秘密,就藏在 AI 是否能主动沉默、打断或发起对话的细节里。


本期 meetup 我们邀请到 来自 Soul、Voila、TEN VAD 和 TEN Turn Detection 等项目的 开发者和专家。主题覆盖全双工、情境感知、轮次检测和管理、语音 VAD 等话题。


同时,来自 Voice Agent Camp 的创业者,也会分享这些技术在不同语音对话场景里的 具体需求、遇到的问题和解决方案。


我们也鼓励你 带上自己的项目或 idea 报名参与,并特别设置了快闪 demo 环节,邀请大家展示和交流。


这是一场轻松的开发者聚会,既可以交流技术也可以交朋友。期待你的报名!


本活动采用滚动录取的方式。现开放报名,感兴趣的朋友请通过下方表格申请,审核通过后会有小助手通过微信联系,并告知具体线上活动地址。



扫码前往社区网站报名活动


注:扫码后,建议在浏览器中打开页面注册报名(微信内置浏览器不支持 Google 登录)


Web 端也可直接访问网页报名:https://www.rtecommunity.dev/t/t_uXNEywfHWzqcrn

活动议程

6 月 28 日,10:00am~12:00pm,线上举办


主题分享(10:00~10:40)


The World of Real-time Interaction AI


史业民,实时互动 AI 创业者,前智源研究院研究员


Low-Latency Lightweight and High-Performance Streaming VAD


Rambo,TEN VAD Creator&Founder,TEN VAD 是一款低延迟,低功耗,高准确率语音活动检测 AI 模型


圆桌讨论(10:40~11:30)


圆桌话题:恭喜你,都会抢答了——主动式语音 AI 的技术和场景应用


对谈嘉宾和主持人:


  • 尹顺顺,Soul AI 技术负责人,正在开发端到端全双工语音通话,让 AI 自主决定说话时机

  • Rambo,TEN VAD Creator&Founder

  • 史业民,Viola 作者,实时互动 AI 创业者,前智源研究院研究员

  • Darcula(主持人),TEN Turn Detection 作者,TEN Turn Detection 是一款支持情境感知的智能对话轮次管理模型


此外,所有参与者都有发言机会,人人提问,人人发言~


Lightning Demo(11:30~12:00)


本次活动设置了快闪 demo 环节,邀请大家用 3 分钟时间展示自己的项目 demo。


注:本次活动是小型闭门活动,不接受直接空降。


关于 RTE Meetup


Real-Time&Real Connection,RTE Meetup 是 RTE 开发者社区发起的小型开发者聚会,邀请开发者分享技术和产品的同时,也重视每个与会者的深度参与和交流体验。


成为 RTE Meetup 参与者


Meetup 每个月都有,想 demo 分享或者交流的,都可以找我们报名。新一期均开放给往期参与者参与。


成为 RTE Meetup 组织者


欢迎联系我们申请成为 RTE Meetup 组织者,用你感兴趣的话题聚集同类人,分享新技术、新理念和新场景,一同探索实时互动新可能。有意者请联系我们(微信: creators2022)。


关于 Voice Agent Camp


你是否也曾反复揣摩《Her》中的语音交互,并梦想着复刻甚至超越那份智能与情感?在 Voice Agent Camp,遇见与你怀着同样热忱与梦想的伙伴。


Voice Agent Camp 正在寻找重塑人机实时互动体验的语音智能体初创团队!多模态 AI、语音合成、multi-agent 等技术日臻成熟,场景应用即将爆发。入选团队共同围绕「Voice First」理念,打造 AI 陪伴、个人助理、企业客服、AI 语音智能硬件等下一代产品。


「超音速计划 2025·Voice Agent Camp」 已于 6 月初开营,并将在 8 月底的 Demo Day 结营。通过 peer learning 朋辈互助的方式,分享交流语音技术和产品、开源策略和商业模式、全球化拓展和增长等话题。同时提供丰富的免费技术资源、投融资对接、展会展位和媒体访谈等创业加速支持。


❤️ 感谢以下伙伴的支持


陪跑音符


五源资本、线性资本、纪源资本、星连资本、真格基金、MiniMax、商汤科技、原力资本


Real-Time AI DevKit 丨实时多模态 AI 资源包


声网对话式 AI 引擎/RTC/RTM、讯飞创业投资孵化语音资源包、商汤 SenseNova V6 Omni、MiniMax、智谱、微软、PPIO 派欧云


社区支持


S 创、AI 启蒙小伙伴、TEN Framework


往期 RTE Meetup 回顾


级联vs端到端、全双工、轮次检测、方言语种、商业模式…语音 AI 开发者都在关心什么?丨RTE Meetup 回顾


对话式 AI 硬件开发者都关心什么?低延迟语音、视觉理解、Always-on、端侧智能、低功耗……丨 RTE Meetup 回顾


Gemini 2.0 来了,这些 Voice Agent 开发者早已开始探索……丨 RTE Meetup 回顾




用户头像

声网

关注

还未添加个人签名 2021-02-05 加入

声网(NASDAQ:API)成立于2014年。开发者可通过声网API,在应用内构建多种实时音视频互动场景。使用声网服务的包括小米、陌陌、斗鱼、哔哩哔哩、新东方、小红书、HTC VIVE 、Yalla等遍布全球的巨头、独角兽企业。

评论

发布
暂无评论
线上活动丨主动式语音 AI:全双工、对话轮次管理、VAD 技术交流会丨RTE Meetup_声网_InfoQ写作社区