写点什么

语音数据集

0 人感兴趣 · 2 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/41/41569841dcd1f25f7497acd8fb44ff90.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

全双工分轨语音数据集:让 AI 实现无缝对话

全双工语音交互是一种允许设备在接收语音的同时并行处理和响应的技术。在传统半双工模式下,用户需要说完一句话后等待系统响应,交互效率低且体验不自然;而全双工交互支持边听边说、实时打断和无效语音拒识等。

https://static001.geekbang.org/infoq/3e/3edfbdcf0d83d6cb231bac610688ecaf.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

INTERSPEECH2025-MLC-SLM 挑战赛正式启动!语音 AI 的巅峰之战!

大语言模型(LLMs)作为语言理解与生成的基础技术,其应用已扩展至语音处理领域,如语音识别、对话系统等新兴方向。然而,构建基于LLMs的语音对话系统面临核心挑战:真实多语种对话数据的稀缺性。这类数据需涵盖自然停顿、说话者重叠等复杂交互场景,对提升A

语音数据集_语音数据集技术文章_InfoQ写作社区