写点什么

RTC Dev Meetup

0 人感兴趣 · 5 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/7c/7ce8af5ca64237c1971040a1ea3065ea.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

如何解决 Iterative 半监督训练 在 ASR 训练中难以落地的问题丨 RTC Dev Meetup

用户头像
声网
2022-06-23

通用 ASR 的字准确率虽然已经非常高,但是在面向具体的场景(游戏场景、私聊场景、群聊场景、主播场景)时,还是存在场景不匹配的问题,因为通用的 ASR 在这些领域中的应用相对比较困难,主要存在以下问题。

https://static001.geekbang.org/infoq/34/3424873ee6fa1de7c7243f8e5e180710.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Any to Any 实时变声的实现与落地丨 RTC Dev Meetup

用户头像
声网
2022-06-20

本文基于声网音频体验算法专家冯建元在活动中分享内容整理。

https://static001.geekbang.org/infoq/c0/c07d1af21d910cfe8203fbfc00f7964d.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

FastCorrect:语音识别快速纠错模型丨 RTC Dev Meetup

用户头像
声网
2022-06-18

本文将介绍一种低延迟、高精度的纠错模型 FastCorrect,通过利用编辑对齐以及多个候选结果,在取得 10% 的词错误率下降的同时,将模型加速 6-9 倍,相关研究论文已被 NeurIPS 2021 和 EMNLP 2021 收录。

https://static001.geekbang.org/infoq/87/877b3100483d96968e7fc75442fb0a34.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

依图在实时音视频中语音处理的挑战丨 RTC Dev Meetup

用户头像
声网
2022-06-17

依图是一家做 AI 基础设施和 AI 解决方案的提供商,拥有的 AI 技术能力相对比较广泛,包括图片、视频、语音、自然语言处理等,除具备 AI 算法能力外,也能提供 AI 算力。

https://static001.geekbang.org/infoq/82/82b30ea7a08f97df69a97bf0aac4a27e.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

黄硕:百度飞桨文心大模型在语音文本审核中的应用

用户头像
声网
2022-06-13

实时互动作为下一代基础技术能力,正在支撑并推进着人、物及空间之间创新的沟通和交互方式。

RTC Dev Meetup_RTC Dev Meetup技术文章_InfoQ写作社区