写点什么

ASR

0 人感兴趣 · 6 次引用

  • 最新
  • 推荐

初探语音识别 ASR 算法

摘要:语音转写文字ASR技术的基本概念与数学原理简介。

解析 WeNet 云端推理部署代码

摘要:WeNet是一款开源端到端ASR工具包,它与ESPnet等开源语音项目相比,最大的优势在于提供了从训练到部署的一整套工具链,使ASR服务的工业落地更加简单。

多语言 ASR?没有什么听不懂,15 种语言我全都要

​​​​摘要:在这篇博文中,我们介绍来自Google的一篇论文《Scaling End-to-End Modelsfor Large-Scale Multilingual ASR》,来看看如何构建一个能够识别15种语言的多语ASR系统。

基于 RNN 和 CTC 的语音识别模型,探索语境偏移解决之道

​​​​​​​​摘要:在本文介绍的工作中,我们展示了一个基于RNN和CTC的语音识别模型,在这个模型中,基于WFST的解码能够有效地融合词典和语言模型。

从 Encoder-Decoder 模型入手,探索语境偏移解决之道

​​摘要:在本文中,我们展示了CLAS,一个全神经网络组成,端到端的上下文ASR模型,通过映射所有的上下文短语,来融合上下文信息。在实验评估中,我们发现提出的CLAS模型超过了标准的shallow fusion偏置方法。

探索专有领域的端到端 ASR 解决之道

​​​​​​​​​​摘要:本文从《Shallow-Fusion End-to-End Contextual Biasing》入手,探索解决专有领域的端到端ASR。

ASR_ASR技术文章_InfoQ写作社区