0 人感兴趣 · 6 次引用
摘要:语音转写文字ASR技术的基本概念与数学原理简介。
摘要:WeNet是一款开源端到端ASR工具包,它与ESPnet等开源语音项目相比,最大的优势在于提供了从训练到部署的一整套工具链,使ASR服务的工业落地更加简单。
摘要:在这篇博文中,我们介绍来自Google的一篇论文《Scaling End-to-End Modelsfor Large-Scale Multilingual ASR》,来看看如何构建一个能够识别15种语言的多语ASR系统。
摘要:在本文介绍的工作中,我们展示了一个基于RNN和CTC的语音识别模型,在这个模型中,基于WFST的解码能够有效地融合词典和语言模型。
摘要:在本文中,我们展示了CLAS,一个全神经网络组成,端到端的上下文ASR模型,通过映射所有的上下文短语,来融合上下文信息。在实验评估中,我们发现提出的CLAS模型超过了标准的shallow fusion偏置方法。
摘要:本文从《Shallow-Fusion End-to-End Contextual Biasing》入手,探索解决专有领域的端到端ASR。
让技术不再枯燥,让每一位技术人爱上技术
人生享受编程,编程造就人生!
大丈夫生于天地之间,岂能郁郁久居人之下
靠敲代码在北京买房的程序员
百度官方技术账号