0 人感兴趣 · 1 次引用
摘要:在调研多篇论文后,笔者发现预训练语音模型的预测方法基本可以分为以下3类:<1>用前文预测当前及后文(自回归)<2> 随机mask 一些帧并预测 <3> 用两侧上下文预测中间帧。
让技术不再枯燥,让每一位技术人爱上技术
人生享受编程,编程造就人生!
大丈夫生于天地之间,岂能郁郁久居人之下
靠敲代码在北京买房的程序员
百度官方技术账号