0 人感兴趣 · 1 次引用
摘要:在调研多篇论文后,笔者发现预训练语音模型的预测方法基本可以分为以下3类:<1>用前文预测当前及后文(自回归)<2> 随机mask 一些帧并预测 <3> 用两侧上下文预测中间帧。
公众号【后台技术汇】
某某某技术有限责任公司架构师
行动就在当下。
🏆 InfoQ写作平台-签约作者 🏆
提供全面深入的云计算技术干货