0 人感兴趣 · 1 次引用
摘要:在调研多篇论文后,笔者发现预训练语音模型的预测方法基本可以分为以下3类:<1>用前文预测当前及后文(自回归)<2> 随机mask 一些帧并预测 <3> 用两侧上下文预测中间帧。
还未添加个人签名
你若毁我天堂,我必戳你脊梁
No Silver Bullet
小助手微信号:Bytedance-data