ICASSP2021 M2VoC 挑战赛报告会:高分队伍及评审分享回顾(附 PPT)
2020 年,爱奇艺联合多家单位在 ICASSP2021 举办多说话人多风格音色克隆大赛——M2VoC,旨在提供一个通用的数据集以及一个公平的测试平台,对语音克隆任务进行研究。
大赛上线以来,全球共有 153 支队伍报名参赛。近日,根据已提交的方案,竞赛组委会审核并公布了 ICASSP2021 M2VoC 高分队伍排名。
3 月 10 日下午 2 点,我们邀请了本次四个赛道的四支高分排名 top2 队伍代表,一起齐聚“云”上,共同分享优秀参赛方案,回顾本次大赛内容。
此外,我们还有幸邀请到了组委会的四位评审老师:西北工业大学教授谢磊、清华大学副教授吴志勇、新加坡国立大学研究员田霄海、爱奇艺高级经理李海,进行了各自专业领域的精彩分享。
具体排名可点击“阅读原文”前往官网查看。
福利!点击右上角关注“爱奇艺技术产品团队”公众号,在主页对话框输入“m2voc”获取 4 位评审老师及获胜队伍代表的精彩分享 PPT!
爱奇艺高级经理李海:大赛回顾——153 支队伍参赛,共提交 26 个方案
爱奇艺高级经理李海首先在报告会开场进行了致辞,现场回顾了整个大赛的过程:全球共有 153 支队伍参赛,共提交 26 个参赛方案,并现场公布了 4 个赛道排名 top2 的队伍。
清华大学副教授吴志勇:面向智能语音交互的可控重音语音生成
嘉宾分享阶段,清华大学副教授吴志勇带来了题为《面向智能语音交互的可控重音语音生成》的演讲,分享了可控重音语音生成面临的挑战和基于 Forward Attention 的解决方案。
西北工业大学教授谢磊:拟人化语音合成技术新进展
接下来,西北工业大学的谢磊教授分享了拟人化语音合成技术的新进展。他回顾了语音合成技术的历史和挑战,并论述了强度可控的情感语音合成的技术难点,之后用美团真实客服数据建模案例,详细论述了低质数据建模的问题和解决方案。
田霄海, 新加坡国立大学研究员:Non-parallel Data Voice Conversion
最后一位组委会嘉宾是来自新加坡国立大学的研究员田霄海,他带来了题为《Non-parallel Data Voice Conversion》的演讲。
四个赛道 top2 高分队伍代表分享比赛方案
本次报告会上,四个赛道的高分排名队伍代表也齐聚报告会,为大家分享了他们的参赛方案和心得。
来自猿辅导 AI Lab 的研究员杨明祺分享了本次竞赛的参赛方案及心得,他所在的队伍提交的参赛方案在这次竞赛的“极少样本赛道 (开集)”中排名第一。
来自中科院自动化所的博士生汪涛所在队伍提交的方案在这次竞赛的少样本赛道 (开集)以及极少样本赛道 (闭集)中,都获得了 top2 排名的好成绩,他在报告会现场分享了题为《个性化语音合成风格迁移》的演讲,就比赛方案的系统框架的具体问题,比如说话人特征抽取、韵律时长控制、说话风格相关参数的自适应进行了详细论述。
第三位分享嘉宾是来自 vivo 的深圳研究员李鸿斌,他所在的队伍提交的方案在这次竞赛的少样本赛道 (闭集)和(开集)中,都获得了 top1 的排名。他带来了题为《The vivo TTS System For M2VOC 2021》的分享内容。
原文链接:ICASSP2021 M2VoC挑战赛报告会:高分队伍及评审分享回顾(附PPT)
评论