AI 技术在音乐类产品中的应用场景

HIFIVE嗨翻屋

关注

发布于: 2020 年 11 月 20 日

自动标注、平滑过渡、音乐鉴权、AI 创作，当 AI 技术应用于音乐行业为人类的精神文化与娱乐生活带来便利和更多选择时，也是一件让人激动不已的事情。

随着深度学习算法的出现、大数据和 5G 技术的成熟，AI 人工智能已逐渐融入我们的生产生活中，在教育、医疗、政务办公、城市管理等多个方面发挥作用。

随着 AI 技术在音乐行业研究及应用的深入，音乐人工智能已经不新鲜，很多新的应用和产品已经惊艳亮相。

基于对于音乐技术及产品的了解，简单梳理一下目前 AI 技术在音乐类产品的各类应用场景。

一、自动标注

当平台曲库量达到⼀定量级时，如果再依赖传统的⼈为打标签模式就会花费⼤量成本且受到主观影响较⼤。⾳频⾃动标注相关技术就受到⼴泛关注，⾃动标注的作⽤不仅仅只是能替代⼈⼯标注以达到节省成本，同时可以客观评价⾳乐内容，因此还可以拓展到流媒体播放的⾳乐推荐⽅⾯。

例如：Spodify、KKBOX 都有利⽤深度学习做推荐，其中 KKBOX 采⽤⾳频⽂件、歌词以及⽤户相关标注和评论等数据作为输⼊从曲⻛、场景及情绪等多个维度来判断⾳乐是否满⾜推荐的条件。⼀般的⾃动标注功能也和 KKBOX 的推荐维度类似，从曲⻛、应⽤场景、器乐和情绪等维度来进⾏标注。

（示例：笔者所在公司旗下平台，关于音乐标注的标签）

对于⾃动标注，笔者也在⽹上听到过一些不太专业的吐槽，比如之前有看到说音频自动标注可能会出现将一首歌曲的情绪同时标注为“欢乐”和“悲伤”两种情绪。

在解释这⼀原因之前，可以简单普及⼀下机器学习中分类器、单标签多分类任务和多标签多分类任务。

简单来说，分类器就是利⽤已知的输⼊和输出数据来训练，然后该分类器就会对未知的输⼊数据进⾏分类或输出⼀个值。对于⼀个分类器模型，它预测的结果是 2 个或⼤于 2 个以上的（结果只有 1 个代表结果确定就不需要分类模型了）。如果可能的结果数为 2 称之为⼆分类任务⼤于 2 就是多分类任务；对于情绪可能有：⾼亢、欢快、安静、悲伤等多个结果，因此情绪分类是⼀个多分类任务。

如果认为情绪模型是⼀个单标签多分类任务，那么绝对是不可能出现”欢乐“和”悲伤”同时出现的情况。如果同时出现“欢乐”和“悲伤”，则只能存在于多标签多分类任务。

⽽“欢乐”和“悲伤”同时出现就⼀定是错误的吗？也不⼀定！

基于深度学习的⾳乐处理⽅式⼀般是分段处理，也就是将⼀⾸⾳乐划分为多个⽚段然后对每⼀个⽚段进⾏预测判断它可能的标签。如果⼀⾸歌曲情绪存在波动，比如一首歌曲的情绪从开始的“欢乐”转向了“悲伤”，那么这种情况也是完全可能出现，现实⽣活中很多歌曲的确是存在多个情绪甚⾄互斥的标签存在的情况。

二、平滑过渡

平滑过渡功能是近⼏年新出现的“炫酷”功能。

简单理解，就是当⼀⾸歌曲快要播放完毕时下⼀⾸歌曲可能⽆缝接⼊，这种歌曲间的平滑过渡，不会让听众觉得非常突兀。

这种功能的实现，也有依赖于基于深度学习的技术。

⼤致原理是将歌曲的末尾⽚段和可能平滑过渡的其他歌曲的头部⽚段作为训练样本。训练出来的模型可以预测当前输⼊⽚段可以过渡的下⼀个⽚段，然后当播放器播放⾄歌曲尾部⽚段的时候利⽤该模型得到可平滑过渡的下⼀⾸歌曲。

三、音乐鉴权

互联网上的音乐侵权一直存在，但音乐版权方要在互联网上维护自己的权益，往往比较困难。

因为互联网具有海量的内容，而且内容形式具有复合性，比如音乐内容仅仅作为视频的背景音乐，靠人工去发现和识别，难度太大。

在这方面，AI 技术的运用，已经能够实现实时监控视频、直播或⼴播节⽬中是否有存在歌曲的侵权情况。

其中的原理是，将版权⽅的曲库中歌曲提取出关键特征保存在集群数据库，然后提取待检测的⾳频特征，并通过⼤数据技术进⾏快速检索数据库中是否存在相似数据。

目前，拥有类似技术的公司，除了笔者所在公司外，ACRCloud 也较具有代表性。

四、AI 创作

当 AI 进入到音乐创作层面，在互联网行业也已有不少 AI 音乐创作工具，Amper Music、AIVA、Jukedeck、Ecrett Music、Melodrive、等 ORB Composer 等。

公司层面，索尼、谷歌、百度以及人工智能非营利组织 OpenAI 等均在 AI 作曲领域有所尝试。

2016 年，索尼公司使用一种名为“流机器”(Flow Machines)的软件，创作了一首披头士(Beatles)风格的旋律，然后作曲家伯努瓦卡雷(Benoit Carre)将其制作成一首完整的流行歌曲《Daddy ‘s Car》(爸爸的车)。

2018 年，微软宣布第四代小冰加入到虚拟歌手市场竞争当中，并“演唱”了一首《隐形的翅膀》。

AIVA 科技开发的 AI 作曲家“Aiva”创作摇滚乐曲《On the Edge》并与歌手 Taryn Southern 合作创作流行乐曲《Love Sick》；

在国内，笔者所在公司的相关产品在 AI 智能创作上，能够实现识曲（识别音乐作品中的音乐元素）、作词、作曲等功能，并已实现了商业化授权和应用。

在具体的 AI 智能音乐创作层面，AI 作曲工具可辅助创意生成。

如英国音乐制作人 Alexa Da Kid 利用 IBM 沃森认知计算平台中的机器学习音乐生成算法创作出单曲《Not Easy》、歌手 Taryn Southern 与 AI 作曲公司 Amper Music 开发的工具共同创作出《Break Free》与 Aiva 合作创作流行乐曲《Love Sick》。这些作品都曾一度成为热播曲目。

随着越来越多 AI 音乐创作工具的诞生，充当音乐人的辅助，协助创作出更多优质的作品，AI 作曲家的音乐创作能力也在逐渐得到认可。

五、结语

当 AI 遇上音乐，音乐被注入了越加鲜活的生命力，智能化大潮来袭，AI+音乐，未来值得期待！

发布于: 2020 年 11 月 20 日阅读数: 369

原文链接:【http://xie.infoq.cn/article/5a2022815816fc40d04931f68】。

HIFIVE嗨翻屋

关注

HIFVIE，专业的音乐版权云平台！ 2020.11.02 加入

关于音乐产品的技术及产品运营交流，欢迎来群768968340交流~

发布

暂无评论

创作场景

AI 技术在音乐类产品中的应用场景

一、自动标注

二、平滑过渡

三、音乐鉴权

四、AI 创作

五、结语

HIFIVE嗨翻屋

评论