写点什么

音乐弹幕?智能修音?回森 K 歌社区的创新玩法?(上)

作者:快手技术
  • 2024-05-21
    北京
  • 本文字数:6898 字

    阅读完需:约 23 分钟

回森是快手精心孵化并运营的 APP,完美融合了 K 歌与社交两大元素。它采用 K 歌+音乐视频的模式,为用户提供了一个展示才华、共创音乐作品的平台。上线三年以来,在 K 歌领域崭露头角,吸引了众多用户。然而回森的成长之路也历经了诸多挑战与困境,但正是这些经历,使其积累了丰富的经验。本系列文章将带您回顾回森的成长历程、踩过的坑以及创新玩法……

先通过一段视频带您了解回森这款音乐 K 歌社区产品。

本文主要为大家分享回森在离线 K 歌社区中的创新玩法,共分为上中下三篇:

  • 本篇是上篇,首先会为大家介绍 K 歌社区在面临短视频平台冲击背景下的困境与回森的思考,然后会介绍回森离线 K 歌场景下创新玩法(音乐弹幕与重塑 K 歌流程)的背后逻辑与推演过程。

  • 在中篇,会为大家详细拆解回森最有特色的功能-音乐弹幕的技术架构与核心实现,并在文章中分享两个有趣的小故事,让大家感受回森与用户之间相互信任、一起成长的社区氛围。

  • 在下篇,会为大家详解回森在本地 K 歌流程中的创新玩法,回森在入局时面对众多成熟(已上线近 10 年)的竞品,产品与技术团队是如何挖掘出未被满足的用户需求、然后制定方案、实施落地并最终取得业务收益的。在下篇的最后,我也会站在技术人的角度和大家再聊一下自己对 K 歌社区的理解与感悟。

接下来进入我们第一部分,先为大家介绍一下 K 歌社区这一赛道的困境,然后为大家讲解一下回森这个产品是如何脱颖而出的。


一、K 歌社区困境与回森的思考

01 K 歌社区赛道介绍

先来看一下国内 K 歌社区赛道的规模,几个数据统计如下:

  • 在线 K 歌用户规模达 5.1 亿(年度使用过 K 歌 App 的用户)

  • 在线 K 歌 MAU 2.2 亿

  • K 歌社区第一名的产品 MAU 1.5 亿


从以上数据可以看出,整个赛道的盘子还是蛮大的。接下来再看下这个赛道上的竞品情况:



从上图可以清晰地看到,第一行罗列我们耳熟能详的 K 歌社区产品,如全民、唱吧、唱鸭等,而第二行是一些专注于在线 K 歌的应用,如音遇、撕歌、TT 语音、Soul 等。在海外市场,也有像 Wesing(全民)、Starmaker、Pokekara 以及 Sing(Smule)等应用在这一领域积极布局。然而,在不完全列举的情况下,我们仍然能够感受到这一领域的竞争之激烈。坦白说,近年来 K 歌赛道或 K 歌 App 正面临着来自短视频平台的巨大冲击,它们普遍陷入了不小的困境。接下来,我将带领大家一同探讨这一困境的根源和可能的影响。


02 K 歌社区赛道的困境

在社区型产品中,通常存在几个关键角色,一是生产者、二是消费者,两者之间通过生产者创造的内容紧密相连。在 K 歌社区中,这一模式同样适用,我们把用户分为两类,一类是消费者,他们欣赏和享受 K 歌作品带来的音乐体验;另一类是 K 歌作品的生产者,他们通过创作和分享自己的音乐作品,为社区注入活力和创意。为了更好地理解这两个角色之间的互动关系,我们特别绘制了两个系统循环图,如图所示:



先看左边的消费者循环图,主要揭示了消费者在 K 歌社区中的行为模式,他们首先消费音乐作品,享受音乐带来的内容刺激,并通过转发、点赞、评论等互动方式与其他用户建立联系,进而构建社交关系,这些行为的结果可能是情感上的愉悦感,或者是来自社交互动的满足感和归属感,这些正面的反馈进一步激发他们的兴趣,促使他们继续消费更多的音乐作品,从而形成了一个良性的循环:消费->结果->反馈->再消费。


而右侧的 K 歌生产者循环图,用户在 K 歌生产的过程中会释放情绪,随后上传作品并期待反馈。这些作品可能获得平台的曝光,也可能引发消费者的互动和关注。这些积极的结果不仅为生产者带来了自我认可和解压,还让他们收获了粉丝的关注和认可。随着粉丝数量的增加,生产者还可能获得更多变现的机会,从而进一步激发了他们的创作热情。因此,生产者的循环图表现为:生产->结果->反馈->再生产。


两个系统循环图之间相互依赖、相辅相成,彼此间形成了正反馈的良性循环。然而,在 2018 年以前,这种模式能够成功运作(据了解:K 歌社区 Top1 的产品在 18 年暑假日活规模达到过 7500W 以上),但与近年来短视频平台的社区运营模式相比,传统的 UGC(用户生成内容)K 歌社区暴露出了一些明显的缺点:

  • 作品种类单一,传统 K 歌社区主要围绕 UGC 的音乐内容展开,在品类丰富程度上远不及短视频平台;

  • 视觉消费性差,UGC 的音乐作品的画面大多数是歌词加背景图片,缺乏视觉冲击力;

  • 传播性与可反馈性较低,UGC 的音乐作品是普通人基于商业化伴奏演唱混音的作品,由于自身消费性与可围观性交叉口,导致传播性与反馈性也都远不及短视频平台;


综上所述,两个系统循环图之间的正反馈逐渐转变为负反馈,进一步导致了消费者减少消费意愿,流量供给随之减少,进而使得生产者难以获得他人的认可,创作动力也随之减弱。这种负向循环最终造成了“产消脱节”的困境,使得 UGC(用户生成内容)的 K 歌社区在短视频平台的冲击下显得力不从心。然而,面临这个困境,回森团队经过了一段时间的探索,逐渐找到了自己的破局之道。接下来,我们将一起探讨回森是如何通过创新策略和技术手段,成功打破这一负向循环,重新激发社区活力的。


03 回森的思考

作为快手精心孵化的应用,回森充分利用了快手强大的底层技术能力和资源,为其发展奠定了坚实基础。在快手高效、稳健的中后台支持下,回森团队得以全身心投入业务创新,实现了业界领先的迭代速度,不断探索并优化用户体验。回森项目立项之初,便致力于打造一个离线 K 歌社区。首先,我们构建了 K 歌生产、作品上传、作品分发的基座,在基座之上通过回森的“支点” - 音乐弹幕功能将用户连接起来,然后辅以社交功能(IM、天团、互动消息等),共同构建起了一个功能丰富的 K 歌社区。


随着社区的发展,我们进一步推出了实时互动功能,包括歌房、直播、对唱等,为用户带来更为真实、刺激的互动体验。歌房不仅满足了用户从荷尔蒙和竞技性角度出发的需求,也为商业化变现提供了广阔空间。最终,在实时互动社区的基础上,我们构建了完善的商业生态,让 KOL 和唱歌爱好者在平台上实现价值变现。


通过上述的阐述,我们得以一窥回森的核心理念与创新策略。本文聚焦于离线 K 歌社区的创新玩法,对于离线 K 歌社区,我们将重点关注两个创新点:音乐弹幕与 K 歌流程重塑。由于文章篇幅较长,将会分为三篇进行详述。本篇作为开篇,将提纲挈领地介绍音乐弹幕与 K 歌流程重塑的核心理念。接下来,让我们一同领略回森最具特色的功能——音乐弹幕。它将如何为离线 K 歌社区注入新的活力与魅力?


二、K 歌社区的玩法创新-音乐弹幕

从上述视频上可以看出,音乐弹幕允许用户将自己的录音发送到视频作品上,并且这些录音能够同步播放,形成令人耳目一新的合唱效果,这种产品形态不仅极大地提升了平台的互动性,还为用户带来了全新的参与体验。回顾前文对 K 歌社区困境分析,我们不难发现,传统的 K 歌作品在视觉消费性和互动反馈性方面存在明显的不足。用户之间的文字评论也往往局限于简单的几个词汇,如“好听”、“来啦”、“甜妹”等,缺乏深度和多样性,难以基于作品内容产生有意义的互动。


消费者通过发送音乐弹幕的行为表达了“对作品的喜欢”和“与作品作者有同好”,作品作者接收到这些弹幕时,可以选择点赞、评论,最重要的是可以“Pick”,Pick 的意思就是让这个弹幕成为作品的一部分,形成了共创作品。音乐弹幕这一功能,不仅是一个简单的互动工具,更是一个连接弹幕作者与作品作者的桥梁。通过共创作品,两者之间的关系得以深化,也更容易建立起持久的联系。其他用户看到这样的弹幕作品还会感觉到回森的社区氛围:回森是一个热闹,有人味的地方。总结来说,音乐弹幕在 K 歌社区中扮演着举足轻重的角色。如下图所示:



我们会说音乐弹幕是撬动音乐社区这一地球的“支点”,在回森社区里面,音乐弹幕的数量大约是文字评论数量的十倍。这其实是很恐怖的一个现象,毕竟音乐弹幕是要发声的,对用户、对环境要求都更高。弹幕作者也是社区中的生产者,最终还比文字评论高一个数量级,说明这项功能非常好的解决了用户的需求,是非常棒的一个产品形态,它让消费者的循环图和生产者的循环图真正的运转起来。具体音乐弹幕的详细讲解放在第二篇(中篇),在此之前,让我们继续探索回森是如何通过重塑 K 歌流程,实现弯道超车的。这一过程不仅展示了我们的创新力和执行力,更为整个音乐社区带来了前所未有的变革与活力。


三、本地 K 歌的玩法创新-重塑 K 歌流程


一般来讲所有 K 歌社区的本地 K 歌流程分为准备演唱、演唱录制、编辑混音、作品发布四个核心阶段,这里面每个阶段回森都做了深入的功能开发,一部分的确是为了与竞品保持竞争力而进行的必要优化,而另外一部分是基于我们对用户的洞察、对 K 歌赛道的理解、对外部环境的变化而做出的创新功能,是我们真正有特色的创新点。正式这些创新点,使得我们能够重塑整个 K 歌流程,为用户带来前所未有的体验。在具体讲解如何重塑 K 歌流程之前,先跟大家同步两个背景,一个是跟大家介绍一下一首传统歌曲的制作过程,第二个是跟大家同步一下手机 K 歌用户的现状。


3.1 一首歌的制作过程



上图呈现了一首歌曲的传统制作过程,下面简单介绍其核心环节:

第一步是作词作曲,这部分的作曲一般指的是主旋律,作词就是最终歌曲中看到、听到的歌词,其实这一步对应到我们 K 歌系统曲库物料中的 MIDI 与歌词。


第二步是编曲,编曲的职责是给这个主旋律去配一些和弦以及和声,丰富一点的可以使用不同乐器进行细致的编排。一般这一步结束之后就可以成为一个商业化的伴奏了,也就是基于这个伴奏可以进行 K 歌了。


第三步是进棚录制,也就是找歌手到录音棚里面进行人声(Vocal)部分的录制,录制的时候一般也会录制多轨,防止后续调音师修剪过程中没有足够可用的音频物料。


第四步是混音,这一步的工作主角是调音师,调音师一般对多轨人声(Vocal)进行一些节奏、音高的调整,然后根据歌手特点使用混音效果器(Compressor、EQ、Reverb 等)加上一些音效,最后与伴奏混成一个音频,一般称这个音频就是我们最终的作品了,但实际上在真正发布之前还会经过一次母带处理的步骤。


最后一步是母带处理,母带处理的职责是将歌曲的响度调整到与专辑中其他歌曲差不多,用到的最重要的效果器就是 Multiband Compressor。由于多个乐器在混音阶段已经占据了不同的频率范围,而母带处理允许在一定程度上对独立的乐器以及频段元素进行更好的操控与调整。


歌曲的传统制作过程涉及多个核心环节,绝大部分的 K 歌 App 主要聚焦于录制、编辑/混音这两个阶段。在录制阶段,通过精心设计的产品与交互,让用户听着伴奏、看着歌词进行录音。而在编辑/混音阶段,这些 App 则致力于对人声进行音效处理和混音,最终生成一个优质的视频或音频作品。然而,市场上也有一些产品如快手的小森唱和 suno.ai,它们更多地关注于作词、作曲与编曲的创意过程。与此同时,回森在母带处理方面也做了一些微创新,在回森的编辑页面中,用户可以发现一个独特的母带音效功能,这一功能不仅为用户提供了更多的创作可能性,还使得作品在音质上能够达到更高级别的标准。


MIDI 是一个协议标准,里面可以包含很多轨,一般 K 歌 App 中指填充 MIDI 的主旋律轨,用于 K 歌打分、修音等功能中,所以我们日常提到的 MIDI,其实大部分情况下只包含主旋律,回森也只有在弹唱模版里面会使用到 MIDI 中的和弦轨道。


3.2 手机 K 歌用户现状


第二个背景,我想与大家同步一下手机 K 歌用户的现状。作为在手机 K 歌领域资深的一员,我见证了这个领域自 2012 年以来的巨大变化。然而,遗憾的是,从各项关键指标来看,这些变化并非全然向好。具体的现状,我们可以通过下面的图表来详细了解。



先看左边第一张图,它详细展示了 K 歌中用户佩戴耳机的比例

  • 从图中可以看到佩戴有线耳机唱歌的用户只有 10%,这个比例比十年以前下降了得 4~5 倍;

  • 佩戴蓝牙耳机的比例竟然上升到了 5%,甚至更高的比例;

  • 剩下的百分之八十五都是不佩戴耳机唱歌的用户,这一比例比十年前上升了很大,这说明我们若想高质量的采集到人声更难了;

除此之外,我们观察到安卓用户的占比也在不断增加,虽然安卓设备在普及率上占据优势,但在媒体处理方面,如耳返和低延时等功能,相较于 iOS 设备仍存在一定的差距。这进一步加剧了 K 歌应用整体硬件设施质量的下滑。


看中间的图,代表了用户的演唱得分分布,回森在设计评分机制时,充分考虑到了激励用户积极演唱的初衷,因此评分体系相对宽松。这里面的 A、B、C 等级所代表的演唱质量,或许在某些方面还存在提升的空间,如音准或节奏上的不足。然而,若从音乐消费的悦耳性角度出发,即便是被评委 S 等级的作品中,也有相当一部分可能并不完全符合高标准。这意味着,从纯粹的听觉享受来看,大部分用户的演唱技巧仍有待提高


最右侧的图表,可以清晰地洞察用户作品中的媒体类型分布情况,可以看到绝大多数人使用的是单图,并且这些单图还是由算法根据歌词智能推荐的,值得注意的是,仅有大约 2%的用户选择视频拍摄作为他们的创作形式。这部分也是说明越来越多的年轻用户倾向于选择不露脸、极简风格的模板或单图来表达自己的情感和创意。


基于我们对歌曲制作链路的深入理解,面对日益严峻的硬件环境和用户特点带来的挑战,我们必须思考如何在本地 K 歌中寻求创新。答案就在于全链路地重塑 K 歌流程,简图如下:


3.3 重塑 K 歌流程

那我们又应该如何去重塑 K 歌流程呢?答案是要从整个流程里面去寻找创新突破的点,可以看我们详细的 K 歌流程大图:


上述大图详细勾勒出了我们所付出的核心努力,其中既包含为了与竞品齐步并进所展开的基础工作,也展示了我们独特的创新之处。接下来,我将重点介绍这些创新内容。


在准备阶段,我们推出了多项功能以鼓励用户开口演唱,其中推荐热门片段功能是回森首创的,在所有 K 歌 App 中也唯有回森会推荐用户去唱热门片段。我们之所以做出这个决策是有一套严谨的推理过程的:

  • 站在生产者角度来看,目前短视频平台给大家听的大多是一首歌的副歌部分,主歌部分其实大家都不太会唱。因此我们意识到,与其强迫用户挑战整首歌曲,不如推荐他们演唱热门的歌曲片段,这样既能提升用户的演唱体验,也增加了他们发布作品的选择性。

  • 另外一个是站在消费者角度来看,在快节奏的生活中,用户往往没有足够的时间或耐心去听完一首完整的 UGC 作品。相反,他们可能更倾向于聆听副歌部分,并在此基础上进行社交互动。因此,推荐热门片段也符合了消费者的使用习惯。

  • 最后一个是站在平台角度来讲,希望能够提高作者渗透率,这样才有可能服务好生产者进一步提高留存,而提高生产者渗透率最重要的就是开口发布率指标,用户唱的越多犯错机率也就会越多,唱的越少犯错也就越少,也就会越有利于发布。


基于以上三点考虑,我们推出了推荐热门片段的功能。当然,为了保障作品的质量,我们也设置了最低时长限制,即用户至少需要演唱 10 秒以上的片段。


在录制阶段要做的工作非常多,比如在录制过程中的各种录制反馈,包括基本的歌词、伴奏等,还有进阶的音高组件与打分。比较有特色的是针对收音我们做了很多的优化,会开启一个音乐场景下的 DeepAEC,捕捉用户更为干净、优质的人声,这也是基于我们对用户唱歌的硬件条件(80%不戴耳机)变差认知的决策。另外还有最重要的人声特征分析包括音量、对齐,以及更高阶的 asr 特征的提取,这里面还有一个特色的功能是清唱找调,在本系列文章的中篇中也会做详细分析。这一阶段我们尽可能通过反馈与交互给用户提供最优秀的录制体验,最终可以拿到录制下来的用户高质量人声与人声的一些特征。


在编辑阶段,首要目标是确保用户可以满意地听到自己刚刚演唱的声音与伴奏完美混合的效果,为此,我们精心设计了音量配比与对齐功能,这是最基本也是最关键的一环。除了这些基础功能,我们还为用户提供了智能修音、智能音效和母带音效等高级功能,旨在让用户的作品在音质上更上一层楼。特别值得一提的是,相较于其他平台,我们的智能修音功能在保持自然度的同时,能够更有效地提升音质,这一点将在本系列文章的下篇中重点讲解。此外,我们不仅在音频处理上下了功夫,还在视频编辑方面进行了创新。我们为用户提供了丰富多样的特效模板、特效主题和歌词字幕等功能,目的是为了降低视频画面制作的门槛,让用户能够轻松制作出高质量的视频 K 歌作品。这些功能将为用户带来全新的创作体验,让他们的作品更加生动、有趣。


在发布阶段,除了完成话题、@、选择封面等基本功能之外,回森还做了提前上传、异步上传,并且使用了快手音视频团队的边导出边上传的能力,大大提升了回森用户作品上传成功率以及体验。


四、总结与反思

本篇首先从 K 歌社区赛道介绍入手,深入剖析了 K 歌社区在面对短视频平台冲击时所面临的困境与挑战。随后,详细阐述了回森团队的思考过程,以及他们如何从零开始,逐步在 K 歌领域取得现今的成就。紧接着,我们聚焦于音乐弹幕这一创新功能,探讨了它是如何解决 K 歌社区困境的关键所在。最后,为了让大家对 K 歌流程有更清晰的了解,我们还介绍了 K 歌流程的大图,并详细讲解了回森在每个阶段所进行的创新探索。在接下来文章里,我会分别展开音乐弹幕与重塑 K 歌流程,如果有问题也欢迎指出。


引用文献与资料:

1、在线 K 歌用户规模达 5.1 亿:引用自《艾瑞咨询|2021 年中国在线 K 歌行业发展专题研究报告》

2、在线 K 歌 MAU 2.2 亿:引用自《2020 年中国在线 K 歌社交娱乐行业发展洞察白皮书》

3、K 歌社区第一名的产品 MAU 1.5 亿:引用自《亿级月活全民 K 歌 Feed 业务在腾讯云 MongoDB 中的应用及优化实践》分享


本文作者:展晓凯

发布于: 刚刚阅读数: 4
用户头像

快手技术

关注

还未添加个人签名 2024-05-15 加入

快手官方技术号,即时播报快手技术实践的最新动态 关注微信公众号「快手技术」

评论

发布
暂无评论
音乐弹幕?智能修音?回森K歌社区的创新玩法?(上)_快手技术_InfoQ写作社区