带你了解 S12 直播中的“黑科技”
本文分享自华为云社区《用硬核方式打开S12名场面》,作者:华为公众号。
让精彩更流畅、让较量更清晰、让参与更沉浸、让体验更有趣,幕后的舞台,从来都是技术的战场,S12 背后的名场面同样场场高能。
经过 35 天的鏖战,2022 英雄联盟全球总决赛(S12)终于在 11 月 6 日落下帷幕。在这一个多月里,各方战队一路披荆斩棘,有命悬一线,也有高光瞬间,荣耀的背后始终跟随着挑战。而对于拥有 S12 直播平台独家版权的哔哩哔哩(以下简称“B 站”)来说,亦是如此。
据悉,整个赛事期间,B 站共完成了 91 场比赛的实时直播,其中最后一场的 S12 全球总决赛播出后,哔哩哔哩英雄联盟赛事直播间的实时人气一度突破 3.1 亿。
纹理更加清晰的画质、“纵享丝滑”的转播效果、沉浸感十足的互动特效、更贴心的无障碍直播间......S12 直播可以看做是音视频领域“黑科技”的一次前沿试水。对于需承载亿万级并发在线观看人次的直播平台来说,每一处升级都错综复杂,每一点进步都得来不易。
高光时刻,和战队即时共享
在短视频、直播、社交等并进的互动时代,超高清已经成为游戏玩家的硬核需求。“得画质者得人心”,不管是音视频内容的生产商还是服务商,极致的画质体验已经成为获得用户注意力资源的武器。
而在 B 站上看过今年英雄联盟全球总决赛的观众,大都会明显感觉到:今年的赛事直播画面更清晰了,互动也更多了。
据【哔哩哔哩技术】官方公众号公布的信息显示,针对 S12 的赛事直播,B 站研发了一种实时画面超分算法来提升画面质量,该算法能够在源流的基础上使得画面细节更加清晰、纹理更加丰富。
▲低质图像/超分图像/高质图像/残差图像
图像超分算法在业内已经不是新词,目前主流超分算法分为非实时和实时处理两种类型。在过往,已有大量非实时超分算法的实践案例,比较典型的是视频网站将低分辨率、低清晰度的老旧视频转换成符合主流观看需求的 720p、1080p、2k 的高分辨率视频。但这种非实时超分算法的计算量很大,只适用于对视频实时性没有要求的场景。
在 B 站 S12 赛事直播这类对视频实时性要求很高的游戏直播场景中,实时处理的超分算法可大幅度缩减计算量,在提升画面质量的同时,也能提高视频处理效率。
在此前测试时,B 站的实时画面超分算法将视频从 1080p 超分至 4k 分辨率,单卡处理速度可以达到 75fps(画面每秒传输帧数)。这个处理效率对于 60fps 的游戏直播源流来说,在速度上还有较大富余。
此次 B 站推出的单卡 4k 75fps 的实时超分速度拓宽了超分技术在直播领域的应用。尽管目前该算法仅在 S12 官方赛事直播间应用,但据 B 站透露,未来其也将服务于更多需要较高实时性的游戏直播业务中,开拓更为广阔的应用空间。
不过,当前的互动时代,远不止画质等信息的“通信”传输,更强调的是共享时空,实时互动。
“看比赛时候的氛围有非常强的实时性和感染力,大家会想要把自己比较饱满的情绪及时表达出来,所以我们希望能通过除了弹幕或者是常规的点赞动作,让大家能把自己兴奋的一面更好地展现在直播间里,让所有在线的观众能共庆此时,分享快乐。”今年 B 站的赛事直播比较明显的变化是赛事房间使用了新版直播间,支持上下滑切换直播间、全新背景图、表情包弹幕等功能。据 B 站直播互动技术保障负责人 CrystalDan 介绍,为了增强互动性和趣味性,B 站在直播间加入了不少新玩法。
例如在比赛到了团战、推高地等比较激烈的时刻,直播间会发起“点赞热力特效”,引导大家积极点赞为选手打 call,在极短的时间内打满进度条后会出现酷炫的动画特效。一方面是让用户通过点赞的方式表达自己对这场比赛的热情,另一方面也让没有点赞的用户可以通过进度条和动画特效感受到紧张的比赛氛围。
再比如通过“小黄车”卖赛事装扮。当某一个战队获胜了,用户可能会由此产生购买该战队装扮或周边的欲望,以获得归属感和荣誉感。而直播间里的“小黄车”提供淘宝、京东、会员购、个性装扮等商品,能够满足用户边看边买的需求。此外,还有一键预约、礼物特效、弹幕表情等更便捷、强互动的功能,大大提升了用户的观赛和参与体验。
更好的画质,更多的玩法,说起来简单,要实现起来却并不容易。作为承载千万级乃至亿量级的赛事直播平台,任何细小的问题都会对用户体验造成巨大的伤害,而新的玩法也会带来新的场景计算和流量并发。
最强辅助,为直播保驾护航
简单来讲,本次 S12 赛事直播的流程可以理解为:
腾讯官方提供赛事的原地址;
B 站的云源站拿到直播信号后,会进行画面的预处理,包括增强或锐化等;
进行转码和 4k 的一个超分;
将处理好的视频流通过 CDN 内容分发网络,下发至观众的设备中进行播放。
为了保障直播各个环节的稳定性,早在今年 8 月,B 站的技术团队就制定出了周密的直播保障方案。不仅在技术上,对直播老网关做了迁移和容器化,并通过 Go/PHP 去 cpuset 化、内核升级推进了直播合池,提升了 PaaS 资源弹性,对核心功能做多活保证直播体验,还通过全链路压测、混沌工程、设定预案/SOP 等技术手段,去提高系统的可靠性。
同时,在业务上,B 站也与上游业务方做了合理的流量预估和资源预算,并同往年一样,选择依托华为云过硬的技术服务,以确保直播万无一失。
“从外面来看,我们整个直播系统是一个比较简单的结构,但其实整个直播系统后面涉及到的微服务有几百个。这对于直播的保障工作来说,是一件很有挑战的事情。”B 站 S12 技术总负责人小卫在采访中说道。
要知道,赛事直播是一项比较复杂的工程,需要统一的管理和调度。因此,华为云容器的引擎为 B 站提供了混合集群的统一管理服务。基于华为云 CCE 容器的托管服务,B 站搭建起导购台和中转台,配合华为高性能的 GPU 云主机进行赛事的流转码,让每场比赛都能够顺利地在亿万的终端上流畅、顺滑地调度播放。
“在今年新增的这些玩法中,高并发的读和写是同时存在的,我们需要在高并发的场景下,保证用户的互动体验。” 小卫表示。
本次赛事华为云还为 B 站提供了边缘分布式直播方案,帮助 B 站降低计算成本,消除了之前统一转码源站的单点故障,增强了直播过程中的稳定性、安全性。同时打造海量弹性资源池,按需调度,更好地提升了用户的互动体验。
例如基于华为云智能边缘站点,可实现视频访问的冷热分流:
如果用户访问冷视频,就通过边缘站点解析域名,经由华为云内部 DCI 高速网络访问直读存储 OBS;
如果用户访问热视频,则通过热域名访问华为云 CDN,通过 CDN 的就近内容分发,保证热度视频的用户播放体验。
通过这样冷、热不同视频的不同调度逻辑,细粒度管理,能够更精细化地管理与控制成本。
同时,华为云独创的高性价比直播方案——边缘 G-EIP 的网络算力分离,也是本次赛事技术支持中的一大亮点。
众所周知,华为云在很多城市都有大量优质稳定的计算资源,能够确保 B 站的收流、转码、录制等计算密集型业务的持续稳定运行。只不过,一线城市的带宽资源相对成本较高,直播又是带宽强依赖型业务,这样势必会导致直播建设成本上浮,形成成本与稳定不可兼得的局面。
因此,华为云针对 B 站的实际场景需求,创新性地将网络出口拉远至一线城市附近的二三线城市 pop 点,利用当地廉价的带宽资源与华为云主力 region 的网络服务绑定结合,做到了可靠性与成本兼顾。同时,也得益于华为云分布在全国各区域的边缘站点,终端用户得以就近接入,保障了流畅的观赛体验。
此外,除了对直播间的互动功能进行升级,在今年的 S12 期间,B 站的无障碍直播间也使用了华为的高性能 GPU 云主机,在自动生成实时字幕上比去年更为快速、准确。
“每当我们有一些资源不足、备量不足的问题时,就会找到我们的合作伙伴一起去看能不能通过一些方案或者从内部协调一些机器,帮我们去 cover 这些问题。”据 B 站 S12 技术总负责人小卫介绍,在赛事期间,华为云会专门指派一些工程师到现场做驻场保障,在比赛的后端也会有团队远程在线互动,以确保不管是前方还是后方出现问题,都能及时响应,从而保证整个赛事过程的平稳顺利。
共进共赢,音视频产业迎来黄金时代
“希望成为中国年轻人的文化生活方式,陪这一代人一起成长。”成立 13 年,以技术创新为源动力的 B 站已发展成为了国内音视频行业的领军企业,而华为也在借助底层技术架构的不断创新,释放音视频技术生产力。
从 1988 年华为通话业务成就国内一流的音频引擎,到 2004 年华为视频业务拥有国内一流的直播 CDN 能力,再到 2017 年华为云上线 CDN 海量节点,以及今年和 B 站的合作进一步突破了视频直播这一复杂工程,华为始终立足于整个音视频大生态,探索技术在其中的创新价值。
而得益于底座能力与关键技术的持续突破,音视频服务体系正逐步从点播、直播到实时音视频深化发展。实时性与互动性的长足需求与优化,逐步激活了更多场景下的音视频互动模式,驱动用户的音视频消费习惯向更加还原真实、更加沉浸式的实时音视频服务迁移。
“我曾经看过一个电影叫做《头号玩家》。在我自己的设想中,未来一定是往这个方向发展的,是通过脑机接口或者类似 AR、VR 的技术来实现的。我觉得这种沉浸式的体验给用户带来的感受会非常好。”B 站技术委员会负责人毛剑在采访中说道。
实时的音视频互动与社交娱乐场景具有天然契合度,不仅可以直接提升现有产品的基础属性,还可以融合空间音频、VR、AR 等技术,给予用户沉浸式的实时互动体验。也正因如此,国内实时音视频的市场规模一直在不断上升,场景效能也在不断深化。
根据艾瑞咨询发布的《2022 年中国实时音视频行业研究报告》显示,2021 年中国实时音视频(RTC)PaaS 市场规模为 16 亿元,同比增长 10.3%。受社交娱乐头部应用的高度渗透及“双减”政策的持续影响,预计未来三年的复合增长率为 28.4%,2024 年实时音视频(RTC)PaaS 市场规模将达到 30 亿元。
而目前来看,华为云的 SparkRTC 技术已经十分成熟,可提供高质量、低成本的实时音视频服务,实现了跨大洲端到端时延 200ms 以内,SLA 服务可用性高达 99.99%。
“我们设想的未来,它包含着元宇宙、数字孪生,也包括 VR 和 AR 在内的很多技术。实现这些技术的核心在于,在应用的过程中解决高带宽和低延时问题。在那之后,视频这个市场就会像星辰大海一样宽广。它能带来海量的视频,人人都会去享受视频。”华为云上海总经理张英梗在采访中说道。
可以预见,未来实时音视频将有望在越来越多的产业互联网领域实现落地,同时元宇宙相关应用的出现也将为消费互联网创造更大的想象空间。
据张英梗总经理介绍,无论是 to B 还是 to C,华为云都具有丰富的服务经验,未来也将持续加强数字内容生产的生态体系构建和技术研究实践,助力客户搭建无限玩法或场景,共建实时互动的世界。
“我们希望客户和伙伴在整个大视频生态上,都能体验到未来技术带给他们的创新价值,让客户能更好地服务于他的客户以及他自己。同时,也希望我们的伙伴在整个华为云生态上,都能享受到‘一切皆服务’带给他们价值体验。” 张英梗说道。
S12 虽已落幕,但属于 B 站与华为云的音视频“黄金时代”才刚刚开始。
版权声明: 本文为 InfoQ 作者【华为云开发者联盟】的原创文章。
原文链接:【http://xie.infoq.cn/article/b2e4488b4af787976a890c960】。文章转载请联系作者。
评论