解密猫晚直播技术:如何保障全球 200 多个国家和地区同时在线狂欢?
2020年11月10日的”猫晚“,又是一场视觉盛宴,满满的双11仪式感。
自2015年以来,每年的猫晚都是重金打造、众星云集,并通过广电卫视和互联网多渠道同时进行全球多屏分发。
想要把这场极具艺术价值的舞台风景,通过直播技术演幻到移动端,还原真实,甚至超越真实的音效与视觉,并非易事,但却是阿里云视频云的执着之事。
众所不知,阿里云视频云团队在猫晚这样的重量级晚会直播上,一直承担着重要的技术角色,今年如是,每年如是。
具体说来,猫晚有两大特点:第一个是广电级别的匠心制作。精心的编排,豪华的阵容,酷炫的舞台效果,堪称顶级现场制作。第二个是极致专业,专业的演员和表演,同时现场有专业的各种设备,诸如灯光、摄影、音响和调音台等等设备以及专业的现场导播制作团队。
要把这场实时晚会盛宴进行多屏分发到全球各地,确保屏幕前的观众一起参与狂欢,感受晚会氛围,就需要背后的技术指标至少要满足三点:高可靠、高画质、高音质。
首先,高可靠。确保晚会表演的每一帧画面、每一个声音都能让屏幕前的观众看得到、听得到、感受得到,那么就要求除了各个云端服务必要的高可靠性以外,还需要端到端的全链路来保障每个链路环节的高可靠。
再者,高画质与高音质。如此匠心之作的晚会,要求区别于一般的泛娱乐主播秀,不仅要注重屏幕前观众的视觉享受,同时也必须要保证他们听觉上的享受,要让屏幕前的观众有如临现场的观看体验。
怎样达到这些技术指标?来看看阿里云视频云的技术解决方案。
高可靠保障:端到端全链路主备双重机制
针对高可靠,阿里云视频云是采用端到端的全链路主备双重机制来实现,同时值得强调的是,阿里云不是采用两条主备全链路,而是针对全链路的每个环节,进行主备双重机制重保来实现的。主备双重机制可以保证主设备或者主链路环节出了任何抖动、卡顿或者故障等问题,其备用环节会立即补上,让播放端无感知,最大可能保证观看流畅。
阿里云视频云把全链路拆分为三大环节: 活动现场、阿里云端、用户侧多屏播放端。(下图所示)
在活动现场环节,主要是信号采集、处理、编码、上传几个模块。其中信号的采集和处理是通过现场的导播制作团队来保证高可靠的,比如:可以通过添加多个专业设备和专业人士以及多条线路。
而编码和上传就是信号IP化,这需要进行主备重保来保证该环节的高可靠。现场制作而来的信号需要同时传输给主备两个编码器,这两个编码器使用同一组信号源,同一组编码参数进行编码,然后经过不同运营商的多条专线网络上传到阿里云直播服务中心。
在阿里云端环节中,我们采用双中心多机房、主备合流、无缝切换的技术加上资源隔离以及机器独享、冗余的方式来确保云端各个环节的高可靠性。其中双中心多机房是为了容灾,而主备合流是为了保证主备链路环节的流,能够动态选取最优帧率的链路,无缝合并成一路输出。
同时在播放侧,阿里云视频云除了通过全球2800多个CDN节点进行多屏分发外,在播放技术上,采用双回源、多码率组合的播放方式,集成了阿里云播放SDK 的播放端,可以根据分发的网络情况进行网络自适应来切换不同的转码档次,确保在网络不是很好的情况下也能保障非常顺畅的观看体验。
高音质保障:SRT接入+全链路杜比
在高音质方面,阿里云视频云采用了SRT接入和全链路杜比音频技术,来让屏幕前的观众听到比现场还真实的全景声音。
在直播链路中支持SRT协议接入,确保广电行业的视频流可以进行低延迟、高可靠的接入到互联网进行分发。SRT是基于UDP的低延时、高可靠传输协议,如果要接入一路流的话,需要打开端口,但是多路流的区分以前只能通过端口来区分,而现在,阿里云支持可以通过streamID的方式区分不同流来接入,从而进行端口复用。
用户可以通过任何一款的支持SRT的推流端设备或者软件直接推流到阿里云边缘节点即可使用,比如业内通用的OBS桌面软件推流端或者其它硬件SRT推流设备。同时阿里云视频云与Haivision 厂商密切合作,也支持Haivision的Media Gateway 和硬件编码器等各种硬件直接接入。
阿里云视频云为真实还原晚会现场声音,采用了杜比全景声技术,支持端到端全链路杜比音频传输,确保各个转码档次的音频也是杜比音质,让网络环境不好的屏幕前的观众也能享受到高音质的全景声,感受甚至比现场还真实。
高画质保障:窄带高清2.0+FPGA265编码
在高画质方面,采用了独有的窄带高清2.0技术和FPGA265编码。
阿里云视频云窄带高清2.0技术,是从人眼视觉模型出发,将视频的优化目标从经典的“保真度最高”调整为“主观体验最好”。凭借独有算法,突破当代视频编码器的能力上限,在节省码率的同时,也能提供更加清晰的观看体验。
而使用FPGA265 编码器来保证码率更多的节省,同时FPGA编码器也能够提供更好的实时压缩性能,确保高画质视频码率更低,画质更真。
我们知道 H265 具有很好的压缩比,但是在直播过程中如果使用CPU转码,很难达到实时,因为265的计算复杂度比较高,针对高分辨率、高帧率、高码率的视频源,使用CPU去做高画质的压缩计算来实现265转码,实时性是几乎不可能有保证的,而且CPU机器的成本也是比较高的。
所以,业内通用的做法是倾向于使用 GPU 或者 FPGA 等借助硬件来实现H265的实时编码。
达摩院XG实验室精心打造了一款实时的高性能的H265 FPGA硬件编码器“XGH265”, 不管是从压缩效果还是性能等各个维度来看,都已经达到了业内顶尖水平,同时它还支持可配置的视频前处理的能力,在画质更清晰的观看体验下,压缩比和压缩性能最好。
在压缩性能上, XGH265 的压缩性能和X265 的slowpreset 档次相当。我们要知道,在直播过程中针对1080p的源流能够达到 X265 slow 档次的实时压缩性能是非常困难的,在业内的各种GPU\FPGA等硬件编码器几乎是不可能实现的,在实时和画质之间无法同时平衡。而XGH265是目前市场上罕见的一款能够支持1080p 60fps实时,且压缩性能相当X265的slow 档次FPGA卡。目前阿里云达摩院XG实验室正在针对4K甚至更高的分辨率提出更好的方案,后续也会推向市场。
从高可靠、高音质、高画质维度,阿里云视频云提供了端到端的全链路重保解决方案,来保证猫晚这类重大活动的直播,稳如泰山、丝般顺滑、身临其境。
阿里云视频云:回顾猫晚直播重保六年
从猫晚一开始存在的时候,即2015年,阿里云视频云团队便开始猫晚护航,期间,团队经历也过了很多重大活动直播的护航。
项目的技术负责人蔡鼎说到,“团队从刚刚开始的紧张,到如今的有条不紊、平淡不惊,表明了视频云对自身云端服务的稳定性的信心,同时,团队针对端到端的全链路各种指标的监控告警、降级措施、应急预案演习等已做得越来越完善”。
针对护航,阿里云视频云团队也有相应严苛的护航手册和条例,所有这些的改进都是通过一次次护航经验的复盘、迭代打磨出来的。
蔡鼎分享到,“以前我们的护航是边看日志边看监控,而目前我们是边看直播边看监控告警,未来,我们甚至期望可以做到边看直播边购物,和其它购物者一样,我们要让护航全自动化,碰到问题能够自动决策各种应急预案和措施,同时,业务方自身也能够使用工具来自我保障,最大限度实现全链条的自动智能安全保障。总言之,我们希望每次重大活动直播都是无惊无险、平平淡淡、稳如泰山。“
重大盛典/赛事直播的视频云技术能力
利用端到端的全链路重保解决方案,阿里云视频云可将技术复用在更多业务场景上,如曾支持的春晚直播、元旦跨年直播、国庆阅兵直播、世界杯直播等等,其中,2018年的世界杯直播项目尤为深刻经典。
在支持大型晚会、体育赛事、竞技赛事的直播能力上,阿里云视频云的突出优势在于:端到端的全链路主备解决方案、各种指标的监控、水位告警、大盘监控,以及可视化画面合屏盯屏、主备合流、帧率码率监控等一整套经过多次大型直播活动打磨过的护航解决方案。
未来,该技术解决方案还有更多的升级空间,技术负责人介绍到,“目前,重保全链路方案,在主备链路合流上还只能做到3-5秒的抖动,我们期望后续真正做到主备链路帧级无缝合流的能力,让播放端体验完全无感知,从而以端到端的高可靠全链路方案,达到广电级别的重保效果。“
阿里云视频云引领直播行业的前瞻性技术,不断探索与升级,期待更多视觉盛宴以身临其境的直播体感而来。
阿里云视频云技术公众号分享视频云行业和技术趋势,打造“新内容”、“新交互”。
版权声明: 本文为 InfoQ 作者【阿里云视频云】的原创文章。
原文链接:【http://xie.infoq.cn/article/1ca0eff7bb2142c48a4926a3c】。文章转载请联系作者。
评论