揭秘阿里云 RTS SDK 是如何实现直播降低延迟和卡顿
作者:予涛 途坦
这个夏天,没什么能够比一场酣畅淋漓的奥运比赛来的过瘾。但是,在视频平台直播观看比赛也有痛点:“卡顿” 和 “延时”。受限于不同地域、复杂的网络情况、传输速度等原因,当您还在为赛点焦灼的时候,隔壁已经传来欢呼声,观赛兴致瞬间全无。为了打造更加流畅稳定低延时的直播体验,越来越多企业关注低延时直播技术应用。
阿里云低延时直播 RTS(Real-time Streaming)是在视频直播的基础上,进行全链路延时监控、CDN 传输协议改造、UDP 等底层技术优化,通过集成直播播放端 SDK,支持千万级并发场景下的节点间毫秒级延时直播能力,弥补了传统直播 3~6 秒延时的问题,保障低延时、低卡顿、秒开流畅的极致直播观看体验。
为了能够降低直播的端到端延时,2020 年阿里云正式推出全球实时传输网络 GRTN (Global Real Time Network) ,是部署在边缘云节点之上的超低延时、全分布式下沉的通信级流媒体传输网络,用于支持视频会议、视频直播、实时音视频等服务。要使用 GRTN 提供的短延迟 / 实时传输服务,客户端可以通过浏览器的 webrtc 能力接入,也可以自行开发客户端协议栈来接入。
RTS NetSDK 是什么?
低延时直播 SDK 是由 RTS NetSDK、推流 SDK 和播放器 SDK 组成。其中,推流 SDK 将编码器输出的音视频帧发送给 RTS NetSDK,播放器 SDK 从 RTS NetSDK 以帧的形式读取音频 PCM 数据和视频 H264/H265 数据。
Example: ffmpeg 集成 RTS NetSDK 后拉 ARTC 流
RTS NetSDK 是基于 GRTN 开发运行在客户端的协议栈。RTS NetSDK 通过 UDP 传输层协议和 GRTN 上的 SFU 通讯,收发音视频数据。考虑网络条件未知性,RTS NetSDK 集成了 WebRTC 的 QoS 算法来适应网络变化,从而提供优质的音视频传输服务。RTS NetSDK 的轻量化设计使其非常容易被诸如 ffmpeg,obs 一类的开源框架所集成。
RTS 客户端构成
RTS NetSDK 承担推流拉流对接阿里云 RTS 服务桥梁,以包体积小、集成简单、对现有业务没有入侵为主要特点,帮助直播客户简单快速的升级传统直播到阿里云 RTS 直播。
RTS NetSDK 支持多平台,Android/iOS/MacOS/linux/Windows/RTOS, 支持多个开源项目集成的接入代码,ijkPlayer、obs、FFmpeg,而且阿里云推流 SDK 和播放器 SDK 已经内置了 RTS 直播推拉流能力。
RTMP 是基于 TCP 传输的,RTS 是基于 UDP 传输的。在网络稳定带宽足够条件下,RTS 对比 rtmp 没有多少优势,但这种理想情况是比较难以保证的。传输协议上的差异,使得 RTMP 对于变化的网络没有太多的 QoS 手段,完全依赖 TCP 的拥塞控制。这种拥塞控制不以低延迟为目标。阿里云的 RTS 引入 WebRTC 的 QoS 技术,对于网络丢包有更好的容忍度。出色的带宽估计和拥塞控制,提供了细腻的网络使用策略。
另外,在 Adobe Flash Player 停止更新,RTMP 在网页上已经无法再使用。客户要么选择延迟非常大的 HLS 技术,或选择 WebRTC 技术。RTS H5 版本本质上是 WebRTC,可以在网页上运行。
产品优势
低延迟
HLS 直播因为其 TS 文件切片--整片读取的机制,其延迟至少都在一个 gop 以上。
RTMP、FLV 直播,为了保证客户端的播放顺畅,往往会让客户端保持 5 秒以上的缓存。
阿里云 RTS 直播,基于 udp 传输技术,全链路针对延迟优化,最新 v1.8.0 版本已经可以将延迟降低到 500 毫秒左右。
抗弱网
阿里云 RTS 直播是基于 UDP 传输的,通过应用 WebRTC 的先进技术(比如 BWE、jitter buffer、NetEQ、FEC、NACK 等 QoS 机制)以及自研的抗弱网技术,在复杂易变的用户网络环境中,比基于 TCP 传输的直播有着更好的流畅度和延迟。
包体积小
RTS NetSDK 拥有轻巧的包体积,以最新版本 Android 和 iOS 为例:
易集成
直播客户大多都已经有了成型的直播推流和直播拉流能力。RTS NetSDK 以库的形式被集成进客户现有的 SDK,实现低成本升级,且兼容之前的业务逻辑。阿里云 RTS 直播已经支持到传统直播的基本所有特性。
产品应用架构
RTS 直播将支持传统直播的基本全部能力,如直播录制、防盗链、导播台等。
RTS NetSDK 可以被集成进拉流侧的各种产品中去。另外提供了集成到 ffplay、ijkPlayer 的源码,客户可以直接使用或者参照着修改。阿里云播放器 SDK 已经内置了 RTS NetSDK 的拉流能力。
RTS NetSDK 也可以被集成进端侧的产品中去,RTS NetSDK 赋予推流产品 RTS 直播的能力,同时也提供了集成到 ffmpeg、obs 的源码。阿里云推流 SDK 已经内置了 RTS NetSDK 推流能力。
RTS NetSDK 是未来直播和通信一体化 SDK 的基石。在 RTS NetSDK 之上,加一个 Multimedia Framework,以及 QoS 消息处理,就可以构成一个一体化 SDK。这对于已经有自己的 Framework 的客户来说是个好消息,不需要为直播和通信分别开发软件了,同时也简化了直播连麦场景的实现。
「视频云技术」你最值得关注的音视频技术公众号,每周推送来自阿里云一线的实践技术文章,在这里与音视频领域一流工程师交流切磋。公众号后台回复【技术】可加入阿里云视频云产品技术交流群,和业内大咖一起探讨音视频技术,获取更多行业最新信息。
版权声明: 本文为 InfoQ 作者【阿里云视频云】的原创文章。
原文链接:【http://xie.infoq.cn/article/ab467442070a7c7fc6c3e6d2f】。文章转载请联系作者。
评论