揭秘金山云云游戏 PaaS 服务平台背后的视频编码技术
近日,金山云发布了云游戏 PaaS 平台。该平台的云游戏架构能够为客户提供稳定、快速、弹性的云游戏部署及运维解决方案,支持 CPU+GPU 资源池的混合架构,以更低的损耗代价实现更高的用户流并发处理效率。在云端,金山云投入了大量研发精力获取高度弹性的虚拟化/容器能力,以此为基础自研了 GPU pass-through 虚拟化技术,一方面大大降低了 VM 在 OS 层的损耗以提升用户资源使用经济性,整体降低 TCO;另一方面获得了等效于 vGPU 方案的资源监控能力,从而可使用高效调度算法来实现更优质的资源分配灵活性及平行伸缩能力。
在流式传输环节上,金山云直接从编码器入手,对 KSC265 做了深度优化定制,使其适配了 WebRTC 等通用 RTC 方案。在 5G 终端应用场景中,金山云丰富的边缘节点提供了出色的 MEC 接入能力,将优化用户网络拥塞的工作推进至了最后一公里,在大部分工况条件下把玩家 RTT 延迟降低到了 25ms 以下。本文将重点介绍基于云游戏 PaaS 平台定制优化后最新 KSC265 的技术优势。
云游戏定制优化下的最新版 KSC265
KSC265 是金山云自主研发的符合 HEVC 标准的软件级 H.265 视频编解码器,曾多次获得世界编码大赛冠军。
与基于 H.265 标准的开源视频编解码器 X265 相比,KSC265 在压缩效率和速度方面优势明显,编码速度能够满足直播、短视频、云游戏等的时效性需求。在快速编码模式下,金山云 KSC265 压缩比显著,相较 X264 相同画质仍可以实现 30%-50%的码率节省,仅消耗一半的带宽,即可获得相同的观看体验。相较硬件编码,KSC265 的参数设置更加灵活,不仅压缩比同画质优于硬编,成本也低于硬件解决方案。
本次基于云游戏定制优化了最新版本的 KSC265,在码率、PSNR、转码速度等方面均有新的突破。基于端游和手游,我们测试了代表性的 4 个游戏,采集 5 分钟时长的云游戏视频,采用 ultrafast 与 zerolatency 档次,在码率、PSNR、转码速度三个方面进行了对比。结果显示,KSC265 在相同峰值信噪比 PSNR 下较 x264 码率平均节省 62.44%,较 x265 码率平均节省 28.52%。
KSC265 的背后技术揭秘
在 MV 搜索、屏幕内容、主观优化与码率平衡方面,最新 KSC265 均实现了升级。
对于云游戏,特别是需要渲染的端游类,KSC265 可以利用游戏本身的渲染信息,通过一些简单的矩阵乘法计算出相邻帧的像素级 DirectMV 来跳过编码器原始的 MV 搜索过程,大幅加速整个编码过程。在整个基于 MV 的优化加速中,KSC265 能在加速 24%的情况下,仅损失 3%的 BD-rate。
KSC265 还能针对基于屏幕内容的视频编码扩展技术(Screen Content Coding)进行优化。HEVC-SCC 本质上是 HEVC 的扩展,KSC265 针对 SC 图像特性增加了四个编码工具:帧内块数据复制(Intra Block Copy, IBC)、调色板模式(Palette Mode)、自适应颜色空间变换(Adaptive Color Transform, ACT)以及自适应运动矢量分辨率(Adaptive Motion Vector Resolution, AMVR)。相较于自然图像视频,屏幕内容视频在 RGB 颜色通道上的关联度更低,转换为常见的 YUV-420 格式并不利于其编码压缩。鉴于此,KSC265 使用支持可扩展 RGB-444 模式的编码器,在取得更好压缩效率的同时,得到色彩更鲜艳、清晰度更高的视频流。
在主观优化和码率节省的平衡方面,KSC265 采用了 HVS 的最小可觉察误差(just-noticeable difference,JND)模型,JND 度量了人眼对画质损失的容忍程度,利用人眼对图像中不同区域、不同背景的敏感性差异进行像素域 JND 建模和码率分配,从而提高压缩比。算法上将 JND 模型分解为视觉对比度敏感度带通(contrast sensitivity function,CSF)模型,亮度幅度非线性(luminance masking,LM)模型, 纹理对比度掩蔽(contrast masking,CM)模型, 人眼凸起掩蔽(foveated masking,FM)模型, 和时域掩蔽(temporal masking,TM)等五种模型。
金山云在视频云领域已深耕多年,团队一直在关注相关前沿技术,并已实现多种技术的具体落地。未来,金山云将持续在云游戏赛道发力,利用最新技术突破为用户提供更高品质的沉浸式游戏体验。
评论