如何优化大场景实时渲染?HMS Core 3D Engine 这么做
在先前举办的华为开发者大会 2022(HDC)上,华为通过 3D 数字溪村展示了自有 3D 引擎“HMS Core 3D Engine”(以下简称 3D Engine)的强大能力。作为一款高性能、高画质、高扩展性的 3D 引擎,3D Engine 不仅能通过实时光追、水体渲染、体积云雾、多维 GPU 粒子系统等技术还原真实世界的物理表现,对于大规模数字世界的实时渲染,3D Engine 同样也能为开发者提供有力的技术支持。
大规模数字世界的需求与挑战
今天,如何更好地实现大场景下的实时渲染,已经成为行业的热门话题,相关技术在众多领域都有着广阔的应用前景。我们可以明显感受到,从 3D 游戏到虚拟现实,从三维 GIS 到数字城市,涉及场景的规模都在呈指数级增长,部分游戏中的世界地图甚至没有边界。可以说,大规模场景的实时交互渲染能力正在成为构筑数字世界的基础设施。
然而,这并非易事。
场景规模的扩大带来的结果就是海量的内容和数据。一个城市涉及的物件数差不多是百万级,面片数更是可能达到亿级,而硬件配置却始终是相对有限的,即使再高级的硬件配置也有力不从心的时候。
数据和硬件之间的矛盾,对 3D 引擎的大场景实时渲染能力提出了挑战:
1、由于物件、网格、材质等内容数量太多,受限于显存容量,传统的全场景预先加载方式无法实现;
2、在传统 3D 绘制模式下,GPU 的算力不足以支撑万级规模物件数和亿级规模面片的实时渲染;
3、如果使用流式加载场景的方式,可以实现一边渲染一边加载数据,但需要预处理场景数据,诸如分区分层、模型合并、材质合并、纹理烘焙等预处理往往极为耗时,几万个物件就需要小时级的等待,且仅支持场景中静止不动的物件。
譬如上图这个服务器大楼,三角面片数达到了千万级,并且有将近万件的模型。为了实现实时渲染,通常需要通过 HLOD 的方式将整个场景进行 Spatial-Coherent 的层次重组。
类似于右图红圈所示,以不同半径为一个空间节点,将圈圈内的模型进行合并处理,从而降低场景物件的遍历数量,提高绘制性能。而这个预处理操作本身就需要耗费近一个小时,大大增加了调试和开发成本。
那么,HMS Core 3D Engine 将如何应对挑战,构建大规模场景的实时渲染能力?
Hi-Mesh 层级网格渲染加速技术
为了解决这三个“放不下”、“算不了”、“等不起”的问题,华为 2012 菲尔兹实验室基于 HMS Core 3D Engine 自研了“Hi-Mesh”层级网格渲染加速技术,针对场景中的资产进行多维度、多层级的结构优化,确保场景结构在生成、遍历、处理过程中的高效。譬如针对一个大规模场景,可将其数字内容进行多维分区:
1.按空间结构分区
3D 场景中利用物件原生隐含的空间属性,进行快速位置编码和索引,大幅降低传统树形结构的线性遍历耗时;
2.按视角空间分层
利用视角的局限性,对场景中的物件进行不同细节层次的区分或合并处理,从而降低场景的数据量;
3.按内容特征分组
利用场景物件的特征,如按网格、材质的同源性进行分组,从而使用特定优化的绘制指令来强化它们的绘制效率;
4.按拓扑连接分片
将模型网格进行更精细粒度的分片,实现高效率的剔除和遮挡操作,优化实时渲染的性能。
Hi-Mesh 架构图
Hi-Mesh 架构图
基于将场景化整为散的原则,以高效率的空间/视角结构来实现多层级的数据优化,并以 GPU 驱动的方式,最终实现百万级物件、亿级片面的数字世界的实时渲染。
一千个物件实时动态更新
为了实现上述的操作,3D Engine 使用了一种隐式编码树的空间层次结构——“Hi-Mesh Tree”。不同于传统基于链表形式的空间结点树的方式,3D Engine 通过一种常量级性能的构造和遍历方法,相较现有的商业引擎,大规模场景的实时渲染性能可提升 15%~120%。此外,还可以大幅提升三维空间场景组织结构的生成效率,甚至达到毫秒级,大大降低了工作流的时间成本。
数据来源: 华为内部实验室测试结果
同时,3D Engine 还使用了基于 GPU 驱动的 Cluster Rendering (GDCR)绘制技术。
GPU 驱动在业界已有一些探索和应用,其理想目标是用一个 Draw Call(DC)来绘制整个场景,以充分发挥 GPU 的并行流水线能力,实现渲染性能的提高。下图是 Ubisoft 在 Siggraph 15 上提出的 GPU 驱动管线的架构图,其核心思想就是将原本基于 CPU 的可视性检测处理迁徙到 GPU 上,利用 GPU 的并行和可编程能力,提供高并发、不同粒度的可视性检测能力,从而大幅提高渲染性能。
3D Engine 为了更充分的实现 GPU 驱动的效率,对 GPU 驱动的管线节点、数据传输、图形资产进行深度优化和耦合,将场景下的所有 3D 物件在 GPU 上进行各个维度(包围盒、实例、片区、三角面)的可视性剔除,配合多层的重组(材质、顶点),从而实现以最少量的绘制指令来实现场景的光栅化和着色,同等规模场景下相比传统模式的渲染性能实现了翻倍。
同等规模场景下渲染性能对比
可以预见,未来的数字世界无论是元宇宙、数字孪生、还是开放大世界,趋于庞大的丰富多彩场景都将会是不可或缺的组成部分。在 Hi-Mesh 技术的加持下,3D Engine 得以通过高效的空间层级结构和 GPU 友好的绘制管线,大幅提高大规模数字场景下的实时渲染能力,使场景中的 3D 内容“尽情放”、“更快看”、“少等待”,帮助开发者大大提升生产力。
关于 HMS Core 3D Engine
3D Engine 是 HMS Core 面向行业伙伴推出的重要图形能力,不仅提供高性能、高画质、高扩展性的实时 3D 引擎,配合低代码的可视化开发,能够帮助开发者便捷高效地创造出高品质的 3D 内容和体验。如需进一步了解更多信息,请访问: developer.huawei.com/consumer/cn/hms/3d-engine/?ha_source=hmswm
评论