写点什么

揭秘 2022 冬奥黑科技,阿里云视频云「Cloud ME」如何实现全息会面?

  • 2022 年 2 月 22 日
  • 本文字数:2720 字

    阅读完需:约 9 分钟

揭秘2022冬奥黑科技,阿里云视频云「Cloud ME」如何实现全息会面?

2022 北京冬奥会本是一届非凡的存在,这是有史以来第一次将奥运会所需的全部核心系统全面上云,以数字化技术创造奥运的新纪元。


但绿色奥运不止如此,在面临 Covid-19 限制和物理隔阂之下,千里之外,人与人的会面可以透过绿色科技之光而以全息形态实现,这便是阿里云视频云基于 AliRTC(音视频通信技术)推出的云上创新解决方案——阿里云聚“Alibaba Cloud ME”,第一次在百年奥运史上跨越物理空间,创造了人与人之间的“云聚”时刻。(以下简称 Cloud ME)


云聚现场的汩汩之温—Cloud ME 创造传奇会面


“Cloud ME”本意出发,为物理空间限制下渴望探索真实会面感的人们,提供沉浸交互体验,使他们能够以真人 3D 形态见面,并享受彼此的实时对话与交互。


就在冬奥会刚刚开幕,身处北京闭环内的国际奥委会主席巴赫通过 Cloud ME “现身”2022 北京新闻中心云聚展区,与远在上海的阿里巴巴集团董事会主席兼 CEO 张勇,隔空“云聚”,以全息形态同台送出奥运寄语,又在“现场”隔空传递冬奥火炬,于众多媒体记者的见证下,Cloud ME 让一切交谈和交互犹如真人临于现场,气氛真实而有流动感,惊叹元宇宙的提前到来,又深感科技涌出的汩汩之温。


远隔1300公里的巴赫与张勇先生,以全息形态现身北京新闻中心,同台云拜年。


在奥运世纪见面之外,更有温度的,是透过 Cloud ME,让因疫情分离别北京、上海两地的医护人员家庭得以在“云上全家团聚”,孩子看到父母如临眼前的欢喜之相,和一张穿越空间的全家福,浓浓暖意,足以瞬间融化这背后所有技术的艰辛演进。而这一刻,技术也挥着人文的熠熠之光。


通过Cloud ME,一场特别的见面


整个会面过程通过 Cloud ME,将会面者们的全身图像投射到远程全息舱中,以展示他们的 3D 形象,从而促成多人异地的远程会面交互。


Cloud ME 全息舱装置简单,除典型的演播室设备(如摄像机和计算机来捕捉镜头)之外,基于强大的云计算能力,不需要任何额外的现场 IT 基础设施或优化的互联网带宽来助力录制和传输。正是 Cloud ME 易于落地的特性,让虚拟现实会面可以在更无限的场域向更广泛的受众开放,创造更多样、更有温度的云聚可能。


一张特殊而浓浓暖意的“全家福”


就此,无论多想见的人、多遥远的客户、多难相聚的团队,都能透过阿里云视频云的 Cloud ME,以云聚之力,咫尺相见。

Cloud ME 的魔法显现—发丝级全息复刻 & 眨眼般超低延时


基于阿里巴巴在数字化和智能技术的支撑,Cloud ME 制作的音视频将在阿里云上进行压缩、传输、处理和渲染,在这过程中,经久打磨的 RTC 技术起到最为关键的作用,而阿里云先进的计算能力和广泛的全球网络覆盖也为 RTC 提供了坚实基础。

实现多人异地全息会面,Cloud ME 的操作落地简单,但技术非同寻常。

冬奥黑科技 Cloud ME 的技术实现


传奇过程,如下所现:


首先,在影像采集环节,摄影机采集的画面是无法直接在播放端进行全息成像的,所有画面需要通过先进的编码器进行深度压缩,并在实时传输协议和 QoS(Quality of Service)抗丢包策略的保障下发送到阿里云的音视频通信(RTC)网络,画面最终上传的格式和尺寸与普通 4K 电影无异。


随之,当画面到达云端之后,需要借助云上强大的处理能力完成包括转码、渲染、场景重建、光影处理在内的复杂流程,完成从“平面”到“全息”的蜕变,以真人 1:1 等比虚拟化复刻,生成 3D 全息人物,以高清方式重建所有互动细节,包括人物的微面部表情和服装纹理,达到“发丝级”全息全尺寸复刻,塑造全真实交互的沉浸感,一切犹如身临其境。


天下武功,唯快不破。在如此复杂和大跨度的技术链路上,为了实现顺畅的会面效果,技术实现的关键也在于“速度”,而保障“速度”的关键则是阿里云覆盖全球的音视频传输网络 GRTN(Global Realtime Transport Network),及其在视频编解码、网络传输、超大规模音视频处理和调度等方面的核心技术。


基于这些技术,影像画面传输和处理的全过程,包括 SDK 编码、实时传输,云上处理和渲染,端侧解码和成像,仅需在眨眼间的 200 毫秒内即可完成,体感上与我们日常交流互动的综合体感相同,毫无延时顿感,极度真实。

由此,Cloud ME 发丝级的全息全尺寸复刻、眨眼般的超低延时,和稳若磐石的网络传输力,让更多交互奇迹由而发生。


AliRTC 极致技术的普惠之光—“零处理”时代顺势而来


Cloud ME 的技术实现,核心依托于阿里云视频云曾提出的 AliRTC“零处理”解决方案,即通过“云处理+端渲染”技术,让硬件端只进行简单的采集,传输,播放,同时,所有的复杂工作全部集中在云上完成,让终端实现“零处理”。


这是百年奥运史上,第一次利用云上全息 RTC 技术,实现跨场景远程会面的技术应用,在疫情期彻底打破了物理空间隔阂。通过 Cloud ME,可将运动员、赛事工作人员、志愿者和媒体朋友们“瞬移”到指定地点,实时交互沟通。


湖南卫视《新闻大求真》栏目主持人在体验 Cloud ME 的过程中,就将北京冬奥会现场的志愿者”瞬移“到”节目现场“,进行“面对面”的超级采访,实现了时空同步。来自清华大学的志愿者许雯钧说道:“这感觉就像我们面对面交流一样!”。


湖南卫视《新闻大求真》栏目对Cloud ME进行现场体验与节目采访


阿里云视频云的 “ Cloud ME” 既可以应用在奥运会场景下,也可以在奥运会之外,向更多参与者和球迷广泛开放,让他们在虚拟现实中体验真实、沉浸、趣味的全息交互,真正开启百年奥运的新内容与新交互。


不仅如此,基于阿里云 RTC 的全球部署,还可实现“一地上线,多地同步互动呈现”的场景景象,拥有“分身不再乏术”的现象级能量。


事实证明,RTC 音视频通信是一项有助于世界有效连接的关键技术。借助阿里云的全球网络和视频云的智能算法,阿里云视频云旨在将音视频通信能力带入更广泛的应用场景中,不仅在互动娱乐、智慧教育、视频会议,还有更多更具价值的企业服务和更具想象力的沉浸交互场域。


从图文到音视频,社会的第一次交互变革发生于 2014 年,而 RTC 技术在 2017 年驱动了互动视频技术和在线互动商业的颠覆性发展。随着 5G 技术的发展还会带来新一轮的交互演进,如 VR 远程协作、虚拟现实互动等。



在云厂商中,阿里云视频云曾率先提出“云处理+端渲染”技术,通过实时通信与云上处理的技术结合,前瞻性地解决了新交互体验因端侧算力受限而无法实现的虚拟交互场景难题,推动终端“零处理”时代顺势而来,而 Cloud ME 即是阿里云视频云在这一领域的创新实践。



未来,AliRTC 会充分利用云端一体的混合计算能力,助力更多创新场景的商业化落地,例如全息演唱会、虚拟演唱会、创新云展会,全息交互娱乐等等,让场景向更低延时、更沉浸交互的极致化体验演进。


RTC 是技术,科技是工具,而其所有的终点,是人文涵蕴的温暖,那是打破尔疆我界的无形之力,是人与人、人与物、人与世界彼此存在的咫尺之间。


期待 Cloud ME,期待 AliRTC,期待未来。




「视频云技术」你最值得关注的音视频技术公众号,每周推送来自阿里云一线的实践技术文章,在这里与音视频领域一流工程师交流切磋。公众号后台回复【技术】可加入阿里云视频云产品技术交流群,和业内大咖一起探讨音视频技术,获取更多行业最新信息。

发布于: 刚刚阅读数: 2
用户头像

公众号:视频云技术 2020.10.20 加入

「视频云技术」你最值得关注的音视频技术公众号,每周推送来自阿里云一线的实践技术文章,在这里与音视频领域一流工程师交流切磋。

评论

发布
暂无评论
揭秘2022冬奥黑科技,阿里云视频云「Cloud ME」如何实现全息会面?