写点什么

多元融合成为音视频技术发展新风向

作者:中关村科金
  • 2023-04-21
    北京
  • 本文字数:3464 字

    阅读完需:约 11 分钟

近年来,随着 5G、云计算、人工智能等技术的日臻完善,行业数字化转型进入深水区,音视频技术在各种应用场景下全面开花。银行业,作为关系到国计民生的重要行业,历来是数字化转型的排头兵。因此,在众多银行业务场景深度融合音视频技术,推动业务创新和服务转型成为必然。对于音视频技术在银行业应用的现状、未来发展趋势等问题,中关村科金智慧视频事业部总经理李超在 LiveVideoStackCon 期间对 CSDN 分享了他的看法。


李超 中关村科金智慧视频事业部总经理

三个阶段,音视频技术推动银行交互体验升级

技术和需求的关系与“鸡生蛋”还是“蛋生鸡”的逻辑一样,这一条也适用于银行业务需求和音视频技术发展。李超认为,银行业务需求的不断变迁与音视频技术的发展是相辅相成、互相成就的。一方面,音视频技术保障了银行业务场景的安全性、合规性与稳定性,另一方面,银行业务需求的变迁进一步推动了音视频技术的发展以及音视频技术与更多新场景、新技术(例如 AI)的融合。随着音视频技术的发展,银行业务正在不断借助音视频技术,推进沉浸式互动,实现交互体验全新升级。据此,音视频技术在银行业务场景的应用经历了三个阶段,从满足监管合规到满足业务发展,再到升级交互体验,塑造品牌科技感。

第一阶段,音视频能力阶段

该阶段并不具备实时音视频通信能力,主要是为了满足监管合规需求。典型场景为传统的录音、录像双录。将录音、录像的音视频内容录制完成后上传并存储,上传带宽较低且不具备实时通信、AI 质检等能力。

第二阶段,实时音视频通信阶段

该阶段可覆盖品牌宣传、业务线上办理等场景,主要是为了丰富业务办理方式,促进业务价值提升。通过视频直播、点播、视频通话等应用,赋能远程双录、视频客服、商户巡检等业务办理场景,打通线上业务宣传、办理、服务全链路。

第三阶段,视频银行阶段

该阶段通过搭建一个沉浸式、体验卓越、能充分互动,并且能进行业务交互的线上虚拟场景,有机地融合各种先进的数字化技术,如 VR、数字人、语音交互、声纹识别、AIGC 等。在该阶段中,除了满足业务发展需求外,银行更看重客户的交互体验和品牌的科技含量,以便在市场竞争中获得差异化优势。

总体来说,银行业务需求场景日益丰富,由少到多,对音视频技术的要求也越来越高,经历了由 WebRTC、实现多对多视频通话和直播,进而将视频互动能力与 IM 即时通信相叠加;AI 能力加持,逐渐升级为音视频+消息+互动+AI,实现更加智能的视频互动能力;融合多种互联网互动能力,叠加 AI 能力赋能业务,拓展更多业务使用场景。最终形成了融合通信能力,适用于不同的场景,连接人、设备、场景。

三大因素,银行业务需求促进音视频技术不断发展

银行科技部门作为业务创新的重要支撑力量,是最懂业务的技术人,一方面,他们在巩固和提升自身的技术实力,另一方面,积极寻找专业的技术服务合作伙伴。

在音视频领域,他们首选的合作伙伴必须是能够提供音视频中台能力,且让他们更便捷、稳定、可靠地接入音视频技术服务,以便他们可以有更多的时间专注于自身业务创新。那么,除此以外,还有哪些重要因素影响着银行的决策呢?据李超介绍,在环境、政策、转型三方面因素的综合作用下,银行业务需求正在不断推动音视频技术走向多元融合,包括多种音视频技术的综合运用、音视频+及多渠道集成等。

首先,环境影响

新冠肺炎疫情在对经济社会造成巨大冲击的同时,也在倒逼经济社会加快数字化转型。在银行数字化转型中,线上化、智能化是其中的重点;且在后疫情时代,银行加强线上服务的必要性愈加凸显,实时互动成为常态化需求。

其次,政策驱动

中国人民银行在《金融科技发展规划(2022-2025 年)》中提到,搭建多元融通的服务渠道。以线上为核心,探索构建新一代线上金融服务入口,持续推进移动金融客户端等数字渠道迭代升级,实现服务渠道多媒体化、轻量化和交互化,推动金融服务向云上办、掌上办转型;建立人与人、人与物、物与物之间智慧互联的服务渠道。

再次,数字化转型

完成数字化转型,打造数字化营销,提升交互体验。银行业务要依托数字化工具和手段,坚持以“价值创造”为战略导向。而音视频互动作为在特殊时期商业化传播效率最高的一种信息传递形式,内容传播更容易,社交属性更强,信息密度更高。依托音视频互动能力,将现有业务、服务能力迁移至线上,成为银行数字化转型中必不可少的组成部分。

同时,在业务发展过程中,随着新的业务形式的出现、业务体量的不断增长,对实时音视频通信的要求也越来越高。银行亟需高品质融合的通信能力,来满足各业务环节对音视频通信能力的不同需求,从而更好地为各部门赋能。这也就对音视频通信的能力提出了更高要求,因此银行迫切需要具备高可用、可扩展、私有化、易维护的专属音视频中台。

四项能力,中关村科金打造专属音视频中台

正是基于对银行业务需求的洞察和音视频中台能力的思考,中关村科金推出得助智慧视频中台(MetaIV)。据李超介绍,得助智慧视频中台(MetaIV)通过可集成、可定制的音视频技术,以多渠道、多场景、高并发、高性能、高可靠为标准,依托四项核心能力支撑清晰流畅的音视频互动服务体验,满足银行对于音视频互动的需求。


中关村科金得助智慧视频中台(MetaIV)

广泛的连接能力

得助智慧视频中台(MetaIV)广泛的连接能力包括支持弱网环境,伴随设备性能及网络环境变化,可实时动态自适应调节视频分辨率、帧率、码率,保持稳定的通话质量,延迟低至 80ms。在画面质量方面,支持 1080p 高清视频通话,完美还原真实环境,所见即所得,有效提高通话效率。在连接的广度方面,实现对银行内外部沟通链路的全覆盖,满足各业务模块的音视频应用需求。

极简的集成能力

得助智慧视频中台(MetaIV)充分考虑可集成性,能够支持各业务线技术研发快速调用。通过 SDK 组件的方式,灵活集成手机银行、网上营业厅、超级柜台、自助终端等不同渠道、不同业务线的不同类型的终端和场景。针对不同应用场景,重点推出音频降噪、多路混流、内容录制、内容存储、虚拟背景、智能组件等六款应用,以增强方案提升场景适配集成能力。

灵活的扩展能力

得助智慧视频中台(MetaIV)在基础音视频能力上进行灵活扩展,叠加 AI、虚拟人、云计算等能力,实现了一对多的灵活对接。以更加精细化的“技术+业务”的服务体系,使各业务线方便高效接入,无需再投入技术研发成本,只需专注精细化设计各自的业务能力。

完善的运维能力

得助智慧视频中台(MetaIV)还具备全链路监控能力,通过对服务全链路(从客户音视频呼叫到售后回访)、接入节点、网络状态、时延状态、设备状态等内外部因素进行实时监控,实现在音视频系统发生故障时能够对故障原因进行快速的判断与修复,显著提升后期运维效率,并降低运维成本。同时,平台采用高抗压架构,通过对等部署、分区和隔离,确保骨干网络故障无缝切换;流量暴增时,架构实时调整,终端用户无感知;全球节点部署,支持超大文件分发。

作为领先的对话式 AI 技术解决方案提供商,中关村科金得助智慧视频中台(MetaIV)及相关音视频技术解决方案已成功应用于近 100 家银行,包括中国邮政储蓄银行、中信银行、哈尔滨银行、贵阳银行等,覆盖银行售前、售中、售后全流程。除银行业外,还成功应用于信托、保险、消费金融、政务等多个行业。

以某国有大型银行为例,在完成得助智慧视频中台(MetaIV)的部署后,远程双录业务超预期地发挥了关键作用。2022 年部分省市受疫情影响较大,该行通过远程双录完成的业务量超过了 50%,整个过程均表现得清晰流畅,客户体验极佳。大型营销活动期间,音视频中台为远程双录场景提供了有效的支撑,短时间内远程双录录制提交的并发量急速增加,覆盖全国数万客户经理及几万个营业网点,部分省份线上业务占比甚至达到 50%以上,期间未出现因音视频通信质量造成的业务中断或业务投诉。

多元融合,视频银行将为行业刷新市场空间

从图文到视频,音视频产业跨越了传统的单点接收屏障,通过直播和互动的方式无限地接近消费者。多元的算力、云原生、AI、WASM 技术、AIGC 等能力与音视频技术的不断融合,伴随着低延迟、编解码、硬件结合等方面的优化,推动了音视频厂商不断增强互动性。

目前,各家银行已陆续着眼于视频银行的布局,以期建立竞争壁垒,其中包括搭建视频营业厅,构建视频直播间、视频理财室、视频会议厅、视频云工作室等,视频银行的普及将很快成为现实。

未来,随着视频银行的布局逐渐深入,音视频技术将与人工智能、虚拟数字人、虚拟营业厅等更多能力、更多场景进行多元融合,这也为行业提供了新的市场空间和发展机遇。而中关村科金在人工智能、音视频等领域多年的自研技术储备,将为银行提供更高质量、更稳定的视频银行建设服务。

用户头像

还未添加个人签名 2020-07-20 加入

还未添加个人简介

评论

发布
暂无评论
多元融合成为音视频技术发展新风向_实时音视频_中关村科金_InfoQ写作社区