快手 StreamLake: 构建大算力基础设施体系, 应对视频和大模型挑战
8 月 24 日,2023 浪潮信息新产品“互联网+AIGC”行业巡展暨大模型智算软件栈 OGAI 发布会在北京举办。作为浪潮合作伙伴,快手 StreamLake 深入参与此次大会,快手异构计算负责人刘凌志博士进行了《“芯”驱动:释放智能视频之力》主题演讲,重点分享了快手 SL200 芯片的最新进展,介绍了智能视频 SOC 芯片的典型架构和主要功能,以及基于此芯片搭建的智能视频处理云端基础设施,展示在多种场景所表现的优异性能,并在圆桌论坛环节与嘉宾们探讨了如何与上下游企业进行深度合作。
构建大算力基础设施体系,应对视频和大模型挑战
伴随快手用户、内容、商业生态的快速发展,AI 特效、AI 数字人等应用在快手广泛落地。在 AI 大模型进入 AGI 时代的过程中,快手紧跟大模型应用浪潮,在搜广推场景、内容创作、提高研发效能等方面持续深耕大模型领域,并于近期发布了“快意”大语言模型,在 CMMLU 中文向排名中,KwaiYii-13B 同时位列 five-shot 和 zero-shot 第一。
刘凌志指出,大模型在音视频上的应用更加复杂。根据音视频第一性的原理,音视频主要是要解决清晰度、成本和流畅度三个问题,需要在这三者之间做到平衡。在此过程中,处在核心地位的就是视频的压缩和增强。
快手的大模型和视频编解码如何结合?刘凌志表示,在传统生产和消费的过程中,生产端视频首先经过编码器产生码流并传送到消费端,消费端通过解码器把视频解码出视频展示出来。利用大模型来做视频压缩和增强,视频通过理解网络生成出高维特征,并传输 Text 和 Prompt,这是一个非常小的信息量,用户通过生成网络大模型再把视频恢复出来,这样可以极大地减少传输成本,得到更好的效果。
在刘凌志看来,快手在大模型和视频领域面对的挑战归根到底是大算力的挑战,包括视频算力挑战和大模型算力挑战两个方面。
快手又是如何解决这两大挑战中的各类问题?刘凌志表示,快手构建了大规模的基础设施,来支撑主站、电商、商业化、本地生活和海外在内的产品矩阵。快手核心技术包括音视频、AI 和数据中心三大类,每一类技术都需要十分庞大的基础设施,比如千万级别的 CPU 核、10 万级别的 GPU 和算力、10EB 级别的数据存储,带宽需求也到了 100TB 规模。
为此,快手搭建了大模型架构体系。通过 AI 算力中心、平台、数据等高性能、高并发、高算力的大基建,可以支撑快手多模态大模型,而多模态大模型通过生成或理解,可以支持快手的搜广推、AIGC、增长或研发效能等大应用。
更进一步来看,快手 AI 大基建的数据已有日均数千万的短视频和数千万小时的直播,一方面是传输给用户,另一方面也是作为输入持续不断的输送到大模型之中,不断打磨大模型,达到更佳的效果。刘凌志强调,“更重要的是,我们在算力中心里面进行了比较深入的开发,这个深入开发最终体现在自研芯片 SL200 上。”
首款智能视频处理芯片,SL200 节省 30%码率,支持 8K 应用
作为快手 StreamLake 首款自研智能视频处理芯片,快手 SL200 芯片具有非常优秀的视频效果。提及该款芯片可以做哪些工作,刘凌志表示,SL200 芯片首先是高质量、高密度的编解码器。比如,把快手自研的算法固化到硬件中,作为一个硬件的视频处理引擎;高质量的编码器在同样的质量下,可以节省 30%的码率,在同样的带宽下,可以提升相应的清晰度。依托 SL200 芯片,不仅自然场景视频能够获得非常好的效果,较难处理的游戏、数字人等场景也会得到非常显著的清晰度的提升。
同时,刘凌志指出,SL200 也已实现了智能视频的处理,这在未来视频领域尤其重要,在同样主观质量下,可以继续降低 20%以上的带宽。比如把感兴趣的区域找出来,然后对它投入更多的带宽,而对不感兴趣的地方可以降低清晰度以平衡带宽。传统视频的任务,如去模糊、降噪、去视频效应等,除了可以用自己硬件的传统算法来做,也可以用 AI 获得更好的效果,并且可以二者在流水线上进行叠加获得叠加的效果。SL200 芯片在其他智能视频应用中也展示优异性能,比如超分,可以实时的把一个小的幅面放大到 4K/8K,或者是大的变小;在视频内容识别和检测应用中,SL200 有较高的处理速度,准确率也是比较高的。
据悉,具备高质量、高性能、智能化特点的快手 SL200,已达到行业领先的压缩效率,客观质量相比 X265 medium 可以节省 30%码率,单卡可以支持 8K120 帧/秒的处理或者 8 路 4K60 帧/秒的处理,内置智能画质处理引擎,支持内容自适应编码。
刘凌志认为,从芯片设计来看,进入到智能视频时代,需要的是一个具有多种功能的 SOC 芯片。这就要求芯片不仅要有高质量高密度的编解码器,还需要有能够支持实时视频处理的 AI 引擎。另外,为了支持未来视频算法的迭代,需要有较强的可编程的能力,所以 SL200 集成了多核 GPGPU 和高性能多核 CPU,RISC-V 处理器,以及数据中心里面的功耗检测、温度检测等功能,为了保护用户的隐私也需要内嵌硬件安全模块。
SL200 芯片也获得了业内高度认可,在今年 7 月举办的 MSU2022 世界编码器大赛中,SL200 一举夺得 4K 和 1080P 赛道 24 项指标中的 16 项第一,在全部 6 个赛道中获得 5 项“最佳 ASIC 编码器”。
刘凌志透露,基于 SL200 芯片,快手自研了板卡、服务器,也与浪潮等合作开发了云服务器,同时搭建了算力中心,开发了全套自主软硬件的生态系统,已经在快手部署了数万片,并在各大公有云厂商进行测试。快手 StreamLake 持续通过成熟的技术赋能产业,并与浪潮等生态伙伴深入合作。
活动现场,快手 StreamLake 还围绕芯片、快手智播等核心产品进行了重点展示,向现场嘉宾展示了产品的广泛应用场景。
据悉,基于浪潮与快手 StreamLake 的深度合作,双方将在硬件生态等领域携手发展,布局算力未来。刘凌志表示,快手 StreamLake 希望通过卓越的技术能力,能够更好地助力各行各业在智能视频新时代、大模型新时代获得成功。
评论