学界 VS 工业界:深度学习究竟能不能打破视频编解码天花板
智能手机的普及降低了音视频创作的门槛,短视频以不同于文字的视觉呈现与信息表达,受到普通人的青睐,也成为企业数字化转型的重要入口。
2016 年以来直播市场的爆发,将图像、语音信息的全面数字化进一步向前推进。对于早期的流媒体直播而言,1080P 是完全可接受的高清直播;而在今天,譬如在冬奥会这样的直播场景下,8k 高清直播开始被一些平台作为卖点。
我们亟需改良传统的音视频技术,以应对 5G 时代下视频体积过大的问题。与此同时,人们对交互体验提出更高清、更沉浸、更低延时的要求,也促使行业对 H.266、AV1 等标准的编码器不断优化迭代的需求变得更为迫切。
然而相比于迭代极为迅速的深度学习,音视频编解码技术发展至今二十余年,正面临着发展缓慢、创新成本高且收益慢等诸多挑战。于是,深度学习+编解码成为行业探索的路径之一。
深度学习有可能在未来给音视频行业带来颠覆性变革吗?伴随人工智能技术的日益成熟,音视频技术的未来又将如何发展?
作为国内独树一帜的内容社区,截至 2021 年 10 月,小红书月活跃用户数已经超过 2 亿。广泛、真实、高实时的用户场景,海量的音视频笔记,丰富且复杂的用户观看行为数据,创造了小红书在音视频应用上的独特优势。目前小红书音视频团队吸纳了来自国内外的顶尖技术人才,也在不断携手行业及院校,探索技术新趋势,比如最新一期【REDtech 来了】就将带来音视频主题分享。
7 月 27 日 19:00,由小红书技术团队出品的直播节目【 REDtech 来了】邀请到了国内音视频领域的顶尖专家——北京大学计算机学院副研究员王苫社,他将就“视频编码的过去、现在和未来”做主题分享。
2020 年,王苫社凭借超高清视频多态基元编解码关键技术摘得国家技术发明奖一等奖。他工作于数字视频编解码技术国家工程实验室,主持了“面向 8K 超高清视频应用的高效编码标准及编解码器”等多个国家重点研发计划。
此外,王苫社师从于中国工程院院士高文。高文院士潜心研究视频编解码关键技术 19 年,牵头制定了具有自主知识产权的 AVS 系列标准。他负责的数字视频编解码技术国家工程实验室引领了我国数字视频产业实现从核心技术空白到国际领先的巨大跨越,为行业发展输送了大量技术中坚。
小红书音视频架构负责人陈靖则将以小红书的实践为例,介绍音视频技术在工业应用领域的落地挑战、创新实践与发展探索。
陈靖曾担任 51Talk 首席音视频科学家、Google Chrome Media 视频组工程师、Mindspeed 视频部高级 DSP 工程师、华为中央研发部视频组工程师,先后出版著作《深入理解视频编解码技术》及翻译著作《计算机视觉算法:基于 OpenCV 的计算机应用开发》。
王苫社和陈靖还将围绕音视频技术的发展困境、深度学习与音视频技术结合的可能性等话题展开深度对谈:
l 音视频新型技术探索上,工业界与学术界存在哪些分歧?
l 深度学习是否会颠覆视频编解码?
l 音视频的下一个风口在哪里?
l 新一代编解码标准将由谁定义?
l 流畅性、海量并发等痛点问题是否会迎来技术拐点?
l 追求超高清带来了哪些视频压缩算法的改进?
注意事项:
时间:2022 年 7 月 27 日(周三)19:00-20:30
直播平台:关注【小红书技术 REDtech 】微信公众号与视频号,预约直播,不见不散。
扫描上方二维码进入直播交流群,第一时间获取直播链接及开播提醒。
我们将在微信群内发布直播链接、嘉宾演讲精华和抽奖活动, 参与互动提问还有机会被嘉宾 pick 解答哦。
小红书现已开启 REDstar 顶尖技术人才招聘计划,点击下方链接,立刻了解:
评论