老电影和图片变清晰的秘密!分辨率提升 400% 的 AI 算法

如上图, 从 100x133pix→400x532pix,除了肉眼可见的清晰,拥有可以将分辨率提升 400%的技术到底意味着什么?
它意味着:
老照片、老电影、动漫等画质可快速提升,分辨率自由调节
产业算法效果可以随着数据质量的提升大幅提高
在网络信号较差时,也能快速查看高清视频或图片
影像传输带宽与存储空间大幅压缩,传输成本也将大大减少




▲ 图片引用自公开数据集[1][2][3]
让世界变得更清晰的不是魔法,而是一项被称为超分辨率提升的技术(简称「超分」),能够将低分辨率的图像、视频,通过特征提取、特征融合、图像重建与上采样(Pix-Shuffle),恢复并补足丢失的信息,最终重建成高分辨率的图像、视频。
超分的实现路径有很多种,而峰值信噪比 PSNR32.53、结构相似度 SSIM0.9083 的视频超分算法 PP-MSVSR,以其卓越的性能达到业界 SOTA!
话不多说, 直接看 PP-MSVSR 在视频超分权威数据集上与其他算法性能(峰值性噪比、结构相似度)的对比图表:


如图所示,PP-MSVSR 提供了 1.45M 和 7.4M 两种参数量大小的模型,峰值信噪比与结构相似度均高于其他开源算法,同时还保持了参数量较小。也就是说,PP-MSVSR 在对分辨率提升效果达到最细腻的情况下,还保持体积小的优势,是真正意义上的高性能、低成本,并且 PP-MSVSR 还不限制输入视频的分辨率,支持分辨率一次提升 400%,将超分自定义做到了极致,给大家无限想象空间。
PP-MSVSR 的源码与教程也已经开源至 PaddleGAN 项目,除了视频超分,PaddleGAN 中也提供业界领先的单张图片超分系列算法。
心动不如行动,赶紧 Star⭐收藏上手试试吧~
https://github.com/PaddlePaddle/PaddleGAN/blob/develop/README_cn.md

下面,让我们详细来看看 PP-MSVSR 超分算法到底是如何解决实际问题的吧!
1、将老电影从模糊变清晰,实现影像修复
在文娱领域,如社交、新闻媒体、电商等行业,常常涉及到对于视频的增强与编辑,PP-MSVSR 的表现着实可圈可点。


2、通过提升训练数据的清晰度,提升算法精度
无论是目标检测、图像识别,还是图像分类、语义分割等 CV 相关任务,训练数据质量的好坏对于最终任务效果影响都极大。因此,开发者可尝试通过 PP-MSVSR 将任意分辨率下的视频数据提升至理想分辨率,实现下游的检测、识别、分割等任务的准确率有效提升。


▲ 图片引用自公开数据集[4][5]
3、降低视频网络传输成本 在终端使用算法对分辨率进行恢复提升
在这个对清晰度有着极致追求的时代,视频的存储与传输成本越来越高,比如,传输 4K 信号,一天的传输成本至少大几千元,要想给成本来个「大降低」,就必须从存储与传输下手。
在视频超分的助力下,视频云端存储空间可大幅降低,进一步降低视频 CDN 传输带宽,同时提高视频传输速度,也就意味着,在存储的空间、传输的成本大大下降的同时,视频传输的速度也得到显著提升!

PP-MSVSR 这么有用,他的使用复杂嘛?答案是:完全不!仅一行命令即可实现分辨率的提升!


▲ 图片引用自公开数据集[1]
除了 PP-MSVSR 详细、完整的实现代码、预训练模型及文档教程外,飞桨生成对抗网络开发套件 PaddleGAN 还提供了图像生成、唇形合成、人脸融合等丰富的前沿 GAN 相关能力与应用,还在等什么,赶紧 Star⭐上手试试吧!
https://github.com/PaddlePaddle/PaddleGAN/blob/develop/README_cn.md
版权声明: 本文为 InfoQ 作者【百度大脑】的原创文章。
原文链接:【http://xie.infoq.cn/article/061f2a5207b50e89097b7e1d4】。文章转载请联系作者。
评论