写点什么

老电影和图片变清晰的秘密!分辨率提升 400% 的 AI 算法

作者:百度大脑
  • 2021 年 12 月 08 日
  • 本文字数:1322 字

    阅读完需:约 4 分钟


如上图, 从 100x133pix→400x532pix,除了肉眼可见的清晰,拥有可以将分辨率提升 400%的技术到底意味着什么?

它意味着:

  • 老照片、老电影、动漫等画质可快速提升,分辨率自由调节

  • 产业算法效果可以随着数据质量的提升大幅提高

  • 在网络信号较差时,也能快速查看高清视频或图片

  • 影像传输带宽与存储空间大幅压缩,传输成本也将大大减少






▲ 图片引用自公开数据集[1][2][3]

让世界变得更清晰的不是魔法,而是一项被称为超分辨率提升的技术(简称「超分」),能够将低分辨率的图像、视频,通过特征提取、特征融合、图像重建与上采样(Pix-Shuffle),恢复并补足丢失的信息,最终重建成高分辨率的图像、视频。

超分的实现路径有很多种,而峰值信噪比 PSNR32.53、结构相似度 SSIM0.9083 的视频超分算法 PP-MSVSR,以其卓越的性能达到业界 SOTA!

话不多说, 直接看 PP-MSVSR 在视频超分权威数据集上与其他算法性能(峰值性噪比、结构相似度)的对比图表:




如图所示,PP-MSVSR 提供了 1.45M 和 7.4M 两种参数量大小的模型,峰值信噪比与结构相似度均高于其他开源算法,同时还保持了参数量较小。也就是说,PP-MSVSR 在对分辨率提升效果达到最细腻的情况下,还保持体积小的优势,是真正意义上的高性能、低成本,并且 PP-MSVSR 还不限制输入视频的分辨率,支持分辨率一次提升 400%,将超分自定义做到了极致,给大家无限想象空间。

PP-MSVSR 的源码与教程也已经开源至 PaddleGAN 项目,除了视频超分,PaddleGAN 中也提供业界领先的单张图片超分系列算法。

心动不如行动,赶紧 Star⭐收藏上手试试吧~

https://github.com/PaddlePaddle/PaddleGAN/blob/develop/README_cn.md



下面,让我们详细来看看 PP-MSVSR 超分算法到底是如何解决实际问题的吧!

 1、将老电影从模糊变清晰,实现影像修复 

在文娱领域,如社交、新闻媒体、电商等行业,常常涉及到对于视频的增强与编辑,PP-MSVSR 的表现着实可圈可点。




 2、通过提升训练数据的清晰度,提升算法精度 

无论是目标检测、图像识别,还是图像分类、语义分割等 CV 相关任务,训练数据质量的好坏对于最终任务效果影响都极大。因此,开发者可尝试通过 PP-MSVSR 将任意分辨率下的视频数据提升至理想分辨率,实现下游的检测、识别、分割等任务的准确率有效提升。



▲ 图片引用自公开数据集[4][5]

 3、降低视频网络传输成本 在终端使用算法对分辨率进行恢复提升 

在这个对清晰度有着极致追求的时代,视频的存储与传输成本越来越高,比如,传输 4K 信号,一天的传输成本至少大几千元,要想给成本来个「大降低」,就必须从存储与传输下手。

在视频超分的助力下,视频云端存储空间可大幅降低,进一步降低视频 CDN 传输带宽,同时提高视频传输速度,也就意味着,在存储的空间、传输的成本大大下降的同时,视频传输的速度也得到显著提升!



PP-MSVSR 这么有用,他的使用复杂嘛?答案是:完全不!仅一行命令即可实现分辨率的提升!




▲ 图片引用自公开数据集[1]

除了 PP-MSVSR 详细、完整的实现代码、预训练模型及文档教程外,飞桨生成对抗网络开发套件 PaddleGAN 还提供了图像生成、唇形合成、人脸融合等丰富的前沿 GAN 相关能力与应用,还在等什么,赶紧 Star⭐上手试试吧!

https://github.com/PaddlePaddle/PaddleGAN/blob/develop/README_cn.md

发布于: 3 小时前阅读数: 6
用户头像

百度大脑

关注

用科技让复杂的世界更简单 2020.07.15 加入

百度大脑是百度技术多年积累和业务实践的集大成,包括视觉、语音、自然语言处理、知识图谱、深度学习等 AI 核心技术和 AI 开放平台。 即刻获取百度AI相关技术,可访问 ai.baidu.com了解更多!

评论

发布
暂无评论
老电影和图片变清晰的秘密!分辨率提升400%的AI算法