写点什么

AI 简报:Blind 超分 KernelGAN

  • 2022 年 5 月 13 日
  • 本文字数:1003 字

    阅读完需:约 3 分钟

AI简报:Blind超分KernelGAN
  • Blind Super-Resolution Kernel Estimation using an Internal-GAN

  • https://arxiv.org/abs/1909.06581

  • https://github.com/sefibk/KernelGAN

1. 意图或目的

超分(Super-Resolution)是从低分辨率图 LR 中恢复到高分辨率图 HR。为了构造配对的数据集,通常会在 HR 图做各种降质的操作,如高斯模糊,下采样,噪声以及压缩等,之后生成 LR 与 HR 的配对数据进行训练模型。如下图所示,Ks 为模糊核。



问题在于各种降质操作后图片是否和测试的图片(即真实环境中的低质图像)是在同一分布的,是否是 match 的,答案往往是否定的,这就造成按照降质操作后模拟的低质图像训练出来的模型,在真实低质图像上效果差强人意。这就在传统超分中衍生出针对真实图片(Real Image)的 Blind Super-Resolution, 也称作 Real Super-Resolution;这里 Blind 指的就是降质操作是未知的。


这篇 KernelGAN 就是 Blind Super-Resolution 的领域的一种解决方案。主要是针对上面降质的模糊核 Ks 进行估计。

2. 思路

既然 Real Image 与人为降质 mismatch,那能不能学习这种分布? 众所周知,GAN 是学习数据内部分布的良器。


所以,KernelGAN 的思路可以简单概括为:


  • 用 GAN(patchGAN)的生成器 G 来模拟 2 倍下采样后的图片,使得判别器无法区分从原图中裁剪的图片,以此来说明生成器 G 模拟了原图中的数据分布

  • GAN 中的判别器采用的 PatchGAN,即 label 并不是一个值,而是对应原图一定感受野每个特征像素都有一个 label

  • KernelGAN 最终要从生成器 G 网络中,合成一个显式的 kernel;以此作用于用来训练的 HR 来生成配对 LR 进行有监督的训练


2.1 生成器 G 和显式的 kernel 合成


生成器 G 是一个下采样的网络,输入尺寸为 64x64,输出为 32x32,由 6 个卷积层组成。


the generator G constitutes, implicitly, the ideal SR downscaling function for the specific LR image.


可以把生成器本身看成是隐式的模糊核,为了生成显式的模糊核,文章中将生成器 G 中所有的卷积核依次进行卷积操作,得到最终 SR kernel。 为了更好的获得有效的 SR kernel,文章对于合成的 SR kernel 进行了限制,主要体现 loss 设计上。

2.2 判别器 D

判别器的输入为 32x32,是全卷积网络,包含 6 个卷积层,有 7x7 的卷积核和 6 个 1x1 卷积核。


2.3 loss

kernelGAN 采用 LSGAN 的 loss,加上前面对于合成 kernel 的正则限制 R



R 限制如下:


  • kernel 权重和为 1

  • 鼓励 kernel 的稀疏防止过度模糊

  • 抑制边界非零值和鼓励适当的 k 个中心点


3. 训练

  • 优化器:ADAM(0.5, 0.999)

  • 学习率:2e-4,每 750iters 下降 0.1

  • 迭代次数:3000

4. 结果






发布于: 58 分钟前阅读数: 6
用户头像

公众号:人工智能微客(weker) 2019.11.21 加入

人工智能微客(weker)长期跟踪和分享人工智能前沿技术、应用、领域知识,不定期的发布相关产品和应用,欢迎关注和转发

评论

发布
暂无评论
AI简报:Blind超分KernelGAN_人工智能_AIWeker-人工智能微客_InfoQ写作社区