数据增强(二)-SamplePairing
1.背景
在数据增强(一)中介绍了 imgaug 图像增强库,本文介绍 SamplePairing 的数据增强策略。
参考文献:Data Augmentation by Pairing Samples for Images Classification
2. 内容
2.1 增强策略
训练集中任一的图片 A(256x256, 标签为 A),经过
普通增强
后随机 patch 出 224*224 的区域随机选择(256x256,标签为 B)的图片 B,也经过
普通增强
后随机 patch 出 224*224 的区域patch 部分像素平均:(patch A + pathc B)/2
新合成的 A(256x256 标签为 A) 参与训练
关键点:合成后的图像保留标签 A 不变,不考虑标签 B 的部分;但是合成的数据中既有标签 A 也有标签 B 的数据,训练中会存在会存在训练误差和验证误差降低的情况; 所以需要再最后不使用 SamplePairing 增强情况,做 finetune 后的效果要高于训练中没有 SamplePairing 增强的训练;
2.2 训练步骤
without SamplePairing: 先按照
普通的数据增强
策略训练若干 epoch(如 100 个 epoch)enable SamplePairing: 接下来的 8 个 epoch
SamplePairing增强
+2 个 epoch普通增强
, 执行若干个组合 (enable SamplePairing for 8 epochs and disable it for the next 2 epochs)disable the SamplePairing as the fine-tuning: 执行
普通的数据增强
策略最后训练若干 epoch。
2.3 实现细节
3.结语
本实验介绍了 samples pair 的数据增强策略,通过随机叠加两个图片的方式来形成一个强的正则化器, 提高模型的泛化能力。
希望对大家有帮助。
版权声明: 本文为 InfoQ 作者【AIWeker-人工智能微客】的原创文章。
原文链接:【http://xie.infoq.cn/article/bed6cdd877cb3f75cf5755f02】。文章转载请联系作者。
评论