恒源云 (Gpushare)_ 今日炼丹小疑问:如何给数据加权重?
文章来源 | 恒源云社区
原文地址 | 【炼丹保姆】
原文作者 | 阿洲
时间:2022 年 5 月 6 号
心情:崩溃边缘
原因:居家隔离一月有余……且解封不知何时……
算了,我摊牌了,我开始摆烂了!
因为心情💢不好,所以工作消极!
挑个简短精干的帖子分享,你们爱看不看🙈,就是这么拽🕶️
来吧,展示🀄️:
准备工作:
复制代码
生成数据
复制代码
生成权重
复制代码
数据封装
复制代码
实验 A: 加权分配使用 replacement (样本可重复使用)
复制代码
实验 B: 加权分配不使用 replacement (样本不可重复使用)
复制代码
实验 C: 简单随机分配
复制代码
结论
使用 WeightedRandomSampler 并且允许样本重复使用的话基本可以保证样本的均衡采样。
评论