写点什么

恒源云 (Gpushare)_ 炼丹萌新指南,这次错不了!

作者:恒源云
  • 2022 年 4 月 12 日
  • 本文字数:517 字

    阅读完需:约 2 分钟

恒源云(Gpushare)_炼丹萌新指南,这次错不了!

文章来源 | 恒源云社区


原文地址 | 【炼丹必备】


原文作者 | 阿洲




对于炼丹新人来说,我总结了一些实用技巧清单,每个技巧都将为一个目标服务,每个目标的排名分先后。

首要目标,让程序成功跑起来

核心思想是为了减少 debug 时间

case 1: 从 0 写起

  • 数据

  • 检查数据维度

  • 随机 Plot 数据看看

  • 分好训练集,验证集,测试集,严防数据泄露(比如测试集中有的数据在训练集中出现)

  • 确保数据封装过程不出错,比如忘了随机,出现类别不均衡等

  • 精简数据集,只用少量的数据集

  • 模型

  • 使用最简模型或尽量精简目标模型

  • 检查模型输入和输出

  • 检查 loss 计算是否准确

case 2: 复现别人公开的项目

  • 环境

  • 选对架构版本

  • 检查软件包版本

  • 选对 python 版本

  • 数据

  • 定位数据读取的代码

  • 检查数据存储读取路径

  • 检查数据维度

  • 随机 Plot 数据看看

  • 训练

  • 把 epoch 改成一个先

  • 检查模型存储位置

  • 测试

  • 查看结果存储类型

  • 检查实验结果存储位置

测试结果

  • 实验结果设计,尽量存储比较底层的数据,比如一个分类问题,尽量去存储每个样本的预测标签和实际标签,而不是准确率,因为前者可以算出后者,以及其他分析指标,而后者则不能。

  • 实验结果保存

  • 检查路径

  • 检查实验结果是否可覆盖,可修改

优化代码

  • 代码模块化

  • 注释

优化实验结果

这里只能指出大的方向,这个阶段给不了具体的指导了


  • 数据

  • 模型

  • 损失函数

  • 训练方式

  • 超参

用户头像

恒源云

关注

专注人工智能云GPU服务器训练平台 2020.12.25 加入

还未添加个人简介

评论

发布
暂无评论
恒源云(Gpushare)_炼丹萌新指南,这次错不了!_深度学习_恒源云_InfoQ写作平台