ModelArts 黑科技揭秘|模型智能评估、诊断,让模型来个“体检
摘要:华为云 AI 开发平台 ModelArts 黑科技加持 AI 研发,让模型开发更高效、更简单,降低 AI 在行业的落地门槛。全面的可视化评估以及智能诊断功能,使得开发者可以直观了解模型各方面性能,从而进行针对性的调优。
今年,全新发布的华为云 ModelArts 备受关注,创新黑科技成为 AI 界团宠。
模型构建一直是 AI 落地行业遇到的挑战之一,尤其是如何对即将部署上线的模型进行评估和诊断,以确保研发是否满足业务需求,保证 AI 产品的质量水平,让评测结果优秀的模型直接投入生产环境,对差强人意的模型进行调优。
华为云 AI 开发平台 ModelArts 黑科技加持 AI 研发,让模型开发更高效、更简单,降低 AI 在行业的落地门槛。全面的可视化评估以及智能诊断功能,使得开发者可以直观了解模型各方面性能,从而进行针对性的调优。
全方位为 AI 模型体检,降低 AI 研发门槛
长期以来,模型调优通常过于依赖数据科学家或算法工程师的个人经验,这就导致开发一个最优 AI 模型门槛高、代价大。另一方面,除了模型精度等常用指标之外,要将模型部署在生产环境,就必须考虑其性能、可解释性、鲁棒性、抗攻击性等其他指标。对于大多数数据科学家或算法工程师而言,这些指标的分析和优化并不是非常直观。这就导致 AI 模型进入生产环境困难重重。
为了解决上述两方面的问题,华为云 ModelArts 通过平台内置的工具帮助用户自动分析和评估出模型的各项指标,相当于生成模型的“体检报告”,并给出优化建议,用户可根据优化建议进一步提升模型效果或者决定是否将其部署到生产环境。
模型评估诊断更智能,调优更具针对性
ModelArts 可提供精度、敏感度、计算性能、对抗性等指标的分析和诊断,并辅助热力图、抽象特征分布等手段便于理解模型和数据分布情况。
1.可视化呈现样本预测值和真实值,数据分析更直观
在精度方面,ModelArts 提供了混淆矩阵、ROC 等常用指标,将每个样本的预测值和真实值可视化呈现,便于用户基于原始数据进行深入分析。例如花卉识别场景,由于花卉种类繁多,同一类别下花卉差异性小,对 AI 模型的精度要求就会更高。ModelArts 对图像识别模型精度进行精确评估,保证花卉识别的准确性。
基于 ModelArts 的图像分类模型预测结果展示
2.切分数据集细化模型敏感度分析,优化建议更聚焦
在敏感度分析方面,ModelArts 根据数据集的一些基础特性(例如图像的亮度、清晰度等特征,或者文本的长度等特征)将原始数据集切分为不同的子集,然后在不同的子集上评估模型的精度指标,即可分析出该模型对于不同特征的敏感度,进而为模型优化提供方向。当图像亮度对模型精度影响波动比较大时,需要再重训练时对亮度进行增强。
基于 ModelArts 的抽象特征敏感度分析及其诊断建议
3.深入 AI 底层系统算子优化,具象化模型计算性能分析
在计算性能方面,ModelArts 可针对常用框架训练的模型进行细粒度性能分析,可以分析出算子的推理时长和参数量分布,为算子优化和模型压缩提供方向。
基于 ModelArts 的模型计算性能分析
4.内置多种攻击算法,多维度评估模型对抗性
在对抗性评估方面,ModelArts 内置了多种攻击算法,针对模型进行攻击并输出攻击成功率以及被攻击后的模型的精度指标,如图 4 所示。根据诊断建议,可以发现模型在某些类别上更容易受到攻击,可以通过进一步的数据增强来优化。对于模型中潜在的容易受到攻击的算子,ModelArts 也可以自动做出相应的提示。从图 5 中,可以看出,被攻击后 ROC 曲线明显不如被攻击之前。因此,不建议该模型直接部署到生产环境,而需要先根据 ModelArts 诊断建议进行进一步优化。
图 4. 基于 ModelArts 的模型对抗性攻击评估和诊断
(a)
(b)
图 5. 模型被攻击前(a)和被攻击后(b)的 ROC 曲线
三大场景智能评估和诊断,模型调优有的放矢
目前,模型智能评估与诊断支持三种类型的模型和数据集,“图像分类”、“物体检测”和“语义分割”,让用户全面了解模型对不同数据特征的适应性,使得模型调优可以做到有的放矢。
假如要对五类食品的图像进行分类,使用 ModelArts 市场订阅的 ResNet_V1_50 算法训练,第一次训练得到的模型在测试集上进行评估,精度为 54.8%,在敏感度分析中,可以发现模型对图像亮度的敏感度非常大,不同亮度区间里模型精度的方差达到 0.249,建议进行亮度方面的数据扩增。
扩增数据后重新训练模型,使用相同测试集进行模型评估,精度上升到 63.4%,不同亮度区间里模型精度的方差下降到 0.217。
在对安全帽的检测任务中,使用 ModelArts 市场订阅的物体检测-EfficientDet 算法训练,在验证集上获得 74.8%mAP。
根据建议进行数据扩增,点击二次训练按钮,推荐的训练参数会自动加载到新的训练任务中。
训练结束后,查看评估结果,验证集 mAP 有显著提升。
华为云 ModelArts 的黑科技功能不止于自动化模型评估与诊断功能。运用 ModelArts,机器狗可以实现工业巡检,自动识别火情、规划路径、关闭火情按钮;雨林保护组织里的护林员可以更好地保护蜘蛛猴等濒危动物;同济大学的学生们基于 ModelArts 平台建立了一套湿地数字孪生系统帮助杭州湾的候鸟得到更好的保护和科研……后续将为大家带来更多 ModelArts 创新技术揭秘。
华为云 ModelArts 通过持续创新,打造最强 AI 黑科技,使 AI 可以更好地进入生产生活,加速 AI 在产业的落地和深入,扩大 AI 应用的覆盖面,进一步释放 AI 技术红利,让更多企业可以借力 AI 进行转型升级。
版权声明: 本文为 InfoQ 作者【华为云开发者社区】的原创文章。
原文链接:【http://xie.infoq.cn/article/91e64a6f70fcc8ed8cea395e8】。文章转载请联系作者。
评论