写点什么

模型推理耗时降低 98%!PaddleTS 又双叒叕带来重磅升级!

  • 2023-02-10
    北京
  • 本文字数:2494 字

    阅读完需:约 8 分钟

模型推理耗时降低98%!PaddleTS又双叒叕带来重磅升级!

大家好,飞桨时序模型库 PaddleTS 的重磅升级啦!今天为大家介绍带来的是 PaddleTS 此次升级的核心内容解读,快来看看有没有你所期待的新内容!


飞桨时序模型库 PaddleTS 具备统一的时序数据结构、全面的基础模型功能、丰富的数据处理和分析算子以及领先的深度时序算法,可以帮助开发者实现时序数据处理、分析、建模、预测全流程,在预测性维护、能耗分析、价格销量预估等场景中有重要应用价值。


近期,PaddleTSv1.1 版本重磅发布,带来了在模型推理、模型可解释性、新增模型算法等多方面的重要升级:


  • 更高效的推理部署:基于 Paddle Inference 实现高吞吐、低时延的推理部署,MLP 模型推理耗时降低 98%!

  • 新增时序分类模块:覆盖更多应用场景需求,让开发者一站式解决时序分类问题!

  • 提升模型解释能力:两种技术实现模型解释性,帮助开发者更好理解模型结果!

  • 表征学习支持分类与聚类:针对先进的表征学习,提供即开即用的表征分类与聚类模型,提高开发效率!

  • 扩充深度学习模型:增加更多时序预测与异常检测模型,帮助开发者探索更多的领先模型!


wps_doc_0.png


⬇️GitHub 传送门


https://github.com/PaddlePaddle/PaddleTS


⭐️欢迎 Star 关注⭐️


wps_doc_1.png

可利用 Paddle Inference 进行推理部署

Paddle Inference 是飞桨的原生推理库,作用于服务器和云端,提供高性能的推理能力。其针对不同平台不同的应用场景进行了深度的适配优化,提供了 C、C++、Python、Golang 四种 API,实现做到高吞吐、低时延的推理部署。同时,通过对计算图的分析,完成对计算图的一系列的优化,如 OP 的融合、内存/显存的优化、MKLDNN、TensorRT 等底层加速库的支持等。


PaddleTSv1.1 支持了原生飞桨 Paddle Network 模型的导出以及前序数据自动构建功能,实现 PaddleTS 模型在多系统、多语言、多平台的适配。开发者利用 Paddle Inference 即可完成推理部署,加速 PaddleTS 模型应用的最后一公里,保证了 PaddleTS 模型在服务器端即训即用,快速部署。


以 MLP 和 Informer 为例,使用 Paddle Inference 推理后,MLP 模型推理耗时降低约 98%,Informer 模型推理耗时降低约 50%。


wps_doc_2.png


  • 🚗直通车


https://paddlets.readthedocs.io/zh_CN/stable/source/modules/models/paddle_inference.html

增加时序分类模块

时间序列分类是时序预测任务中的一种,其目的是利用标记好的训练数据(每个时间序列所属类别),预测未来时间序列的分类,从而指导决策。时间序列分类在一些时间敏感的应用领域至关重要,例如健康信息学、异常检测、设备状态识别等。


PaddleTSv1.1 的时序分类模块,新增两个时序分类深度模型——经典的 CNN 以及领先的 InceptionTime,同时提供 ClassifyBaseModel 基类,开发者可利用其构建时序分类模型。


同时,PaddleTSv1.1 支持两种分类结果评估方式,既可直接使用 PaddleTS 中预置的 accuracy_score 函数,也可调用 sklearn.metrics 相关评估算子,实现模型分类效果的评估。


开发者可以使用 PaddleTS 构建时序分类模型,得到未来时间序列的分类结果及每个分类的概率,如设备故障类型、患病类型等。也可用来辅助用于时序数据的预处理,如检测数据周期性并剔除,从而进行正常历史数据的学习或异常检测,实现预测或检测准确率的提升。


wps_doc_3.png


  • 🚗直通车


https://paddlets.readthedocs.io/zh_CN/latest/source/modules/models/classify.html

提升模型可解释能力

近年来随着深度学习的发展,深度时序模型逐步超越了浅层模型取得了更好的效果。但深度模型由于其复杂的网络结构,往往难以解释预测结果是如何产生的,给使用者带来困扰,由此,模型解释性技术应运而生。PaddleTSv1.1 提供 ante-hoc(模型相关)和 post-hoc(模型无关)两种方式提升模型可解释性。

ante-hoc(模型相关)

ante-hoc 是一种模型相关的方法,即开发者在模型设计阶段就考虑了模型可解释性的问题,因此往往会设计特殊的模型结构或损失函数,便于对已训练好的模型进行评估。PaddleTSv1.1 的 ante-hoc 模块引入了 TFT 模型,分别从特征权重、注意力评分角度对模型结果进行解释。


  • 特征权重


特征权重在掌握模型的关键特征方面具有重要作用,特征权重越高,代表特征对预测结果的影响越大。TFT 模型将时序特征可以分为静态特征、历史特征、未来特征三类,用户可以分析不同类别下的特征权重。


  • 注意力评分


在进行时间序列建模时,不同时刻点之间存在着一定的相互依赖关系,自注意力机制可以最大程度上挖掘任意两个点之间的关系,从而在进行时序预测时抽取强相关特征点的关键信息,使得预测更加准确。自注意力评分可以帮助用户判断对于预测结果影响更大的时间序列节点。以 TFT 模型为例,注意力评分支持从“单步多分位数预测”与“多步单分位数预测”两个角度给出注意力机制的分数权重的可视化展示,帮助开发者更好地分析时间序列的周期模式。


wps_doc_4.png


wps_doc_5.png

post-hoc(模型无关)

post-hoc 是一种模型无关的方法,把模型视为一个黑盒,通过外部添加扰动或建立一个代理模型等方法,对已训练好的模型进行评估和解释。PaddleTSv1.1 的 post-hoc 模块,基于 SHAP 方法实现了模型的特征归因,开发者仅需将模型和训练数据作为输入,即可得到不同时间、协变量对输出结果的贡献,帮助决策者理解模型结果、指导业务优化。


wps_doc_6.png


wps_doc_7.png


  • 🚗直通车


https://paddlets.readthedocs.io/zh_CN/latest/source/modules/xai/overview.html

表征学习支持分类和聚类

在历史版本中,PaddleTS 提供了表征预测模型 ReprForecaster,实现了表征学习和下游预测任务相结合的全流程封装,避免用户处理表征与下游任务结合的复杂处理流程,在解决表征预测问题的同时降低开发者使用门槛,真正实现了模型的即开即用。


PaddleTSv1.1 增加了表征分类模型 ReprClassifier 和表征聚类模型 ReprCluster,针对时序分类和时序聚类问题也可以实现表征学习的快速应用。


wps_doc_8.png


  • 🚗直通车


https://paddlets.readthedocs.io/zh_CN/latest/source/modules/models/representation.html


❤️以上就是本次 PaddleTSv1.1 升级的核心功能解读,更多新功能可点击下方链接查看,欢迎大家积极试用。


  • PaddleTSv1.1 功能概览


https://github.com/PaddlePaddle/PaddleTS/wiki/PaddleTS-1.1.0-Release-Note-CN


相关链接


  • 项目 GitHub


https://github.com/PaddlePaddle/PaddleTS/


  • 项目文档


https://paddlets.readthedocs.io/


  • GitHub Issue 反馈


https://github.com/PaddlePaddle/PaddleTS/issues

用户头像

还未添加个人签名 2022-12-26 加入

还未添加个人简介

评论

发布
暂无评论
模型推理耗时降低98%!PaddleTS又双叒叕带来重磅升级!_paddle_飞桨PaddlePaddle_InfoQ写作社区