NPU 上运行 onnxruntime

1 问题背景
在 Ascend 环境上,使用 onnxruntime 推理时,报错:
复制代码
显示的是 cuda 的组件找不到。由于是 Ascend 环境,肯定是没有 GPU 的,很明显是 onnxruntime 的包装错了。
复制代码
通过如上命令,可以看到环境上确实安装的是 gpu 版本的。这里先卸载 onnxruntime-gpu。
2 解决办法
通过查找 onnxruntime 社区,可以发现 npu 已经对 onnxruntime 进行了适配,参考如下文档:onnxruntime/docs/execution-providers/community-maintained/CANN-ExecutionProvider.md at gh-pages · microsoft/onnxruntime那么该如何才能构建 onnxruntime 适配 Ascend 上的 whl 包呢?这里提供源码构建的办法:
2.1 克隆源码
git clone https://github.com/microsoft/onnxruntime.gitcd onnxruntime
2.2 构建 whl 包
注意**--use_cann**参数
复制代码
3 推理示例
复制代码
评论