写点什么

Pytorch GPU 训练环境搭建

  • 2022 年 9 月 28 日
    北京
  • 本文字数:964 字

    阅读完需:约 3 分钟

之前⼀直使⽤ Tensorflow 训练模型,第⼀次训练 Pytorch 模型的时候,发现速度很慢,仔细观察,发现 GPU 内存占⽤为 0,基本没有使⽤GPU。

AssertionError: CUDA unavailable, invalid device 0 requestedcuda不可⽤报错,现实没有有效的驱动可使⽤
复制代码

测试 cuda 是否配置正确

import torchprint(torch.cuda.is_available())
复制代码

重新安装 cuda

检测本地 GPU CUDA 版本 nvidia-smi



pip3 install torch1.9.0+cu101 torchvision0.10.0+cu101 torchaudio=0.9.0 -fhttps://download.pytorch.org/whl/torch_stable.html
复制代码

当前 torchvision0.10.0+cu101 版本必须是匹配的。如果版本不匹配,如上⾯的命令,则会出现错误

我们打开网站

https://download.pytorch.org/whl/torch_stable.htmlSorry, we were unable to generate a preview for this web page, because the following oEmbed / OpenGraph tags could not be found: description, image

查看所有版本


“cu101” 表示需要的 CUDA 版本

“torchvision-0.2.1” 可以看到我们可以适应的版本

其它字段信息,包含适配 python 版本,cpu 版本,或者是系统⽀持

conda install torch==1.8.1+cu101 torchvision==0.9.1+cu101torchaudio===0.8.1 -f https://download.pytorch.org/whl/torch_stable.html
复制代码

如果安装还是报错的话

ERROR: Could not find a version that satisfies the requirementtorch1.8.1+cu101...
复制代码

我们可以换下⾯这种安装⽅式

conda install -i https://pypi.tuna.tsinghua.edu.cn/simple torch===1.8.1torchvision===0.9.1 -f https://download.pytorch.org/whl/torch_stable.html
复制代码

终于安装成功,满⼼欢⼼重新测试:

还是不对,这⼀次报错说我们的 CUDA 驱动版本太低了,⽽是 Pytorch 的版本和 CUDA 不匹配。

查看我们的 CUDA Version 为 10.0.130

再看下我们当前环境的 torch 版本


发现 1.8.0 版本对应的 CUDA 最低为 10.2 版本,确实⽐我们的要训练环境要高,重新调整我们本地虚拟环境版本,我们稍微降低⼀下版本,Torch 官⽹的版本只提供了 CUDA 9.2 和 CUDA 10.1 的版本,我的 CUDA 是 10.0 的。所以这里版本不对应导致 Torch.cuda 加速无法运行。

这⾥支持 10.0 版本为 1.2.0 版本,感觉有点低,升级⼀下 CUDA 版本到 10.1 版本


更多学习资料戳下方!!!

https://qrcode.ceba.ceshiren.com/link?name=article&project_id=qrcode&from=infoQ&timestamp=1662366626&author=xueqi

用户头像

社区:ceshiren.com 2022.08.29 加入

微信公众号:霍格沃兹测试开发 提供性能测试、自动化测试、测试开发等资料、实事更新一线互联网大厂测试岗位内推需求,共享测试行业动态及资讯,更可零距离接触众多业内大佬

评论

发布
暂无评论
Pytorch GPU 训练环境搭建_测试_测吧(北京)科技有限公司_InfoQ写作社区