写点什么

恒源云 (Gpushare)_JupyterLab/TensorBoard 使用问题?技巧大放送 4!

作者:恒源云
  • 2022 年 4 月 01 日
  • 本文字数:1024 字

    阅读完需:约 3 分钟

恒源云(Gpushare)_JupyterLab/TensorBoard使用问题?技巧大放送4!

文章来源 | 恒源云社区


原文地址 | 【小技巧-工具篇】



1、JupyterLab/TensorBoard 如何使用?

可参考JupyterLab文档TensorBoard文档。

2、JupyterLab 打不开或者响应慢怎么办?

如果遇到 JupyterLab 页面响应特别缓慢或者打不开的情况,可登录实例后通过以下命令来重启 JupyterLab

supervisorctl restart jupyterlab
复制代码

不建议通过 JupyterLab 页面直接运行较消耗资源的程序,因为该程序很可能会导致 JupyterLab 无响应或者运行缓慢问题,可通过 tmux 工具放置在实例后台运行。

3、tensorboard 打不开或者响应慢怎么办?

如果遇到 tensorboard 页面响应特别缓慢或者打不开的情况,可登录实例后通过以下命令来重启 tensorboard

supervisorctl restart tensorboard
复制代码

4、自定义镜像如何安装 jupyterlab?

自定义镜像登录实例后,执行如下命令,即可完成安装 jupyterlab,安装完成后,可通过控制台打开 jupyterlab 页面

curl -OL "https://download.gpushare.com/download/custom_install"chmod u+x ./custom_install./custom_install jupyterlab
复制代码

5、自定义镜像如何安装 tensorboard?

自定义镜像登录实例后,执行如下命令,即可完成安装 tensorboard,安装完成后,可通过控制台打开 tensorboard 页面

curl -OL "https://download.gpushare.com/download/custom_install"chmod u+x ./custom_install./custom_install tensorboard
复制代码

6、JupyterLab 要输入密码怎么办?

通过终端执行 jupyter server list 命令可以得到 JupyterLab 的登陆 Token。

如下可以从执行结果内获得 Token 为 3fq593blw4afqjtqgdp3ldk5。

root@I15b96311d0280127d:~# jupyter server listCurrently running servers:http://0.0.0.0:8888/?token=3fq593blw4afqjtqgdp3ldk5 :: /
复制代码

7、TensorFlow 训练报 ptxas fatal 错误

当在 RTX 3000 系列显卡上使用 TensorFlow 2.4 For CUDA 11.0 时,训练会出现下列警告。

W tensorflow/stream_executor/gpu/asm_compiler.cc:235] Your CUDA software stack is old. We fallback to the NVIDIA driver for some compilation. Update your CUDA version to get the best performance. The ptxas error was: ptxas fatal : Value 'sm_86' is not defined for option 'gpu-name'
复制代码

原因是该版本的 PTX compiler 不支持 8.6 compute capability。此报错为警告,不影响正常训练。

该警告可以通过 os.environ[‘TF_CPP_MIN_LOG_LEVEL’] = “2” 关闭。

此问题虽然不影响训练但性能上会降低,推荐创建 TensorFlow 2.5 For CUDA 11.2 的镜像,不会存在此问题。

用户头像

恒源云

关注

专注人工智能云GPU服务器训练平台 2020.12.25 加入

还未添加个人简介

评论

发布
暂无评论
恒源云(Gpushare)_JupyterLab/TensorBoard使用问题?技巧大放送4!_人工智能_恒源云_InfoQ写作平台