写点什么

模型化

0 人感兴趣 · 1 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/35/35d86f774a201ec34a2ee910adfd2ab5.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

关于深度学习量化的操作

深度学习中做量化提升运行速度是最常用的方法,尤其是大模型这类非常吃GPU显存的方法。一般是高精度浮点数表示的网络权值以及激活值用低精度(例如8比特定点)来近似表示达到模型轻量化,加速深度学习模型推理,目前8比特推理已经比较成熟。比如int8量化,就

模型化_模型化技术文章_InfoQ写作社区