写点什么

cuda

0 人感兴趣 · 8 次引用

  • 最新
  • 推荐

Windows10 上 CUDA9.0+CUDNN7.0.5 的完美安装教程

为什么要在本地电脑安装 CUDA,CUDA 是什么的,用来做什么?我想,点击标题进来的小伙伴,应该都清楚这些。不管你是用来做什么,或者跟我一样为了跑 Tensorflow 的 Object Detection (目标检测)。

https://static001.geekbang.org/infoq/46/46662313de5ada8b4a51f4006f11b365.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

CUDA 编程基础与 Triton 模型部署实践

本文将结合在阿里智能互联云端模型推理部署方面半年以来的工作学习,对相关的GPU编程与云端模型部署的知识与经验进行总结分享。

提速还能不掉点!深度解析 MegEngine 4 bits 量化开源实现

用户头像
MegEngineBot
2022-11-02

MegEngine 开源了 4 bits 的量化的相关内容,通过 MegEngine 4 bits 量化实现的 ResNet-50 模型在 ImageNet 数据集上的精度表现与 8 bits 量化模型相差无几,并且速度是 TensorRT-v7 8 bits ResNet-50 模型的推理速度的 1.3 倍。

Pytorch、CUDA 和 cuDNN 的安装图文详解 win11(解决版本匹配问题)

用户头像
timerring
2022-10-27

本文已收录于Pytorch系列专栏: Pytorch入门与实践 专栏旨在详解Pytorch,精炼地总结重点,面向入门学习者,掌握Pytorch框架,为数据分析,机器学习及深度学习的代码能力打下坚实的基础。免费订阅,持续更新。

https://static001.geekbang.org/infoq/97/9723bad456a6076656cc02eae0a0455a.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

从 Core Dump 中提取 CUDA 的报错信息

用户头像
OneFlow
2022-09-01

近期,Meta AI团队在生产PyTorch AI模型时遇到了一个难题。这一问题由CUDA非法内存访问引起,号称集结了Meta全公司最牛的AI工程师才搞定,这篇博客记录了他们使用CUDA的core dump来确定报错位置所使用的技巧和实践。

https://static001.geekbang.org/infoq/f2/f27b8ba6bb5329baa67c47d0b73b6eb3.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

CUDA 优化之 PReLU 性能调优

用户头像
OneFlow
2022-05-17

InsightFace模型里大量使用了PReLU激活函数,而PReLU的工作模式有两种:1. PReLU(1),此时权重alpha的形状为(1, ),等价于一个Elementwise操作。2. PReLU(channels),此时权重alpha的形状为(channels, ),和输入特征(N, C, H, W)中C的大小是对应的。

郑泽康:一名热爱技术的“保安”|OneFlow U

用户头像
OneFlow
2022-03-25

郑泽康,一流科技研发工程师。2021年,他毕业于深圳大学通信工程专业。业余爱玩英雄联盟,用FL Studios“瞎鼓捣”电子音乐。

cuda_cuda技术文章_InfoQ写作社区