aclgraph
0 人感兴趣 · 10 次引用
- 最新
- 推荐

Ascend 的 aclgraph(十)另外一种成图方式 GeConcreteGraph
在Ascend的aclgraph(一)aclgraph是什么?torchair又是怎么成图的?中提到了GeConcreteGraph的概念,

Ascend 的 aclgraph(九)e2e 执行 aclgraph
前面的几章内容探讨了aclgraph运行过程中的涉及到的关键模块和技术。本章节将前面涉及到的模块串联起来,对aclgraph形成一个端到端的了解。先给出端到端运行的代码,如下:

Ascend 的 aclgraph(八)AclConcreteGraph:capture_end
在上一章Ascend的aclgraph(七)AclConcreteGraph:capture_begin中提到了对capture_begin做了了解,现在继续看下capture_end。

Ascend 的 aclgraph(七)AclConcreteGraph:capture_begin
在上一章Ascend的aclgraph(六)AclConcreteGraph中提到了capture_begin和capture_end两个函数,这2个函数是pybind形式,调用到torch_npu中去执行。大概流程图如下:

Ascend 的 aclgraph(六)AclConcreteGraph
在Ascend的aclgraph(一)aclgraph是什么?torchair又是怎么成图的?中提到了AclConcreteGraph的概念,

Ascend 的 aclgraph(五)PrimTorch & TorchInductor
参考:Torch.compile()流程解析——4. PrimTorch & TorchInductor

Ascend 的 aclgraph(四)AOT Autograd
参照文章:Torch.compile()流程解析——3. AOTAutograd

Ascend 的 aclgraph(三)TorchDynamo
参考:【编译系列】Torch.compile()流程解析——2. TorchDynamo针对TorchDynamo的介绍,该已经讲的比较仔细,本篇文章,主要是基于原文并加上自己的理解介绍。

Ascend 的 aclgraph(一)aclgraph 是什么?torchair 又是怎么成图的?
PyTorch框架默认采用Eager模式,单算子下发后立即执行,每个算子都需要从Host侧Python API->Host侧C++层算子下发->Device侧算子kernel执行,在Device侧每次kernel执行之前都需要等待Host侧的下发逻辑完成。因此当单个算子计算量过小或者Host性能不佳时,很容