您的位置:首页 > 科技 > IT业 > 短视频获客_个人网站源代码html_免费代码网站_关键词优化排名软件案例

短视频获客_个人网站源代码html_免费代码网站_关键词优化排名软件案例

2024/9/25 2:42:19 来源:https://blog.csdn.net/weixin_44659309/article/details/141458508  浏览:    关键词:短视频获客_个人网站源代码html_免费代码网站_关键词优化排名软件案例
短视频获客_个人网站源代码html_免费代码网站_关键词优化排名软件案例

流水优化、搬运优化、内存优化、API使用优化以及Tiling优化

流水优化

  • AI Core内流水并行
  • double buffer将待处理的数据一分为二,提高Vector单元利用效率
  • Iterate异步接口,避免AIC/AIV同步依赖

1、AI Core内流水并行

AI Core内部执行单元异步并行地执行接收到的指令。每一个执行单元都可以看成是流水线上的节点,通过流水线并行的方式来提高计算效率。从输入数据到输出数据需要经过3个阶段任务的处理,多个执行单元并行处理,每个执行单元只会专注于一个任务的处理,会处理所有的数据分片。

基于Ascend C编程范式进行代码编写,实际上就是应用这种流水线式的编程范式,把算子核内的处理程序,分成多个流水任务,通过队列(Queue)完成任务间通信和同步,并通过统一的资源管理模块(Pipe)来统一管理内存、事件等资源。

Ascend C流水编程范式将单核算子处理逻辑划分为多个流水任务,CopyIn搬入,Compute计算,CopyOut搬出,基于该编程范式,可快速搭建算子实现的代码框架。

以Vector编程范式为例:
CopyIn负责搬入操作:将输入数据从Global Memory搬运到Local Memory(VECIN用于表达矢量计算搬入数据的存放位置),完成搬运后执行入队列操作;
Compute负责矢量指令计算操作:完成队列出队后,从Local Memory获取数据并计算,计算完成后执行入队操作;
CopyOut负责搬出操作:完成队列出队后,将计算结果从Local Memory(VECOUT用于表达矢量计算搬出数据的存放位置)搬运到GM。

伪代码


TPipe pipe;   //创建全局的资源管理    
TQue<VecIn, 1

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com