由中国通信标准化协会、中国通信学会指导,CCSA TC610 SDN /NFV /AI标准与产业推进委员会主办的2024年云网智联大会于4月10日-11日在北京召开。
趋动科技联合申报的“中国移动新型智算中心AI算力池化商用实践”,获得2023年度SDN、NFV、网络AI优秀案例征集最佳实践案例。
趋动科技助力中国移动新型智算中心AI算力池化商用实践
由中国移动提出并由趋动科技参与的新型智算中心智算资源池化平台方案,借鉴云计算的思路,对GPU、AI芯片等AI加速器资源进行聚合池化,利用先进的资源管理技术进行切分、调度和分配,使能资源可按任务实际需求进行有序供给,以充分利用稀缺、昂贵的算力资源,降低其不可分配的碎片概率。
智算资源池化平台以“软件定义”的方式,提供四大资源敏捷管理核心功能,优化资源效率,降低总体购置成本。
● 化整为零:改变传统的整卡分配、一虚多的粗放式分配方式,使能精细化分配能力,根据AI任务需求做到1%算力和1MB显存的细粒度资源按需供给;
● 隔空取物:基于高速无损网络,跨节点调取智算资源,使CPU及AI加速器高度解耦,进一步降低碎片化率;
● 化零为整:整合分布在多机上的零散资源,汇聚成为大模型业务可使用的资源,使资源可高效分配;
● 变静为动:改变传统的资源静态绑定的机制,使能资源可以根据负载变化动态分配、回收,多任务间可以峰谷互补,全局资源可以适度超分,促进资源效率提升。