您的位置:首页 > 财经 > 产业 > 郑州制作网站的基本流程_网络广告营销的概念_线上广告平台_高中同步测控优化设计答案

郑州制作网站的基本流程_网络广告营销的概念_线上广告平台_高中同步测控优化设计答案

2025/3/16 12:04:51 来源:https://blog.csdn.net/RayLobeCode/article/details/146281002  浏览:    关键词:郑州制作网站的基本流程_网络广告营销的概念_线上广告平台_高中同步测控优化设计答案
郑州制作网站的基本流程_网络广告营销的概念_线上广告平台_高中同步测控优化设计答案

前言

曾在游戏世界挥洒创意,也曾在前端和后端的浪潮间穿梭,如今,而立的我仰望AI的璀璨星空,心潮澎湃,步履不停!愿你我皆乘风破浪,逐梦星辰!

混合精度:

FL32是目前模型存储数据一个比较普遍的格式。有时候过于浪费,根本用不着那么多。所以如果有一种方法能动态调整存储数据的大小,就能节省不少显存占用,从来提高批次大小,加速学习。

混合精度简单简单的来说,就是用FL16+FL32来代替原来的清一色FL32数据。具体实现是,在初始化好scaler以后,在遍历批次中的数据的时候,使用autocast自动对前向传播和损失处理混合精度。然后再使用梯度缩放器来缩放损失,并反向传播。

from torch.cuda.amp import GradScaler, autocastscaler = GradScaler()
# 使用autocast自动处理混合精度
with autocast():out = model(**data)  # 前向传播loss = out['loss']  # 获取损失
# 使用梯度缩放器来缩放损失,并反向传播
optimizer.zero_grad()
scaler.scale(loss).backward()
scaler.step(optimizer)
scaler.update()

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com