您的位置:首页 > 汽车 > 时评 > 【python实现】实时监测GPU,空闲时自动执行脚本

【python实现】实时监测GPU,空闲时自动执行脚本

2024/7/6 7:39:07 来源:https://blog.csdn.net/weixin_44883789/article/details/139449193  浏览:    关键词:【python实现】实时监测GPU,空闲时自动执行脚本

文章目录

  • 代码


代码

# author: muzhan
# contact: levio.pku@gmail.com
import os
import sys
import time
cmd = 'nohup python -u train_post_2d_aut.py > output1.log &'    # gpu空闲时,需要执行的脚本命令
def gpu_info():gpu_status = os.popen('nvidia-smi | grep %').read().split('|')# 监控2号gpugpu_memory = int(gpu_status[10].split('/')[0].split('M')[0].strip())                   # max:12288gpu_power = int(gpu_status[9].split('   ')[-1].split('/')[0].split('W')[0].strip())   # max:250# 监控3号gpu# gpu_memory = int(gpu_status[14].split('/')[0].split('M')[0].strip())  # max:12288# gpu_power = int(gpu_status[13].split('   ')[-1].split('/')[0].split('W')[0].strip())# 获取空闲的功率和内存power_all, memory_all = 250, 12288       # gpu功率和内存的最大值power_free = power_all - gpu_powermemory_free = memory_all - gpu_memoryreturn power_free, memory_free
def narrow_setup(interval=2):power_free, memory_free = gpu_info()i = 0while not (memory_free > 7000 and power_free > 175):  # 如果空闲的内存和功率大于指定阈值,就执行cmd脚本power_free, memory_free = gpu_info()i = i % 10symbol = 'monitoring: ' + '>' * i + ' ' * (10 - i - 1) + '|'gpu_power_str = 'gpu power_free:%d W |' % power_freegpu_memory_str = 'gpu memory_free:%d MiB |' % memory_freesys.stdout.write('\r' + gpu_memory_str + ' ' + gpu_power_str + ' ' + symbol)sys.stdout.flush()time.sleep(interval)     # 每2s检测一次i += 1print('\n' + cmd)os.system(cmd)if __name__ == '__main__':narrow_setup()

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com