您的位置:首页 > 文旅 > 旅游 > 办网站费用多少钱_网站制作厦门_正安县网站seo优化排名_推广代理

办网站费用多少钱_网站制作厦门_正安县网站seo优化排名_推广代理

2025/4/22 3:04:53 来源:https://blog.csdn.net/WhiffeYF/article/details/147240989  浏览:    关键词:办网站费用多少钱_网站制作厦门_正安县网站seo优化排名_推广代理
办网站费用多少钱_网站制作厦门_正安县网站seo优化排名_推广代理

文章目录

  • 0 相关资料
  • 1 源码安装
  • 2 Qwen2.5-0.5B-Instruct 模型下载
  • 3 训练demo
  • 4 在多个 GPU/节点上进行训练
  • 总结

0 相关资料

https://github.com/huggingface/trl
https://blog.csdn.net/weixin_42486623/article/details/134326187

TRL 是一个先进的库,专为训练后基础模型而设计,采用了监督微调 (SFT)、近端策略优化 (PPO) 和直接偏好优化 (DPO) 等先进技术。TRL 建立在 🤗 Transformers 生态系统之上,支持多种模型架构和模态,并可在各种硬件配置上进行扩展。

b站视频:https://www.bilibili.com/video/BV18ndfYfEcz/

PyTorch / 2.3.0 / 3.12(ubuntu22.04) / 12.1

在这里插入图片描述

1 源码安装

source /etc/network_turbo
git clone https://github.com/huggingface/trl.git
cd trl/
pip install -e .
source /etc/network_turbo
pip install trl transformers datasets accelerate

2 Qwen2.5-0.5B-Instruct 模型下载

https://www.modelscope.cn/models/Qwen/Qwen2.5-0.5B-Instruct

source /etc/network_turbo
pip install modelscope

采用SDK方式下载

from modelscope import snapshot_download# 指定模型的下载路径
cache_dir = '/root/'
# 调用 snapshot_download 函数下载模型
model_dir = snapshot_download('Qwen/Qwen2.5-0.5B-Instruct', cache_dir=cache_dir)print(f"模型已下载到: {model_dir}")

3 训练demo

demo.py
执行脚本前,输入:

source /etc/network_turbo
from trl import SFTTrainer
from datasets import load_datasetdataset = load_dataset("trl-lib/Capybara", split="train")trainer = SFTTrainer(model="/root/Qwen/Qwen2.5-0.5B-Instruct",train_dataset=dataset,
)
trainer.train()

在这里插入图片描述

00:15<1:57:58,

在这里插入图片描述

4 在多个 GPU/节点上进行训练

执行脚本前,输入:

source /etc/network_turbo
accelerate launch --config_file=examples/accelerate_configs/multi_gpu.yaml --num_processes 2 demo.py --all_arguments_of_the_script

在这里插入图片描述

在这里插入图片描述

总结

一块L20 GPU 48G,需要2小时
两块L20 GPU 48G,需要0.5小时
速度提升明显

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com