您的位置：首页 > 财经 > 金融 > 大语言模型微调框架Unsloth：简化模型微调流程，提升模型性能

大语言模型微调框架Unsloth：简化模型微调流程，提升模型性能

2025/2/25 23:36:04 来源：https://blog.csdn.net/hero272285642/article/details/141209051 浏览: 次关键词：大语言模型微调框架Unsloth：简化模型微调流程，提升模型性能

在这里插入图片描述
Unsloth 将 Llama-3、Mistral、Phi-3 和 Gemma 等大型语言模型的微调速度提高了 2 倍，内存使用量减少了 70%，而且准确性不会降低！

特点

通过手动派生所有计算繁重的数学步骤和手写 GPU 内核，unsloth 可以在不更改任何硬件的情况下神奇地使训练更快。
与 Flash Attention 2 （FA2）相比，在单个 GPU 上快 10 倍，在多个 GPU 系统上快 32 倍。
我们支持从 Tesla T4 到 H100 的 NVIDIA GPU，并且可以移植到 AMD 和 Intel GPU。

支持模型

可以看到主流的开源模型基本都有支持，Llama、Qwen、Mistral、Gemma、Phi等等
在这里插入图片描述

版本

本身开源（Free），同样也支持企业级操作，费用见下图
在这里插入图片描述

Google Colab支持

Unsloth 开源版本可以安装在本地或像 Google Colab 这样的其他 GPU 服务中。大多数人通过 Google Colab 界面使用 Unsloth，它提供了一个免费的 GPU 来训练。

链接地址：https://docs.unsloth.ai/get-started/unsloth-notebooks
在这里插入图片描述
开源地址：https://github.com/unslothai/unsloth

可以点击里面的“start for free"直接开始你的微调工作。
在这里插入图片描述

版权声明:

本网仅为发布的内容提供存储空间，不对发表、转载的内容提供任何形式的保证。凡本网注明“来源：XXX网络”的作品，均转载自其它媒体，著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处。

我们尊重并感谢每一位作者，均已注明文章来源和作者。如因作品内容、版权或其它问题，请及时与我们联系，联系邮箱：809451989@qq.com，投稿邮箱：809451989@qq.com

最新新闻

热搜词

专业网站模板设计与制作全流程指南题解 [NOISG2025 Prelim] Lasers 2 【开源】基于Vue+SpringBoot的企业项目合同信息系统萨满Shaman-增强-团体-大秘境-专精-天赋-配装-宏团队组成五个基本要素_团队构成的五大要素用python绘制五角星

声明：本站所有新闻及新闻图片来源于其他网站，如有侵权，请及时联系我们！

客户服务 | 关于我们 | 版权声明

版权所有：

Copyright 2024 尧图网 All Rights Reserved.QQ:809451989