一、初始化LLM WebUI机器
1.注册账号
打开:https://cloud.vast.ai,进行账号注册
2.绑定信用卡& 充值10美金
进入 BILLING菜单 -> 绑定信用卡💳(visa 银联信用卡即可) -> 邮箱验证
3.选择模型
进入TEMPLATES 菜单-> 选择 Oobabooga LLM WebUI(LLaMA2)
镜像
4.选择机器
之前选择的 Oobabooga LLM WebUI(LLaMA2)
镜像就会出现在左上角的 框中,选择机器配置:1X RTX 4090(24G 显存)
, 一个模型大概20~30G ,所以 磁盘空间需要选大一些。
5.等待机器初始化
机器选择完以后 可以在INSTANCES 菜单里面等待机器初始化,当看到【OPEN】表示机器已经准备好了,可以连上去。大概3min左右的初始化时间。
6.注销机器(不使用的时候记得删除机器,暂停的机器收取存储费用)
-
暂停机器,收存储费用,一个晚上大概1美金。下次登录东西还在
-
删除机器,不收费。建议删除机器,省钱
二、LLM模型加载和测试
1.挑选LLM模型
https://huggingface.co/ 网站挑选需要评估的模型
uncensored/unfiltered 不进行过滤,因为AI女友有软色情
eg:复制模型名称 TheBloke/Wizard-Vicuna-7B-Uncensored-GPTQ
2.下载模型
7B模型
将 模型名称 TheBloke/Wizard-Vicuna-7B-Uncensored-GPTQ
放置在 Modl Tab页进行下载,模型下载完成以后可以看到 Done!
3.加载模型
1.在Model 先刷新,然后就可以在下拉菜单上看到刚刚下载的模型名称TheBloke/Wizard-Vicuna-7B-Uncensored-GPTQ
2.下拉框选中模型名称TheBloke/Wizard-Vicuna-7B-Uncensored-GPTQ
3.点击【Reload】按钮,如果模型加载成功可以看到 对应的 提示tips
4.选择模板
https://huggingface.co/TheBloke/Wizard-Vicuna-7B-Uncensored-GPTQ
根据上面的模型说明, 查找对应的prompt 模板,然后在下拉选项中选择
5.设置Chat characters
具体详情参见:https://github.com/oobabooga/text-generation-webui/blob/main/docs/Chat-mode.md
下面的 Context 是根据我们自己业务中 中的504 朋克女孩的prompt进行修改而成的。修改完以后记得保存对应的模型
6.进行对话
选择chat ,然后开始对话
7.导出聊天记录
把对应的聊天内容保留下来,记录到文档中