您的位置:首页 > 科技 > IT业 > 成都好玩的地方_企业微信小程序如何开发_西安网站建设平台_成都业务网络推广平台

成都好玩的地方_企业微信小程序如何开发_西安网站建设平台_成都业务网络推广平台

2025/3/18 20:46:10 来源:https://blog.csdn.net/u012514495/article/details/145720593  浏览:    关键词:成都好玩的地方_企业微信小程序如何开发_西安网站建设平台_成都业务网络推广平台
成都好玩的地方_企业微信小程序如何开发_西安网站建设平台_成都业务网络推广平台

根据零刻官方测试数据,SER9 Pro系列(HX370与AI 365机型)已全面支持本地部署DeepSeek-R1大模型,并可通过AMD Radeon核显加速运算。
在这里插入图片描述

详细性能数据

机型内存显存显卡
SER9 Pro 37064G48GRadeon 890M
大模型显存占用大小你好你是谁写一个贪吃蛇的代码
DeepSeek-R1-Distill-Qwen-1.5B-Q21.1G67.65 tok/sec, 37 tokens, 0.02s to first token60.61 tok/sec, 58 tokens, 0.03s to first token57.40 tok/sec, 1358 tokens, 0.17s to first token
DeepSeek-R1-Distill-Qwen-1.5B-Q41.2G69.80 tok/sec, 17 tokens, 0.03s to first token66.70 tok/sec, 40 tokens, 0.16s to first token56.30 tok/sec, 1816 tokens, 0.11s to first token
DeepSeek-R1-Distill-Qwen-1.5B-Q81.9G50.60 tok/sec, 31 tokens, 0.21s to first token50.21 tok/sec, 40 tokens, 0.17s to first token44.15 tok/sec, 1609 tokens, 0.11s to first token
DeepSeek-R1-Distill-Qwen-7B-Q23.2G24.02 tok/sec, 16 tokens, 0.10s to first token22.08 tok/sec, 171 tokens, 0.06s to first token20.27 tok/sec, 1829 tokens, 0.63s to first token
DeepSeek-R1-Distill-Qwen-7B-Q44.6G19.52 tok/sec, 32 tokens, 0.08s to first token18.68 tok/sec, 128 tokens, 0.06s to first token16.72 tok/sec, 1614 tokens, 0.38s to first token
DeepSeek-R1-Distill-Qwen-7B-Q87.5G12.28 tok/sec, 37 tokens, 0.10s to first token12.26 tok/sec, 222 tokens, 0.09s to first token11.52 tok/sec, 1684 tokens, 0.37s to first token
DeepSeek-R1-Distill-Qwen-8B-Q23.6G22.42 tok/sec, 25 tokens, 0.38s to first token20.77 tok/sec, 294 tokens, 0.10s to first token19.40 tok/sec, 1060 tokens, 0.38s to first token
DeepSeek-R1-Distill-Llama-8B-Q45.1G19.36 tok/sec, 23 tokens, 0.38s to first token18.29 tok/sec, 203 tokens, 0.08s to first token16.58 tok/sec, 1145 tokens, 0.37s to first token
DeepSeek-R1-Distill-Llama-8B-Q88.3G11.66 tok/sec, 40 tokens, 0.33s to first token11.32 tok/sec, 331 tokens, 0.10s to first token9.43 tok/sec, 3123 tokens, 0.67s to first token
DeepSeek-R1-Distill-Qwen-14B-Q26.5G11.49 tok/sec, 31 tokens, 0.18s to first token10.82 tok/sec, 197 tokens, 0.13s to first token9.79 tok/sec, 1534 tokens, 1.53s to first token
DeepSeek-R1-Distill-Qwen-14B-Q49G10.66 tok/sec, 31 tokens, 0.16s to first token10.03 tok/sec, 239 tokens, 0.11s to first token9.27 tok/sec, 1351 tokens, 1.37s to first token
DeepSeek-R1-Distill-Qwen-14B-Q814.2G6.71 tok/sec, 17 tokens, 0.19s to first token6.30 tok/sec, 224 tokens, 0.17s to first token5.94 tok/sec, 1206 tokens, 0.67s to first token
机型内存显存显卡
SER9 Pro 36532G24GRadeon 880M
大模型显存占用大小你好你是谁写一个贪吃蛇的代码
DeepSeek-R1-Distill-Qwen-1.5B-Q21.3G60.97 tok/sec, 41 tokens, 0.32s to first token64.73 tok/sec, 181 tokens, 0.32s to first token49.53 tok/sec, 8834 tokens, 0.17s to first token
DeepSeek-R1-Distill-Qwen-1.5B-Q41.3G67.41 tok/sec, 31 tokens, 0.17s to first token63.32 tok/sec, 192 tokens, 0.22s to first token53.61 tok/sec, 2919 tokens, 0.28s to first token
DeepSeek-R1-Distill-Qwen-1.5B-Q82G52.14 tok/sec, 17 tokens, 0.24s to first token50.12 tok/sec, 40 tokens, 0.20s to first token44.54 tok/sec, 602 tokens, 0.26s to first token
DeepSeek-R1-Distill-Qwen-7B-Q23.2G23.65 tok/sec, 17 tokens, 0.10s to first token22.13 tok/sec, 176 tokens, 0.09s to first token20.79 tok/sec, 921 tokens, 0.39s to first token
DeepSeek-R1-Distill-Qwen-7B-Q44.8G19.90 tok/sec, 31 tokens, 0.10s to first token18.84 tok/sec, 222 tokens, 0.07s to first token17.24 tok/sec, 1758 tokens, 0.78s to first token
DeepSeek-R1-Distill-Qwen-7B-Q87.8G12.94 tok/sec, 32 tokens, 0.12s to first token12.47 tok/sec, 128 tokens, 0.11s to first token11.55 tok/sec, 1797 tokens, 0.39s to first token
DeepSeek-R1-Distill-Qwen-8B-Q23.6G22.86 tok/sec, 34 tokens, 0.42s to first token21.64 tok/sec, 180 tokens, 0.10s to first token19.67 tok/sec, 828 tokens, 0.43s to first token
DeepSeek-R1-Distill-Qwen-8B-Q45.3G18.97 tok/sec, 40 tokens, 0.49s to first token18.06 tok/sec, 522 tokens, 0.10s to first token15.87 tok/sec, 1874 tokens, 0.81s to first token
DeepSeek-R1-Distill-Qwen-8B-Q88.6G11.92 tok/sec, 40 tokens, 0.65s to first token11.56 tok/sec, 179 tokens, 0.13s to first token10.65 tok/sec, 1648 tokens, 0.45s to first token
DeepSeek-R1-Distill-Qwen-14B-Q26.4G13.21 tok/sec, 17 tokens, 0.18s to first token12.24 tok/sec, 171 tokens, 0.17s to first token10.73 tok/sec, 1323 tokens, 0.93s to first token
DeepSeek-R1-Distill-Qwen-14B-Q49.2G10.81 tok/sec, 31 tokens, 0.19s to first token10.25 tok/sec, 249 tokens, 0.13s to first token9.07 tok/sec, 1541 tokens, 1.58s to first token
DeepSeek-R1-Distill-Qwen-14B-Q815G6.80 tok/sec, 17 tokens, 0.23s to first token6.44 tok/sec, 199 tokens, 0.21s to first token6.03 tok/sec, 1231 tokens, 1.44s to first token

说明:

  • 显存占用大小:随着模型复杂度的增加,显存占用也随之增大。
  • 响应速度(tokens/sec):在“你好”和“你是谁”任务中,DeepSeek-R1-Distill-Qwen-1.5B-Q4模型的响应速度最快;而在“写一个贪吃蛇的代码”任务中,DeepSeek-R1-Distill-Qwen-1.5B-Q2模型的响应速度最快。
  • 首token响应时间(seconds):在大多数任务中,DeepSeek-R1-Distill-Qwen-7B-Q4模型的首token响应时间最短。

以下是零刻SER9 Pro HX370(AI370)与SER9 Pro 365(AI365)在本地部署DeepSeek-R1大模型的性能对比分析:

硬件配置对比

机型CPU核显内存显存
SER9 Pro 370AMD Ryzen AI 9 370Radeon 890M64GB48GB
SER9 Pro 365AMD Ryzen AI 9 365Radeon 880M32GB24GB

性能对比总结

1. 显存占用与模型兼容性
  • HX370(48G显存):可支持更高量化级别(如Q8)的14B大模型(显存占用14.2G),显存利用率更高,冗余显存可能支持多任务并行。
  • AI365(24G显存):部分高量化模型(如14B-Q8)显存占用达15G,接近显存上限,可能影响稳定性或无法运行更大模型。
2. 推理速度(tok/sec)
  • 小模型(1.5B)
    • Q2/Q4量化下,AI365(如Owen-1.5B-Q4)表现略优(67.41 tok/sec vs 69.80 tok/sec),但差距较小;
    • Q8量化下,HX370(Queen-1.5B-Q8)速度下降更明显(50.60→44.15 tok/sec),推测与核显性能差异有关。
  • 大模型(7B/8B/14B)
    • HX370在相同量化级别下普遍更快(如7B-Q4:19.52 vs 19.90 tok/sec),Radeon 890M的核显性能优势显现。
3. 首Token生成时间
  • HX370:首Token延迟更低,尤其在复杂任务(如“写贪吃蛇代码”)中优势显著(14B-Q8:0.67s vs 1.44s),可能受益于更大显存和更高带宽。
  • AI365:首Token时间波动较大,高负载任务下延迟增加明显(如14B-Q4:1.58s)。
4. 任务负载适应性
  • 短任务(“你好”“你是谁”):两者差异较小,AI365在部分场景甚至略优(如1.5B-Q4的“你好”任务)。
  • 长任务(“写代码”):HX370显著领先,14B-Q2模型速度达9.79 tok/sec(AI365为10.73 tok/sec),且总token处理量更高(1534 vs 1323)。

结论

  • HX370(Ryzen AI 9 HX370)
    适合部署大型高量化模型(如14B-Q8),显存充足,长任务处理速度更快,首Token延迟更低,综合性能更强。
  • AI365(Ryzen AI 9 365)
    性价比更高,适合中小模型(1.5B-7B)和短任务场景,但在高负载任务中显存和核显性能可能成为瓶颈。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com