您的位置:首页 > 娱乐 > 八卦 > 美食网站素材_问题谁负责_厦门搜索引擎优化_产品推广策划方案

美食网站素材_问题谁负责_厦门搜索引擎优化_产品推广策划方案

2025/4/18 12:40:43 来源:https://blog.csdn.net/weixin_47569031/article/details/147089719  浏览:    关键词:美食网站素材_问题谁负责_厦门搜索引擎优化_产品推广策划方案
美食网站素材_问题谁负责_厦门搜索引擎优化_产品推广策划方案

前提条件:

x64 Linux 主机:安装CMake 和 arm-gnu-toolchain-12.2.rel1-x86_64-aarch64-none-linux-gnu
radxa O6主机

1.从 Kaggle 获取模型权重和分词器
Gemma 3 2B 模型文件:访问 Kaggle 上的 Gemma 模型页面 https://www.kaggle.com/models/google/gemma
Gemma C++ . On this tab, theVariation` 下拉菜单包含以下选项。请注意,bfloat16 权重选项具有更高的保真度,而 8 位切换浮点权重可实现更快的推理。
下载如下:
2b-it-sfp 20 亿参数的指令调优模型,8 位切换浮点

2.解压缩文件 模型权重和分词器

tar -zxf archive.tar.gz
这应该会生成一个包含模型权重(例如 2b-it-sfp.sbs)和分词器文件 (tokenizer.spm) 的文件
2b-it-sfp.sbs
tokenizer.spm

3.构建可执行程序
下载代码:
git clone https://github.com/google/gemma.cpp.git -b v0.1.4

交叉编译
进入到gemma.cpp代码目录下:
mkdir build && cd build

cmake -DCMAKE_C_COMPILER= A R M C C P R E F I X g c c − D C M A K E C X X C O M P I L E R = {ARMCC_PREFIX}gcc \ -DCMAKE_CXX_COMPILER= ARMCCPREFIXgcc DCMAKECXXCOMPILER={ARMCC_PREFIX}g++
-DCMAKE_C_FLAGS=“ A R M C C F L A G S " − D C M A K E C X X F L A G S = " {ARMCC_FLAGS}" \ -DCMAKE_CXX_FLAGS=" ARMCCFLAGS" DCMAKECXXFLAGS="{ARMCC_FLAGS}”
-DCMAKE_VERBOSE_MAKEFILE:BOOL=ON
-DCMAKE_SYSTEM_NAME=Linux
-DCMAKE_SYSTEM_PROCESSOR=aarch64
-DBENCHMARK_ENABLE_TESTING=ON
-DCMAKE_BUILD_TYPE=Release

在build目录中生成gemma、benchmarks可执行程序

4.执行
拷贝gemma、tokenizer.spm、2b-it-sfp.sbs到O6主机主机中。
修改文件权限:
chmod 700 benchmarks
chmod 700 gemma

执行:
./gemma --tokenizer tokenizer.spm --weights 2b-it-sfp.sbs --model 2b-it
在这里插入图片描述

5.性能测试
./benchmarks --weights 2b-it-sfp.sbs --tokenizer tokenizer.spm --model 2b-it

如其中的1个测试项:
[ Timing info ] Prefill: 2368 ms for 54 prompt tokens (22.80 tokens / sec); Time to first token: 2714 ms

[ Timing info ] Generate: 49690 ms for 256 tokens (5.15 tokens / sec)
在这里插入图片描述

6.总结
从CPU性能测试数据看,与HW Krini 9020芯片、2022年的高通8gen1或HW的数据相当。作为创业公司的首颗SOC就能有如此表现,表现令人赞叹

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com