CUDA:NVCC编译过程和兼容性详解_nvcc把cuda代码转换成什么-CSDN博客https://blog.csdn.net/fb_help/article/details/80462853
1、CUDA:NVCC编译过程和兼容性详解
CUDA:NVCC编译过程和兼容性详解
https://codeyarns.com/2014/03/03/how-to-specify-architecture-to-compile-cuda-code/
https://docs.nvidia.com/cuda/cuda-compiler-driver-nvcc/index.html#supported-phases
CUDA:NVCC编译过程和兼容性详解
前言
编译流程
一些基础知识
GPU的“代”
GPU的小“代”
应用程序的兼容性
虚拟架构
真实架构
提高兼容性的方式
即时编译(Just-In-Time)
Fatbinaries
–generate-code
CUDA程序兼容性
总结
————————————————
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/fb_help/article/details/80462853
2、CUDA学习入门(二)(CUDA编译过程 & CUDA 线程层次)
虚拟架构代号 真实架构代号 CUDA支持版本 支持架构 支持硬件
compute_50 sm_50 CUDA 6~11 Maxwell Tesla/Quadro M series
compute_52 sm_52 CUDA 6~11 Maxwell GTX-980, GTX Titan X
compute_53 sm_53 CUDA 6~11 Maxwell Tegra TX1, Jetson Nano
compute_60 sm_60 CUDA 8 Pascal Tesla P100
compute_61 sm_61 CUDA 8 Pascal GTX 1080, GTX1070
compute_62 sm_62 CUDA 8 Pascal Jetson TX2
compute_70 sm_70 CUDA 9 Volta Tesla V100
compute_72 sm_72 CUDA 9 Volta Jetson AGX Xavier
compute_75 sm_75 CUDA 10 Turing RTX 2080, RTX 2070 Tesla T4
compute_80 sm_80 CUDA 11.1 Ampere A100
compute_86 sm_86 CUDA 11.1 Ampere RTX 3090
compute_87 sm_87 CUDA 11.1 Ampere Jetson AGX Orin
compute_89 sm_89 CUDA 11.8 Lovelace RTX 4090
compute_90 sm_90 CUDA 12 Hopper H100 H200
compute_95 sm_95 CUDA 12 Blackwell B100
————————————————
我这里介绍的CUDA代码编译过程较为笼统,只是对大的过程进行概括,更加细节的可以参考下面这位大佬的文章:
https://blog.csdn.net/fb_help/article/details/80462853
原文链接:https://blog.csdn.net/weixin_44222088/article/details/135716596