上一页 1 ··· 11 12 13 14 15 16 17 18 19 ··· 66 下一页
摘要: 当CUDA应用程序启动一个内核时,CUDA运行时会确定系统中每个GPU的计算能力,并利用这些信息自动寻找最适合该GPU的内核cubin文件或PTX版本(如果可用)。如果存在支持目标GPU架构的cubin文件,将直接使用它;否则,CUDA运行时将加载PTX代码,并在启动之前将其即时编译(JIT编译)为 阅读全文
posted @ 2024-06-04 10:46 立体风 阅读(131) 评论(0) 推荐(0)
摘要: 设置环境变量 CUDA_FORCE_PTX_JIT 的作用是控制NVIDIA CUDA运行时是否强制使用PTX即时编译(Just-In-Time compilation)。当这个环境变量被设置时,它会对CUDA程序的行为产生以下影响: 禁用二进制缓存加载:正常情况下,CUDA运行时会尝试从二进制缓存 阅读全文
posted @ 2024-06-04 10:31 立体风 阅读(199) 评论(0) 推荐(0)
摘要: NVIDIA CUDA C++编译器nvcc可用于生成针对特定架构的cubin文件和每个内核的向前兼容的PTX版本。每个cubin文件针对特定的计算能力版本,并且仅与具有相同主版本号的GPU架构向前兼容。例如,针对计算能力3.0的cubin文件在所有计算能力3.x(Kepler)设备上受支持,但在计 阅读全文
posted @ 2024-06-04 10:05 立体风 阅读(181) 评论(0) 推荐(0)
摘要: 概述 最近新学习的JAX在使用时,提示: 2024-05-26 19:46:32.016388: W external/xla/xla/service/gpu/nvptx_compiler.cc:760] The NVIDIA driver's CUDA version is 12.2 which 阅读全文
posted @ 2024-05-26 23:29 立体风 阅读(3386) 评论(0) 推荐(0)
摘要: 概述 通常,matplotlib使用 TkAgg 做为后端(back end),但这要保证安装了 python3-tk 包。否则 matplotlib就使用 agg 做为后端,agg 只能保存图像,不能显示图像。 设置 TkAgg 检查是否当前后端。 import matplotlib matplo 阅读全文
posted @ 2024-05-26 09:01 立体风 阅读(470) 评论(0) 推荐(0)
摘要: 概述 我的cuda 版本是 12x 的,对齐版本,故 cupy 也是 12x 版本, 12代表 cuda 大的版本号,x 代表小的版本号可以不同,用一个变量 x 代表。 cupy 依赖 CUDA Toolkit 12.x ,在 ubuntu24.04 下,它的名字是:nvidia-cuda-tool 阅读全文
posted @ 2024-05-25 16:41 立体风 阅读(537) 评论(0) 推荐(0)
摘要: 概览 cuda是利用Nvidia GPU进行计算,计算的方式,就是利用 cuda 函数库,应该熟悉这些函数库的分类方式和它们之间的关系。 常用的有:随机数生成(curand)、傅里叶变换(cufft)、基本线性代数(cublas)、稀疏矩阵运算(cusparse)、深度神经网络加速(cudnn)、解 阅读全文
posted @ 2024-05-25 15:30 立体风 阅读(1201) 评论(0) 推荐(0)
摘要: 概括 根据pytorch官网介绍的安装pytorch命令,运行 pip3 install torch torchvision torchaudio 后,出现一堆相关包,现介绍如下,记录并熟记。 核心包 torch:也称为 PyTorch,是一个开源的机器学习库,主要用于深度学习。它提供了张量计算(类 阅读全文
posted @ 2024-05-25 12:53 立体风 阅读(329) 评论(0) 推荐(0)
摘要: 概述 当上层软件提供了名称相同,但功能不同的api时,下层使用该api的软件就会不知道如何选择,或随机选择。进而可能造成软件故障,崩溃。 所以起冲突的是上层软件,造成影响的却是下层软件。 示例背景 假设有一个小型的软件生态系统,包含两个上层库——LibraryA和LibraryB,以及一个下层的应用 阅读全文
posted @ 2024-05-25 06:42 立体风 阅读(43) 评论(0) 推荐(0)
摘要: 用于LFS 故分了 4 个区,分别是 efi 分区、boot 分区、swap 分区、root 分区 大小对应分别为:200mb,1g,2g,剩余所有 步骤 选择硬盘 parted /dev/sdb 给硬盘设定 gpt 分区表 mktable gpt 给硬盘分区 mkpart efi fat32 10 阅读全文
posted @ 2024-05-23 16:47 立体风 阅读(287) 评论(0) 推荐(0)
上一页 1 ··· 11 12 13 14 15 16 17 18 19 ··· 66 下一页