会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
zwlwf
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
下一页
2024年9月20日
一个nvcc编译的小问题
摘要: 下面的cuda代码为什么指定compute capability = 8.0 后在A100上跑结果不对? nvcc a.cu # 正确 nvcc a.cu -gencode arch=compute_80,code=sm_80 # 结果不正确 // a.cu #include <cuda_runti
阅读全文
posted @ 2024-09-20 22:12 zwlwf
阅读(44)
评论(0)
推荐(0)
2024年8月26日
pip install超慢解决方法
摘要: 这个问题一般都是pip install 下载的源不在国内,可以参考 https://zhuanlan.zhihu.com/p/129866307 指定清华源,让下载速度飞起来, pip install -r requirements.txt -i https://pypi.tuna.tsinghua
阅读全文
posted @ 2024-08-26 08:10 zwlwf
阅读(62)
评论(0)
推荐(0)
pytorch源码阅读
摘要: register_hook 参考资料: [Pytorch] Tensor底层机制 https://blog.csdn.net/smartcat2010/article/details/118882020 cudaLauchKernel传入参数的一个提问 https://cloud.tencent.c
阅读全文
posted @ 2024-08-26 08:06 zwlwf
阅读(34)
评论(0)
推荐(0)
2024年8月15日
atc转换过程问题记录
摘要: LD_LIBRARY_PATH地址设置.非root用户 . ${HOME}/Ascend/ascend-toolkit/set_env.sh #若开发套件包Ascend-cann-toolkit在非昇腾设备上安装,则如下环境变量必须执行,用于设置动态链接库所在路径,否则无需执行 export LD_
阅读全文
posted @ 2024-08-15 08:07 zwlwf
阅读(54)
评论(0)
推荐(0)
2024年7月29日
torch中的矩阵乘法
摘要: torch中的矩阵乘法 torch.matmul应该是打包的函数,/home/zwl/software/pytorch/torch/csrc/autograd/generated/python_torch_functions_0.cpp:4865 static PyObject * THPVaria
阅读全文
posted @ 2024-07-29 00:10 zwlwf
阅读(27)
评论(0)
推荐(0)
2024年7月17日
tmux配置
摘要: set -g mode-keys vi set -g mouse on # Use v to trigger selection bind-key -T copy-mode-vi v send-keys -X begin-selection # Use y to yank current selec
阅读全文
posted @ 2024-07-17 08:25 zwlwf
阅读(21)
评论(0)
推荐(0)
2024年7月14日
无GPU情况下对cuda程序进行功能性测试
摘要: 安装cuda-toolkit, 在没有gpu的情况下,不能安装其中的cuda driver, 不勾选,装cuda toolkit即可。 安装gpgpu-sim程序。gpgpu的仿真程序,目前仅仅支持cuda11。而cuda11最高支持的ubuntu为20.0。但在22.0的ubuntu上下载cuda
阅读全文
posted @ 2024-07-14 22:24 zwlwf
阅读(340)
评论(0)
推荐(0)
2024年7月2日
参考资料
摘要: pytorch训练中的一些优化手段 https://blog.csdn.net/deephub/article/details/139622843 pytorch中python和底层C++ tensor对象关系 https://pytorch.org/cppdocs/notes/tensor_bas
阅读全文
posted @ 2024-07-02 23:53 zwlwf
阅读(100)
评论(0)
推荐(0)
2024年6月28日
qemu网络
摘要: 主要参考 https://wiki.qemu.org/Documentation/Networking qemu网络分为后端和前端。 backends是在qemu里设置,如下面的-netdev user, 指定了user类型的backends, 并且讲本地的5555端口和guest上22绑定,如此可
阅读全文
posted @ 2024-06-28 08:20 zwlwf
阅读(316)
评论(0)
推荐(0)
2024年6月23日
AscendC学习
摘要: 算子工程中sim和cpu模式都运行在cpu上,两者有什么区别? 猜测sim的等效是在npu指令层面,cpu的等效仅仅在AsecendC的层面? 表现在sim可以完全等效得跑cce代码算子,而cpu只能跑AscendC的算子。 当cce代码保存为.cpp后缀的文件,采用ccec编译,需要指定-x cc
阅读全文
posted @ 2024-06-23 23:41 zwlwf
阅读(470)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
下一页
公告