1 2 3 4 5 ··· 50 下一页
摘要: 一、功能定义 cudaDeviceSynchronize() 这是一个主机端(CPU)函数,用于阻塞 CPU 线程,直到 GPU 上所有未完成的操作(包括内核执行、内存拷贝等)完成12。 它的主要作用是确保 GPU 和 CPU 之间的操作同步,常用于调试或确保 GPU 任务完成后再继续 CPU 的后 阅读全文
posted @ 2025-08-12 10:49 小kk_p 阅读(33) 评论(0) 推荐(0)
摘要: https://blog.csdn.net/m0_64561077/article/details/140516251 阅读全文
posted @ 2025-07-22 13:48 小kk_p 阅读(39) 评论(0) 推荐(0)
摘要: import triton import triton.language as tl @triton.jit def softmax(Y, stride_ym, stride_yn, X, stride_xm, stride_xn, M, N): m = tl.program_id(0) n = t 阅读全文
posted @ 2025-06-19 16:01 小kk_p 阅读(35) 评论(0) 推荐(0)
摘要: ‌ 清华大学镜像站 ‌:https://pypi.tuna.tsinghua.edu.cn/simple/ ‌ 阿里云镜像站 ‌:https://mirrors.aliyun.com/pypi/simple/ ‌ 中国科学技术大学镜像站 ‌:https://pypi.mirrors.ustc.edu 阅读全文
posted @ 2025-06-18 17:58 小kk_p 阅读(38) 评论(0) 推荐(0)
摘要: conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/freeconda config --add channels https://mirrors.tuna.tsinghua.edu.cn/an 阅读全文
posted @ 2025-06-16 14:10 小kk_p 阅读(326) 评论(0) 推荐(0)
摘要: pip install torch==2.5.1 torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu121 不使用历史下载的安装包: --no-cache-dir 阅读全文
posted @ 2025-05-28 17:42 小kk_p 阅读(57) 评论(0) 推荐(0)
摘要: python3.12报错原因 https://blog.csdn.net/weixin_49739990/article/details/142219454 阅读全文
posted @ 2025-05-22 14:48 小kk_p 阅读(51) 评论(0) 推荐(0)
摘要: https://zhuanlan.zhihu.com/p/636776166 阅读全文
posted @ 2025-04-02 16:01 小kk_p 阅读(11) 评论(0) 推荐(0)
摘要: https://kexue.fm/archives/8130 阅读全文
posted @ 2025-03-28 18:45 小kk_p 阅读(30) 评论(0) 推荐(0)
摘要: https://zhuanlan.zhihu.com/p/614147698 https://kexue.fm/archives/9181 阅读全文
posted @ 2025-03-17 10:21 小kk_p 阅读(15) 评论(0) 推荐(0)
1 2 3 4 5 ··· 50 下一页