摘要: Causal Mask(上三角):挡住未来位置,自回归生成必须遵守时序; Padding Mask:挡住PAD 占位符,过滤无效填充位; 合并规则: final_mask = causal_mask | pad_mask 只要其中一个掩码标记为 True(需要遮挡),该位置就统一填充 -1e9。 i 阅读全文
posted @ 2026-06-01 11:08 小kk_p 阅读(8) 评论(0) 推荐(0)
摘要: https://zhuanlan.zhihu.com/p/1929640607300719712 阅读全文
posted @ 2025-12-26 11:28 小kk_p 阅读(13) 评论(0) 推荐(0)
摘要: 在 Linux 上创建用户,最常用的方法是使用 useradd 或 adduser 命令,具体取决于你的发行版和需求。下面是详细步骤和常见用法: 🧰 方法一:使用 useradd(推荐所有发行版) useradd 是底层命令,适用于所有 Linux 发行版。 1. 创建用户 bash 复制 sud 阅读全文
posted @ 2025-11-21 16:10 小kk_p 阅读(400) 评论(0) 推荐(0)
摘要: https://zhuanlan.zhihu.com/p/1929640607300719712 阅读全文
posted @ 2025-11-03 19:16 小kk_p 阅读(9) 评论(0) 推荐(0)
摘要: 一、功能定义 cudaDeviceSynchronize() 这是一个主机端(CPU)函数,用于阻塞 CPU 线程,直到 GPU 上所有未完成的操作(包括内核执行、内存拷贝等)完成12。 它的主要作用是确保 GPU 和 CPU 之间的操作同步,常用于调试或确保 GPU 任务完成后再继续 CPU 的后 阅读全文
posted @ 2025-08-12 10:49 小kk_p 阅读(189) 评论(0) 推荐(0)
摘要: https://blog.csdn.net/m0_64561077/article/details/140516251 阅读全文
posted @ 2025-07-22 13:48 小kk_p 阅读(96) 评论(0) 推荐(0)
摘要: import triton import triton.language as tl @triton.jit def softmax(Y, stride_ym, stride_yn, X, stride_xm, stride_xn, M, N): m = tl.program_id(0) n = t 阅读全文
posted @ 2025-06-19 16:01 小kk_p 阅读(81) 评论(0) 推荐(0)
摘要: ‌ 清华大学镜像站 ‌:https://pypi.tuna.tsinghua.edu.cn/simple/ ‌ 阿里云镜像站 ‌:https://mirrors.aliyun.com/pypi/simple/ ‌ 中国科学技术大学镜像站 ‌:https://pypi.mirrors.ustc.edu 阅读全文
posted @ 2025-06-18 17:58 小kk_p 阅读(79) 评论(0) 推荐(0)
摘要: conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/freeconda config --add channels https://mirrors.tuna.tsinghua.edu.cn/an 阅读全文
posted @ 2025-06-16 14:10 小kk_p 阅读(724) 评论(0) 推荐(0)
摘要: pip install torch==2.5.1 torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu121 不使用历史下载的安装包: --no-cache-dir 阅读全文
posted @ 2025-05-28 17:42 小kk_p 阅读(178) 评论(0) 推荐(0)