摘要:
type: tech-note created: {{date:YYYY-MM-DD}} tags: [] {{title}} 一、背景 / 为什么要学这个? 二、核心概念 三、关键点 & 示例 四、易错点 / 注意事项 五、总结 阅读全文
posted @ 2025-12-12 21:45
natdog
阅读(3)
评论(0)
推荐(0)
摘要:
Untitled Conversation Time: 2025-12-12 17:10 Summary: Summary generation failed Untitled Conversation Time: 2025-12-12 18:14 Summary: Summary generati 阅读全文
posted @ 2025-12-12 21:45
natdog
阅读(4)
评论(0)
推荐(0)
摘要:
type: essay created: {{date:YYYY-MM-DD}} tags: [] {{title}} 起因 思考过程 我的结论 阅读全文
posted @ 2025-12-12 21:45
natdog
阅读(3)
评论(0)
推荐(0)
摘要:
type: project created: {{date:YYYY-MM-DD}} tags: [] project: {{title}} 一、项目背景 二、需求 / 问题 三、设计思路 四、实现细节 五、结果 & 数据 六、复盘 & 改进 阅读全文
posted @ 2025-12-12 21:45
natdog
阅读(5)
评论(0)
推荐(0)
摘要:
type: bug created: {{date:YYYY-MM-DD}} tags: [] env: {{title}} 一、问题描述(现象) 二、影响范围 三、排查过程(非常重要) 四、根因分析 五、解决方案 六、如何避免 阅读全文
posted @ 2025-12-12 21:45
natdog
阅读(2)
评论(0)
推荐(0)
摘要:
阅读全文
posted @ 2025-12-12 21:45
natdog
阅读(3)
评论(0)
推荐(0)
摘要:
title: DataCopy问题 对于DataCopy 在npu调试下: 源码部分在CopyIn部分代码如下: 结果如下所示: 在CPU调试下结果正常 阅读全文
posted @ 2025-12-12 21:45
natdog
阅读(2)
评论(0)
推荐(0)
摘要:
type: tech-note created: 2025-12-12 tags: - 昇腾 - 算子 昇腾AscendC算子 一、背景 / 为什么要学这个? 在昇腾 AI 芯片的开发中,要实现一些定制化的神经网络计算功能,就得自己写自定义算子。 而用 AscendC 开发算子的时候,步骤又多又杂: 阅读全文
posted @ 2025-12-12 21:45
natdog
阅读(5)
评论(0)
推荐(0)
摘要:
title: 创建算子 构建算子开发工程 根据msopgen与op.json创建算子开发标准工程 op.json示例 [ { "op": "AddCustom", "input_desc": [ { "name": "x", "param_type": "required", "format": [ 阅读全文
posted @ 2025-12-12 21:44
natdog
阅读(6)
评论(0)
推荐(0)
摘要:
CUDA Softmax 算子优化讲解 一、Softmax 原理讲解 1.1 基本 Softmax 原理 Softmax 是深度学习中常用的激活函数,将输入向量映射为概率分布。对于一个长度为 n 的向量 x,Softmax 函数定义为: $$\text{Softmax}(x_i) = \frac{e 阅读全文
posted @ 2025-12-12 21:44
natdog
阅读(4)
评论(0)
推荐(0)

浙公网安备 33010602011771号