会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
懒猫后花园
哦,这该死的代码!
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
下一页
2025年8月9日
从供需的视角:半导体行业量化分析的尝试
摘要: 之前 blog [1] 十分感性地总结了“半导体科研工程导向强”。“工程”语境相对于“科学”而言。那么何为“科学”,何为“工程”?“科学是认识世界,工程是改变世界”,即所谓工程导向即不光要考虑技术原理、还要考虑可行性,再升华点便是需要同时思考供给和需求侧特点。本文尝试感性地构建一个量化分析框架解释这
阅读全文
posted @ 2025-08-09 16:52 DevilXXL
阅读(84)
评论(0)
推荐(0)
2025年7月31日
范畴论基础概念和 Yoneda Lemma 定理
摘要: 范畴论概念辨析 范畴 (Category) 包含对象(Object)和态射,对比集合概念,范畴不仅定义了静态的成员,也定义了成员之间的动态交互关系。不是任意对象和态射都能称为范畴,态射中至少包含一个单位态射,任何对象经过该态射得到本身。 不仅态射可以让对象发生变换,态射本身也可以看作一个对象处理进行
阅读全文
posted @ 2025-07-31 10:24 DevilXXL
阅读(76)
评论(0)
推荐(0)
2025年7月18日
简单的并发调度模型
摘要: 什么时候需要并发? 由于片上buffer 宝贵,且不同程序中的同一个计算操作对存储开销具有动态性,同一个程序中不同计算操作的先后顺序具有动态性,多个计算单元往往共享同一块片上 buffer 资源以便提高 buffer 利用率以及交换上下文数据。多对一便存在仲裁竞争等问题。 最简单的 baseline
阅读全文
posted @ 2025-07-18 22:40 DevilXXL
阅读(27)
评论(0)
推荐(0)
2025年7月9日
GPGPU? NPU?
摘要: zhihu-title: GPGPU? NPU? zhihu-topics: - GPGPU - NPU zhihu-link: https://zhuanlan.zhihu.com/p/1926295995316172022 zhihu-created-at: 2025-08-06 17:26 起
阅读全文
posted @ 2025-07-09 15:19 DevilXXL
阅读(97)
评论(0)
推荐(0)
2025年7月7日
对齐 NVIDIA BF16 算术模块的尝试
摘要: 整形算术单元容易预测实现硬件行为,而浮点单元由于 (1)不遵守结合律(2)rounding 模式和特殊情况处理(subnormal、nan、-0、+inf、-inf) 往往更难预测硬件计算结果。神经网络中运算 MAC 运算累加超长数组同时涉及 (1) 和 (2) 问题,不满足交换律使得遍历保证 10
阅读全文
posted @ 2025-07-07 11:23 DevilXXL
阅读(78)
评论(0)
推荐(0)
2025年7月4日
一种偏主观的矩阵乘法梯度推导方法
摘要: 很早在纸上推导过梯度的计算方法,但每次都忘记推导过程反复推导。于此想总结新的记忆方法。 梯度下降推导过程难以记忆来自于矩阵微积分,矩阵微积分中涉及标量、向量、矩阵之间两两求导操作,其定义如下图,√ 表示存在定义,x 表示不存在定义[1]: 函数 \ 自变量 scalar vector matrix
阅读全文
posted @ 2025-07-04 16:20 DevilXXL
阅读(52)
评论(3)
推荐(0)
2025年5月23日
数据依赖(三):序列语言下的存储一致性
摘要: DeepSeek ISCA 2025 [1] 6.4 小节中提到无论 load/store 语义的 scale-up 网络,还是 message 语义的 scale-out 网络,维护一致性都会明显增加额外的通信开销。期望一种既需要程序员通过 acquire/release 等语义编程保证一致性,硬
阅读全文
posted @ 2025-05-23 21:35 DevilXXL
阅读(109)
评论(0)
推荐(0)
2025年5月5日
学术流片复盘(一):第一次流片复盘
摘要: 在四月的尾巴终于把第一次流片交出去了。许多前辈曾告诫我流片如何困难,而想要请教却很难得到统一的回答。经过这一轮流片切身怯魅,积攒了一些浅薄的流片 know how 经验分享。 流片要见实物,而想要让数百万千万至数亿晶体管老老实实守本分工作并不是那么轻松。从算法到编译器到RTL到网表到GDS到电路板,
阅读全文
posted @ 2025-05-05 21:21 DevilXXL
阅读(230)
评论(2)
推荐(0)
2025年5月2日
并行计算时代下的 Cache
摘要: 熟悉的 AI 加速器领域 on-chip buffer 往往使用 scratchpad memory,对传统 cache 结构接触不多。但 cache 可谓是传统 CPU 架构中最最基础和重要的一个组件,从 cache 的设计思想上或许可以借鉴学习 AI 的访存问题。 SRAM + 映射 = Cac
阅读全文
posted @ 2025-05-02 16:28 DevilXXL
阅读(94)
评论(0)
推荐(0)
2025年4月6日
冰山之下:ICAC 2.5D/3D 互联课程记录
摘要: 去 ICAC 蹭完饭有一阵了,懒癌发作拖到现在才做心得总结。ICAC 印象最深刻的是复旦陈迟晓老师带来的 《2.5D/3D/3.5D Integration: Fabrication and Chiplet Partition》 演讲。因为先前纯数字架构接触更多一些,对 chiplet 更多是门外汉
阅读全文
posted @ 2025-04-06 22:24 DevilXXL
阅读(219)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
下一页
公告