摘要: 杜书丞,目前正在香港科技大学攻读 Permanent Head Damage 学位,指导导师是 Tim CHENG 教授。对流片庞大的人物力开销深恶痛绝,每当压力超过阈值就会转换成文字宣泄出来 于是有了这个博客 lab 主页 | 知乎主页 | 领英主页 | 邮件 为什么要写博客:忙碌世界外的花园 费 阅读全文
posted @ 2024-04-23 16:44 DevilXXL 阅读(129) 评论(0) 推荐(0)
摘要: zhihu-title: 头疼的数字验证:谈谈设计验证的成本 zhihu-topics: - IC - 数字验证 zhihu-link: https://zhuanlan.zhihu.com/p/1983236204800542210 zhihu-created-at: 2025-12-13 18: 阅读全文
posted @ 2025-12-13 18:06 DevilXXL 阅读(79) 评论(0) 推荐(0)
摘要: zhihu-title: 量化存储墙(三):GEMM EMA 下限解析解以及硬件静态资源分配设计 zhihu-topics: - AI芯片 - 计算机体系架构 zhihu-link: https://zhuanlan.zhihu.com/p/1973459537362190705 zhihu-cre 阅读全文
posted @ 2025-11-16 18:37 DevilXXL 阅读(55) 评论(0) 推荐(0)
摘要: zhihu-title: 分布式计算通信原语的抽象模型 zhihu-topics: - 并行计算 - 并行训练 zhihu-link: https://zhuanlan.zhihu.com/p/1973408496331539484 zhihu-created-at: 2025-11-16 15:1 阅读全文
posted @ 2025-11-16 15:13 DevilXXL 阅读(60) 评论(0) 推荐(0)
摘要: zhihu-title: 论文导读:从 TSMC ISSCC 看 SRAM 存算发展 zhihu-topics: - AI芯片 - IC - CIM zhihu-link: https://zhuanlan.zhihu.com/p/1969166385071519343 zhihu-created- 阅读全文
posted @ 2025-11-04 22:18 DevilXXL 阅读(150) 评论(0) 推荐(0)
摘要: zhihu-title: 半年小结 Vol4. 跌跌撞撞开启 PhD 生涯 zhihu-topics: - 博士 - 读博 - AI芯片 - IC zhihu-link: https://zhuanlan.zhihu.com/p/1958531530549883871 zhihu-created-a 阅读全文
posted @ 2025-10-06 13:58 DevilXXL 阅读(221) 评论(2) 推荐(1)
摘要: zhihu-title: Channel-Driven 降低模块耦合设计复杂度 zhihu-topics: - IC zhihu-link: https://zhuanlan.zhihu.com/p/1957439527766460225 zhihu-created-at: 2025-10-03 1 阅读全文
posted @ 2025-10-03 13:38 DevilXXL 阅读(64) 评论(0) 推荐(0)
摘要: HKUST 25 Fall COMP 6411D Data Visualization 课堂笔记 可视化的可视化 当我第一眼看到 slide 中“chart taxonomies” ,我有两个反应: 图表数量也太多了 这个分类方式并不是很直观,Comparsion / Relationship / 阅读全文
posted @ 2025-09-27 17:08 DevilXXL 阅读(58) 评论(0) 推荐(0)
摘要: zhihu-title: Bank Conflict 的数学表示 及 Buffer 设计 Trade-Off zhihu-topics: - IC zhihu-link: https://zhuanlan.zhihu.com/p/1951764877585680150 zhihu-created-a 阅读全文
posted @ 2025-09-17 21:50 DevilXXL 阅读(193) 评论(0) 推荐(0)
摘要: Vertical 从 Volta 引入 SMEM 总共 3 层存储结构。纵向结构上,传统架构仅对用户暴露 2 层存储交互,而随着 Hopper 添加 st.async ,NVIDIA GPU 完成暴露 3 层存储结构的双向通信接口,即 \(2\times C_{3}^{2}=6\) 一共 6 种指令 阅读全文
posted @ 2025-09-14 16:30 DevilXXL 阅读(31) 评论(0) 推荐(0)
摘要: 调研三个系列: 数据中心、图形卡 RTX 以及边缘 Jetson 系列,数据来自 LLM 整理。 片上 buffer 存储容量图表: OPS- Off-chip Bandwidth 配比,OPS 选择各种精度中最高 dense OPS: 能效分析,OPS 选择各种精度中最高 dense OPS: 阅读全文
posted @ 2025-09-14 16:29 DevilXXL 阅读(25) 评论(0) 推荐(0)