摘要: ZigZag 在 PE array-memory hierarchy level 上对 nested-loop based 算子数据部署设计策略进行详细分析。文章作者来自鲁汶 MICAS [1]实验室。 软硬件建模 软件上只涉及 MAC-based 的网络算子(Linear、Convolutiona 阅读全文
posted @ 2024-08-04 18:18 DevilXXL 阅读(210) 评论(0) 推荐(0)
摘要: 互联网络泛泛谈 互联网络是一种图结构,节点之间通过边连接。比如一般总线计算机架构中 CPU、Memory、Timer 等模块看作节点, 通过总线相连。 每个节点在网络中的身份是不对等的,有 master 和 slave 之分,或者按 TLM 中的模型 initiator 和 target。Initi 阅读全文
posted @ 2024-07-29 23:22 DevilXXL 阅读(156) 评论(0) 推荐(0)
摘要: ❗️此坑还没填完,等到后面用到 triton 再补充 既生 CUDA, 何生 triton CUDA 编程昂贵上手门槛促使 triton 的诞生[1]。 语法福利 相比 CUDA C++ like 的设计风格,triton 使用 python。语法回避 C++ 模板编程和指针;环境集成比起 Pyto 阅读全文
posted @ 2024-07-26 16:52 DevilXXL 阅读(927) 评论(0) 推荐(0)
摘要: 在数字电路中也有冲突冒险的概念,也表示对公共资源的冲突,此文的冒险则侧重于流水线并行中的冒险概念。 现代 ISA 并非描述依赖的语言 数据相关即 Producer-Consumer 关系,后一个指令的输入依赖前一个指令的输入,根据因果性二者的执行必须串行。这种指令间的因果依赖关系要靠图结构来表示,每 阅读全文
posted @ 2024-07-21 00:39 DevilXXL 阅读(201) 评论(0) 推荐(0)
摘要: Introduction ITRS [1]每次预测未来 15 年半导体的发展,2024 年恰好是 Dark Silicon 文章写作年份 ITRS 预测最后一年[2]。15 年回首,重温 《Dark silicon and the end of multicore scaling》[3] 这篇伟大文 阅读全文
posted @ 2024-07-12 18:36 DevilXXL 阅读(416) 评论(0) 推荐(0)
摘要: 朋友们好,距离上篇总结又过去了半年,这句话非常重量,代表我cos科研人员已经一年!奉上一年总结,自勉之! Outline 修正先前的科研生活模型[1],带 * 号在先前的博客中有涉及。 A. 知识输入 读什么文章* (带着目的做调研) 怎么快速判断文章好不好* (数据是普适价值) B. 产出 如何选 阅读全文
posted @ 2024-06-27 17:39 DevilXXL 阅读(167) 评论(0) 推荐(0)
摘要: ❗️此坑还没填完 人造游戏尚难以用模型以概之,何况真实世界? 经济增长即是总产出增长 Cobb-Douglas 生产函数: \[Y = A K^{\alpha} L^{\beta} \]产出 \(Y\) (total production)和什么相关? 可累加投入(规模) 劳力投入(Labor) \ 阅读全文
posted @ 2024-05-26 21:43 DevilXXL 阅读(423) 评论(0) 推荐(0)
摘要: 循环是迭代空间的一个点 使用嵌套循环(Nested Loop)抽象不同的 DNN 乘加算子[1],使用多面体数学模型(Polyhedral Model)抽象循环的变换优化。 多面体模型里循环可以用迭代向量或者迭代点表示,我们以常见的 Linear Projection Layer 为例分析,该循环的 阅读全文
posted @ 2024-05-23 23:20 DevilXXL 阅读(289) 评论(0) 推荐(0)
摘要: 以 [1] 参考, Chisel 版本 6.0。Chisel 使用 mill 或 sbt 作为项目构建工具,我们这里使用 mill 为例 版本 mill 工具构建时对版本有强依赖关系,版本号不一致就会自动下载,创建环境需要检查 Chisel / Scala / Mill 的版本,mill 构建工具更 阅读全文
posted @ 2024-05-09 22:35 DevilXXL 阅读(674) 评论(0) 推荐(0)
摘要: 强烈推荐 《香山源代码剖析》作为入门 Chisel 的教材 —— 2024 / 10 / 12 一年多前接触 Chisel 望 Scala 晦涩不堪的语法而却步。这一年多 Chisel 经过几次大版本更新,特别是切换后端后[1]生成 HDL 代码可读性提升一大截;更有小道消息最新 VCS 新增支持 阅读全文
posted @ 2024-04-26 22:47 DevilXXL 阅读(973) 评论(0) 推荐(0)