摘要: 在数字电路中也有冲突冒险的概念,也表示对公共资源的冲突,此文的冒险则侧重于流水线并行中的冒险概念。 现代 ISA 并非描述依赖的语言 数据相关即 Producer-Consumer 关系,后一个指令的输入依赖前一个指令的输入,根据因果性二者的执行必须串行。这种指令间的因果依赖关系要靠图结构来表示,每 阅读全文
posted @ 2024-07-21 00:39 DevilXXL 阅读(150) 评论(0) 推荐(0)
摘要: Introduction ITRS [1]每次预测未来 15 年半导体的发展,2024 年恰好是 Dark Silicon 文章写作年份 ITRS 预测最后一年[2]。15 年回首,重温 《Dark silicon and the end of multicore scaling》[3] 这篇伟大文 阅读全文
posted @ 2024-07-12 18:36 DevilXXL 阅读(375) 评论(0) 推荐(0)
摘要: 朋友们好,距离上篇总结又过去了半年,这句话非常重量,代表我cos科研人员已经一年!奉上一年总结,自勉之! Outline 修正先前的科研生活模型[1],带 * 号在先前的博客中有涉及。 A. 知识输入 读什么文章* (带着目的做调研) 怎么快速判断文章好不好* (数据是普适价值) B. 产出 如何选 阅读全文
posted @ 2024-06-27 17:39 DevilXXL 阅读(154) 评论(0) 推荐(0)
摘要: ❗️此坑还没填完 人造游戏尚难以用模型以概之,何况真实世界? 经济增长即是总产出增长 Cobb-Douglas 生产函数: \[Y = A K^{\alpha} L^{\beta} \]产出 \(Y\) (total production)和什么相关? 可累加投入(规模) 劳力投入(Labor) \ 阅读全文
posted @ 2024-05-26 21:43 DevilXXL 阅读(405) 评论(0) 推荐(0)
摘要: 循环是迭代空间的一个点 使用嵌套循环(Nested Loop)抽象不同的 DNN 乘加算子[1],使用多面体数学模型(Polyhedral Model)抽象循环的变换优化。 多面体模型里循环可以用迭代向量或者迭代点表示,我们以常见的 Linear Projection Layer 为例分析,该循环的 阅读全文
posted @ 2024-05-23 23:20 DevilXXL 阅读(276) 评论(0) 推荐(0)
摘要: 以 [1] 参考, Chisel 版本 6.0。Chisel 使用 mill 或 sbt 作为项目构建工具,我们这里使用 mill 为例 版本 mill 工具构建时对版本有强依赖关系,版本号不一致就会自动下载,创建环境需要检查 Chisel / Scala / Mill 的版本,mill 构建工具更 阅读全文
posted @ 2024-05-09 22:35 DevilXXL 阅读(620) 评论(0) 推荐(0)
摘要: 强烈推荐 《香山源代码剖析》作为入门 Chisel 的教材 —— 2024 / 10 / 12 一年多前接触 Chisel 望 Scala 晦涩不堪的语法而却步。这一年多 Chisel 经过几次大版本更新,特别是切换后端后[1]生成 HDL 代码可读性提升一大截;更有小道消息最新 VCS 新增支持 阅读全文
posted @ 2024-04-26 22:47 DevilXXL 阅读(903) 评论(0) 推荐(0)
摘要: CIM 发展这么多年,RRAM CIM 和 SRAM CIM 各自精彩。前几天 TSMC+新竹清华的张孟凡老师团队在 Science 上发表 RRAM + SRAM CIM 的 Fusion CIM 工作[1]。 Review Digital SRAM CIM 相较其他主流 AI 加速器范式区别不大 阅读全文
posted @ 2024-04-25 16:46 DevilXXL 阅读(801) 评论(0) 推荐(0)
摘要: ❗️此坑还没填完 最近 Chisel 改用 CIRCT 的 firtool 作为 FIRRTL 的编译后端,不仅生成 Verilog 可读性上升一大截,速度也快上不少[1]。据说新版本 VCS 也支持 Chisel 了。UC Berkey 技能树点得真是猛 来圣地巡游学习一下著名的 RocketCh 阅读全文
posted @ 2024-04-23 21:11 DevilXXL 阅读(430) 评论(0) 推荐(0)
摘要: ❗️此坑还没填完 TODO: GS 组成 point cloud render flow optimize 仓库结构 仓库由 C++/CUDA 和 Python 组成,CUDA 包括 diff-rasterization ,Python 包括 optimize 。CUDA 部分依赖 glm ,只用了 阅读全文
posted @ 2024-04-23 16:47 DevilXXL 阅读(1151) 评论(0) 推荐(0)