04 2024 档案
摘要:强烈推荐 《香山源代码剖析》作为入门 Chisel 的教材 —— 2024 / 10 / 12 一年多前接触 Chisel 望 Scala 晦涩不堪的语法而却步。这一年多 Chisel 经过几次大版本更新,特别是切换后端后[1]生成 HDL 代码可读性提升一大截;更有小道消息最新 VCS 新增支持
阅读全文
摘要:CIM 发展这么多年,RRAM CIM 和 SRAM CIM 各自精彩。前几天 TSMC+新竹清华的张孟凡老师团队在 Science 上发表 RRAM + SRAM CIM 的 Fusion CIM 工作[1]。 Review Digital SRAM CIM 相较其他主流 AI 加速器范式区别不大
阅读全文
摘要:❗️此坑还没填完 最近 Chisel 改用 CIRCT 的 firtool 作为 FIRRTL 的编译后端,不仅生成 Verilog 可读性上升一大截,速度也快上不少[1]。据说新版本 VCS 也支持 Chisel 了。UC Berkey 技能树点得真是猛 来圣地巡游学习一下著名的 RocketCh
阅读全文
摘要:❗️此坑还没填完 TODO: GS 组成 point cloud render flow optimize 仓库结构 仓库由 C++/CUDA 和 Python 组成,CUDA 包括 diff-rasterization ,Python 包括 optimize 。CUDA 部分依赖 glm ,只用了
阅读全文
摘要:杜书丞,目前正在香港科技大学攻读 Permanent Head Damage 学位,指导导师是 Tim CHENG 教授。对流片庞大的人物力开销深恶痛绝,每当压力超过阈值就会转换成文字宣泄出来 于是有了这个博客 lab 主页 | 知乎主页 | 领英主页 | 邮件 为什么要写博客:忙碌世界外的花园 费
阅读全文
摘要:硬件决定上限,软件实现上限。即使是顶尖的硬件也需要匹配优秀的软件栈才能发挥最大功效。如今 Machine Learning Compiler 主要有 Apache TVM 和 MLIR(Multi Level IR) 两种范式。让我们来研究一下 TVM 如何支持新的 backend。 Apache
阅读全文

浙公网安备 33010602011771号