摘要: CIM 发展这么多年,RRAM CIM 和 SRAM CIM 各自精彩。前几天 TSMC+新竹清华的张孟凡老师团队在 Science 上发表 RRAM + SRAM CIM 的 Fusion CIM 工作[1]。 Review Digital SRAM CIM 相较其他主流 AI 加速器范式区别不大 阅读全文
posted @ 2024-04-25 16:46 DevilXXL 阅读(895) 评论(0) 推荐(0)
摘要: ❗️此坑还没填完 最近 Chisel 改用 CIRCT 的 firtool 作为 FIRRTL 的编译后端,不仅生成 Verilog 可读性上升一大截,速度也快上不少[1]。据说新版本 VCS 也支持 Chisel 了。UC Berkey 技能树点得真是猛 来圣地巡游学习一下著名的 RocketCh 阅读全文
posted @ 2024-04-23 21:11 DevilXXL 阅读(451) 评论(0) 推荐(0)
摘要: ❗️此坑还没填完 TODO: GS 组成 point cloud render flow optimize 仓库结构 仓库由 C++/CUDA 和 Python 组成,CUDA 包括 diff-rasterization ,Python 包括 optimize 。CUDA 部分依赖 glm ,只用了 阅读全文
posted @ 2024-04-23 16:47 DevilXXL 阅读(1189) 评论(0) 推荐(0)
摘要: 杜书丞,目前正在香港科技大学攻读 Permanent Head Damage 学位,指导导师是 Tim CHENG 教授。对流片庞大的人物力开销深恶痛绝,每当压力超过阈值就会转换成文字宣泄出来 于是有了这个博客 lab 主页 | 知乎主页 | 领英主页 | 邮件 为什么要写博客:忙碌世界外的花园 费 阅读全文
posted @ 2024-04-23 16:44 DevilXXL 阅读(129) 评论(0) 推荐(0)
摘要: 硬件决定上限,软件实现上限。即使是顶尖的硬件也需要匹配优秀的软件栈才能发挥最大功效。如今 Machine Learning Compiler 主要有 Apache TVM 和 MLIR(Multi Level IR) 两种范式。让我们来研究一下 TVM 如何支持新的 backend。 Apache 阅读全文
posted @ 2024-04-20 11:17 DevilXXL 阅读(318) 评论(0) 推荐(0)
摘要: Transistor-level 的 Analogy SRAM CIM 回顾 阅读全文
posted @ 2024-03-07 23:55 DevilXXL 阅读(401) 评论(0) 推荐(0)
摘要: Memristor 阵营目前主要四哥们:ReRAM、FeRAM、PCM、MRAM。 存储器件 横向对比其他存储器件,数据如下图: Memristor 商用成本高 根据2021年的数据[1], PCM 在四哥们里最接近商用,但在价格、能量、容量上主流 NAND 固态碾压四兄弟。21 年人民币对美元汇率 阅读全文
posted @ 2024-02-02 01:54 DevilXXL 阅读(511) 评论(1) 推荐(0)
摘要: 这半年,从零开始了科研生活,每天在论文和代码海里摸爬滚打。说自己迈入了科研的大门,那是远远不够格的,现在只是一个门外汉伸长了脖颈想往大门里面巴望。 虽然目前仍是硕果一个没有,但我认为科研是不分大小的。用异于一般的学习思维的考量事物,便可称作科研。于此复盘半年的科研生活和思路,自勉之。 科研生活大致可 阅读全文
posted @ 2023-11-10 02:53 DevilXXL 阅读(276) 评论(0) 推荐(0)