会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
懒猫后花园
哦,这该死的代码!
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
下一页
2024年7月21日
数据依赖(一):流水线中的相关和冒险(Hazard)
摘要: 在数字电路中也有冲突冒险的概念,也表示对公共资源的冲突,此文的冒险则侧重于流水线并行中的冒险概念。 现代 ISA 并非描述依赖的语言 数据相关即 Producer-Consumer 关系,后一个指令的输入依赖前一个指令的输入,根据因果性二者的执行必须串行。这种指令间的因果依赖关系要靠图结构来表示,每
阅读全文
posted @ 2024-07-21 00:39 DevilXXL
阅读(150)
评论(0)
推荐(0)
2024年7月12日
Dark Silicon 暗硅,先进节点的运算极限
摘要: Introduction ITRS [1]每次预测未来 15 年半导体的发展,2024 年恰好是 Dark Silicon 文章写作年份 ITRS 预测最后一年[2]。15 年回首,重温 《Dark silicon and the end of multicore scaling》[3] 这篇伟大文
阅读全文
posted @ 2024-07-12 18:36 DevilXXL
阅读(375)
评论(0)
推荐(0)
2024年6月27日
半年小结 Vol2. 半年一度的画饼时刻
摘要: 朋友们好,距离上篇总结又过去了半年,这句话非常重量,代表我cos科研人员已经一年!奉上一年总结,自勉之! Outline 修正先前的科研生活模型[1],带 * 号在先前的博客中有涉及。 A. 知识输入 读什么文章* (带着目的做调研) 怎么快速判断文章好不好* (数据是普适价值) B. 产出 如何选
阅读全文
posted @ 2024-06-27 17:39 DevilXXL
阅读(154)
评论(0)
推荐(0)
2024年5月26日
维多利亚三的经济机制
摘要: ❗️此坑还没填完 人造游戏尚难以用模型以概之,何况真实世界? 经济增长即是总产出增长 Cobb-Douglas 生产函数: \[Y = A K^{\alpha} L^{\beta} \]产出 \(Y\) (total production)和什么相关? 可累加投入(规模) 劳力投入(Labor) \
阅读全文
posted @ 2024-05-26 21:43 DevilXXL
阅读(405)
评论(0)
推荐(0)
2024年5月23日
Polyhedral Model: DNN Nested Loop 的实现模型
摘要: 循环是迭代空间的一个点 使用嵌套循环(Nested Loop)抽象不同的 DNN 乘加算子[1],使用多面体数学模型(Polyhedral Model)抽象循环的变换优化。 多面体模型里循环可以用迭代向量或者迭代点表示,我们以常见的 Linear Projection Layer 为例分析,该循环的
阅读全文
posted @ 2024-05-23 23:20 DevilXXL
阅读(276)
评论(0)
推荐(0)
2024年5月9日
Chisel 项目环境配置
摘要: 以 [1] 参考, Chisel 版本 6.0。Chisel 使用 mill 或 sbt 作为项目构建工具,我们这里使用 mill 为例 版本 mill 工具构建时对版本有强依赖关系,版本号不一致就会自动下载,创建环境需要检查 Chisel / Scala / Mill 的版本,mill 构建工具更
阅读全文
posted @ 2024-05-09 22:35 DevilXXL
阅读(620)
评论(0)
推荐(0)
2024年4月26日
Chisel 再回首
摘要: 强烈推荐 《香山源代码剖析》作为入门 Chisel 的教材 —— 2024 / 10 / 12 一年多前接触 Chisel 望 Scala 晦涩不堪的语法而却步。这一年多 Chisel 经过几次大版本更新,特别是切换后端后[1]生成 HDL 代码可读性提升一大截;更有小道消息最新 VCS 新增支持
阅读全文
posted @ 2024-04-26 22:47 DevilXXL
阅读(903)
评论(0)
推荐(0)
2024年4月25日
RRAM SRAM Fusion CIM 论文阅读
摘要: CIM 发展这么多年,RRAM CIM 和 SRAM CIM 各自精彩。前几天 TSMC+新竹清华的张孟凡老师团队在 Science 上发表 RRAM + SRAM CIM 的 Fusion CIM 工作[1]。 Review Digital SRAM CIM 相较其他主流 AI 加速器范式区别不大
阅读全文
posted @ 2024-04-25 16:46 DevilXXL
阅读(801)
评论(0)
推荐(0)
2024年4月23日
SoC | Rocket SoC 圣地巡游
摘要: ❗️此坑还没填完 最近 Chisel 改用 CIRCT 的 firtool 作为 FIRRTL 的编译后端,不仅生成 Verilog 可读性上升一大截,速度也快上不少[1]。据说新版本 VCS 也支持 Chisel 了。UC Berkey 技能树点得真是猛 来圣地巡游学习一下著名的 RocketCh
阅读全文
posted @ 2024-04-23 21:11 DevilXXL
阅读(430)
评论(0)
推荐(0)
渲染 | Gaussian Splatting 源码解析
摘要: ❗️此坑还没填完 TODO: GS 组成 point cloud render flow optimize 仓库结构 仓库由 C++/CUDA 和 Python 组成,CUDA 包括 diff-rasterization ,Python 包括 optimize 。CUDA 部分依赖 glm ,只用了
阅读全文
posted @ 2024-04-23 16:47 DevilXXL
阅读(1151)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
下一页
公告