摘要: CMOS 电路一般而言是不提供高阻态状态的,要提供高阻状态就得有特殊的电路安排,可是那样就使芯片上的电路单元不规整划一了……对于像这样的电路的实现,现在采用的策略是将其做成标准件供程序员选用,但不向程序员开放高阻状态,以免滥用——《香山源码剖析》5.1 组合电路 阅读全文
posted @ 2024-10-04 10:52 DevilXXL 阅读(861) 评论(0) 推荐(0)
摘要: 今日不少北京的朋友在朋友圈晒出了漂亮的晚霞,欣赏美景之余不禁好奇,为何晚霞是红色呢?GPT 给出的回答无非绕不开瑞利散射对波长特性不一致,而落日时角度使得光路长度不一致,进而导致晚霞红色。但进一步深究,光路长度怎么影响到波长?傍晚红光穿透力强,蓝光被散射了,为何直射天空是蓝色的?GPT 就开始胡扯了 阅读全文
posted @ 2024-09-20 21:40 DevilXXL 阅读(320) 评论(0) 推荐(0)
摘要: 捏他下相对论~可重构计算和时空域概念高度关联,而相对论也是探讨时空域之间的关联关系 阅读全文
posted @ 2024-09-13 12:07 DevilXXL 阅读(278) 评论(0) 推荐(0)
摘要: 本文是 Mamba 阅读第一篇文章,本来想从三个问题出发(1)不同 SSM 模型的区别是什么?(2)Transformer 和 SSM 可以等效吗?什么情况下可以等效?(3)很多实验表明 Mamba1 和 Mamba2 并不是单纯替代关系[1],Mamba2 相比 Mamba1 的变化是什么?即 S 阅读全文
posted @ 2024-09-06 20:21 DevilXXL 阅读(1017) 评论(3) 推荐(1)
摘要: 广义来说并行分为俩种,提高单元效率是时域并行,一般是通过提高 utilization,而增加单元数量则是空域并行。现代处理器中往往各种并行机制混合存在,本文旨对不同的并行机制分析归类。大部分并行机制都是针对俩个问题:1)解耦单元之间的依赖关系提高并行度 [1],以及2)访存问题,后续并行机制大都可以 阅读全文
posted @ 2024-08-23 19:52 DevilXXL 阅读(56) 评论(0) 推荐(0)
摘要: ETH Computer Architecture Fall 2023 [1]课程笔记 从 parallelism 到 heterogeneity Admal's Law 和 Polloack's Rule 支撑 parallelism。理想 N 核对单核加速比遵守 \(s = \frac{1}{p 阅读全文
posted @ 2024-08-09 22:42 DevilXXL 阅读(138) 评论(0) 推荐(0)
摘要: “数学的关键是作图呐!”—— 知名数学教师,孙庆宏 Bayesian Inference Overview of IC Design 从 PPA 出发想办法把各项指标关系用一张图表示,很多地方还不是展现得很好,比如 Arch 的部分都用 utilization 概括了,用 FLOPS 表示 perf 阅读全文
posted @ 2024-08-07 15:01 DevilXXL 阅读(36) 评论(0) 推荐(0)
摘要: ZigZag 在 PE array-memory hierarchy level 上对 nested-loop based 算子数据部署设计策略进行详细分析。文章作者来自鲁汶 MICAS [1]实验室。 软硬件建模 软件上只涉及 MAC-based 的网络算子(Linear、Convolutiona 阅读全文
posted @ 2024-08-04 18:18 DevilXXL 阅读(196) 评论(0) 推荐(0)
摘要: 互联网络泛泛谈 互联网络是一种图结构,节点之间通过边连接。比如一般总线计算机架构中 CPU、Memory、Timer 等模块看作节点, 通过总线相连。 每个节点在网络中的身份是不对等的,有 master 和 slave 之分,或者按 TLM 中的模型 initiator 和 target。Initi 阅读全文
posted @ 2024-07-29 23:22 DevilXXL 阅读(146) 评论(0) 推荐(0)
摘要: ❗️此坑还没填完,等到后面用到 triton 再补充 既生 CUDA, 何生 triton CUDA 编程昂贵上手门槛促使 triton 的诞生[1]。 语法福利 相比 CUDA C++ like 的设计风格,triton 使用 python。语法回避 C++ 模板编程和指针;环境集成比起 Pyto 阅读全文
posted @ 2024-07-26 16:52 DevilXXL 阅读(863) 评论(0) 推荐(0)