My AETHS show me the way to infinity and beyond

摘要:Tensor Processoring UnitTPU V1 20152CH的2133MHz的DDR3内存是Off Die的,一共8GiB;内存的带宽:2Channel*2133MHz*64bit/8/1000=34GB/s256*256=65536 8bit MAC 矩阵乘法单元700MHz,Peak :65536*2(M/A)*700MHz=92T INT8 Operations/second... 阅读全文
posted @ 2020-07-03 23:56 AETHS 阅读(21) 评论(0) 推荐(0) 编辑
摘要:什么是脉动阵列脉动阵列,是现在某些智能加速芯片的一种架构;由一组处理单元 Processor Elements组成;处理单元简称是PE,也经常简称为Cell;所有的Cell是用Mesh结构互连起来;每个Cell处理一系列的流经自己的数据;之后传递给邻居的Cell,大部分的Cell都是相同的操作。SIMD和脉动阵列的区别SIMD是和其相似的架构,但是SIMD如名字表达的那样,控制指令是唯一的,数据是... 阅读全文
posted @ 2020-07-02 21:34 AETHS 阅读(17) 评论(0) 推荐(0) 编辑
摘要:系统-Fugaku System名字的来源就是Mount Fuji,简单翻译就是富士山或者富岳的意思一个系统有396个满配的Rack和36个半配的Rack;一个Rack有384个Node(CPU);那么Node数目就是396Full *384+36Half*192=152064+6912=158976个CPU;Rack高度2000mm,宽度800mm,深度是1400mm;存储分为三层第一层是全局文... 阅读全文
posted @ 2020-06-23 21:23 AETHS 阅读(178) 评论(0) 推荐(0) 编辑
摘要:2020年6月19日,因为疫情也是在线的会议,下面是真正的slogan和会议的名字。但是我更加喜欢宣传片中的:百业流深,润物无声。言归正传,这次轻描淡写的一共发布了四个硬件产品:3rd Xeon SP for 4S/8S platformUPI的速度没变,数量有较大的提升;最高支持6个;Bfloat16的支持,还是和CLX一样;内存的通道数没提高,但是内存的频率可以提高到DDR4-3200MT/s... 阅读全文
posted @ 2020-06-20 22:29 AETHS 阅读(38) 评论(0) 推荐(0) 编辑