上一页 1 2 3 4 5 6 ··· 62 下一页
摘要: Xe分为四个系列; 用模块化的方式组合: Xe HPC的Xe Core:里面有8个Vector Engine和8个XMX Engine,以及8个深度脉动阵列;512KiB L1 Cache; 每个Vector Engine是512bit的,1个时钟周期可以完成512/32=16个FMA的操作; 因此 阅读全文
posted @ 2021-08-29 09:42 kongchung 阅读(217) 评论(0) 推荐(0) 编辑
摘要: 问题提出,也就是说内存和处理器之间的带宽永远都会存在,刚不过就躲一下,直接在内存进行计算。 Aquabolt已经是三星电子的HBM2的内存,Aquabolt-XL是基于HBM2构建了PIM的产品;是这种形式产品的第一代; 上面图中的比较是HBM2和DRAM的比较,不是HBM2-PIM和HBM2的比较 阅读全文
posted @ 2021-08-25 00:05 kongchung 阅读(776) 评论(0) 推荐(0) 编辑
摘要: 我从Intel的微信的公众号了解到这个系列,这上面的有汉化的字幕; 第一部分:https://mp.weixin.qq.com/s/27dwNmoc5GNgiIq1-jNMpQ 第二部分:https://mp.weixin.qq.com/s/RZIUgxLc8EHyyVIorkGY2Q 在Intel 阅读全文
posted @ 2021-05-30 21:27 kongchung 阅读(159) 评论(0) 推荐(0) 编辑
摘要: 看到下面的白皮书的两段话: https://images.nvidia.com/aem-dam/en-zz/Solutions/data-center/nvidia-ampere-architecture-whitepaper.pdf Using FP16/FP32 mixed-precision 阅读全文
posted @ 2021-05-23 07:13 kongchung 阅读(297) 评论(0) 推荐(0) 编辑
摘要: Yoshua Bengio,蒙特利尔大学教授; Geoffrey Hinton,多伦多大学教授,Google的VP; Yann LeCun,纽约大学教授,Facebook的VP; for conceptual and engineering breakthroughs that have made 阅读全文
posted @ 2021-05-13 21:41 kongchung 阅读(82) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 62 下一页