上一页 1 ··· 210 211 212 213 214 215 216 217 218 ··· 367 下一页
摘要: GPU指令集技术分析 本文将两篇文章整理了一下。 参考文章链接如下: https://zhuanlan.zhihu.com/p/391238629 https://zhuanlan.zhihu.com/p/166180054 一.GPGPU- 指令执行设计 本节主要内容: GPGPU指令执行简介 G 阅读全文
posted @ 2021-07-21 06:23 吴建明wujianming 阅读(9839) 评论(0) 推荐(1)
摘要: 寒武纪智能系统参数 思元290 MLU290-M5智能加速卡 MLU290-M5 MLU290-M5智能加速卡搭载寒武纪首颗训练芯片思元290,采用台积电7nm先进制程工艺,采用MLUv02扩展架构,集成了高达460亿的晶体管。MLU290-M5智能加速卡采用开放加速模块OAM设计,具备64个MLU 阅读全文
posted @ 2021-07-20 06:08 吴建明wujianming 阅读(795) 评论(0) 推荐(0)
摘要: TVM量化路线图roadmap INT8量化方案 本文介绍了量化过程的原理概述,提出了在TVM中实现量化过程的建议。 l 介绍量子化的背景知识 l INT8量化-后端代码生成 l 这个线程只 量子开发 基于搜索的自动量化 提出了一种新的量化框架,将硬件和训练方法结合起来。 借鉴已有的一些量化框架的思 阅读全文
posted @ 2021-07-19 06:17 吴建明wujianming 阅读(1227) 评论(0) 推荐(0)
摘要: EUV光刻机市场与技术 EUV光刻机市场 EUV光刻机已经成为芯片制造的支柱,台积电和三星等晶圆厂这几年不断追逐5nm和3nm等先进工艺,本身就是EUV光刻机采购大户,再加上现在这几大晶圆厂纷纷扩产建厂,无疑又加大了对EUV光刻机的需求。 除了晶圆厂等逻辑厂商之外,存储厂商也逐渐来到光刻机采用阶段, 阅读全文
posted @ 2021-07-18 07:26 吴建明wujianming 阅读(4052) 评论(0) 推荐(0)
摘要: 低数值精度推理和训练 介绍 如今,大多数商业深度学习应用程序使用 32 位浮点精度 ( ) 来处理训练和推理工作负载。各种研究人员已经证明,深度学习训练和推理都可以以较低的数值精度进行,使用 16 位乘法器进行训练,使用 8 位乘法器进行推理,精度损失最小甚至没有。使用这些较低的数值精度(使用累积到 阅读全文
posted @ 2021-07-17 14:58 吴建明wujianming 阅读(1160) 评论(0) 推荐(0)
摘要: FinFET与芯片制程 芯片制造商已经在基于 10nm 和/或 7nm finFET 准备他们的下一代技术了,但我们仍然还不清楚 finFET 还能坚持多长时间、用于高端设备的 10nm 和 7nm 节点还能延展多久以及接下来会如何。 在 5nm、3nm 以及更小节点,半导体行业还面临着巨大的不确定 阅读全文
posted @ 2021-07-17 06:24 吴建明wujianming 阅读(2163) 评论(0) 推荐(0)
摘要: LLVM Backend技术 LLVM编译器介绍 LLVM 是一个编译器基础设施的设计与实现,具有独特的多阶段优化系统。广泛支持过程间和配置文件驱动的优化,同时对于商业编译器系统也十分高效。 LLVM 虚拟指令集把系统作为一个整体关联到一起,使用高级的类型信息,来做低级的系统表象,支持链接时和链接后 阅读全文
posted @ 2021-07-16 06:23 吴建明wujianming 阅读(1221) 评论(0) 推荐(0)
摘要: 安霸Ambarella CV系列芯片 关于Ambarella(安霸半导体) Ambarella 的产品广泛应用于人类和计算机视觉领域,包括视频安防、高级驾驶辅助系统(ADAS)、电子后视镜、行车记录仪、驾驶员及舱内智能监控、汽车无人驾驶和机器人应用等。Ambarella 的低功耗处理器可用于智能摄像 阅读全文
posted @ 2021-07-15 06:05 吴建明wujianming 阅读(5653) 评论(0) 推荐(0)
摘要: 3D卷积,代码实现 三维卷积:理解+用例-发现 在图像卷积神经网络内核中,包含3D卷积及其在3D MNIST数据集上的实现。 什么是卷积? 从数学上讲,卷积是一种积分函数,表示一个函数g在另一个函数f上移动时的重叠量。 直觉地说,卷积就像一个混合器,将一个函数与另一个函数混合在一起,在保留信息的同时 阅读全文
posted @ 2021-07-14 06:14 吴建明wujianming 阅读(1917) 评论(0) 推荐(0)
摘要: TVM darknet yolov3算子优化与量化代码的配置方法 使用以下接口函数 l tvm.relay.optimize l quantize.quantize 实际代码: # convert nnvm to relay print("convert nnvm symbols into rela 阅读全文
posted @ 2021-07-13 06:11 吴建明wujianming 阅读(527) 评论(0) 推荐(0)
上一页 1 ··· 210 211 212 213 214 215 216 217 218 ··· 367 下一页