会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
信
旅途日志
博客园
首页
新随笔
联系
订阅
管理
[置顶]
登堂入室:毫米波雷达开发手册之信号模型
摘要: 本文为笔者的毫米波雷达开发手册之信号模型章节,主要解读时域信号模型、空域信号模型和信号处理栈。登堂入室!Let us make millimeter-wave radar serve everyone!
阅读全文
posted @ 2023-05-07 16:00 信海
阅读(4088)
评论(2)
推荐(16)
2025年1月6日
TORCH-NGP环境配置
摘要: 楼主的服务器是NVIDIA RTX 4090,可支持12.2CUDA驱动,但是TORCH-NGP中CUDA函数与TORCH=1.11.0版本适配,因此需要安装符合TORCH-NGP的CUDA环境。建议不要用github官网上的指令【https://github.com/ashawkey/torch-
阅读全文
posted @ 2025-01-06 17:16 信海
阅读(158)
评论(0)
推荐(0)
2024年11月13日
微架构
摘要: 在硬件加速器中,微架构(Microarchitecture)指的是计算设备(如CPU、GPU、TPU等)内部的硬件设计和组织结构,它定义了硬件组件之间的具体布局、操作方式以及彼此如何交互。微架构可以视为硬件在逻辑层面的实现方式,确定了如何实现指令集架构(ISA)的细节。 在微架构中,典型的组成部分包
阅读全文
posted @ 2024-11-13 19:27 信海
阅读(122)
评论(0)
推荐(0)
2024年11月10日
eNVM
摘要: RRAM(电阻式随机存储器) 数据编码:RRAM利用不同的电阻状态编码数据,通常通过高电阻状态(HRS)和低电阻状态(LRS)来分别表示二进制的“0”和“1”。这种电阻变化通过施加特定的电压或电流来改变存储单元的导电性。 计算方式:在存内计算中,RRAM通过施加控制电压来实现逻辑运算和矩阵运算。RR
阅读全文
posted @ 2024-11-10 10:36 信海
阅读(103)
评论(0)
推荐(0)
2024年11月8日
热数据&冷数据
摘要: 在系统架构设计中,数据的存储和获取方式通常基于数据的访问频率和性能需求。针对不同访问频率的数据,常见的处理方式如下: 频繁访问的数据(热数据) 对于频繁访问的数据,一般会选择更高性能的存储方式,以保证数据的快速读取。这些数据的特征是高并发访问、低延迟要求。常见的存储和获取方式包括: 内存数据库(如R
阅读全文
posted @ 2024-11-08 00:10 信海
阅读(266)
评论(0)
推荐(0)
2024年11月7日
B样条插值加速
摘要: B样条插值通常涉及较多的计算,尤其是在处理大量数据或需要实时响应的应用中。以下是一些常见的B样条插值加速方法: 预计算基函数值 B样条的插值计算依赖于基函数值。对于固定阶数和节点的情况,可以预先计算出基函数值并存储在查找表中,以便在插值时快速查表,避免重复计算。这样在实际计算中,只需要进行查找和简单
阅读全文
posted @ 2024-11-07 23:47 信海
阅读(184)
评论(0)
推荐(0)
KAN&MLP
摘要: MLP 多层感知器(MLP)在深度学习和科学任务中的一些主要问题包括: 固定的激活函数:MLP的激活函数通常是固定的,应用在网络节点(神经元)上,这限制了模型的表达能力。相较之下,KAN允许在边缘(权重)上使用可学习的激活函数,使模型更具适应性和灵活性。 维度诅咒(Curse of Dimensi
阅读全文
posted @ 2024-11-07 21:21 信海
阅读(173)
评论(0)
推荐(0)
2024年11月4日
稀疏感知&稀疏预定义数据调度器
摘要: 稀疏感知的数据调度器和稀疏预定义的数据调度器虽然都针对稀疏数据的高效调度,但在处理方式和灵活性上有所不同。 稀疏感知数据调度器(Sparse-Aware Scheduler) 稀疏感知数据调度器的核心在于其动态适应性和智能调度能力。它不仅知道数据是稀疏的,还能动态识别稀疏性模式并实时适应调度,例如在
阅读全文
posted @ 2024-11-04 22:06 信海
阅读(95)
评论(0)
推荐(0)
2024年11月3日
MERCURY: Accelerating DNN Training By Exploiting Input Similarity
摘要: 动机与创新点 这篇论文的主要动机在于应对深度神经网络(DNN)训练过程中计算量过大的问题。DNN训练中包含大量的多维点积运算,尤其是当输入数据存在相似性时,这种计算可以优化。MERCURY提出了一种利用输入相似性的硬件加速方案,通过使用随机投影和量化(RPQ)生成输入向量的签名,存储在MCACHE中
阅读全文
posted @ 2024-11-03 14:47 信海
阅读(84)
评论(0)
推荐(0)
2024年10月1日
PyRAML测量功耗
摘要: PyRAML测量功耗 total_pkg_energy = 0 total_dram_energy = 0 count = 0 for i in range(repetitions): measure = pyRAPL.Measurement('bar') with measure: with to
阅读全文
posted @ 2024-10-01 20:23 信海
阅读(34)
评论(0)
推荐(0)
2024年5月22日
Product Quantization
摘要: Background 如何在数据海量的内容库中快速检索出Top-k的信息候选? 缩小查找的范围,快速找到最有可能成为近邻的一个粗集合 对Embedding向量做压缩,快速计算两个Embedding的距离。 本实践内容的代码管理在Codes24/FlashCIM/文件夹下的pq_lib中 Vector
阅读全文
posted @ 2024-05-22 15:49 信海
阅读(444)
评论(0)
推荐(0)
下一页
公告