摘要:最近想要实现CNN的FPGA加速处理,首先明确在CNN计算的过程中,因为卷积运算是最耗时间的,因此只要将卷积运算在FPGA上并行实现,即可完成部分运算的加速 那么对于卷积的FPGA实现首先要考虑的是卷积子模板具体如何实现,我们在matlab或者c实现比如3X3的子模板的时候,只要用一个数组即可将模板
阅读全文
摘要:一、HOG算法 HOG的一个详细的介绍:https://www.cnblogs.com/wyuzl/p/6792216.html fast-hog源码实现流程整理xmind HOG的核心思想是通过检测局部物体的梯度和边缘方向信息得到被检测物体的局部特征,HOG能较好的捕捉到局部形状信息,而且对几何以
阅读全文
摘要:首先还是把握大的系统框架: 我要实现的部分不包括DA以及AD的转换,主要是将SSP接收到的数据送入到FIFO中,然后经过FIR带通滤波器的处理后对该信号计算幅值并做PSD,然后处理的信号经过积分够一方面送入到FIFO一方面进行均值滤波(实际上就是在一定的积分门时间内做累加操作)。最后结果通过通信模块
阅读全文
摘要:PCA的实质就是要根据样本向量之间的相关性排序,去掉相关性低的信息,也就是冗余的特征信息。 我们都知道噪声信号与待测量的信号之间实际上是没有相关性的,所以我我们利用这个原理就可以将与待测量无关的噪声信号PCA去噪 PCA的原理也就是它的简单的实现过程就是: 首先将样本数据构造成对应的数据矩阵,然后求
阅读全文
摘要:3种方法: 1.JPL近似的实现方法 2.调用IP模块的cordic算法实现效果 可选模式可以是fraction或者intergalactic 工程中输入数据的范围是远大于2的,于是我们可以采用实现方法是将所有的数据先归一化成-2~2之间,然后再进一步的采用cordic模块 IP的配置如下 3.牛顿
阅读全文
摘要:采用线性逼近法结合32段线性查找表的方式来实现1/z的计算。 首先将1/32-1/64的定点化数据存放到ROM中,ROM中存放的是扩大了2^20 次方的数字四舍五入后的整数部分。n值越大,精度越大,误差越小。这里取n=20; ROM中存储的数据是1/(32+i)*2^20的四舍五入的整数部分。 32
阅读全文
摘要:全局观查,对整个工程的搭建的关键是要保证PL部分搭建成功,PS部分搭建成功,而且两者配合的很好。 我理解的PL部分涉及到模块的组合以及模块或者IP之间的逻辑的整理,PL部分困扰我比较久的是自动生成的wrapper总是会把一些自己需要特殊考虑的信号全部综合成端口,所以需要我们设计的部分就是把实现的wr
阅读全文
摘要:zynq架构之别人整理http://xilinx.eetrend.com/blog/4415 在验证算法时,首先第一步就是如何载入图片进行验证,这里的图像包括图像,视频数据流,外部摄像头的调用~ HLS中两种基础的加载方法: 1)通过 cvLoadImage 函数加载图片 格式: IplImage*
阅读全文
摘要:FPGA IO驱动能力设置对设计的影响 FPGA有各种逻辑电平输出标准信号,包括1.2V1.8V以及3.3V理论上而言可以通过改变IO输出电平的设置改变输出,但实际上并不能因此达到要求,需要改变电路板子上的跳线帽才能修改该电平,此外修改IO的驱动电流或者IO输出电平,能够达到改变驱动波形的输出。 最
阅读全文