05 2014 档案
摘要:一般的矩阵旋转操作都是对矩阵中的元素逐个操作,假设矩阵大小为m*n,那么时间复杂度就是o(mn)。如果使用了arm公司提供的neon加速技术,则可以并行的读取多个元素,对多个元素进行操作,虽然时间复杂度还是o(mn),但是常数因子会变小,并且在寄存器里的操作比在普通内存中还要快一些,所以会带来一定的...
阅读全文
摘要:在对基于ARM-v7处理器及以上的程序进行优化时,可以使用neon优化技术来加速程序。不过搞这个的人比较少,所以网上有用的资料很稀少。我翻了半天国内国外的博客,发现还是ARM公司的帮助网站最有用:http://infocenter.arm.com/help/index.jsp如下面截图所示,在左面的...
阅读全文

浙公网安备 33010602011771号