随笔分类 -  论文分析和复现

摘要:ConvReLU++ Reference-based Lossless Acceleration of Conv-ReLU Operations on Mobile CPU 1 核心问题 为了优化边缘设备上的 CNN 推理,我们寻求一个机会来节省 ReLU 的计算和延迟。ReLU 是一种广泛使用的 阅读全文
posted @ 2024-01-03 23:23 SheepHuan 阅读(197) 评论(0) 推荐(0)
摘要:原文地址 Abstract (key idea) 现在的Mobile Devices配备了很多的CPU+GPU+DSP的设备。但是现在的大多数NN model因为自己的顺序结构导致无法充分地利用这些异构处理器。本文提出了一种新的模型适应(model adaption)策略NN-Stretch,它针对 阅读全文
posted @ 2023-11-03 16:11 SheepHuan 阅读(485) 评论(1) 推荐(0)
摘要:intel NCS2计算棒是由openvino支持的,但是目前openvino只有2022.3.1版本支持NCS2了,之后的版本都不支持计算棒了。 本文记录一下再NVIDIA Jetson Nano上用openvino实现NCS2的调用。 通过交叉编译openvino samples,通过bench 阅读全文
posted @ 2023-10-16 20:19 SheepHuan 阅读(291) 评论(0) 推荐(0)
摘要:这篇工作还是做的是一个DVFS技术,来动态调整CPU/GPU的电压和频率,达到节能、控温。 1. introduction 传统的DVFS技术主要停留在操作系统内核层面,与应用程序无关。但是不同的应用的需求决定了它们的最佳的CPU,GPU的功耗分布。 一些DVFS无法摆脱过热的问题。这里举例(图1) 阅读全文
posted @ 2023-10-10 15:08 SheepHuan 阅读(208) 评论(0) 推荐(0)
摘要:1.1 introduction 传统的DVFS的解决方案现在变成了次优解,因为没考虑到工作负载的特性。zTT提到了。 最近的面向应用的(application-oriented)的研究,通过给定应用的工作负载的上下文来学习和预测合适处理器频率。很难广泛应用开来。 现在手机的多任务情况越来越多,面向 阅读全文
posted @ 2023-10-08 16:50 SheepHuan 阅读(334) 评论(0) 推荐(1)
摘要:## 1 [MobileOne](https://arxiv.org/pdf/2206.04040.pdf) ### 1.1 重要分析(Insight) 1. 作者为了找到**端侧推理时模型架构中的瓶颈部分**,它基于CoreML在iPhone上进行了延迟测试。 2. 经过测试,作者认为对于移动设备 阅读全文
posted @ 2023-05-26 23:15 SheepHuan 阅读(329) 评论(0) 推荐(0)
该文被密码保护。
posted @ 2023-05-25 13:44 SheepHuan 阅读(3) 评论(0) 推荐(0)