摘要: 一、前言 PyTorch模型的高性能部署问题,主要关注两个方面:高度优化的算子和高效运行计算图的架构和runtime。python有快速开发以及验证的优点,但是相比C++来说速度较慢而且比较费内存,一般高性能场景都是使用C++去部署,尽量避免使用python环境。 TensorRT为什么那么快,因为 阅读全文
posted @ 2024-01-10 16:19 小金乌会发光-Z&M 阅读(41) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2023-05-06 11:09 小金乌会发光-Z&M 阅读(1) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2023-04-10 17:33 小金乌会发光-Z&M 阅读(0) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2023-04-06 16:59 小金乌会发光-Z&M 阅读(0) 评论(0) 推荐(0) 编辑
摘要: 一、问题描述 当我在C++多线程环境下使用OpenCV的cv::connectedComponentsWithStats函数,参数使用4连通(使用8连通没问题),但是报出了如下的错误: Program terminated with signal SIGSEGV, Segmentation faul 阅读全文
posted @ 2023-03-20 10:43 小金乌会发光-Z&M 阅读(152) 评论(0) 推荐(0) 编辑
摘要: 一、前言 在日常并行编程开发时,我们通常想到的方式有OpenMP,TBB和原生的多线程等。这里先简要各种比较结论如下,然后会在各部分详细论述: TBB需要相当可观的重新设计程序,而OpenMP足够简单; TBB不太适合并行化已有的实现,它为新设计的并行程序培养一种好的编程风格和更高的抽象层; 在论文 阅读全文
posted @ 2023-02-17 18:10 小金乌会发光-Z&M 阅读(2302) 评论(0) 推荐(0) 编辑
摘要: 一、前言 程序的CPU问题是另外一类典型的程序性能问题,很多开发人员都受到过程序CPU占用过高的困扰。本文首先探讨了CPU占用率的排查方法,其次针对一些典型的CPU问题进行分析,最后总结了一些实践心得。 二、CPU占用率排查方法 对于C/C++程序,目前业界使用的比较多的CPU热点定位工具有:val 阅读全文
posted @ 2023-02-10 17:42 小金乌会发光-Z&M 阅读(1624) 评论(0) 推荐(0) 编辑
摘要: 一、前言 YOLOv5是一个在COCO数据集上预训练的物体检测架构和模型系列,它是YOLO系列的一个延申,其网络结构共分为:input、backbone、neck和head四个模块,yolov5对yolov4网络的四个部分都进行了修改,并取得了较大的提升,在input端使用了Mosaic数据增强、自 阅读全文
posted @ 2023-01-10 17:27 小金乌会发光-Z&M 阅读(2101) 评论(0) 推荐(0) 编辑
摘要: 一、深度学习模型热更新 在工程中,完成一个模型的核心目标就是上线来跑,而且版本需要做迭代,或者是针对一些实时的情况,需要对模型或者模型内的参数进行热更新。然而,一旦服务上线了,就不能随意停止或者是重启服务,服务终止所带来的损失在互联网时代看来是非常难以支撑的,所以要保证尽可能小的损失的话,就需要有特 阅读全文
posted @ 2023-01-09 14:41 小金乌会发光-Z&M 阅读(1001) 评论(0) 推荐(0) 编辑
摘要: 论文一.工件表面微小缺陷的检测与识别方法 地址:http://journal.seu.edu.cn/oa/DArticle.aspx?type=view&id=201404010 针对微小缺陷在复杂背景图像情形下分割难的问题,提出了一种基于像元搜索算法的微小缺陷检测方法.首先采用直方图均衡化提升背景 阅读全文
posted @ 2023-01-08 23:13 小金乌会发光-Z&M 阅读(101) 评论(0) 推荐(0) 编辑