上一页 1 ··· 282 283 284 285 286 287 288 289 290 ··· 367 下一页
摘要: GPU端到端目标检测YOLOV3全过程(上) Basic Parameters: Video: mp4, webM, avi Picture: jpg, png, gif, bmp Text: doc, html, txt, pdf, excel Video File Size: not more 阅读全文
posted @ 2020-10-21 07:06 吴建明wujianming 阅读(1069) 评论(0) 推荐(0)
摘要: 如何使用Intel vtune profilier? 阅读全文
posted @ 2020-10-20 14:29 吴建明wujianming 阅读(242) 评论(0) 推荐(0)
摘要: 如何使用Nsight System? 阅读全文
posted @ 2020-10-20 14:22 吴建明wujianming 阅读(1534) 评论(0) 推荐(0)
摘要: 如何使用Nsight Compute? 下图command Line Argunments是指训练或测试命令,Linux下直接用测试或训练命令 阅读全文
posted @ 2020-10-20 14:15 吴建明wujianming 阅读(1658) 评论(0) 推荐(0)
摘要: Yolov3&Yolov4网络结构与源码分析 从2018年Yolov3年提出的两年后,在原作者声名放弃更新Yolo算法后,俄罗斯的Alexey大神扛起了Yolov4的大旗。 文章目录 1. 论文汇总 2. Yolov3核心基础内容 2.1 网络结构可视化 2.2 网络结构图 2.3 核心基础内容 3 阅读全文
posted @ 2020-10-20 13:26 吴建明wujianming 阅读(12075) 评论(1) 推荐(1)
摘要: Yolov4性能分析(下) 六. 权重更新 "darknet/src/detector.c"--train_detector()函数中: ...... /* 开始训练网络 */ float loss = 0; #ifdef GPU if (ngpus == 1) { int wait_key = ( 阅读全文
posted @ 2020-10-20 12:15 吴建明wujianming 阅读(905) 评论(0) 推荐(0)
摘要: Yolov4性能分析(上) 一.目录 实验测试 1) 测试介绍 2) Test 3) Train 二. 分析 1.实验测试 1. 1 实验测试方法 Yolov4训练train实验方法(Darknet should be compiled with OpenCV): duration_run_dete 阅读全文
posted @ 2020-10-20 12:07 吴建明wujianming 阅读(2544) 评论(0) 推荐(0)
摘要: 基于自动驾驶车辆的NVIDIA-TensorRT推理实时优化 Optimizing NVIDIA TensorRT Conversion for Real-time Inference on Autonomous Vehicles 自动驾驶系统使用各种神经网络模型,这些模型需要在gpu上进行非常精确 阅读全文
posted @ 2020-08-22 13:28 吴建明wujianming 阅读(555) 评论(0) 推荐(0)
摘要: 利用NVIDIA NGC的TensorRT容器优化和加速人工智能推理 Optimizing and Accelerating AI Inference with the TensorRT Container from NVIDIA NGC 自然语言处理(NLP)是人工智能最具挑战性的任务之一,因为它 阅读全文
posted @ 2020-08-22 11:50 吴建明wujianming 阅读(1018) 评论(0) 推荐(0)
摘要: CUDA刷新器:CUDA编程模型 CUDA Refresher: The CUDA Programming Model CUDA,CUDA刷新器,并行编程 这是CUDA更新系列的第四篇文章,它的目标是刷新CUDA中的关键概念、工具和初级或中级开发人员的优化。 CUDA编程模型提供了GPU体系结构的抽 阅读全文
posted @ 2020-07-26 10:59 吴建明wujianming 阅读(343) 评论(0) 推荐(0)
上一页 1 ··· 282 283 284 285 286 287 288 289 290 ··· 367 下一页