随笔分类 - CV&DL
深度学习和图像识别相关
摘要:1. 基本要求 从直观理解,一个目标检测网络性能好,主要有以下表现: 把画面中的目标都检测到——漏检少 背景不被检测为目标——误检少 目标类别符合实际——分类准 目标框与物体的边缘贴合度高—— 定位准 满足运行效率的要求——算得快 下图是从 Tensorflow Object Detection A
阅读全文
摘要:论文题目:Robust Lane Detection via Expanded Self Attention 链接地址:https://arxiv.org/abs/2102.07037 文章核心想要解决的是车道线遮挡、缺失、模糊等情况下的识别精度问题。主要通过一个自注意力模块,增强网络对于这部分车道
阅读全文
摘要:OpenCV从3.3版本就开始引入DNN模块,现在已经是4.5版本了,DNN模块的支持度也更好了。目前OpenCV已经支持ONNX格式的模型加载和推理,后端的推理引擎也有了多种选择。 而Pytorch作为目前易用性相对最好的深度学习训练框架,使用非常广泛。Pytorch的pth格式模型没法直接用Op
阅读全文
摘要:在目标跟踪领域,Kalman滤波器是一个很常用的方法。 以在二维平面中跟踪一个物体的位置和速度为例,说明如果实现一个简单的Kalman跟踪器。 具体使用OpenCV中的KalmanFilter类来实现。 1. 参数初始化 kalman = cv2.KalmanFilter(4,2) 表示Kalman
阅读全文
摘要:1. 成像曝光模型 曝光量 = 光线强度×通光孔径×曝光时间×感光强度 成像曝光的天平模型: 光线强度:相当于雨的大小,单位时间内的降雨量; 通光孔径:镜头的光圈大小,相当于盛水的杯子的口径,能够同时接雨水的截面积; 曝光时间:也称快门速度,相当于用杯子接雨水的持续时间; 感光强度:感光元件的信号增
阅读全文
摘要:最近在项目中,涉及到对行为和状态进行建模的需求,尝试用有限状态机(Finite-state machine, FSM)来实现。 1. 概念介绍 1.1 运行机制 基于对有限状态机的粗浅理解,大体的运行机制为: 系统所处的状态是明确并且有限的,必定属于状态全集中的某一种; 系统接受输入,根据判定条件,
阅读全文
摘要:近期阅读的几篇关于车道线检测的论文总结。 1. 任务需求分析 1.1 问题分析 针对车道线检测任务,需要明确的问题包括: (1)如何对车道线建模,即用什么方式来表示车道线。 从应用的角度来说,最终需要的是车道线在世界坐标系下的方程。而神经网络更适合提取图像层面的特征,直接回归方程参数不是不可能,但限
阅读全文
摘要:0. 引子 在训练轻量化模型时,经常发生的情况就是,明明 GPU 很闲,可速度就是上不去,用了多张卡并行也没有太大改善。 如果什么优化都不做,仅仅是使用nn.DataParallel这个模块,那么实测大概只能实现一点几倍的加速(按每秒处理的总图片数计算),不管用多少张卡。因为卡越多,数据传输的开销就
阅读全文
摘要:在Python下,利用pip安装预编译的opencv库,并实现h264格式的视频编码。 1. 安装OpenCV $ pip install opencv-python 建议在python虚拟环境下安装,不容易产生相互影响。 2. 代码示例 读取笔记本自带摄像头,并保存为视频的最简实现。 import
阅读全文
摘要:AMP:Automatic mixed precision,自动混合精度,可以在神经网络推理过程中,针对不同的层,采用不同的数据精度进行计算,从而实现节省显存和加快速度的目的。 在Pytorch 1.5版本及以前,通过NVIDIA出品的插件apex,可以实现amp功能。 从Pytorch 1.6版本
阅读全文

浙公网安备 33010602011771号