摘要:学习YOLOv5算法,发现搜到的网络结构图不方便自己理解记忆,并且将pt模型转化成onnx之后,模型可视化后差异太大,简直看不出是同一个模型,虽然结果大致相同...,所以整理了一版网络结构图坚固原始模型在心里的地位,并配上yaml网络设置相关代码。 YOLOv5s网络结构: 其中橙色的数字表示层号,
阅读全文
摘要:15年论文,百度实验室 We introduce DenseBox, a unifified end-to-end FCN framework that directly predicts bounding boxes and object class confiences through all
阅读全文
摘要:谷歌出品。这篇文章是通过学习目标的结构和动力学特征来预测视频中的目标,从而实现非监督。利用识别关键点技术,将目标像素级别之间的关系提升到关键点之间的关系,更加接近语义特征,确定目标结构。通过VRNN算法确定从关键点特征中得到的动力学特征。 《摘要》 从无监督视频中学习到目标的结构和动力学特征是一个挑
阅读全文
摘要:关于反走样,这篇硕士论文进行了总结和创新。创新部分没有代码,我也没有验证这篇论文的创新点,因此摘录下其总结部分。 《绪论》 国内外研究现状中,包含了基本图形(直线、圆、椭圆)的反走样绘制现状和二维裁剪的现状。 论文的研究内容与创新点,点明文章将从以下3点创新: a、利用DDA和Wu算法测增量思路,以
阅读全文
摘要:很久前就想开始学习记录本文阅读笔记,一直在整理它的代码,拖到现在。 《摘要》 Long-range dependencies can capture useful contextual information to benefit visual understanding problems. “大(
阅读全文
摘要:借助于高分辨率图像提升低分辨率图像的识别性能。 论文地址:https://arxiv.org/pdf/1908.10027v1.pdf 目前无开源代码 创新点: 1、在模型上在胶囊网络的基础上添加了卷积层,可进行很低分辨率图像的识别; 2、提出了两个损失函数指导VLR(very low resolu
阅读全文
摘要:版权声明:本文为博主原创文章,未经博主允许不得转载。 1、动机 anchor free 和 proposal free anchor-based的弊病在于: ①模型计算量上,一个特征图像素点取很多个不同尺寸的候选框,正负样本失调、训练时计算所有候选框的IOU耗费计算力 ②有很多需要优化的超参数 an
阅读全文
摘要:YOLO 优点:速度快,端到端。在Titan gpu上的帧率是45fps,并且加速版的帧率可以达到155fps。 缺点:实践证明,该算法对小物体和离得近的物体分类效果比较差。 实验效果 SSD 在Titan X上的帧率达到58fps,(在VOC2007测试中, 58 FPS下 72.1%mAP,对F
阅读全文
摘要:faster rcnn 相比fast rcnn抛弃了原来的滑窗方法,采用了anchor方法。 input是原始图片,经过CNN网络提取特征之后,在特征图的每个点对应的原图位置按照anchor取候选框,得到响应的特征图,然后进行后续的检测分类。流程图如下: 通过上图,可以注意到其训练方式也是有创新的:
阅读全文
摘要:fast rcnn 与rcnn的进步之处在于, 1、还是滑窗移动,但是已经不会将每个RGB图都塞进去,逐个图片提取特征,而是将原图输入网络,然后将特征图上与各个候选框对应,得到响应候选框的特征图。 2、不再利用SVM分类器进行分类,而是直接合并到CNN网络中去了。 如何利用CNN网络进行检测定位与分
阅读全文