sariel_sakura

2021年4月18日

摘要： A+B训练时，A的BatchNorm层要FIx (86条消息) Pytorch的BatchNorm层使用中容易出现的问题_机器学习杂货铺1号店-CSDN博客阅读全文

posted @ 2021-04-18 17:27 sariel_sakura 阅读(224) 评论(0) 推荐(0)

2021年4月9日

摘要： 1.COCO人体关键点 12个关键点： ['left_shoulder', 'right_shoulder', 'left_elbow', 'right_elbow', 'left_wrist', 'right_wrist','left_hip', 'right_hip', 'left_knee', 阅读全文

posted @ 2021-04-09 14:03 sariel_sakura 阅读(3732) 评论(0) 推荐(0)

2021年2月20日

语义分割-地表建筑物识别

摘要：语义分割-地表建筑物识别赛题和数据下载：零基础入门语义分割-地表建筑物识别-天池大赛-阿里云天池 (aliyun.com) 实验记录 1.赛题理解与baseline backbone代码 main.py import numpy as np import pandas as pd import o 阅读全文

posted @ 2021-02-20 15:27 sariel_sakura 阅读(1310) 评论(0) 推荐(0)

2021年2月15日

小目标检测

摘要： 1.相关文章小目标检测相关技巧总结如何显著提升小目标检测精度？深度解读Stitcher：简洁实用、高效涨点阅读全文

posted @ 2021-02-15 13:08 sariel_sakura 阅读(290) 评论(0) 推荐(0)

2021年2月14日

Transformer学习笔记

摘要： 1. 比较好的总结文章 Visual Transformer: 搞懂 Vision Transformer 原理和代码，看这篇技术综述就够了 (qq.com) 搞懂 Vision Transformer 原理和代码，看这篇技术综述就够了（二） (qq.com) Transformer在CV领域有可能阅读全文

posted @ 2021-02-14 22:03 sariel_sakura 阅读(418) 评论(0) 推荐(0)

2021年1月24日

SMPL模型学习

摘要：动画制作相关术语 Vertex(顶点)：动画模型可以看成多个小三角形（四边形）组成，每个小三角形就可以看成一个顶点。顶点越多，动画模型越精细。骨骼点：人体的一些关节点，类似于人体姿态估计的关键点。每个骨骼点都由一个三元组作为参数去控制（可以查看欧拉角，四元数相关概念）蒙皮：将模型从一个姿态转变为阅读全文

posted @ 2021-01-24 18:35 sariel_sakura 阅读(18740) 评论(0) 推荐(2)

2020年12月9日

实例分割之Mask R-CNN

摘要： 1.作用：基于区域候选网络的目标分割方法，可进行目标检测，分类，实例分割，人体关键点检测是一个小巧、灵活的通用实例分割框架，（Faster R-CNN+FPN）不仅可以对图像中目标进行检测，还可以对每一个目标给出一个高质量的分割结果。 AP:37.1 Speed: 5fps 2.机器视觉主要研究任阅读全文

posted @ 2020-12-09 15:31 sariel_sakura 阅读(510) 评论(0) 推荐(0)

2020年12月5日

目标检测之Faster-rcnn

摘要：本文基于 chenyuntc/simple-faster-rcnn-pytorch: A simplified implemention of Faster R-CNN that replicate performance from origin paper (github.com) 项目写理解 1 阅读全文

posted @ 2020-12-05 12:28 sariel_sakura 阅读(317) 评论(0) 推荐(0)

2020年12月4日

Siamese系列跟踪

摘要：算法总结算法数据集&评价指标网络框图 SiamFC 创新点：We propose to learn a function that compares an exemplar image to a candidate image of the same size and returns a high 阅读全文

posted @ 2020-12-04 15:22 sariel_sakura 阅读(1633) 评论(0) 推荐(0)

2020年12月3日

语义分割总结

摘要：图像分割算法总结 1.评价指标：普通指标： Pixel Accuracy(PA,像素精度)：标记正确的像素点占所有像素点的比例。混淆矩阵中=\(\frac{{\rm{对角线}}}{总和}\) Mean Pixel Accuracy（MPA 均像素精度）：计算每个类内被正确分类像素数的比例，再求所有阅读全文

posted @ 2020-12-03 23:04 sariel_sakura 阅读(7542) 评论(1) 推荐(3)

语义分割之RedNet

摘要： 1：文字回答：简述深度图相关基础知识深度图也叫距离影响，是指从图像采集器到场景中各点的距离（深度）值作为像素值的图像。获取方法：激光雷达深度成像法、计算机立体视觉成像、坐标测量机、莫尔条纹法、结构光法 2：文字回答：简述深度图相关研究方向单目深度估计和双目深度估计 3：文字回答：简述RGB-D分阅读全文

posted @ 2020-12-03 22:36 sariel_sakura 阅读(944) 评论(0) 推荐(0)

语义分割之DFANet

摘要： 1：文字回答：简述实时分割真实的应用场景（不限于课堂讲过的应用方向）自动驾驶，移动机器人，AI摄影 2：文字回答：简述实现AI产品过程中软硬件的协同过程先有高性能算法，然后研发相应硬件，然后让算法可以在硬件中实时跑起来 3：文字回答：简述主流的分割结构（参考第二课时PPT9页中的图） a: 使用阅读全文

posted @ 2020-12-03 22:30 sariel_sakura 阅读(414) 评论(0) 推荐(0)

2020年10月26日

语义分割之BiSeNet

摘要：作业内容： 1：文字回答：辨析TP、FN、FP、TN分别对应的含义（参考第一课时PPT14页中的图） TP: 真实为1，预测为1 FP：真实为0，预测为0 FN：真实为1，预测为0 TN：真实为0，预测为0 2：代码实现：根据需要自行搜索第一课时所提及损失函数的代码定义交叉熵加权交叉熵 Foca 阅读全文

posted @ 2020-10-26 15:30 sariel_sakura 阅读(537) 评论(0) 推荐(0)

语义分割之ENet, LinkNet

摘要：作业内容： 1：文字回答：简述实时分割算法常用思想实时分割要在保证分割准确性不会过低的前提下，尽可能减少参数，压缩模型，因此实时网络对硬件设备的要求不高且省时。实时分割算法常用思想有： 1）替换主网络： ResNet101或ResNet50替换为ResNet34或ResNet18 2）减少通道阅读全文

posted @ 2020-10-26 15:28 sariel_sakura 阅读(806) 评论(1) 推荐(0)

2020年10月21日

语义分割之DFN

摘要：作业内容： 1：文字回答：如何从宏观角度看待语义分割宏观角度看待语义分割将语义分割看作一个任务，将一致的语义标签分配给一类事物，而不是每个像素。按照这一角度，语义分割中就会存在类间不一致和类内不一致的问题。 2：文字回答：简述注意力机制的作用注意力机制是把注意力集中在重要的点上，而忽略其他不重要阅读全文

posted @ 2020-10-21 23:02 sariel_sakura 阅读(432) 评论(0) 推荐(0)

2020年10月15日

语义分割之GCN

摘要： 1：文字回答：总结各种卷积方式 1）普通正方形标准卷积 2）空洞卷积——为了让固定大小的卷积核看到更大范围的区域，用空洞卷积代替pooling下采样。 3）非对称卷积——将标准3x3卷积拆分成一个1x3卷积和3x1卷积，在不改变感受野大小的情况下减少计算量 4）组卷积，深度可分离卷积——组卷积是对输阅读全文

posted @ 2020-10-15 20:11 sariel_sakura 阅读(544) 评论(0) 推荐(0)

2020年10月12日

语义分割之DeepLab系列

摘要： 1：文字回答：按照自己的观点，总结语义分割面临的问题以及DeepLab系列的思想 1）语义分割中连续的池化或下采样会导致图像的分辨率大幅度下降，从而损失原始信息，且在上采样过程中难以恢复。现在越来越多的网络都在试图减少分辨率的损失，比如使用空洞卷积，或者用步长为2的卷积代替池化。 DeepLab引入阅读全文

posted @ 2020-10-12 19:24 sariel_sakura 阅读(423) 评论(0) 推荐(0)

语义分割之SegNet

摘要：作业内容： 1：文字回答：总结对于编码器解码器框架以及反池化操作的理解编码器解码器框架：编码器结构：编码器部分主要由普通卷积层和下采样层将特征图尺寸缩小，使其成为更低维的表征。目的是尽可能多的提取低级特征和高级特征，从而利用提取到的空间信息和全局信息精确分割。解码器结构：解码器部分主要由普通卷积阅读全文

posted @ 2020-10-12 17:19 sariel_sakura 阅读(943) 评论(0) 推荐(0)

语义分割之U-Net和FusionNet

摘要： FusionNet是U-Net的改进 1：文字回答：简述医学分割面临的主要挑战 1）数据量少。一些挑战赛只提供不到100例的数据 2）图片尺寸大。单张图片尺寸大、分辨率高，对模型的处理速度有一定要求。 3）要求高。医学图像边界模糊、梯度复杂，对算法的分割准确度要求极高。 4）多模态。以ISLES脑梗阅读全文

posted @ 2020-10-12 12:09 sariel_sakura 阅读(1038) 评论(0) 推荐(0)

2020年10月11日

语义分割之FCN

摘要： 1.文字回答：按照自己的观点，总结对于语义分割的理解语义分割是对一张图片的每一个像素点进行分类，并将每个类别（车，车道，人物，建筑，天空）用不同的颜色标注出来。它是计算机视觉中的关键任务之一，越来越多的应用场景需要从影响中推理出相关的知识和语义。语义分割可以帮助场景理解 2.文字回答：怎样理解论文阅读全文

posted @ 2020-10-11 20:10 sariel_sakura 阅读(505) 评论(0) 推荐(0)

2020年10月9日

pytorch，python学习

摘要： 1.如何加载pytorch中，torchvision预定义的模型的前几层 https://www.cnblogs.com/dyclown/p/13170884.html https://www.cnblogs.com/jiangkejie/p/12952174.html 新定义一个class: cl 阅读全文

posted @ 2020-10-09 21:26 sariel_sakura 阅读(172) 评论(0) 推荐(0)

2020年9月28日

CV baseline之SENet

摘要： 1：文字回答：用自己的语言描述注意力机制的方式（最好有图）？给特征图提供权重 2：文字回答：Excitation中的Reduction ratio是什么意思？有什么作用？ r：控制第一个全连接层神经元个数。直接影响SE Block的参数量和计算量，r越大，参数越少；r=16时，在精度和参数上得到好阅读全文

posted @ 2020-09-28 20:24 sariel_sakura 阅读(421) 评论(0) 推荐(0)

2020年9月26日

CV baseline之DenseNet

摘要：作业内容： 1：文字回答：DenseNet-B，DenseNet-C，DenseNet-BC分别表示什么意思？ Densenet+bottlenect layer 瓶颈层用来降低特征图通道数，减少后续卷积的计算量 Densenet+compression 在transition layer采用较少的阅读全文

posted @ 2020-09-26 20:15 sariel_sakura 阅读(243) 评论(0) 推荐(0)

CV baseline之ResNeXt

摘要： 1：文字回答：用自己的语言描述 split-transform-merge是怎样一个过程. 先通过1x1卷积实现低维变换，将特征图分解为cardinality个分支，然后对每个分支进行变换（用网络层对数据进行操作）。最后对32个分支得到的变换结果——特征图进行聚合(求和)2：文字回答：ResNeXt 阅读全文

posted @ 2020-09-26 10:05 sariel_sakura 阅读(264) 评论(0) 推荐(0)

2020年8月12日

CV baseline之GoogLeNet v4

摘要：作业内容： 1：文字回答：用自己的理解，总结GoogLeNet-V1到GoogLeNet-V4，这四篇论文的发展 GoogLeNet-V1 引入了1x1卷积，Inception模块 GoogLeNet-V2 在激活函数前加入BN；用5x5卷积替换为2个3x3卷积；第一个Inception模块增加一阅读全文

posted @ 2020-08-12 14:17 sariel_sakura 阅读(134) 评论(0) 推荐(0)

CV baseline之GoogLeNet v3

摘要：作业内容： 1：文字回答：GoogLeNet-V3中，特征图分辨率从35*35降到17*17，采用的是Inception（ABCDE）中的哪一个? 对应论文中哪一幅图？该结构最大的特点是什么？ B 是一个高效的特征图分辨率下降方式 2：文字回答：Label Smoothing 对模型训练有什么积极影阅读全文

posted @ 2020-08-12 14:15 sariel_sakura 阅读(214) 评论(0) 推荐(0)

2020年8月6日

CV baseline之GoogLeNet v2

摘要：作业 1：文字回答：Batch Normalization 层中的加减乘除是什么意思？减均值，除以标准差，乘gamma,加beta 2：文字回答：Batch Normalization 层中均值和标准差通过什么方式得到？均值和标准差通过指数滑动平均统计得来 3：文字回答：采用Batch Norm 阅读全文

posted @ 2020-08-06 16:06 sariel_sakura 阅读(132) 评论(0) 推荐(0)

2020年8月5日

CV baseline之GoogLeNet v1

摘要：作业内容： 1：文字回答：GoogLeNet采用了几个辅助损失？辅助损失函数的权重是多少？为什么要采用辅助损失函数？在Inception4b和Inception4e增加两个辅助分类层，用于计算辅助损失，对于每种辅助损失，论文中使用的权重值为0.3。作用：loss回传；充当正则约束，迫使中间层特征也阅读全文

posted @ 2020-08-05 15:38 sariel_sakura 阅读(283) 评论(0) 推荐(0)

2020年8月4日

CV baseline之VGG

摘要：作业题 1：文字回答：VGG中3个3*3卷积相对于1个7*7卷积，在参数上较少了百分之多少？（假设输入和输出通道数均为C） 1个7x7卷积核所需参数量：7x7xCxC=49C2 3个3x3卷积核所需参数量：3x(3x3xCxC)=27C2 参数减少比：（49-27）/49=44% 2：文字回答：VG 阅读全文

posted @ 2020-08-04 15:19 sariel_sakura 阅读(337) 评论(0) 推荐(0)

2020年8月3日

CV baseline之Alexnet

摘要：作业题 1.文字回答：ImageNet数据集与ILSVRC之间的关系是什么？ ILSVRC比赛从ImageNet中挑选1000类的1200000张做训练集，所用的数据集是ImageNet的子集。 2.文字回答：AlexNet训练过程的数据增强中，针对位置，采用什么方法将一张图片有可能变为2048张不阅读全文

posted @ 2020-08-03 15:39 sariel_sakura 阅读(193) 评论(0) 推荐(0)

Colab踩得坑

摘要： 1.进入某一目录下： %cd 你要运行的代码的目录 2. 列出当前目录下文件： %ls 3. 解压命令 !unzip '路径' >train.log！unrar x '路径' '目的文件夹' >train.log 4.移动文件夹 !mv 'A' 'B' 弃用了！开了Colab pro之后跑程序还没我阅读全文

posted @ 2020-08-03 11:28 sariel_sakura 阅读(211) 评论(0) 推荐(0)

2020年7月31日

CV baseline之ResNet

摘要：作业题： 1：文字回答：ResNet的shortcut connection与Highway Net有什么差别？ Highway networks也使用了带有门函数的shortcut。但是这些门函数需要参数，而ResNet的shortcut不需要参数。而且当Highway networks的门函数的阅读全文

posted @ 2020-07-31 23:01 sariel_sakura 阅读(331) 评论(0) 推荐(0)

2020年7月30日

轻量模型之Distilling the Knowledge in a Neural Network

摘要： 1.知识蒸馏介绍 2. 知识蒸馏思想 3.知识蒸馏方法 4.在大数据集上训练专家集成模型作业 1：推导：推导证明利用logits优化是知识蒸馏的特殊形式 2：文字回答：在知识蒸馏中，温度T的作用是什么？为了从教师网络中蒸馏出更多，更丰富的信息，引入温度参数T的概念，T越大，网络输出类别概率分布越阅读全文

posted @ 2020-07-30 10:36 sariel_sakura 阅读(278) 评论(0) 推荐(0)

轻量模型之Xception

摘要： 1.Inception网络发展 2.Xception网络结构作业 1：文字回答：Xception中继承了哪些来自Inception系列的思想？又有哪些改进？继承：使用1x1的卷积使用两个3x3卷积来代替一个5x5卷积加了BN层。改进：去掉池化层，得到简化版本的Inception modu 阅读全文

posted @ 2020-07-30 09:47 sariel_sakura 阅读(1186) 评论(0) 推荐(0)

2020年7月15日

Cascaded Deep Video Deblurring Using Temporal Sharpness Prior阅读笔记

摘要： 1.本文创新点：提出了一个CNN,可以同时估计光流和视频中模糊的隐藏帧为了更好的研究连续帧的特性，在CNN模型中开发了一种时间清晰度。 2.算法介绍：该算法包含optical flow estimation module, latent image restoration module, 阅读全文

posted @ 2020-07-15 22:52 sariel_sakura 阅读(1012) 评论(0) 推荐(0)

2020年7月13日

CVPR2020有开源代码的图像分割论文

摘要： Point-based rendering 模块改进实例和语义分割[15].PointRend: Image Segmentation As Rendering作者 | Alexander Kirillov, Yuxin Wu, Kaiming He, Ross Girshick单位 | FAIR代阅读全文

posted @ 2020-07-13 18:48 sariel_sakura 阅读(735) 评论(0) 推荐(0)

注意力机制

摘要： https://blog.csdn.net/cdlwhm1217096231/article/details/95060636?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-13.no 阅读全文

posted @ 2020-07-13 17:33 sariel_sakura 阅读(168) 评论(0) 推荐(0)

图像去雾、去雨、去模糊

摘要： https://www.zhihu.com/question/361679585 https://blog.csdn.net/huixingshao/article/details/42834939 https://blog.csdn.net/gavinmiaoc/article/details/8 阅读全文

posted @ 2020-07-13 17:28 sariel_sakura 阅读(634) 评论(0) 推荐(0)

2020年7月12日

如何读论文

摘要：笔记摘自深度之眼余老师的课（我太菜了） 1.读什么高质量期刊会议论文：CVPR，ECCV，ICCV，AAAI，NIPS，ICLR，ICML 推荐网站，有代码复现的论文：https://paperswithcode.com 2.怎么读读论文三部曲：泛读、精度、总结泛读：快速浏览，把握概要重点阅读全文

posted @ 2020-07-12 18:48 sariel_sakura 阅读(313) 评论(0) 推荐(0)

2020年7月11日

imread遇到的坑

摘要：使用函数cv2.imread(filepath,flags)读入一副图片 filepath：要读入图片的完整路径 flags：读入图片的标志 cv2.IMREAD_COLOR：默认参数，读入一副彩色图片，忽略alpha通道 cv2.IMREAD_GRAYSCALE：读入灰度图片 cv2.IMREAD 阅读全文

posted @ 2020-07-11 15:11 sariel_sakura 阅读(280) 评论(0) 推荐(0)

属于自己的小窝