摘要: A+B训练时,A的BatchNorm层要FIx (86条消息) Pytorch的BatchNorm层使用中容易出现的问题_机器学习杂货铺1号店-CSDN博客 阅读全文
posted @ 2021-04-18 17:27 sariel_sakura 阅读(187) 评论(0) 推荐(0) 编辑
摘要: 1.COCO人体关键点 12个关键点: ['left_shoulder', 'right_shoulder', 'left_elbow', 'right_elbow', 'left_wrist', 'right_wrist','left_hip', 'right_hip', 'left_knee', 阅读全文
posted @ 2021-04-09 14:03 sariel_sakura 阅读(3025) 评论(0) 推荐(0) 编辑
摘要: 语义分割-地表建筑物识别 赛题和数据下载:零基础入门语义分割-地表建筑物识别-天池大赛-阿里云天池 (aliyun.com) 实验记录 1.赛题理解与baseline backbone代码 main.py import numpy as np import pandas as pd import o 阅读全文
posted @ 2021-02-20 15:27 sariel_sakura 阅读(1072) 评论(0) 推荐(0) 编辑
摘要: 1.相关文章 小目标检测相关技巧总结 如何显著提升小目标检测精度?深度解读Stitcher:简洁实用、高效涨点 阅读全文
posted @ 2021-02-15 13:08 sariel_sakura 阅读(261) 评论(0) 推荐(0) 编辑
摘要: 1. 比较好的总结文章 Visual Transformer: 搞懂 Vision Transformer 原理和代码,看这篇技术综述就够了 (qq.com) 搞懂 Vision Transformer 原理和代码,看这篇技术综述就够了(二) (qq.com) Transformer在CV领域有可能 阅读全文
posted @ 2021-02-14 22:03 sariel_sakura 阅读(356) 评论(0) 推荐(0) 编辑
摘要: 动画制作相关术语 Vertex(顶点):动画模型可以看成多个小三角形(四边形)组成,每个小三角形就可以看成一个顶点。顶点越多,动画模型越精细。 骨骼点:人体的一些关节点,类似于人体姿态估计的关键点。每个骨骼点都由一个三元组作为参数去控制(可以查看欧拉角,四元数相关概念) 蒙皮:将模型从一个姿态转变为 阅读全文
posted @ 2021-01-24 18:35 sariel_sakura 阅读(13135) 评论(0) 推荐(2) 编辑
摘要: 1.作用:基于区域候选网络的目标分割方法,可进行目标检测,分类,实例分割,人体关键点检测 是一个小巧、灵活的通用实例分割框架,(Faster R-CNN+FPN)不仅可以对图像中目标进行检测,还可以对每一个目标给出一个高质量的分割结果。 AP:37.1 Speed: 5fps 2.机器视觉主要研究任 阅读全文
posted @ 2020-12-09 15:31 sariel_sakura 阅读(420) 评论(0) 推荐(0) 编辑
摘要: 本文基于 chenyuntc/simple-faster-rcnn-pytorch: A simplified implemention of Faster R-CNN that replicate performance from origin paper (github.com) 项目写理解 1 阅读全文
posted @ 2020-12-05 12:28 sariel_sakura 阅读(244) 评论(0) 推荐(0) 编辑
摘要: 算法总结 算法数据集&评价指标网络框图 SiamFC 创新点:We propose to learn a function that compares an exemplar image to a candidate image of the same size and returns a high 阅读全文
posted @ 2020-12-04 15:22 sariel_sakura 阅读(1390) 评论(0) 推荐(0) 编辑
摘要: 图像分割算法总结 1.评价指标: 普通指标: Pixel Accuracy(PA,像素精度):标记正确的像素点占所有像素点的比例。混淆矩阵中=\(\frac{{\rm{对角线}}}{总和}\) Mean Pixel Accuracy(MPA 均像素精度):计算每个类内被正确分类像素数的比例,再求所有 阅读全文
posted @ 2020-12-03 23:04 sariel_sakura 阅读(6698) 评论(1) 推荐(3) 编辑
摘要: 1:文字回答:简述深度图相关基础知识 深度图也叫距离影响,是指从图像采集器到场景中各点的距离(深度)值作为像素值的图像。获取方法:激光雷达深度成像法、计算机立体视觉成像、坐标测量机、莫尔条纹法、结构光法 2:文字回答:简述深度图相关研究方向 单目深度估计和双目深度估计 3:文字回答:简述RGB-D分 阅读全文
posted @ 2020-12-03 22:36 sariel_sakura 阅读(876) 评论(0) 推荐(0) 编辑
摘要: 1:文字回答:简述实时分割真实的应用场景(不限于课堂讲过的应用方向) 自动驾驶,移动机器人,AI摄影 2:文字回答:简述实现AI产品过程中软硬件的协同过程 先有高性能算法,然后研发相应硬件,然后让算法可以在硬件中实时跑起来 3:文字回答:简述主流的分割结构(参考第二课时PPT9页中的图) a: 使用 阅读全文
posted @ 2020-12-03 22:30 sariel_sakura 阅读(323) 评论(0) 推荐(0) 编辑
摘要: 作业内容: 1:文字回答:辨析TP、FN、FP、TN分别对应的含义(参考第一课时PPT14页中的图) TP: 真实为1,预测为1 FP:真实为0,预测为0 FN:真实为1,预测为0 TN:真实为0,预测为0 2:代码实现:根据需要自行搜索第一课时所提及损失函数的代码定义 交叉熵 加权交叉熵 Foca 阅读全文
posted @ 2020-10-26 15:30 sariel_sakura 阅读(486) 评论(0) 推荐(0) 编辑
摘要: 作业内容: 1:文字回答:简述实时分割算法常用思想 实时分割要在保证分割准确性不会过低的前提下, 尽可能减少参数,压缩模型,因此实时网络对硬件设备的要求不高且省时。 实时分割算法常用思想有: 1)替换主网络: ResNet101或ResNet50替换为ResNet34或ResNet18 2)减少通道 阅读全文
posted @ 2020-10-26 15:28 sariel_sakura 阅读(712) 评论(1) 推荐(0) 编辑
摘要: 作业内容: 1:文字回答:如何从宏观角度看待语义分割 宏观角度看待语义分割将语义分割看作一个任务,将一致的语义标签分配给一类事物,而不是每个像素。按照这一角度,语义分割中就会存在类间不一致和类内不一致的问题。 2:文字回答:简述注意力机制的作用 注意力机制是把注意力集中在重要的点上,而忽略其他不重要 阅读全文
posted @ 2020-10-21 23:02 sariel_sakura 阅读(358) 评论(0) 推荐(0) 编辑
摘要: 1:文字回答:总结各种卷积方式 1)普通正方形标准卷积 2)空洞卷积——为了让固定大小的卷积核看到更大范围的区域,用空洞卷积代替pooling下采样。 3)非对称卷积——将标准3x3卷积拆分成一个1x3卷积和3x1卷积,在不改变感受野大小的情况下减少计算量 4)组卷积,深度可分离卷积——组卷积是对输 阅读全文
posted @ 2020-10-15 20:11 sariel_sakura 阅读(469) 评论(0) 推荐(0) 编辑
摘要: 1:文字回答:按照自己的观点,总结语义分割面临的问题以及DeepLab系列的思想 1)语义分割中连续的池化或下采样会导致图像的分辨率大幅度下降,从而损失原始信息,且在上采样过程中难以恢复。现在越来越多的网络都在试图减少分辨率的损失,比如使用空洞卷积,或者用步长为2的卷积代替池化。 DeepLab引入 阅读全文
posted @ 2020-10-12 19:24 sariel_sakura 阅读(306) 评论(0) 推荐(0) 编辑
摘要: 作业内容: 1:文字回答:总结对于编码器解码器框架以及反池化操作的理解 编码器解码器框架:编码器结构:编码器部分主要由普通卷积层和下采样层将特征图尺寸缩小,使其成为更低维的表征。目的是尽可能多的提取低级特征和高级特征,从而利用提取到的空间信息和全局信息精确分割。 解码器结构:解码器部分主要由普通卷积 阅读全文
posted @ 2020-10-12 17:19 sariel_sakura 阅读(793) 评论(0) 推荐(0) 编辑
摘要: FusionNet是U-Net的改进 1:文字回答:简述医学分割面临的主要挑战 1)数据量少。一些挑战赛只提供不到100例的数据 2)图片尺寸大。单张图片尺寸大、分辨率高,对模型的处理速度有一定要求。 3)要求高。医学图像边界模糊、梯度复杂,对算法的分割准确度要求极高。 4)多模态。以ISLES脑梗 阅读全文
posted @ 2020-10-12 12:09 sariel_sakura 阅读(834) 评论(0) 推荐(0) 编辑
摘要: 1.文字回答:按照自己的观点,总结对于语义分割的理解 语义分割是对一张图片的每一个像素点进行分类,并将每个类别(车,车道,人物,建筑,天空)用不同的颜色标注出来。它是计算机视觉中的关键任务之一,越来越多的应用场景需要从影响中推理出相关的知识和语义。语义分割可以帮助场景理解 2.文字回答:怎样理解论文 阅读全文
posted @ 2020-10-11 20:10 sariel_sakura 阅读(433) 评论(0) 推荐(0) 编辑
摘要: 1.如何加载pytorch中,torchvision预定义的模型的前几层 https://www.cnblogs.com/dyclown/p/13170884.html https://www.cnblogs.com/jiangkejie/p/12952174.html 新定义一个class: cl 阅读全文
posted @ 2020-10-09 21:26 sariel_sakura 阅读(117) 评论(0) 推荐(0) 编辑
摘要: 1:文字回答:用自己的语言描述注意力机制的方式(最好有图)? 给特征图提供权重 2:文字回答:Excitation中的Reduction ratio是什么意思?有什么作用? r:控制第一个全连接层神经元个数。直接影响SE Block的参数量和计算量,r越大,参数越少;r=16时,在精度和参数上得到好 阅读全文
posted @ 2020-09-28 20:24 sariel_sakura 阅读(326) 评论(0) 推荐(0) 编辑
摘要: 作业内容: 1:文字回答:DenseNet-B,DenseNet-C,DenseNet-BC分别表示什么意思? Densenet+bottlenect layer 瓶颈层用来降低特征图通道数,减少后续卷积的计算量 Densenet+compression 在transition layer采用较少的 阅读全文
posted @ 2020-09-26 20:15 sariel_sakura 阅读(190) 评论(0) 推荐(0) 编辑
摘要: 1:文字回答:用自己的语言描述 split-transform-merge是怎样一个过程. 先通过1x1卷积实现低维变换,将特征图分解为cardinality个分支,然后对每个分支进行变换(用网络层对数据进行操作)。最后对32个分支得到的变换结果——特征图进行聚合(求和)2:文字回答:ResNeXt 阅读全文
posted @ 2020-09-26 10:05 sariel_sakura 阅读(177) 评论(0) 推荐(0) 编辑
摘要: 作业内容: 1:文字回答:用自己的理解,总结GoogLeNet-V1到GoogLeNet-V4,这四篇论文的发展 GoogLeNet-V1 引入了1x1卷积,Inception模块 GoogLeNet-V2 在激活函数前加入BN; 用5x5卷积替换为2个3x3卷积;第一个Inception模块增加一 阅读全文
posted @ 2020-08-12 14:17 sariel_sakura 阅读(107) 评论(0) 推荐(0) 编辑
摘要: 作业内容: 1:文字回答:GoogLeNet-V3中,特征图分辨率从35*35降到17*17,采用的是Inception(ABCDE)中的哪一个? 对应论文中哪一幅图?该结构最大的特点是什么? B 是一个高效的特征图分辨率下降方式 2:文字回答:Label Smoothing 对模型训练有什么积极影 阅读全文
posted @ 2020-08-12 14:15 sariel_sakura 阅读(176) 评论(0) 推荐(0) 编辑
摘要: 作业 1:文字回答:Batch Normalization 层中的加减乘除是什么意思? 减均值,除以标准差,乘gamma,加beta 2:文字回答:Batch Normalization 层中均值和标准差通过什么方式得到? 均值和标准差通过指数滑动平均统计得来 3:文字回答:采用Batch Norm 阅读全文
posted @ 2020-08-06 16:06 sariel_sakura 阅读(103) 评论(0) 推荐(0) 编辑
摘要: 作业内容: 1:文字回答:GoogLeNet采用了几个辅助损失?辅助损失函数的权重是多少?为什么要采用辅助损失函数? 在Inception4b和Inception4e增加两个辅助分类层,用于计算辅助损失,对于每种辅助损失,论文中使用的权重值为0.3。作用:loss回传;充当正则约束,迫使中间层特征也 阅读全文
posted @ 2020-08-05 15:38 sariel_sakura 阅读(229) 评论(0) 推荐(0) 编辑
摘要: 作业题 1:文字回答:VGG中3个3*3卷积相对于1个7*7卷积,在参数上较少了百分之多少?(假设输入和输出通道数均为C) 1个7x7卷积核所需参数量:7x7xCxC=49C2 3个3x3卷积核所需参数量:3x(3x3xCxC)=27C2 参数减少比:(49-27)/49=44% 2:文字回答:VG 阅读全文
posted @ 2020-08-04 15:19 sariel_sakura 阅读(304) 评论(0) 推荐(0) 编辑
摘要: 作业题 1.文字回答:ImageNet数据集与ILSVRC之间的关系是什么? ILSVRC比赛从ImageNet中挑选1000类的1200000张做训练集,所用的数据集是ImageNet的子集。 2.文字回答:AlexNet训练过程的数据增强中,针对位置,采用什么方法将一张图片有可能变为2048张不 阅读全文
posted @ 2020-08-03 15:39 sariel_sakura 阅读(163) 评论(0) 推荐(0) 编辑
摘要: 1.进入某一目录下: %cd 你要运行的代码的目录 2. 列出当前目录下文件: %ls 3. 解压命令 !unzip '路径' >train.log!unrar x '路径' '目的文件夹' >train.log 4.移动文件夹 !mv 'A' 'B' 弃用了!开了Colab pro之后跑程序还没我 阅读全文
posted @ 2020-08-03 11:28 sariel_sakura 阅读(179) 评论(0) 推荐(0) 编辑
摘要: 作业题: 1:文字回答:ResNet的shortcut connection与Highway Net有什么差别? Highway networks也使用了带有门函数的shortcut。但是这些门函数需要参数,而ResNet的shortcut不需要参数。而且当Highway networks的门函数的 阅读全文
posted @ 2020-07-31 23:01 sariel_sakura 阅读(267) 评论(0) 推荐(0) 编辑
摘要: 1.知识蒸馏介绍 2. 知识蒸馏思想 3.知识蒸馏方法 4.在大数据集上训练专家集成模型 作业 1:推导:推导证明利用logits优化是知识蒸馏的特殊形式 2:文字回答:在知识蒸馏中,温度T的作用是什么? 为了从教师网络中蒸馏出更多,更丰富的信息,引入温度参数T的概念,T越大,网络输出类别概率分布越 阅读全文
posted @ 2020-07-30 10:36 sariel_sakura 阅读(232) 评论(0) 推荐(0) 编辑
摘要: 1.Inception网络发展 2.Xception网络结构 作业 1:文字回答:Xception中继承了哪些来自Inception系列的思想?又有哪些改进? 继承:使用1x1的卷积 使用两个3x3卷积来代替一个5x5卷积 加了BN层 。 改进:去掉池化层,得到简化版本的Inception modu 阅读全文
posted @ 2020-07-30 09:47 sariel_sakura 阅读(1105) 评论(0) 推荐(0) 编辑
摘要: ​ 1.本文创新点: 提出了一个CNN,可以同时估计光流和视频中模糊的隐藏帧 为了更好的研究连续帧的特性,在CNN模型中开发了一种时间清晰度。 2.算法介绍: 该算法包含optical flow estimation module, latent image restoration module, 阅读全文
posted @ 2020-07-15 22:52 sariel_sakura 阅读(980) 评论(0) 推荐(0) 编辑
摘要: Point-based rendering 模块改进实例和语义分割[15].PointRend: Image Segmentation As Rendering作者 | Alexander Kirillov, Yuxin Wu, Kaiming He, Ross Girshick单位 | FAIR代 阅读全文
posted @ 2020-07-13 18:48 sariel_sakura 阅读(685) 评论(0) 推荐(0) 编辑
摘要: https://blog.csdn.net/cdlwhm1217096231/article/details/95060636?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-13.no 阅读全文
posted @ 2020-07-13 17:33 sariel_sakura 阅读(155) 评论(0) 推荐(0) 编辑
摘要: https://www.zhihu.com/question/361679585 https://blog.csdn.net/huixingshao/article/details/42834939 https://blog.csdn.net/gavinmiaoc/article/details/8 阅读全文
posted @ 2020-07-13 17:28 sariel_sakura 阅读(607) 评论(0) 推荐(0) 编辑
摘要: 笔记摘自深度之眼余老师的课 (我太菜了) 1.读什么 高质量期刊会议论文:CVPR,ECCV,ICCV,AAAI,NIPS,ICLR,ICML 推荐网站,有代码复现的论文:https://paperswithcode.com 2.怎么读 读论文三部曲:泛读、精度、总结 泛读:快速浏览,把握概要 重点 阅读全文
posted @ 2020-07-12 18:48 sariel_sakura 阅读(255) 评论(0) 推荐(0) 编辑
摘要: 使用函数cv2.imread(filepath,flags)读入一副图片 filepath:要读入图片的完整路径 flags:读入图片的标志 cv2.IMREAD_COLOR:默认参数,读入一副彩色图片,忽略alpha通道 cv2.IMREAD_GRAYSCALE:读入灰度图片 cv2.IMREAD 阅读全文
posted @ 2020-07-11 15:11 sariel_sakura 阅读(261) 评论(0) 推荐(0) 编辑