随笔分类 -  深度学习

摘要:noise generalization: 提高降噪模型对噪声的泛化性,主要还是通过增加噪声数据的多样性(可以收集不同噪声数据/或对噪声数据做perturbation) 噪声数据集: sound-ideas 包含各种噪声类型,但是要收费 https://www.sound-ideas.com/ fr 阅读全文
posted @ 2020-04-14 11:23 hahahaf 阅读(856) 评论(0) 推荐(0)
摘要:要用到无标签的数据就要给无标签的数据造一个监督训练的目标,常用的造目标的方法: Pseudo-labeling 可以用现有的数据训练模型,在用模型跑无标签的数据得到一个假的label,用无标签数据和假的label 帮助训练模型,最后再用有label数据finetune data augmentati 阅读全文
posted @ 2020-03-04 18:53 hahahaf 阅读(936) 评论(0) 推荐(0)
摘要:tensorflow计算图 计算图是对有向图的表示,主要包含点和边;tensorflow使用计算图计算,计算图的点对应于ops,variables,constant,placeholder等,边对应于Tensors。因此tensorflow主要包含两个部分:构建计算图和runtime运行计算图。 为 阅读全文
posted @ 2020-02-21 15:33 hahahaf 阅读(494) 评论(0) 推荐(0)
摘要:为了做模型压缩,常见方法将正常卷积换成seperable 卷积(正常卷积和可分离卷积具体见下图) ​​​ (1)正常卷积 (2)depthwise 卷积 (3)pointwise 卷积 正常卷积卷积的大小: kernel_size_w * kernel_size_h * input_channel 阅读全文
posted @ 2020-02-21 15:29 hahahaf 阅读(427) 评论(0) 推荐(0)
摘要:主要的视频分割算法分为两类: OSVOS(one shot video object segmentation)每一帧单独处理 MaskTrack考虑时序信息 在MaskTrack中,首先使用图像语义分割网络(deeplabv2)得到instance segmentation。但问题是:怎么让网络知 阅读全文
posted @ 2018-01-09 16:36 hahahaf 阅读(1551) 评论(0) 推荐(0)
摘要:AlexNet-> vgg vgg 采用更小的卷积核,加深网络深度,但两者的共同点都是卷积层+pooling层最后接上fc 层的结构 Network in network ->googleNet NIN 中采用global average pooling ,而不是使用 fc 层,减少了网络参数,go 阅读全文
posted @ 2017-11-14 14:54 hahahaf 阅读(851) 评论(0) 推荐(0)
摘要:网络更窄、参数更少,因为dense block 中每个卷积层的输出的feature map 的数量较少,不想FCN中后面几层卷积网络feature map 有好几百层。 阅读全文
posted @ 2017-11-13 21:31 hahahaf 阅读(248) 评论(0) 推荐(0)
摘要:使用unet 直接训练 显著性目标检测数据集,不能得到较好的效果。 在一些情况下(边缘对比较强的情况),分割效果还行。由于没有在ImageNet上得到预训练模型,所以不能得到较好的语义分割的效果 阅读全文
posted @ 2017-11-13 11:51 hahahaf 阅读(852) 评论(0) 推荐(0)
摘要:DenseNet 在FCN 网络中考虑加入skip connection,在resnet 中加入identity 映射,这些 shortcut connection等结构能够得到更好的检测效果,在denseNet 中每一层的特征图作为其他所有层的输入,因此对于 L层的网络,中间有(L(L+1))/2 阅读全文
posted @ 2017-11-10 16:29 hahahaf 阅读(2405) 评论(0) 推荐(0)
摘要:Mask RCNN Mask RCNN 中主要改进是在faster rcnn中box regression 的branch 上加入mask prediction branch,能够得到点到点的预测。 主要特点为: mask branch 是一个FCN结构,对每个ROI region 产生k * m* 阅读全文
posted @ 2017-11-10 16:19 hahahaf 阅读(777) 评论(0) 推荐(0)
摘要:、 代码: 阅读全文
posted @ 2017-11-10 16:05 hahahaf 阅读(916) 评论(0) 推荐(0)
摘要:dense prediction 理解:标注出图像中每个像素点的对象类别,要求不但给出具体目标的位置,还要描绘物体的边界,如图像分割、语义分割、边缘检测等等。 基于深度学习主要的做法有两种: 基于图像分块:利用像素、超像素块周围小邻域进行独立的分类。(在分类网络中使用全连接层,固定图像块尺寸) 基于 阅读全文
posted @ 2017-11-09 17:13 hahahaf 阅读(8841) 评论(0) 推荐(1)
摘要:第一步定义卷积核类: 定义卷积层 定义padding 函数:根据扩展的大小进行0填充 定义卷积类: 阅读全文
posted @ 2017-11-06 15:41 hahahaf 阅读(1952) 评论(0) 推荐(0)
摘要:https://zybuluo.com/hanbingtao/note/485480 https://www.zhihu.com/question/39022858 阅读全文
posted @ 2017-11-05 17:35 hahahaf 阅读(158) 评论(0) 推荐(0)
摘要:1、将视频帧作为独立的图像,利用图像目标检测算法获得检测结果 2、利用视频的时序信息和上下文信息对检测结果进行修正 3、高质量的检测窗口的跟踪轨迹对检测结果修正 训练数据集的选取:视频帧之间存在冗余,在别的包含同样目标的数据集上进行数据抽取。 网络结构的选择:resnet+inception 的结构 阅读全文
posted @ 2017-11-02 10:26 hahahaf 阅读(1404) 评论(0) 推荐(0)
摘要:os.environ["CUDA_VISIBLE_DEVICES"]=2 # 设置使用的GPU tfconfig=tf.ConfigProto(allow_soft_placement=True) # 如果分类的GPU没有,允许tf自动分配设备 tfconfig=tf.gpu_options.all 阅读全文
posted @ 2017-10-31 10:52 hahahaf 阅读(5094) 评论(0) 推荐(1)
摘要:faster rcnn 主要分为四个部分: 1. convolutional part: 特征提取 可以使用vgg,resnet 等等 2.region proposal network: 生成 region proposals,通过softmax 判断anchors属于background 或者目 阅读全文
posted @ 2017-10-28 21:52 hahahaf 阅读(1294) 评论(0) 推荐(0)
摘要:github 上大神的代码 https://github.com/endernewton/tf-faster-rcnn.git 在自己跑的过程中的问题: 1. 数据集的问题: 作者实现了 voc,coco数据集接口。由于我要跑自己的数据,所以要重写数据接口。为了方便我将自己的数据格式改为voc的数据 阅读全文
posted @ 2017-10-20 14:21 hahahaf 阅读(1823) 评论(0) 推荐(0)
摘要:map/ reduce 了解: 简单介绍map/reduce 模式: http://www.csdn.net/article/2013-01-07/2813477-confused-about-mapreduce http://www.cnblogs.com/forfuture1978/archiv 阅读全文
posted @ 2017-10-12 17:27 hahahaf 阅读(473) 评论(0) 推荐(0)
摘要:昨天跑通了U-NET 的pytorch 版本,在显著性检测数据集上效果不错。 可以明显看出许多局部的细节被提取出来(边缘特征),主要因为多层的shortcut 连接,就像我训练FCN时,加入前几层的特征图都到后面时,得到的显著图包含很多细节信息。 github 代码: https://github. 阅读全文
posted @ 2017-10-12 11:48 hahahaf 阅读(345) 评论(0) 推荐(0)