随笔分类 - 机器学习(深度学习:计算机视觉)TensorFlow
摘要:1、简介 对于tensorflow.contrib这个库,tensorflow官方对它的描述是:此目录中的任何代码未经官方支持,可能会随时更改或删除。每个目录下都有指定的所有者。它旨在包含额外功能和贡献,最终会合并到核心TensorFlow中,但其接口可能仍然会发生变化,或者需要进行一些测试,看是否
阅读全文
摘要:损失函数汇总(全网最全) 一 损失函数简介 二 常见的损失函数 分类和回归任务中的损失函数为什么不同? 对于分类任务,为什么不采用平方损失/L1损失? 对于分类任务,为什么不采用平方损失/L1损失? 理论层面: ① 平方数损失函数假设最终结果都服从高斯分布,而高斯分布实际上是一个连续变量,并不是一个
阅读全文
摘要:图像处理初学者应该学习的100个问题-你都学会了吗? 转自:深度学习与NLP 本文整理了图像处理初学者应该需要了解的100个基础问题,涉及读取、显示图像、操作像素、拷贝图像、保存图像、灰度化(Grayscale)、二值化(Thresholding)、大津算法、HSV 变换、减色处理、平均池化(Ave
阅读全文
摘要:CVPR 2020 共收录 1470篇文章,根据当前的公布情况,人工智能学社整理了以下约100篇,分享给读者。 代码开源情况:详见每篇注释,当前共15篇开源。(持续更新中,可关注了解)。 算法主要领域:图像与视频处理,图像分类&检测&分割、视觉目标跟踪、视频内容分析、人体姿态估计、模型加速、网络架构
阅读全文
摘要:包含三部分:1、WGAN改进点 2、代码修改 3、训练心得 一、WGAN的改进部分: 判别器最后一层去掉sigmoid (相当于最后一层做了一个y = x的激活) 生成器和判别器的loss不取log 每次更新判别器的参数之后把它们的绝对值截断到不超过一个固定常数c 不要用基于动量的优化算法(包括mo
阅读全文
摘要:参考:https://blog.csdn.net/kyang624823/article/details/78633897 卷积层 池化层反向传播: 1,CNN的前向传播 a)对于卷积层,卷积核与输入矩阵对应位置求积再求和,作为输出矩阵对应位置的值。如果输入矩阵inputX为M*N大小,卷积核为a*
阅读全文
摘要:YOLO V1损失函数理解: (结构图) 首先是理论部分,YOLO网络的实现这里就不赘述,这里主要解析YOLO损失函数这一部分。 损失函数分为三个部分: 代表cell中含有真实物体的中心。 pr(object) = 1 ① 坐标误差 为什么宽和高要带根号??? 对不同大小的bbox预测中,相比于大b
阅读全文
摘要:代码都有注释。适合初学者理解。 例子主要回归了一个自定义的函数 y = x2 本例子的网络结构: 搭建步骤: ① 定义图 ② 定义损失函数 ③ 定义会话,在会话中运行 ④训练 ⑤评估
阅读全文
摘要:AdaBoost算法推导过程: https://www.jianshu.com/p/0d850d85dcbd
阅读全文
摘要:转载自:https://blog.csdn.net/huachao1001/article/details/78501928 使用tensorflow过程中,训练结束后我们需要用到模型文件。有时候,我们可能也需要用到别人训练好的模型,并在这个基础上再次训练。这时候我们需要掌握如何操作这些模型数据。看
阅读全文
摘要:数据转化为VOC格式: 一、我们先看 VOC格式的数据是什么??? 通过上面三个步骤我们就生成了VOC格式的数据集,现在我们只需要放到工程目录下并且进行修改 就可以开始训练了。 详细修改方法见下: https://www.cnblogs.com/WSX1994/p/11216953.html
阅读全文
摘要:SSD实战——人脸检测 Tensorflow 一 、人脸检测的困难: 1. 姿态问题 2.不同种族人, 3.光照 遮挡 带眼睛 4.视角不同 5. 不同尺度 二、 数据集介绍以及转化VOC: 1. FDDB 2.WIDER Face (本实战采用) 3.MegaFace WIDER Face介绍:
阅读全文
摘要:TF项目实战(SSD目标检测)-VOC2007 理论详解:https://blog.csdn.net/u013989576/article/details/73439202 训练好的模型和代码会公布在网上(含 VOC数据集 vgg16 模型 以及训练好的模型): 待续 步骤: 1.代码地址:http
阅读全文
摘要:Faster RCNN训练: 四部训练法: Faster R-CNN,可以大致分为两个部分,一个是RPN网络,另一个是Fast R-CNN网络,前者是一种候选框(proposal)的推荐算法,而后者则是在此基础上对框的位置和框内的物体的类别进行细致计算。首先训练 RPN,用 RPN 输出的 prop
阅读全文
摘要:LDA算法入门(原文:https://blog.csdn.net/warmyellow/article/details/5454943) 一. LDA算法概述: 线性判别式分析(Linear Discriminant Analysis, LDA),也叫做Fisher线性判别(Fisher Linea
阅读全文
摘要:直接采用矩阵方式建立数据集见:https://www.cnblogs.com/WSX1994/p/10128338.html 制作自己的数据集(使用tfrecords) 为什么采用这个格式? TFRecords文件格式在图像识别中有很好的使用,其可以将二进制数据和标签数据(训练的类别标签)数据存储在
阅读全文
摘要:常用的函数: tf.argmax(input, axis=None, name=None, dimension=None) input:输入Tensor axis:0表示按列,1表示按行 name:名称 返回的为索引 1 import tensorflow as tf 2 import numpy
阅读全文
摘要:Tensorflow BN具体实现(多种方式): 理论知识(参照大佬):https://blog.csdn.net/hjimce/article/details/50866313 补充知识: ① tf.nn.moments 这个函数的输出就是BN需要的mean和variance。 方式1: tf.n
阅读全文
摘要:argparse 介绍 argparse模块主要用来为脚本传递命令参数功能,使他们更加灵活。 代码: parser.add_argument() 调用add_argument()向ArgumentParser对象添加命令行参数信息,这些信息告诉ArgumentParser对象如何处理命令行参数。可以
阅读全文
摘要:1.图像卷积 图2 同样地,卷积的时候需要对卷积核进行180的旋转,同时卷积核中心与需计算的图像像素对齐,输出结构为中心对齐像素的一个新的像素值,计算例子如下 图3 这样计算出左上角(即第一行第一列)像素的卷积后像素值。 给出一个更直观的例子,从左到右看,原像素经过卷积由1变成-8。 图4 通过滑动
阅读全文