随笔分类 -  机器学习

摘要:1、SIFT综述 尺度不变特征转换(Scale-invariant feature transform或SIFT)是一种计算机视觉算法用来侦测与描述影像中的局部性特征,它在空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变量,此算法由 David Lowe在1999年所发表,2004年完善总结。 阅读全文
posted @ 2018-02-06 10:34 tbaofang 阅读(1) 评论(0) 推荐(0)
摘要:Sample:样本,数据集中的一条数据。例如图片数据集中的一张图片,语音数据中的一段音频。 Batch:中文为批,一个batch由若干条数据构成。batch是进行网络优化的基本单位,网络参数的每一轮优化需要使用一个batch。batch中的样本是被并行处理的。与单个样本相比,一个batch的数据能更 阅读全文
posted @ 2018-02-05 09:15 tbaofang 阅读(6402) 评论(0) 推荐(1)
摘要:梯度下降(GD)是最小化风险函数、损失函数的一种常用方法,随机梯度下降和批量梯度下降是两种迭代求解思路。 下面的h(x)是要拟合的函数,J(theta)损失函数,theta是参数,要迭代求解的值,theta求解出来了那最终要拟合的函数h(theta)就出来了。其中m是训练集的记录条数,j是参数的个数 阅读全文
posted @ 2018-02-01 15:42 tbaofang 阅读(204) 评论(0) 推荐(0)
摘要:交叉熵(Cross-Entropy) 交叉熵是一个在ML领域经常会被提到的名词。在这篇文章里将对这个概念进行详细的分析。 1.什么是信息量? 假设X是一个离散型随机变量,其取值集合为,概率分布函数为p(x)=Pr(X=x),x∈,我们定义事件X=x0的信息量为: I(x0)=−log(p(x0) 阅读全文
posted @ 2018-02-01 15:14 tbaofang 阅读(419) 评论(0) 推荐(0)
摘要:一、Kmeans算法流程: 1.选取K个类中心(首次随机选取) 2.计算每个点到K个类中心的距离 3.把数据点分配给距离最近的一个类中心 4.计算新的类中心(对该类中的所有点取均值) 5.重复234,直至满足终止条件后终止迭代 不再有重新分配 最大迭代数 所有类中心移动小于某一阈值 二、Kmean算 阅读全文
posted @ 2018-01-30 20:29 tbaofang 阅读(1063) 评论(0) 推荐(0)