随笔分类 -  Machine Learning

摘要:主要为第十周内容:大规模机器学习、案例、总结 (一)随机梯度下降法 如果有一个大规模的训练集,普通的批量梯度下降法需要计算整个训练集的误差的平方和,如果学习方法需要迭代20次,这已经是非常大的计算代价。 首先,需要确定大规模的训练集是否有必要。当我们确实需要一个大规模的训练集,可以尝试用随机梯度下降法来替代批量梯度下降法。 在随机梯度下降法中,定义代价函数一个单一训练实例的代价: 随机梯度下降... 阅读全文
posted @ 2015-11-30 21:41 汪刚 阅读(300) 评论(0) 推荐(0)
摘要:主要为第九周内容:异常检测、推荐系统 (一)异常检测(DENSITY ESTIMATION) 核密度估计(kernel density estimation)是在概率论中用来估计未知的密度函数,属于非参数检验方法之一。密度估计是指给定数据集 x(1),x(2),..,x(m),我们假使数据集是正常的,我们希望知道新的数据 x(test)是不是异常的,即这个测试数据不属于该组数据的几率如何。我们所构... 阅读全文
posted @ 2015-11-30 09:36 汪刚 阅读(1046) 评论(0) 推荐(0)
摘要:主要为第八周内容:聚类(Clustering)、降维聚类是非监督学习中的重要的一类算法。相比之前监督学习中的有标签数据,非监督学习中的是无标签数据。非监督学习的任务是对这些无标签数据根据特征找到内在结构。聚类就是通过算法把数据分成不同的簇(点集),k均值算法是其中一种重要的聚类算法。 K均值算法 K... 阅读全文
posted @ 2015-10-30 15:46 汪刚 阅读(269) 评论(0) 推荐(0)
摘要:主要第七周的内容:支持向量机 可以参考JerryLeed 的支持向量机SVM系列博客http://www.cnblogs.com/jerrylead 以及 pluskid的支持向量机系列博客http://blog.pluskid.org/?page_id=683 优化目标 判定边界 核函数 总结 阅读全文
posted @ 2015-10-29 22:31 汪刚 阅读(184) 评论(0) 推荐(0)
摘要:主要为第六周内容机器学习应用建议以及系统设计。 下一步做什么 当训练好一个模型,预测未知数据,发现结果不如人意,该如何提高呢? 1.获得更多的训练实例 2.尝试减少特征的数量 3.尝试获得更多的特征 4.尝试增加二项式特征 5.尝试减少归一化程度λ 6.尝试增加归一化程度λ 先不要急着尝试这些方法,而是通过一些机器学习诊断方法来判断现在算法是什么情况,哪些方法是可以提高算法的有效性,如何选择更有意... 阅读全文
posted @ 2015-10-28 16:15 汪刚 阅读(457) 评论(0) 推荐(0)
摘要:主要为第四周、第五周课程内容:神经网络神经网络模型引入 之前学习的线性回归还是逻辑回归都有个相同缺点就是:特征太多会导致计算量太大。如100个变量,来构建一个非线性模型。即使只采用两两特征组合,都会有接近5000个组成的特征。这对于普通的线性回归和逻辑回归计算特征量太大了。因此,神经网路孕育而生。神... 阅读全文
posted @ 2015-10-14 16:33 汪刚 阅读(287) 评论(0) 推荐(0)
摘要:主要为第三周课程内容:逻辑回归与正则化 逻辑回归(Logistic Regression) 一、逻辑回归模型引入分类问题是指尝试预测的是结果是否属于某一个类。维基百科的定义为:根据已知训练区提供的样本,通过计算选择特征参数,建立判别函数以对样本进行的分类(有监督分类)。统计学习方法中定义:在监督学习... 阅读全文
posted @ 2015-10-14 15:34 汪刚 阅读(742) 评论(0) 推荐(0)
摘要:主要是第一二周内容 机器学习概要 机器学习是什么? 生活在信息时代的我们,其实时时刻刻都离不开机器学习算法。比如日常使用的搜索引擎就涉及到很多学习算法。 Arthur Samuel 给出第一个定义。他定义机器学习为:在进行特定编程的情况下,给予计算机学习能力的领域。维基百科给出的定义为: ... 阅读全文
posted @ 2015-08-30 18:36 汪刚 阅读(367) 评论(0) 推荐(0)
摘要:统计学习统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。统计学习也称为统计机器学习(statical machine learning)。统计学习的方法是基于数据构建统计模型从而对数据进行预测和分析。统计学习由监督学习、非监督学习、半监督学习和强化学习等组成。统... 阅读全文
posted @ 2015-05-09 23:18 汪刚 阅读(3824) 评论(0) 推荐(0)