摘要: 我终于快把这本书看完了!!!开心! 前面学习到的算法都属于监督学习,数据都会自带标签,而接下来我们会转向无监督学习,目标变量事先不存在,无监督学习在现实生活中应用更为广泛。首先就是聚类和K-Means算法。 这一部分可以看看吴恩达的视频,感觉讲的挺清楚的,当然这本书也不错。 聚类是将相似的对象归到同 阅读全文
posted @ 2019-11-06 19:08 狗狗酱 阅读(169) 评论(0) 推荐(0)
摘要: (1)用线性回归找到最佳拟合直线 线性回归的优点是结果易于理解,计算不复杂,缺点是对非线性的数据拟合不好,适用于数值型和标称型数据类型。 线性回归最重要的是找到回归系数,一旦找到回归系数,乘以输入值,再将结果全部累加在一起,就得到了预测值。(假定输入数据存放在矩阵X中,回归系数存放在向量W中,则预测 阅读全文
posted @ 2019-11-05 19:41 狗狗酱 阅读(204) 评论(0) 推荐(0)
摘要: AdaBoost是adaptive boosting的简写(自适应boosting),其基本思想如下:训练数据中的每一个样本,并赋予其一个权重,这些权重构成了向量D,开始时这些权重都被初始化成相等的数值,首先在训练数据上训练出一个弱分类器并计算这个分类器的错误率,然后在同一数据集上再次训练这个弱分类 阅读全文
posted @ 2019-11-01 13:58 狗狗酱 阅读(218) 评论(0) 推荐(0)
摘要: SVM中主要工作是找到分割超平面从而将数据进行有效分类,而在这里我们先引入SMO(序列最小优化)算法,SMO的目标是找出一系列alpha和b,一旦求出了这些alpha,就很容易计算出权重向量w并得到分割超平面。 SMO算法的工作原理是:每次循环中选择两个alpha进行优化处理,一旦找到一对合适的al 阅读全文
posted @ 2019-10-25 17:19 狗狗酱 阅读(193) 评论(0) 推荐(0)
摘要: 《机器学习实战》ch05 本章主要讲述了基于logistic回归和Sigmois函数的分类问题。 先是梯度上升算法的具体实现(这本书是基于python2的,现在都是python3了,所以里面就有一些语法错误,还有可能因为印刷或者排版造成的错误) (1)logistic回归梯度上升优化算法 训练算法, 阅读全文
posted @ 2019-10-24 17:20 狗狗酱 阅读(222) 评论(0) 推荐(0)