随笔分类 -  机器学习

摘要:在很多机器学习任务中,特征并不总是连续值,而有可能是分类值。 例如,考虑一下的三个特征: ["male", "female"] ["from Europe", "from US", "from Asia"] ["uses Firefox", "uses Chrome", "uses Safari", 阅读全文
posted @ 2018-03-08 20:39 soyosuyang 阅读(346) 评论(0) 推荐(0)
摘要:1. Adaboost类库概述 scikit-learn中Adaboost类库比较直接,就是AdaBoostClassifier和AdaBoostRegressor两个,从名字就可以看出AdaBoostClassifier用于分类,AdaBoostRegressor用于回归。 AdaBoostCla 阅读全文
posted @ 2018-03-08 15:05 soyosuyang 阅读(591) 评论(0) 推荐(0)
摘要:给定向量x=(x1,x2,...xn)L1范数:向量各个元素绝对值之和L2范数:向量各个元素的平方求和然后求平方根Lp范数:向量各个元素绝对值的p次方求和然后求1/p次方L∞范数:向量各个元素求绝对值,最大那个元素的绝对值 阅读全文
posted @ 2018-03-03 12:04 soyosuyang 阅读(422) 评论(0) 推荐(0)
摘要:逻辑回归(Logistic regression): 想要理解LR,只需要记住: Sigmoid 函数: y=1/(1+e-z) 线性回归模型: y=wTx+b 最后: y= 1/(1+e-(wTx+b)) 推导为: ln (y/1-y)=wTx+b 它就是用线性回归模型的预测结果去逼近真实标记的对 阅读全文
posted @ 2017-12-29 10:08 soyosuyang 阅读(264) 评论(0) 推荐(0)
摘要:版权声明:本文为博主原创文章,转载或者引用请务必注明作者和出处,谢谢!线性回归:训练数据中特征是单个,但特征值可以是多个y=wx+b (w: 是单个值)多元线性回归:训练数据中特征数量是多个y=W1X1+W2X2+W3X3+...+b或表示为:y=Wx+b(W:w1,w2,w3.....组成的向量的 阅读全文
posted @ 2017-11-15 13:50 soyosuyang 阅读(1251) 评论(0) 推荐(0)
摘要:方差:是每个样本值与全体样本值的平均数之差的平方值的平均数 标准差:是方差的算术平方根。标准差能反映一个数据集的离散程度 均方误差:对每一个样本,利用机器学习模型判定的类型与真实类型的差值的平方的平均数。(它是观测值与真值偏差的平方与观测次数n比值) 均方根误差(亦称标准误差):它是观测值与真值偏差 阅读全文
posted @ 2017-11-06 15:49 soyosuyang 阅读(1902) 评论(0) 推荐(0)
摘要:分类模型和回归模型本质一样,分类模型是将回归模型的输出离散化。 举几个例子: 1. Logistic Regression 和 Linear Regression: Linear Regression: 输出一个标量 wx+b,这个值是连续值,所以可以用来处理回归问题。 Logistic Regre 阅读全文
posted @ 2017-11-05 16:30 soyosuyang 阅读(4737) 评论(0) 推荐(0)
摘要:总结:(图上 R的计算的分母应该是 :40+10 )(笔误) 模型条件放宽,负类被误判为正类的可能性就变大(即FP变大)精确率和准确率会受影响(变小) 模型条件变严格,正类有可能被误判为负类(即FN变大)召回率会变小 F-measure是一种统计量,F-Measure又称为F-Score,F-Mea 阅读全文
posted @ 2017-11-04 10:33 soyosuyang 阅读(1733) 评论(0) 推荐(0)