随笔分类 - 机器学习实战
摘要:参数值: [ 3.92908866 2.7990655 -0.02259148 14.02249997]均方误差: 2.78412631453
阅读全文
摘要:集成学习实践部分也分成三块来讲解: sklearn官方文档:http://scikit-learn.org/stable/modules/ensemble.html#ensemble 1、GBDT GradientBoostingClassifier:http://scikit-learn.org/
阅读全文
摘要:对于集成学习,由于是多个基学习期共同作用结果,因此在做参数调节时候就有基学习器的参数和集成学习的参数两类 在scikit-learn中,RF的分类类是RandomForestClassifier,回归类是RandomForestRegressor 官方文档:http://scikit-learn.o
阅读全文
摘要:官方文档:http://scikit-learn.org/stable/modules/tree.html scikit-learn决策树算法类库内部实现是使用了调优过的CART树算法,既可以做分类,又可以做回归。分类决策树的类对应的是DecisionTreeClassifier,而回归决策树的类对
阅读全文
摘要:官方文档:http://scikit-learn.org/stable/modules/linear_model.html 一、线性回归实践 1、导入相关库,并查看数据情况 2、对于预测的变量,查看分布情况 3、对于几个特征,查看与因变量的关系 结论:三个特征,前两个与销量呈现明显的线性关系,第三个
阅读全文
摘要:一、一般模型 结果是:0.82222222222222219 二、加入正则项: 结果是:0.77777777777777779
阅读全文
摘要:一、普通的线性模型 二、加入正则化的模型 Ridge回归 Lasso回归
阅读全文