随笔分类 -  ai sklearn

sklearn的一些使用
摘要:一.决策树 决策树一般以选择属性的方式不同分为id3(信息增益),c4.5(信息增益率),CART(基尼系数),只能进行线性的分割,是一种贪婪的算法,其中sklearn中的决策树分为回归树和分类树两种,默认的是CART的决策树,下面介绍CART决策树 分支条件:二分类问题(只用来构建二叉树) 分支方 阅读全文
posted @ 2018-10-16 19:19 yskn 阅读(1791) 评论(0) 推荐(0)
摘要:一.线性回归 LinearRegression类就是我们平时所说的普通线性回归,它的损失函数如下所示: 对于这个损失函数,一般有梯度下降法和最小二乘法两种极小化损失函数的优化方法,而scikit-learn中的LinearRegression类使用的是最小二乘法。通过最小二乘法,可以解出线性回归系数 阅读全文
posted @ 2018-10-14 16:20 yskn 阅读(658) 评论(0) 推荐(0)
摘要:sklearn.metrics 1.MSE(均方误差)和RMSE(均方根误差),以及score() 2.混淆矩阵 混淆矩阵的每一列代表了预测类别 ,每一列的总数表示预测为该类别的数据的数目;每一行代表了数据的真实归属类别,每一行的数据总数表示该类别的数据实例的数目。每一列中的数值表示真实数据被预测为 阅读全文
posted @ 2018-10-14 15:46 yskn 阅读(1644) 评论(0) 推荐(0)
摘要:1、随机划分训练集和测试集 sklearn.model_selection.train_test_split 一般形式: train_test_split是交叉验证中常用的函数,功能是从样本中随机的按比例选取train data和testdata,形式为: 参数解释:- train_data:所要划 阅读全文
posted @ 2018-10-12 20:24 yskn 阅读(1673) 评论(0) 推荐(0)