ai sklearn - 随笔分类 - yskn

sklearn--决策树和基于决策树的集成模型

摘要：一.决策树决策树一般以选择属性的方式不同分为id3(信息增益),c4.5(信息增益率),CART(基尼系数),只能进行线性的分割,是一种贪婪的算法,其中sklearn中的决策树分为回归树和分类树两种,默认的是CART的决策树,下面介绍CART决策树分支条件：二分类问题(只用来构建二叉树) 分支方阅读全文

posted @ 2018-10-16 19:19 yskn 阅读(1813) 评论(0) 推荐(0)

sklearn--回归

摘要：一.线性回归 LinearRegression类就是我们平时所说的普通线性回归，它的损失函数如下所示：对于这个损失函数，一般有梯度下降法和最小二乘法两种极小化损失函数的优化方法，而scikit-learn中的LinearRegression类使用的是最小二乘法。通过最小二乘法，可以解出线性回归系数阅读全文

posted @ 2018-10-14 16:20 yskn 阅读(672) 评论(0) 推荐(0)

sklearn--模型的评价

摘要：sklearn.metrics 1.MSE(均方误差)和RMSE(均方根误差),以及score() 2.混淆矩阵混淆矩阵的每一列代表了预测类别，每一列的总数表示预测为该类别的数据的数目；每一行代表了数据的真实归属类别，每一行的数据总数表示该类别的数据实例的数目。每一列中的数值表示真实数据被预测为阅读全文

posted @ 2018-10-14 15:46 yskn 阅读(1658) 评论(0) 推荐(0)

sklearn--数据集的处理模型参数选择

摘要：1、随机划分训练集和测试集 sklearn.model_selection.train_test_split 一般形式： train_test_split是交叉验证中常用的函数，功能是从样本中随机的按比例选取train data和testdata，形式为：参数解释：- train_data：所要划阅读全文

posted @ 2018-10-12 20:24 yskn 阅读(1703) 评论(0) 推荐(0)

杨凯楠

随笔分类 - ai sklearn

公告