摘要: 参数: fit_intercept : 布尔值 是否计算此模型的截距。 如果设置为false,则计算中不会使用截距(例如,如果数据已居中)。 verbose : 布尔值或整数可选 设置详细度 max_iter:整数,可选 要执行的最大迭代次数。 normalize:布尔值,可选,默认为True 当f 阅读全文
posted @ 2019-10-01 19:59 Dino_L 阅读(3735) 评论(0) 推荐(0)
摘要: 使用散点图矩阵图,可以两两发现特征之间的联系 1、frame,pandas dataframe对象2、alpha, 图像透明度,一般取(0,1]3、figsize,以英寸为单位的图像大小,一般以元组 (width, height) 形式设置4、ax,可选一般为none5、diagonal,必须且只能 阅读全文
posted @ 2019-10-01 19:04 Dino_L 阅读(3916) 评论(0) 推荐(0)
摘要: Sklearn RandomForest算法(有监督学习),可以根据输入数据,选择最佳特征组合,减少特征冗余; 原理:由于随机决策树生成过程采用的Boostrap,所以在一棵树的生成过程并不会使用所有的样本,未使用的样本就叫(Out_of_bag)袋外样本,通过袋外样本,可以评估这个树的准确度,其他 阅读全文
posted @ 2019-09-30 22:17 Dino_L 阅读(4429) 评论(0) 推荐(0)
摘要: 导包合集 数据集合 from sklearn.datasets import load_wine 决策树 from sklearn.tree import DecisionTreeClassifier 随机森林 from sklearn.ensemble import RandomForestCla 阅读全文
posted @ 2019-09-30 16:29 Dino_L 阅读(745) 评论(0) 推荐(0)
摘要: 偏差(Bias) 偏差指预测输出与真实标记的差别,记为: 偏差度量了学习算法的期望预测与真实结果的偏离程度,即刻画了学习算法本身的拟合能力。 方差(Variance) 方差指一个特定训练集训练得到的函数,与所有训练集得到平均函数的差的平方再取期望,记为: 方差度量了同样大小的训练集的变动所导致的学习 阅读全文
posted @ 2019-09-29 03:13 Dino_L 阅读(931) 评论(0) 推荐(0)
摘要: 时间戳处理: 当前日期时间: NOW() 当前日期: CURDATE() 时间戳转日期格式 FROM_UNIXTIME(unix_timestamp,'%Y-%m-%d %H:%i:%s') 日期格式转时间戳 SELECT UNIX_TIMESTAMP() 相加: DATE_ADD(date,INT 阅读全文
posted @ 2019-09-23 04:28 Dino_L 阅读(4531) 评论(0) 推荐(0)