2018 年 10月 7 日随笔档案 - JerryChennn

2018年10月7日

摘要：过拟合我们都知道，在进行数据挖掘或者机器学习模型建立的时候，因为在统计学习中，假设数据满足独立同分布（i.i.d，independently and identically distributed），即当前已产生的数据可以对未来的数据进行推测与模拟，因此都是使用历史数据建立模型，即使用已经产生的数阅读全文

posted @ 2018-10-07 21:15 JerryChennn 阅读(331) 评论(0) 推荐(0)

2.2sklearn.preprocessing.PolynomialFeatures生成交叉特征

摘要： "sklearn.preprocessing.PolynomialFeatures原文" 多项式生成函数：参数说明：：默认为2，多项式次数(就同几元几次方程中的次数一样) ：是否包含单个自变量 n(n 1)特征数据标识，默认为False，为True则表示去除与自己相乘的情况：是否包含偏差标识，阅读全文

posted @ 2018-10-07 17:15 JerryChennn 阅读(948) 评论(0) 推荐(0)

2.1对特征归一化的一些理解

摘要：有很多不同的叫法，比如：，`Feature Normalization Feature Scaling` 数据标准化（归一化）处理是数据挖掘的一项基础工作，不同评价指标往往具有不同的量纲和量纲单位，这样的情况会影响到数据分析的结果，为了消除指标之间的量纲影响，需要进行数据标准化处理，以解决数据指标阅读全文

posted @ 2018-10-07 17:10 JerryChennn 阅读(630) 评论(0) 推荐(0)

JerryChennn

公告