摘要: 过拟合 我们都知道,在进行数据挖掘或者机器学习模型建立的时候,因为在统计学习中,假设数据满足独立同分布(i.i.d,independently and identically distributed),即当前已产生的数据可以对未来的数据进行推测与模拟,因此都是使用历史数据建立模型,即使用已经产生的数 阅读全文
posted @ 2018-10-07 21:15 JerryChennn 阅读(327) 评论(0) 推荐(0)
摘要: "sklearn.preprocessing.PolynomialFeatures原文" 多项式生成函数: 参数说明: :默认为2,多项式次数(就同几元几次方程中的次数一样) :是否包含单个自变量 n(n 1)特征数据标识,默认为False,为True则表示去除与自己相乘的情况 :是否包含偏差标识, 阅读全文
posted @ 2018-10-07 17:15 JerryChennn 阅读(948) 评论(0) 推荐(0)
摘要: 有很多不同的叫法,比如: ,`Feature Normalization Feature Scaling` 数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标 阅读全文
posted @ 2018-10-07 17:10 JerryChennn 阅读(630) 评论(0) 推荐(0)