摘要:
转载:https://blog.csdn.net/jclian91/article/details/81238782 一个真实的例子: sklearn模块中很多方法的返回结果为self, 比如大多数模型的fit()方法,例子如下: 输出: LogisticRegression(C=1.0, clas 阅读全文
posted @ 2018-09-18 22:06 wzd321 阅读(2479) 评论(0) 推荐(0)
|
|
|
|
摘要:
转载:https://blog.csdn.net/jclian91/article/details/81238782 一个真实的例子: sklearn模块中很多方法的返回结果为self, 比如大多数模型的fit()方法,例子如下: 输出: LogisticRegression(C=1.0, clas 阅读全文
posted @ 2018-09-18 22:06 wzd321 阅读(2479) 评论(0) 推荐(0)
摘要:
转载:https://github.com/LearningFromBest/CMB-credit-card-department-prediction-of-purchasing-behavior-in-consumer-finance-scenario/blob/master/stacking. 阅读全文
posted @ 2018-09-18 21:58 wzd321 阅读(2347) 评论(0) 推荐(0)
摘要:
分类特征:定序、定类,编码分类特征,考虑距离度量的含义。此处只讨论高基数的定类编码: 区间计数方案 特征哈希方案: 实体嵌入方案:这部分我会根据一片论文进行详细的讲解,将会在后面推出。 阅读全文
posted @ 2018-09-18 21:03 wzd321 阅读(1133) 评论(0) 推荐(0)
摘要:
二值化处理:将细粒度的度量转化成粗粒度的度量,使得特征的差异化更大。 特征多项式交互:捕获特征之间的相关性 数据分布倾斜的处理: log变化:log变化倾向于拉高那些落在较低的幅度范围内自变量的取值,压缩那些落在较高的幅度范围内自变量的取值,log变化能够稳定数据的方差,使数据的分布接近于正太分布并 阅读全文
posted @ 2018-09-18 20:27 wzd321 阅读(1386) 评论(0) 推荐(0) |
|