导航

2018年9月19日

摘要: import pandas as pd data = pd.DataFrame(np.arange(1,10).reshape(3,3),index=["a","b","c"],columns=["A","B","C"]) # ============================================================================... 阅读全文

posted @ 2018-09-19 11:16 wzd321 阅读(730) 评论(0) 推荐(0)

摘要: merge需要依据共同的某一列或者某一行来进行合并 left: 左表(DataFrame) right:右表(DataFrame) how:连接方式 left: 仅保留左表的键 right: 仅保留右表的键 outer:两表的键取并集 inner:两表的键取交集 on:用来对齐的那一列的名字,用到这 阅读全文

posted @ 2018-09-19 10:32 wzd321 阅读(1672) 评论(0) 推荐(0)

2018年9月18日

摘要: 转载:https://blog.csdn.net/jclian91/article/details/81238782 一个真实的例子: sklearn模块中很多方法的返回结果为self, 比如大多数模型的fit()方法,例子如下: 输出: LogisticRegression(C=1.0, clas 阅读全文

posted @ 2018-09-18 22:06 wzd321 阅读(2476) 评论(0) 推荐(0)

摘要: 转载:https://github.com/LearningFromBest/CMB-credit-card-department-prediction-of-purchasing-behavior-in-consumer-finance-scenario/blob/master/stacking. 阅读全文

posted @ 2018-09-18 21:58 wzd321 阅读(2346) 评论(0) 推荐(0)

摘要: 分类特征:定序、定类,编码分类特征,考虑距离度量的含义。此处只讨论高基数的定类编码: 区间计数方案 特征哈希方案: 实体嵌入方案:这部分我会根据一片论文进行详细的讲解,将会在后面推出。 阅读全文

posted @ 2018-09-18 21:03 wzd321 阅读(1128) 评论(0) 推荐(0)

摘要: 二值化处理:将细粒度的度量转化成粗粒度的度量,使得特征的差异化更大。 特征多项式交互:捕获特征之间的相关性 数据分布倾斜的处理: log变化:log变化倾向于拉高那些落在较低的幅度范围内自变量的取值,压缩那些落在较高的幅度范围内自变量的取值,log变化能够稳定数据的方差,使数据的分布接近于正太分布并 阅读全文

posted @ 2018-09-18 20:27 wzd321 阅读(1380) 评论(0) 推荐(0)

2018年9月16日

摘要: class sklearn.base.BaseEstimator:为所有的estimators提供基类 方法: 获取这个估计器的参数 Parameters: deep : boolean, optional True,将返回该estimator的参数,并包含作为estimator的子对象. Retu 阅读全文

posted @ 2018-09-16 16:12 wzd321 阅读(2303) 评论(0) 推荐(0)

摘要: import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(4,3),columns=list("ABC"),index=[1,2,3,4]) #apply函数对DataFrame和Series的一列做整体运算 df.apply(lambda x:x.max()-x.min()) # =========... 阅读全文

posted @ 2018-09-16 15:47 wzd321 阅读(1027) 评论(0) 推荐(0)

摘要: ctrl+1:注释/反注释 ctrl+4/5:注释/反注释 tab/ shift+tab:缩进/反缩进 F5:全运行 F9:单行运行 F11:全屏 ctrl+I:显示帮助 阅读全文

posted @ 2018-09-16 11:16 wzd321 阅读(126) 评论(0) 推荐(0)

摘要: 我们可以通过包装器将Sequential模型(仅有一个输入)作为Scikit-Learn工作流的一部分,相关的包装器定义在keras.wrappers.scikit_learn.py中: 这里有两个包装器可用: 分类器接口:keras.wrappers.scikit_learn.KerasClass 阅读全文

posted @ 2018-09-16 11:09 wzd321 阅读(293) 评论(0) 推荐(0)