导航

2018年10月31日

摘要: from sklearn.svm import SVC from sklearn.datasets import make_classification import numpy as np X,y = make_classification() def plot_validation_curve(estimator,X,y,param_name="gamma", ... 阅读全文

posted @ 2018-10-31 22:13 wzd321 阅读(585) 评论(0) 推荐(0)

摘要: def plot_learning_curve(estimator,X,y,cv=5,train_sizes=[0.1,0.3,0.5,0.7,0.8,0.9]): """ 描述:对于不同数量的训练样本的估计器的验证和训练评分 param estimator:object| param X:shape=[n_samples,n_feature] param... 阅读全文

posted @ 2018-10-31 21:42 wzd321 阅读(478) 评论(0) 推荐(0)

摘要: import pandas as pd import re def getNum(x): """ 科学计数法和字符转浮点数 """ if re.findall(r'\d+\.\d+E\+',x): return "%.f" % float(x) elif x=="C": return 1 else: ... 阅读全文

posted @ 2018-10-31 20:58 wzd321 阅读(2340) 评论(0) 推荐(0)

摘要: 统计型特征: 组合型特征: 1. 拼接型:简单的组合特征:例如挖掘用户对某种类型的喜爱,对用户和类型做拼接;正负权重,代表喜欢或不喜欢某种类型. - user_id&&category: 10001&&女裙 10002&&男士牛仔 - user_id&&style: 10001&&蕾丝 10002& 阅读全文

posted @ 2018-10-31 20:09 wzd321 阅读(738) 评论(0) 推荐(0)