摘要:1. 二项分布与beta分布对应 2. 多项分布与狄利克雷分布对应 3. 二项分布是什么?n次bernuli试验服从 二项分布 二项分布是N次重复bernuli试验结果的分布。 bernuli实验是什么?做一次抛硬币实验,该试验结果只有2种情况,x= 1, 表示正面。 x=0,表示反面。 bernu 阅读全文
grid search 超参数寻优
2017-09-05 13:39 by xplorerthik, 1464 阅读, 0 推荐, 收藏,
摘要:http://scikit-learn.org/stable/modules/grid_search.html 1. 超参数寻优方法 gridsearchCV 和 RandomizedSearchCV 2. 参数寻优的技巧进阶 2.1. Specifying an objective metric 阅读全文
grid search
2017-09-04 11:56 by xplorerthik, 503 阅读, 0 推荐, 收藏,
摘要:sklearn.metrics.make_scorer(score_func, greater_is_better=True, needs_proba=False, needs_threshold=False, **kwargs)[source]¶ >>> from sklearn.metrics 阅读全文
pipeline 对部分特征进行处理
2017-08-17 14:24 by xplorerthik, 542 阅读, 0 推荐, 收藏,
摘要:http://scikit-learn.org/stable/auto_examples/preprocessing/plot_function_transformer.html#sphx-glr-auto-examples-preprocessing-plot-function-transform 阅读全文
pandas dataframe 满足条件的样本提取
2017-08-05 10:43 by xplorerthik, 13933 阅读, 0 推荐, 收藏,
摘要:pandas 的dataframe 对 数据查询可以通过3种方式 。 预备知识: 1. pandas 的索引和label都是从0开始的计数的 2. 时间切片都是左闭右开的。 [5:6,:] 只会输出index =5的那一行值。 pd.dataframe的3种方式实现数据查询 1. 取其中的一个元素 阅读全文
python 添加日期
2017-08-01 10:35 by xplorerthik, 468 阅读, 0 推荐, 收藏,
摘要:import pandas as pd applydata['apply_time'] = pd.to_datetime(applydata.apply_time)# applydata.apply_time = 2016-04-06 14:30:06:applydata['apply_date'] 阅读全文
R dataframe 遗忘, which 矩阵搜索
2017-07-25 16:31 by xplorerthik, 572 阅读, 0 推荐, 收藏,
摘要:A data frame is used for storing data tables. It is a list of vectors of equal length. For example, the following variable df is a data frame containi 阅读全文
sklearn scoring . xgboost.train . ---> rsme
2017-07-25 13:54 by xplorerthik, 726 阅读, 0 推荐, 收藏,
摘要:http://scikit-learn.org/stable/modules/model_evaluation.html#scoring-parameter 3.3.1. The scoring parameter: defining model evaluation rules Model sel 阅读全文
pandas. dataframe
2017-07-25 10:55 by xplorerthik, 173 阅读, 0 推荐, 收藏,
摘要:loc works on labels in the index. iloc works on the positions in the index (so it only takes integers). ix usually tries to behave like loc but falls 阅读全文
浙公网安备 33010602011771号