08 2016 档案

摘要:网上很多windows python下安装xgboost都是很简单的几步无非是visual studio2013以上版本编译,安装。但现在最新的xgboost已经移除了c++工程文件,找到旧版本的也多是64位python版本安装xgboost的安装教程。由于我python32位已经安装了很多组件,改 阅读全文
posted @ 2016-08-22 11:47 moye 阅读(2372) 评论(1) 推荐(0)
摘要:基础概念: 1,概率质量函数 概率质量函数(probability mass function)PMF:离散随机变量在各特定取值上的概率。 2,累积分布函数 累积分布函数(Cumulative Distribution Function, CDF)计算给定 x 的 CDF(x),就是计算样本中小于等 阅读全文
posted @ 2016-08-19 15:25 moye 阅读(681) 评论(0) 推荐(0)
摘要:排序: 分为内部排序和外部排序 内部排序:只在内存中进行 外部排序:内存和外存结合,数据量比较大的情况下。 内部排序:只在内存中进行 外部排序:内存和外存结合,数据量比较大的情况下。 排序稳定:相等的两个数值排序结束后相对位置不变 内部排序: 插入排序:第k个插入时,和前k-1个数进行比较,放在正确 阅读全文
posted @ 2016-08-17 09:45 moye 阅读(142) 评论(0) 推荐(0)
摘要:当我们有针对同一数据集有多个不同的分类器模型时,怎样组合它们使预测分类的结果更加准确, 针对这种情况,机器学习通常两种策略。 1 一种是bagging,一种是boosting bagging:随机对样本重采样,采得N个数据集(数据集可能有交叉),对每个数据集进行训练,可以使用相同分类器也可以使用不同 阅读全文
posted @ 2016-08-11 15:42 moye 阅读(350) 评论(0) 推荐(0)