摘要: 中文原文链接:http://www.cnblogs.com/AHappyCat/p/5318042.html 英文原文链接: An Introduction to Feature Selection 下面的中文译文侧重从原理上进行解释,但是在实际的应用中往往侧重的是实现过程, 可以看考这个链接,描述 阅读全文
posted @ 2016-10-08 08:29 成为数据分析熟手 阅读(532) 评论(0) 推荐(0) 编辑
摘要: 原文链接:http://www.cnblogs.com/chaosimple/p/3164775.html#undefined 1、DBSCAN简介 DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密 阅读全文
posted @ 2016-10-08 08:18 成为数据分析熟手 阅读(667) 评论(0) 推荐(0) 编辑
摘要: xgboost是基于GBDT原理进行改进的算法,效率高,并且可以进行并行化运算; 而且可以在训练的过程中给出各个特征的评分,从而表明每个特征对模型训练的重要性, 调用的源码就不准备详述,本文主要侧重的是计算的原理,函数get_fscore源码如下, 源码来自安装包:xgboost/python-pa 阅读全文
posted @ 2016-10-03 17:29 成为数据分析熟手 阅读(24345) 评论(0) 推荐(1) 编辑
摘要: 链接:http://www.zhihu.com/question/20326697/answer/58148605 推荐算法大致可以分为三类:基于内容的推荐算法、协同过滤推荐算法和基于知识的推荐算法。 基于内容的推荐算法,原理是用户喜欢和自己关注过的Item在内容上类似的Item,比如你看了哈利波特 阅读全文
posted @ 2016-09-29 22:27 成为数据分析熟手 阅读(442) 评论(0) 推荐(0) 编辑
摘要: 由于最近要经常用到XGBOOST的包,不免对相关的GBDT的原理又重新学习了一遍, 发现其中在考虑损失函数的时候,是以对数log进行度量的,囿于误差平方和函数的印象 那么为什么是对数呢?可能是下面的原因: 【通俗的解释】 对数损失是用于最大似然估计的。一组参数在一堆数据下的似然值,等于每一条数据的概 阅读全文
posted @ 2016-09-29 20:37 成为数据分析熟手 阅读(5091) 评论(0) 推荐(0) 编辑
摘要: 原文链接:http://blog.csdn.net/dulingtingzi/article/details/51374487 问题由来 在很多机器学习任务中,特征并不总是连续值,而有可能是分类值。 例如,考虑一下的三个特征: ["male", "female"] ["from Europe", " 阅读全文
posted @ 2016-09-27 08:44 成为数据分析熟手 阅读(43008) 评论(0) 推荐(2) 编辑
摘要: xgboost入门非常经典的材料,虽然读起来比较吃力,但是会有很大的帮助: 英文原文链接:https://www.analyticsvidhya.com/blog/2016/03/complete-guide-parameter-tuning-xgboost-with-codes-python/ 原 阅读全文
posted @ 2016-09-26 14:55 成为数据分析熟手 阅读(18771) 评论(0) 推荐(2) 编辑
摘要: 原文链接:http://www.jb51.net/article/51892.htm 举例说明解释的非常清楚,应该是看到的类似博文里面最简单的一篇: 这篇文章主要介绍了python 中__name__ = '__main__' 的作用,对于初学者来说很有帮助,需要的朋友可以参考下 很多新手刚开始学习 阅读全文
posted @ 2016-09-26 14:26 成为数据分析熟手 阅读(192) 评论(0) 推荐(0) 编辑
摘要: 大家用的比较多的是Linux和windows,基于Mac os的安装教程不多, 所以在安装的过程中遇到很多问题,经过较长时间的尝试,可以正常安装和使用, 【说在前面】由于新版本的Os操作系统不支持openMP,而官网给出的安装xgboost是给予Openmp的解决方案, 所以需要开启其功能,官方网站 阅读全文
posted @ 2016-09-26 08:32 成为数据分析熟手 阅读(3700) 评论(0) 推荐(0) 编辑
摘要: 原文链接:http://www.cnblogs.com/chaosimple/p/4153083.html 关于pandas的入门介绍,比较全,也比较实在,特此记录~ 还有关于某同学的pandas学习笔记,也是极好的 链接:https://segmentfault.com/a/11900000041 阅读全文
posted @ 2016-09-20 21:15 成为数据分析熟手 阅读(690) 评论(0) 推荐(0) 编辑