随笔 - 2044  文章 - 2 评论 - 157 trackbacks - 0

摘要: 这里以二元分类为例子,给出最基本原理的解释 GBDT 是多棵树的输出预测值的累加 GBDT的树都是 回归树 而不是分类树 分类树 分裂的时候选取使得误差下降最多的分裂 计算的技巧 最终分裂收益按照下面的方式计算,注意圆圈内的部分是固定值 GBDT 二分类 GBDT在实现中可以完全复用上面的计算方法框阅读全文
posted @ 2016-10-10 18:21 知识天地 阅读(280) 评论(0) 编辑
摘要: 现在我们来看看变易算法。所谓变易算法(Mutating algorithms)就是一组能够修改容器元素数据的模板函数,可进行序列数据的复制,变换等。 我们现在来看看第一个变易算法:元素复制算法copy。该算法主要用于容器之间元素的拷贝,即将迭代器区间[first,last)的元素复制到由复制目 标r阅读全文
posted @ 2019-05-05 17:01 知识天地 阅读(12) 评论(0) 编辑
摘要: 在C/C++中使用OpenMP优化代码方便又简单,代码中需要并行处理的往往是一些比较耗时的for循环,所以重点介绍一下OpenMP中for循环的应用。个人感觉只要掌握了文中讲的这些就足够了,如果想要学习OpenMP可以到网上查查资料。 工欲善其事,必先利其器。如果还没有搭建好omp开发环境的可以看一阅读全文
posted @ 2019-01-01 17:19 知识天地 阅读(42) 评论(0) 编辑
摘要: map和unordered_map的差别还不知道或者搞不清unordered_map和map是什么的,请见:http://blog.csdn.net/billcyj/article/details/78065438 需要引入的头文件不同map: #include < map >unordered_m阅读全文
posted @ 2018-11-27 08:15 知识天地 阅读(121) 评论(0) 编辑
摘要: 1.关于set C++ STL 之所以得到广泛的赞誉,也被很多人使用,不只是提供了像vector, string, list等方便的容器,更重要的是STL封装了许多复杂的数据结构算法和大量常用数据结构操作。vector封装数组,list封装了链表,map和set封装了二叉树等,在封装这些数据结构的时阅读全文
posted @ 2018-11-22 16:35 知识天地 阅读(48) 评论(0) 编辑
摘要: 引 言 如果你是一个机器学习社区的活跃成员,你一定知道 提升机器(Boosting Machine)以及它们的能力。提升机器从AdaBoost发展到目前最流行的XGBoost。XGBoost实际上已经成为赢得在Kaggle比赛中公认的算法。这很简单,因为他极其强大。但是,如果数据量极其的大,XGBo阅读全文
posted @ 2018-11-20 19:21 知识天地 阅读(147) 评论(0) 编辑
摘要: sklearn集成方法 集成方法的目的是结合一些基于某些算法训练得到的基学习器来改进其泛化能力和鲁棒性(相对单个的基学习器而言)主流的两种做法分别是: bagging 基本思想 独立的训练一些基学习器(一般倾向于强大而复杂的模型比如完全生长的决策树),然后综合他们的预测结果,通常集成模型的效果会优于阅读全文
posted @ 2018-11-20 19:07 知识天地 阅读(415) 评论(0) 编辑
摘要: 要: 1 背景 随着移动互联网的崛起,越来越多的用户开始习惯于从手机完成吃、喝、玩、乐、衣、食、住、行等各个方面的需求。打开手机,点开手淘、美团等APP,商品玲玲满目,而让用户将所有商品一页页看完已经不现实,通常情况下用户也就查看前几页,如果找不到满意的商品则退出,从而造成流单。 1 背景 随着移动阅读全文
posted @ 2018-11-14 14:34 知识天地 阅读(451) 评论(0) 编辑
摘要: 在国内利用Python从Internet上爬取数据时,有些网站或API接口被限速或屏蔽,这时使用代理可以加速爬取过程,减少请求失败,Python程序使用代理的方法主要有以下几种: (1)如果是在代码中使用一些网络库或爬虫框架进行数据爬取,一般这种框架都会支持设置代理,例如: import urlli阅读全文
posted @ 2018-11-02 19:37 知识天地 阅读(46) 评论(0) 编辑
摘要: 几乎所有的小伙伴都可以随口说几句关于创建索引的优缺点,也知道什么时候创建索引能够提高我们的查询性能,什么时候索引会更新,但是你有没有注意到,即使你设置了索引,有些时候索引他是不会生效的!这不仅考察了大家对索引的了解程度,还要让大家在使用的时候能够正确的使用。以下介绍了一些可能会造成索引失效的特殊情况阅读全文
posted @ 2018-11-01 17:57 知识天地 阅读(55) 评论(0) 编辑
摘要: 一直非常想增加到一个开源项目中去,目的非常easy:分享思路。接受众人的考验,可是却没成行。 看到这篇文章。受到一定的启示。遂转之。注:有删减。http://www.php100.com/html/itnews/it/2012/0420/10275.html 人们常下面3个原因而打消了參与到开源项目阅读全文
posted @ 2018-11-01 16:10 知识天地 阅读(37) 评论(0) 编辑