只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2016-07-30 23:12 苏羽垄 阅读(29) 评论(2) 推荐(0) 编辑
摘要: 参考博客 绝大多数语言中的字典底层实现基本上都是哈希表。哈希表中用 “负载因子” 来衡量哈希表的 空/满 程度。为了让负载因子在一定的合理范围之内,提高查询的性能,一般的做法是让哈希表扩容,然后rehash一把。 but,扩容也不一定就能解决负载因子过大的问题。Redis作为一款成熟的非关系型数据库 阅读全文
posted @ 2017-06-03 15:01 苏羽垄 阅读(444) 评论(0) 推荐(0) 编辑
摘要: Adaboost原理传送门 AdaBoost在我看理论课程的时候,以分类为例子来讲解的,谁知道sklearn里面基本上都有classifier和regressor两种。这个倒是我没想到的!!! from sklearn.ensemble import AdaBoostRegressor 参数介绍: 阅读全文
posted @ 2017-05-16 09:02 苏羽垄 阅读(4483) 评论(2) 推荐(0) 编辑
摘要: from sklearn.ensemble import BaggingRegressor Bagging通过引入随机化增大每个估计器之间的差异。 参数介绍: base_estimator:Object or None。None代表默认是DecisionTree,Object可以指定基估计器(bas 阅读全文
posted @ 2017-05-15 21:25 苏羽垄 阅读(3925) 评论(0) 推荐(0) 编辑
摘要: 集成学习里面在不知道g的情况下边学习边融合有两大派:Bagging和Boosting,每一派都有其代表性算法,这里给出一个大纲。 先来说下Bagging和Boosting之间的相同点:都是不知道g,和blending的区别在于blending手里有已知的g,所以需要边学习g边融合。都需要先做boot 阅读全文
posted @ 2017-05-15 20:18 苏羽垄 阅读(253) 评论(0) 推荐(0) 编辑
摘要: 开源机器学习库介绍 MLlib in Apache Spark:Spark下的分布式机器学习库。官网 scikit-learn:基于SciPy的机器学习模块。官网 LibRec:一个专注于推荐算法的java开源库。官网 BigML:连接外部服务器的库。官网 Caffe:考虑了代码清洁、可读性及速度的 阅读全文
posted @ 2017-05-15 09:33 苏羽垄 阅读(368) 评论(3) 推荐(0) 编辑
摘要: 环境的安装总是让人多愁善感,爱恨交叉... 本人安装环境:win7 64 + python2.7 先来几个网站 https://doc.scrapy.org/en/latest/intro/install.html Scrapy的官网安装教程 安装的过程会出现需要C++9.0的环境,这个时候可以安装 阅读全文
posted @ 2017-02-22 19:55 苏羽垄 阅读(1089) 评论(2) 推荐(0) 编辑
摘要: 题目链接:http://www.lintcode.com/zh-cn/problem/max-points-on-a-line/# 条件:给一个点数组 目标:求出共线的点的最多个数 实现:时间复杂度——O(n^2) 要考虑的特殊情况是:①有相同点(这个也太特喵隐蔽了)②斜率不存在的点 思路:暴力求解 阅读全文
posted @ 2016-12-15 00:31 苏羽垄 阅读(1085) 评论(0) 推荐(0) 编辑
摘要: 参考链接:http://www.liaoxuefeng.com 安装 安装步骤: ①先给操作系统装入git工具,以Linux为例: $ sudo apt-get install git ②去github官网申请账号,用于生成ssh key ③生成ssh key,其中使用的mail是你注册github 阅读全文
posted @ 2016-11-29 00:02 苏羽垄 阅读(511) 评论(0) 推荐(0) 编辑
摘要: 某些应用程序需要对文件或者目录进行监控,来侦测其是否发生了某些事件。Linux很贴心的为我们提供了inotify API,也是Linux的专有。 inotify API 在使用之前一定要有一个inotify实例,int inotify_init(void);返回一个inotify实例的描述符。 添加 阅读全文
posted @ 2016-11-10 15:20 苏羽垄 阅读(3603) 评论(1) 推荐(1) 编辑
摘要: 我们知道有些Linux的命令涉及到一些高效率的算法,在此做出一个积累吧,不是系统的。 1、tail命令打印一个文件的最后num行 2、grep命令从文本中匹配字符串 基于正则表达式的匹配很快。 it is unadvisable to use the algorithm for non-explic 阅读全文
posted @ 2016-11-09 23:33 苏羽垄 阅读(1343) 评论(0) 推荐(0) 编辑