摘要: 最近有个需求,需要从不固定大小的数据集中取固定数量的数据作为样本,有个同学提到了蓄水池算法,于是了解了一下。 蓄水池算法,本身是为了解决海量数据的随机抽样问题,在算法领域应用还是挺广泛的,由于数据本身是有权重,又出现了加权蓄水池算法。 蓄水池算法 问题描述 : 给定一个不固定长度的数据集合 ,从中等 阅读全文
posted @ 2018-01-27 20:03 hatlonely 阅读(884) 评论(0) 推荐(1) 编辑
摘要: 依赖管理是一个语言非常重要的特性,很大程度上决定着一个语言的流行程度,流行的语言大多都有非常成熟的依赖管理工具,java 的 maven 和 gradle,javascript 的 npm,python 的 pip,这些工具极大地降低了我们使用第三方库的成本,提高了生产效率,而 c++ 比较奇葩,并 阅读全文
posted @ 2018-01-27 20:00 hatlonely 阅读(251) 评论(0) 推荐(0) 编辑