posted @ 2018-08-01 21:38
醉月风纯
阅读(80)
推荐(0)
编辑
摘要:
处理海量数据问题的方法大概有以下几种: 1 Bloom filter 2 BitMap 3 字典树 4 外排 5 分布式处理之Hadoop 本文接下来对这5种方法模式结合对应的海量
阅读全文
posted @ 2018-08-01 16:15
醉月风纯
阅读(223)
推荐(0)
编辑
摘要:
Tire树,即字典树,又称单词查找树或键树,是一种树型结构,是一种哈希树的变种。典型的应用是统计和排序大量的字符串(不仅限于字符串),所以经常被搜索引擎用于文本词频统计。它的优点是:最大限度地减少无畏的比较,查询效率比哈希表高。  
阅读全文
posted @ 2018-08-01 12:02
醉月风纯
阅读(130)
推荐(0)
编辑
摘要:
1. "归并排序" 2. "快速排序"
阅读全文
posted @ 2018-07-28 01:05
醉月风纯
阅读(53)
推荐(0)
编辑
摘要:
"0 1背包,完全背包,多重背包"
阅读全文
posted @ 2018-07-27 23:57
醉月风纯
阅读(74)
推荐(0)
编辑
摘要:
概念 二叉搜索树(Binary Search Tree),又称二叉排序树,它或者是一颗空树,或者具有如下性质的树: 1.若它的左子树不为空。则左子树上所有节点的值都小于根节点的值 2.若它的右子树不为空,则右子树上的所有节点的值都大于根节点的值 3.它的左右子树也分别为二叉搜索树 1.基本操作 1.
阅读全文
posted @ 2018-07-26 10:08
醉月风纯
阅读(72)
推荐(0)
编辑
摘要:
项目地址:https://github.com/WillKoehrsen/feature selector 特征选择(feature selection)是查找和选择数据集中最有用特征的过程,是机器学习流程中的一大关键步骤。不必要的特征会降低训练速度、降低模型可解释性,并且最重要的是还会降低其在测试
阅读全文
posted @ 2018-07-09 19:54
醉月风纯
阅读(1934)
推荐(0)
编辑
摘要:
1 给定字符串,要求把前面的若干个字符移到字符串的尾部 使用三段法,先反转前面字符,再反转后面字符,最后全部反转即可。 public class convert { public static void main(String[] args) { String st = "abcdef"; st =
阅读全文
posted @ 2018-07-08 19:13
醉月风纯
阅读(151)
推荐(0)
编辑
摘要:
训练一个模型时大家都需要面对一个问题:参数优化。通常,我们做参数优化时都会先导出一个cost function,然后通过调整参数值来最大化或最小化这个cost function。这个过程听起来很简单,但真的做起来是个剧恶心的体力活! 比方说你要用梯度方法做优化,得求一阶导二阶导吧,求得半死不活之后还
阅读全文
posted @ 2018-07-04 21:37
醉月风纯
阅读(747)
推荐(0)
编辑
摘要:
通常学习器在训练集上的误差称为“训练误差”或“经验误差”,在新样本上的误差称之为“泛化误差”。显然,我们想得到泛化误差小的学习器。然而我们事先不知道新样本是什么,实际上能做的是努力使经验误差最小化。在很多情况下我们可以学习到一个经验误差很小的,在训练集上表现很好的学习器,但这是不是我们想要的学习器呢
阅读全文
posted @ 2018-07-04 12:26
醉月风纯
阅读(272)
推荐(0)
编辑