随笔列表第2页 - 醉月风纯

摘要： Q1: 给出n个数，n 阅读全文

posted @ 2018-08-01 21:38 醉月风纯阅读(80) 评论(0) 推荐(0) 编辑

摘要：处理海量数据问题的方法大概有以下几种： 1 Bloom filter 2 BitMap 3 字典树 4 外排 5 分布式处理之Hadoop 本文接下来对这5种方法模式结合对应的海量阅读全文

posted @ 2018-08-01 16:15 醉月风纯阅读(223) 评论(0) 推荐(0) 编辑

摘要： Tire树，即字典树，又称单词查找树或键树，是一种树型结构，是一种哈希树的变种。典型的应用是统计和排序大量的字符串（不仅限于字符串），所以经常被搜索引擎用于文本词频统计。它的优点是：最大限度地减少无畏的比较，查询效率比哈希表高。阅读全文

posted @ 2018-08-01 12:02 醉月风纯阅读(130) 评论(0) 推荐(0) 编辑

排序算法

摘要： 1. "归并排序" 2. "快速排序" 阅读全文

posted @ 2018-07-28 01:05 醉月风纯阅读(53) 评论(0) 推荐(0) 编辑

背包问题

摘要： "0 1背包，完全背包，多重背包" 阅读全文

posted @ 2018-07-27 23:57 醉月风纯阅读(74) 评论(0) 推荐(0) 编辑

二叉搜索树

摘要：概念二叉搜索树(Binary Search Tree)，又称二叉排序树，它或者是一颗空树，或者具有如下性质的树： 1.若它的左子树不为空。则左子树上所有节点的值都小于根节点的值 2.若它的右子树不为空，则右子树上的所有节点的值都大于根节点的值 3.它的左右子树也分别为二叉搜索树 1.基本操作 1. 阅读全文

posted @ 2018-07-26 10:08 醉月风纯阅读(72) 评论(0) 推荐(0) 编辑

特征选择之FeatureSelector工具

摘要：项目地址：https://github.com/WillKoehrsen/feature selector 特征选择（feature selection）是查找和选择数据集中最有用特征的过程，是机器学习流程中的一大关键步骤。不必要的特征会降低训练速度、降低模型可解释性，并且最重要的是还会降低其在测试阅读全文

posted @ 2018-07-09 19:54 醉月风纯阅读(1934) 评论(0) 推荐(0) 编辑

算法模板

摘要： 1 给定字符串，要求把前面的若干个字符移到字符串的尾部使用三段法，先反转前面字符，再反转后面字符，最后全部反转即可。 public class convert { public static void main(String[] args) { String st = "abcdef"; st = 阅读全文

posted @ 2018-07-08 19:13 醉月风纯阅读(151) 评论(0) 推荐(0) 编辑

贝叶斯优化一

摘要：训练一个模型时大家都需要面对一个问题：参数优化。通常，我们做参数优化时都会先导出一个cost function，然后通过调整参数值来最大化或最小化这个cost function。这个过程听起来很简单，但真的做起来是个剧恶心的体力活！比方说你要用梯度方法做优化，得求一阶导二阶导吧，求得半死不活之后还阅读全文

posted @ 2018-07-04 21:37 醉月风纯阅读(747) 评论(0) 推荐(0) 编辑

评分函数

摘要：通常学习器在训练集上的误差称为“训练误差”或“经验误差”，在新样本上的误差称之为“泛化误差”。显然，我们想得到泛化误差小的学习器。然而我们事先不知道新样本是什么，实际上能做的是努力使经验误差最小化。在很多情况下我们可以学习到一个经验误差很小的，在训练集上表现很好的学习器，但这是不是我们想要的学习器呢阅读全文

posted @ 2018-07-04 12:26 醉月风纯阅读(272) 评论(0) 推荐(0) 编辑

导航

2018年8月1日

2018年7月28日

2018年7月27日

2018年7月26日

2018年7月9日

2018年7月8日

2018年7月4日