醉月风纯
一个即将参加校招的学渣

导航

 

2018年8月1日

摘要: Q1: 给出n个数,n 阅读全文
posted @ 2018-08-01 21:38 醉月风纯 阅读(61) 评论(0) 推荐(0) 编辑
 
摘要: 处理海量数据问题的方法大概有以下几种:   1 Bloom filter   2 BitMap   3 字典树   4 外排   5 分布式处理之Hadoop 本文接下来对这5种方法模式结合对应的海量 阅读全文
posted @ 2018-08-01 16:15 醉月风纯 阅读(146) 评论(0) 推荐(0) 编辑
 
摘要:     Tire树,即字典树,又称单词查找树或键树,是一种树型结构,是一种哈希树的变种。典型的应用是统计和排序大量的字符串(不仅限于字符串),所以经常被搜索引擎用于文本词频统计。它的优点是:最大限度地减少无畏的比较,查询效率比哈希表高。    阅读全文
posted @ 2018-08-01 12:02 醉月风纯 阅读(102) 评论(0) 推荐(0) 编辑
 

2018年7月28日

摘要: 1. "归并排序" 2. "快速排序" 阅读全文
posted @ 2018-07-28 01:05 醉月风纯 阅读(48) 评论(0) 推荐(0) 编辑
 

2018年7月27日

摘要: "0 1背包,完全背包,多重背包" 阅读全文
posted @ 2018-07-27 23:57 醉月风纯 阅读(61) 评论(0) 推荐(0) 编辑
 

2018年7月26日

摘要: 概念 二叉搜索树(Binary Search Tree),又称二叉排序树,它或者是一颗空树,或者具有如下性质的树: 1.若它的左子树不为空。则左子树上所有节点的值都小于根节点的值 2.若它的右子树不为空,则右子树上的所有节点的值都大于根节点的值 3.它的左右子树也分别为二叉搜索树 1.基本操作 1. 阅读全文
posted @ 2018-07-26 10:08 醉月风纯 阅读(56) 评论(0) 推荐(0) 编辑
 

2018年7月9日

摘要: 项目地址:https://github.com/WillKoehrsen/feature selector 特征选择(feature selection)是查找和选择数据集中最有用特征的过程,是机器学习流程中的一大关键步骤。不必要的特征会降低训练速度、降低模型可解释性,并且最重要的是还会降低其在测试 阅读全文
posted @ 2018-07-09 19:54 醉月风纯 阅读(1394) 评论(0) 推荐(0) 编辑
 

2018年7月8日

摘要: 1 给定字符串,要求把前面的若干个字符移到字符串的尾部 使用三段法,先反转前面字符,再反转后面字符,最后全部反转即可。 public class convert { public static void main(String[] args) { String st = "abcdef"; st = 阅读全文
posted @ 2018-07-08 19:13 醉月风纯 阅读(117) 评论(0) 推荐(0) 编辑
 

2018年7月4日

摘要: 训练一个模型时大家都需要面对一个问题:参数优化。通常,我们做参数优化时都会先导出一个cost function,然后通过调整参数值来最大化或最小化这个cost function。这个过程听起来很简单,但真的做起来是个剧恶心的体力活! 比方说你要用梯度方法做优化,得求一阶导二阶导吧,求得半死不活之后还 阅读全文
posted @ 2018-07-04 21:37 醉月风纯 阅读(574) 评论(0) 推荐(0) 编辑
 
摘要: 通常学习器在训练集上的误差称为“训练误差”或“经验误差”,在新样本上的误差称之为“泛化误差”。显然,我们想得到泛化误差小的学习器。然而我们事先不知道新样本是什么,实际上能做的是努力使经验误差最小化。在很多情况下我们可以学习到一个经验误差很小的,在训练集上表现很好的学习器,但这是不是我们想要的学习器呢 阅读全文
posted @ 2018-07-04 12:26 醉月风纯 阅读(184) 评论(0) 推荐(0) 编辑