摘要: 十道海量大数据处理面试题 1、海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映 射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个小文... 阅读全文
posted @ 2014-08-22 15:04 快乐就好 阅读(1038) 评论(0) 推荐(0)
摘要: 在现货黄金市场,一天24小时的交易时间,买卖投资的机会多得是,但为什么还是有人亏钱甚至爆仓了呢?最重要的是投资者不会控制风险。在黄金市场,控制风险是很重要的,能做到将风险控制最低,你才能在黄金市场生存下去。黄金长久以来一直是一种投资工具。它的投资价值高,并且是一种独立的资源,不受限于任何国家或贸易市... 阅读全文
posted @ 2014-08-22 15:01 快乐就好 阅读(371) 评论(0) 推荐(0)
摘要: Trie树也称字典树,因为其效率很高,所以在在字符串查找、前缀匹配等中应用很广泛,其高效率是以空间为代价的。一.Trie树的原理 利用串构建一个字典树,这个字典树保存了串的公共前缀信息,因此可以降低查询操作的复杂度。 下面以英文单词构建的字典树为例,这棵Trie树中每个结点包括26个孩子结点,因为总... 阅读全文
posted @ 2014-08-22 10:12 快乐就好 阅读(236) 评论(0) 推荐(0)