摘要: 记录一个问题: 有一个10G大小的文件,文件内为一行一个的整数,给定可使用内存为2G.要求统计出现次数最多的数字。 1、流式数据处理(这块后面单独写吧,埋坑....) 2、分文件处理 读入部分文件,对数值模10.取值相同放入一个文件。然后处理10个文件。统计出现次数最多的。 我认为上面这种方案可以解 阅读全文
posted @ 2019-06-09 08:37 stone531 阅读(365) 评论(0) 推荐(0)