摘要: 现有两个4G大小、按行分割、每行为50字符(大小写字母)的text文件A, B, 现在需要在有限的内存下(如2G)以B文件为基准,计算出B相对于A增加了哪些数据和减少了哪些数据,分别以added.txt和deleted.txt命名保存。要求不能使用Spark或Hadoop这样的大数据处理框架。 思路 阅读全文
posted @ 2019-03-09 20:53 司青 阅读(60) 评论(0) 推荐(0)