摘要:
最近要排序一个比较大的文件,大概5G左右。文件中每行由两部分组成:“id DocNo”。其中id是一个数字,DocNo是一个字符串。我需要把这个大文件按照DocNo进行排序(字典序)。 要把这个文件加入内存是不太可能的,所以必须把它分解为小文件,然后把小文件加入到内存中进行排序。然后再把小文件组合起来。这有点类似于归并排序,不过需要注意的是,这里的归并是对文件的归并。 分文件也有几种策略。第一种可... 阅读全文
posted @ 2010-08-28 10:45
小橋流水
阅读(222)
评论(0)
推荐(0)
浙公网安备 33010602011771号