摘要:
1.概念了解 在hadoop中默认的排序算法中,只会针对key值进行排序。当key值相同时,需要对value进行排序。 简单来说,就是在数据文件中,如果按照第一列升序排序,当第一列相同时,第二列按照升序排序。 2.应用实例 输入样例 输出样例 3.算法思想 本样例使用了自定义的类MyGrouptes 阅读全文
posted @ 2018-01-30 19:20
M_study
阅读(403)
评论(0)
推荐(0)
摘要:
倒排索引 1.了解概念 "倒排索引"是文档检索系统中最常用的数据结构,被广泛地应用于全文搜索引擎。它主要是用来存储某个单词(或词组)在一个文档或一组文档中的存储位置的映射,即提供了一种根据内容来查找文档的方式。由于不是根据文档来确定文档所包含的内容,而是进行相反的操作,因而称为倒排索引(Invert 阅读全文
posted @ 2018-01-30 18:33
M_study
阅读(427)
评论(0)
推荐(0)

浙公网安备 33010602011771号