随笔分类 -  jiuzhang bigdata

摘要:1单节点上的topK 数据结构:HashMap, PriorityQueue 步骤:(1)数据预处理:遍历整个数据集,hash表记录词频 (2)构建最小堆:最小堆只存k个数据. 时间复杂度:O(n +n*lgk) = O(nlgk) 空间复杂度:O(|n|+k) (|n| = number of u 阅读全文
posted @ 2016-11-07 11:02 coldyan 阅读(99) 评论(0) 推荐(0)