随笔分类 -  hadoop

摘要:pagerank示例: 公式说明: S(Vi) :Vi的PR值 Vi :Vi页面 d :一个阻尼系数,(其实我也不太明白),一个作用就是避免起点页面的PR为零。统计结果表明,设置成0.85就行。(大约100多次迭代PR值就能收敛到一个稳定的值,而当阻尼系数接近1时,需要的迭代次数会陡然增加很多,且排 阅读全文
posted @ 2018-07-18 14:45 大树程序员 阅读(469) 评论(0) 推荐(0)
摘要:cloudera 源代码 https://github.com/cloudera 阅读全文
posted @ 2017-06-10 09:32 大树程序员 阅读(109) 评论(0) 推荐(0)
摘要:场景:总资源:18G内存,9vcore剩余资源:14G,5vcore4个running application 每个占用1G,1vcore5个accepted application 配置: Dynamic Resource Pool Configuration: 最小资源数:1vcore,512m 阅读全文
posted @ 2017-06-06 17:38 大树程序员 阅读(1347) 评论(0) 推荐(0)