随笔分类 -  hadoop

摘要:需求: 编写MapReduce程序算出高峰时间段(如9 10点)哪张表被访问的最频繁的表,以及这段时间访问这张表最多的用户,以及这个用户访问这张表的总时间开销。 测试数据: TableName(表名),Time(时间),User(用户),TimeSpan(时间开销) t003 6:00 u002 1 阅读全文
posted @ 2018-02-02 19:30 总被人想的静静 阅读(526) 评论(0) 推荐(0)
摘要:centos7与之前的版本都不一样,修改主机名在/ect/hostname 和/ect/hosts 这两个文件控制 首先修改/ect/hostname vi /ect/hostname 打开之后的内容是: localhost.localdomain 把它修改成你想要的名字就可以,比如: niukou 阅读全文
posted @ 2018-02-02 19:26 总被人想的静静 阅读(1320) 评论(0) 推荐(0)
摘要:需求:每个文件中各个单词的出现次数并倒叙排列输出所有文件中出现的数量最多的单词测试文件:随意在网上找几篇文章即可 这里给出三分文件: news1: don’t know what I do now is right, those are wrong, a... 阅读全文
posted @ 2017-07-25 20:45 总被人想的静静 阅读(224) 评论(0) 推荐(0)
摘要:1.测试文件 A:B,C,D,F,E,O B:A,C,E,K C:F,A,D,I D:A,E,F,L E:B,C,D,M,L F:A,B,C,D,E,O,M G:A,C,D,E,F H:A,C,D,E,O I:A,O J:B,O ... 阅读全文
posted @ 2017-07-20 19:39 总被人想的静静 阅读(169) 评论(0) 推荐(0)