摘要:
sort -k1 -n 第一列按数字正排序 sort -K1 -rn 第一列按数字倒排序 阅读全文
posted @ 2018-04-13 20:58
bioamin
阅读(273)
评论(0)
推荐(0)
摘要:
a.txt、b.txt文件如下: a.txt 1 hadoop 3 hadoop 5 hadoop 7 hadoop 9 hadoop 11 hadoop 13 hadoop 15 hadoop 17 hadoop 19 hadoop 21 hadoop 23 hadoop 25 hadoop 27 阅读全文
posted @ 2018-04-13 20:54
bioamin
阅读(2280)
评论(0)
推荐(0)
摘要:
二次排序 在Hadoop中,默认情况下是按照key进行排序,如果要按照value进行排序怎么办?即:对于同一个key,reduce函数接收到的value list是按照value排序的。这种应用需求在join操作中很常见,比如,希望相同的key中,小表对应的value排在前面。有两种方法进行二次排序 阅读全文
posted @ 2018-04-13 18:27
bioamin
阅读(1070)
评论(0)
推荐(0)
摘要:
然后保存退出 source ~/.bashrc 或者关机重新启动即可 阅读全文
posted @ 2018-04-13 16:40
bioamin
阅读(567)
评论(0)
推荐(0)
摘要:
压缩 tar cvzf w.tar.gz xxx1 xxx2 对应解压:tar xvzf w.tar.gz 阅读全文
posted @ 2018-04-13 16:11
bioamin
阅读(218)
评论(0)
推荐(0)
摘要:
cat file | grep -c 'xxx' 统计xxx在file中出现的行数 cat file | grep -o 'xxx' 统计xxx在file中出现的次数 阅读全文
posted @ 2018-04-13 16:05
bioamin
阅读(3929)
评论(0)
推荐(0)

浙公网安备 33010602011771号