Hadoop综合大作业
摘要:
1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)词频统计。 先用python将文本当中的不合法词汇剔除,然后另存为newnote.txt 然后hive一系列猛操作,出现结果如下图。(过程不贴了,毕竟跟上次差不多) 2.用Hive对爬虫大作业产生的csv文件进行数据分析, 阅读全文
posted @ 2018-05-16 20:42
163-王晓峰
阅读(297)
评论(0)
推荐(0)