摘要: 一、用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)词频统计。 1、启动hadoop 2、hdfs上创建文件夹并查看 3、上传英文词频统计文本至hdfs 4、启动hive 5、创建novel原始文档表 6、导入文件内容到表novel并查看 7、用HQL进行词频统计,结果放在 阅读全文
posted @ 2018-05-25 13:10 142黄浩峰 阅读(106) 评论(0) 推荐(0) 编辑