摘要: 1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。 启动Hive 上传到hdfs 传到数据库 存到word_count表 查询结果 2.用Hive对爬虫大作业产生的csv文件进行数据分析,写一篇博客描述你的分析过程和分析结果。 爬虫大作业产生CSV文件一览图 阅读全文
posted @ 2018-05-25 17:24 183区展伯 阅读(135) 评论(0) 推荐(0) 编辑