摘要: 要求: 1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。 网上下载经典长篇英文小说The Great Gatsby,保存到wc文件中,命名为xhp.txt。 启动hadoop集群 将wc文件夹的xhp.txt上传文件至hdfs的data文件夹 启动hive 阅读全文
posted @ 2018-05-24 15:36 商软3许怀鹏222 阅读(174) 评论(0) 推荐(0)