06 2019 档案

摘要:作业要求来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3363 大数据分析: 1.将爬虫大作业产生的csv文件上传到HDFS 2.对CSV文件进行预处理生成无标题文本文件 3.把hdfs中的文本文件最终导入到数据仓库Hive中 阅读全文
posted @ 2019-06-20 21:54 刘铖 阅读(234) 评论(0) 推荐(0)
摘要:1. 在HDFS中为hadoop用户创建一个用户目录(hadoop用户 2. 在用户目录下创建一个input目录 3. 在HDFS的根目录下创建一个名称为input的目录 4. 删除HDFS根目录中的“input”目录 二.文件操作 1. 使用vim编辑器,在本地Linux文件系统的“/home/h 阅读全文
posted @ 2019-06-04 20:36 刘铖 阅读(224) 评论(0) 推荐(0)