数据清洗:按照进行数据清洗,并将清洗后的数据导入hive数据库中。
摘要:
虚拟机: hadoop:3.2.0 hive:3.1.2 win10: eclipse 两阶段数据清洗: (1)第一阶段:把需要的信息从原始日志中提取出来 ip: 199.30.25.88 time: 10/Nov/2016:00:01:03 +0800 traffic: 62 文章: articl 阅读全文
posted @ 2019-11-13 21:37
哈萨K
阅读(1898)
评论(0)
推荐(0)