11 2019 档案

摘要:测试第二阶段--(留) (2)第二阶段:根据提取出来的信息做精细化操作 ip >城市 city(IP) date--> time:2016-11-10 00:01:03 day: 10 traffic:62 type:article/video id:11325 这一阶段跟上一阶段类似,只是做了细化 阅读全文
posted @ 2019-11-14 21:25 masuo 阅读(87) 评论(0) 推荐(0)
摘要:测试要求: 1、 数据清洗:按照进行数据清洗,并将清洗后的数据导入hive数据库中。 两阶段数据清洗: (1)第一阶段:把需要的信息从原始日志中提取出来 ip: 199.30.25.88 time: 10/Nov/2016:00:01:03 +0800 traffic: 62 文章: article 阅读全文
posted @ 2019-11-13 22:23 masuo 阅读(374) 评论(0) 推荐(0)