摘要: 今天按照上课的要求,把爬取的数据展示出来。 测试要求: 1、 数据清洗:按照进行数据清洗,并将清洗后的数据导入hive数据库中。 两阶段数据清洗: (1)第一阶段:把需要的信息从原始日志中提取出来 (2)第二阶段:根据提取出来的信息做精细化操作 (3)hive数据库表结构: create table 阅读全文
posted @ 2025-02-19 19:57 kuku睡 阅读(9) 评论(0) 推荐(0)