2019年1月3日

Hadoop网站日志数据清洗——正则表达式实现

摘要: 周旭龙前辈的Hadoop学习笔记—网站日志分析项目案例简明、经典,业已成为高校大数据相关专业的实验项目。上周博主也完成了这个实验,不同于周前辈使用特殊符号切割字符串得到数据的做法,博主使用了正则表达式来匹配数据。在此将我的思路及代码张贴出来,以供后来者学习借鉴。 一、数据情况分析 1.1、数据格式概 阅读全文

posted @ 2019-01-03 20:45 Magic激流 阅读(2335) 评论(1) 推荐(0) 编辑

导航