摘要:
项目的数据分析过程在hadoop集群上实现,主要应用hive数据仓库工具,因此,采集并经过预处理后的数据,需 要加载到hive数据仓库中,以进行后续的挖掘分析。 ETL:用来描述将数据从来源端经过抽取(extract)、交互转换(transform)、加载(load)至目的端的过程 6.1创建原始数 阅读全文
posted @ 2018-07-19 10:41
QueryMarsBo
阅读(305)
评论(0)
推荐(0)
摘要:
注:采用星型模型 5.1 事实表 原始数据表:t_origin_weblog valid string 是否有效 remote_addr string 访客ip remote_user string 访客用户信息 time_local string 请求时间 request string 请求url 阅读全文
posted @ 2018-07-19 08:54
QueryMarsBo
阅读(599)
评论(0)
推荐(0)

浙公网安备 33010602011771号