摘要: 大型数据库技术大作业 作业内容: 1、学习构建北京市政百姓信件分析实战案例,完成 (1) 采集北京市政百姓信件内容; (2) 编写 MapReduce 程序清洗信件内容数据; (3) 利用 HiveSql 语句离线分析信件内容数据; (4) 利用 Sqoop 导出 Hive 分析数据到 MySQL 阅读全文
posted @ 2024-02-08 23:17 秃头的小白 阅读(24) 评论(0) 推荐(0)
摘要: 三、实验内容和要求 1.安装 Flume Flume 是 Cloudera 提供的一个分布式、可靠、可用的系统,它能够将不同数据源的海量 日志数据进行高效收集、聚合、移动,最后存储到一个中心化数据存储系统中。Flume 的 核心是把数据从数据源收集过来,再送到目的地。请到 Flume 官网下载 Fl 阅读全文
posted @ 2024-02-08 00:01 秃头的小白 阅读(15) 评论(0) 推荐(0)