摘要: 1. 2. 3. 阅读全文
posted @ 2020-12-11 18:15 约翰克里斯朵夫 阅读(74) 评论(0) 推荐(0) 编辑
摘要: 一、hive用本地文件进行词频统计 1.准备本地txt文件 2.启动hadoop,启动hive 3.创建数据库,创建文本表 4.映射本地文件的数据到文本表中 5.hql语句进行词频统计交将结果保存到结果表中。 6.查看统计结果 二、hive用HDFS上的文件进行词频统计 1.准备电子书或其它大的文本 阅读全文
posted @ 2020-12-04 12:51 约翰克里斯朵夫 阅读(114) 评论(0) 推荐(0) 编辑
摘要: 1. 列出HBase所有的表的相关信息,例如表名; 在终端打印出指定的表的所有记录数据; 向已经创建好的表添加和删除指定的列族或列; 清空指定的表的所有记录数据; 统计表的行数。 2.关系型数据库中的表和数据(教材P92上),要求将其转换为适合于HBase存储的表并插入数据。 学生表 课程表 选课表 阅读全文
posted @ 2020-11-22 11:01 约翰克里斯朵夫 阅读(106) 评论(0) 推荐(0) 编辑
摘要: 1. 2. 3. 4. 5. 6. 阅读全文
posted @ 2020-11-12 12:28 约翰克里斯朵夫 阅读(83) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2020-10-24 18:45 约翰克里斯朵夫 阅读(62) 评论(0) 推荐(0) 编辑
摘要: 1. 2. 阅读全文
posted @ 2020-10-20 18:20 约翰克里斯朵夫 阅读(101) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2020-10-10 21:34 约翰克里斯朵夫 阅读(58) 评论(0) 推荐(0) 编辑
摘要: 1.对比Hadoop不同版本的特性: Apache Hadoop Apache Hadoop是apache提供的官方版本,以yarn框架的出现为标志分为Hadoop第一代和Hadoop第二代,第一代的Hadoop包含三个大版本:0.20.x 、0.21.x 、0.22.x,其中除了0.20.x(后来 阅读全文
posted @ 2020-09-18 11:09 约翰克里斯朵夫 阅读(117) 评论(0) 推荐(0) 编辑
摘要: 1.2019年微信的月活跃账户数为11.51亿。比去年同期增长6%。微信活跃高峰为午饭前和下班后。公众号打开高峰约为21点。 2.阿迪达斯的“黄金罗盘”: 阿迪达斯的库存问题很严重时,选择了与厦门育泰贸易有限公司合作,运用大数据进行分析,采取了一些“应急措施”。 在最初降价、打折等清库存的“应急措施 阅读全文
posted @ 2020-09-11 11:29 约翰克里斯朵夫 阅读(129) 评论(0) 推荐(0) 编辑