2021年12月10日

第九次作业

摘要: 一.安装Hive 下载解压重命名权限 配置环境变量 $HIVE_HOME 修改Hive配置文件 gedit 配置mysql驱动 下载合适版本的mysql jar包,拷贝到/usr/local/hive/lib目录下 ls 在mysql新建hive数据库 show databases; 配置mysql 阅读全文

posted @ 2021-12-10 08:33 探路者0639 阅读(48) 评论(0) 推荐(0) 编辑

2021年11月23日

第八次作业

摘要: # coding=gb2312 import sys import string if len(sys.argv) == 1 or sys.argv[1] in {"-h", "--help"}: print("usage: uniqueword filename_1 filename_2 ... 阅读全文

posted @ 2021-11-23 08:44 探路者0639 阅读(14) 评论(0) 推荐(0) 编辑

2021年11月5日

第七次作业

摘要: 1.理解HBase表模型及四维坐标:行键、列族、列限定符和时间戳。 已经理解了 2.启动HDFS,启动HBase,进入HBaseShell命令行。 3.列出HBase中所有的表信息list 4.创建表create 5.查看表详情desc 6.插入数据put 7.查看表数据scan 关闭 8.多版本实 阅读全文

posted @ 2021-11-05 09:12 探路者0639 阅读(23) 评论(1) 推荐(0) 编辑

2021年11月2日

第六次作业

摘要: 1.下载压缩文件 2.解压 3.修改文件夹名 4.修改文件夹权限 5.配置环境变量 6.伪分布式配置文件 7.启动HDFS,启动Hbase 8.进入shell界面 9.停止Hbase,停止HDFS运行 阅读全文

posted @ 2021-11-02 09:38 探路者0639 阅读(27) 评论(0) 推荐(0) 编辑

2021年11月1日

第五次作业

摘要: 一、在Ubuntu系统中安装和配置Eclipse 二、利用hadoop 的java api,向HDFS写一个文件。 三、从HDFS读取一个文件的内容。 阅读全文

posted @ 2021-11-01 16:33 探路者0639 阅读(12) 评论(0) 推荐(0) 编辑

2021年10月26日

第四次作业

摘要: Hadoop之父Doug Cutting Hadoop最早起源于lucene下的Nutch。Nutch的设计目标是构建一个大型的全网搜索引擎,包括网页抓取、索引、查询等功能,但随着抓取网页数量的增加,遇到了严重的可扩展性问题——如何解决数十亿网页的存储和索引问题。2003年、2004年谷歌发表的三篇 阅读全文

posted @ 2021-10-26 08:25 探路者0639 阅读(40) 评论(0) 推荐(0) 编辑

2021年9月24日

第三次作业

摘要: (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) (13) (14) (15) (16) (17) (18) (19) (20) (21) (22) (23) (24) (25) (26) (27) (28) (29) (30) (31) (32) 阅读全文

posted @ 2021-09-24 11:08 探路者0639 阅读(41) 评论(0) 推荐(0) 编辑

2021年9月17日

第二次作业

摘要: 阅读全文

posted @ 2021-09-17 12:45 探路者0639 阅读(14) 评论(0) 推荐(0) 编辑

2021年9月10日

第一次作业

摘要: (1)为什么产生大数据技术? 1)对大量消费者提供产品或服务的企业可以利用大数据进行精准营销 2) 做小而美模式的中小微企业可以利用大数据做服务转型 3) 面临互联网压力之下必须转型的传统企业需要与时俱进充分利用大数据的价值 (2)为什么要学习大数据技术? 首先,学习大数据的原因就是大数据分析的采用 阅读全文

posted @ 2021-09-10 08:56 探路者0639 阅读(60) 评论(0) 推荐(0) 编辑

导航