摘要: (一)熟悉常用的Linux操作 请按要求上机实践如下linux基本命令。 cd命令:切换目录 (1)切换到目录 /usr/local (2)去到目前的上层目录 (3)回到自己的主文件夹 ls命令:查看文件与目录 (4)查看目录/usr下所有的文件 mkdir命令:新建新目录 (5)进入/tmp目录, 阅读全文
posted @ 2021-12-22 07:59 张嘉林 阅读(67) 评论(0) 推荐(0) 编辑
摘要: 一.安装Hive 下载解压重命名权限 2. 配置环境变量 $HIVE_HOME 3. 修改Hive配置文件 gedit 4.配置mysql驱动 a.下载合适版本的mysql jar包,拷贝到/usr/local/hive/lib目录下 ls b.在mysql新建hive数据库 show databa 阅读全文
posted @ 2021-12-17 14:22 张嘉林 阅读(35) 评论(0) 推荐(0) 编辑
摘要: 在Ubuntu中实现运行。 准备txt文件 编写py文件 python3运行py文件分析txt文件。 ①txt文件 ②py文件 ③python3运行py文件 2.用MapReduce实现词频统计 2.1编写Map函数 编写mapper.py 授予可运行权限 本地测试mapper.py ①编写mapp 阅读全文
posted @ 2021-11-26 16:07 张嘉林 阅读(36) 评论(0) 推荐(0) 编辑
摘要: 7. 8. 表相关信息 mysql 阅读全文
posted @ 2021-11-06 13:30 张嘉林 阅读(17) 评论(0) 推荐(0) 编辑
摘要: 1.下载压缩文件 2.解压 3.修改文件夹名 4.修改文件夹权限 5.配置环境变量 6.伪分布式配置文件 7.启动HDFS,启动Hbase 8.关闭hbase 阅读全文
posted @ 2021-11-02 15:15 张嘉林 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 写操作: 运行: 读操作: 运行: 阅读全文
posted @ 2021-11-01 20:52 张嘉林 阅读(20) 评论(0) 推荐(0) 编辑
摘要: 1.用图与自己的话,简要描述Hadoop起源与发展阶段。 从与谷歌系统的关系,关键时间节点,1.x,2.x与3.x的区别,不同公司发行版本等方面来讲。 (1)Hadoop最早起源于lucene下的Nutch。Nutch的设计目标是构建一个大型的全网搜索引擎,包括网页抓取、索引、查询等功能,但随着抓取 阅读全文
posted @ 2021-10-22 14:40 张嘉林 阅读(108) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2021-09-28 14:24 张嘉林 阅读(16) 评论(0) 推荐(0) 编辑
摘要: 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. (二)熟悉使用MySQL shell操作 26.显示库:show databases; 27.进入到库:use 库名; 阅读全文
posted @ 2021-09-25 22:24 张嘉林 阅读(45) 评论(0) 推荐(0) 编辑
摘要: 3.简述大数据、云计算、物联网、区块链和人工智能的概念和相互关系。 首先,大数据是物联网和云计算发展到一定阶段的必然结果,物联网为大数据提供了大部分的数据来源,而云计算则为大数据提供了支撑平台。大数据又是人工智能的重要基础,人工智能需要通过大数据完成学习和决策的过程。从整个智能系统的体系结构来看,物 阅读全文
posted @ 2021-09-10 15:26 张嘉林 阅读(29) 评论(0) 推荐(0) 编辑