Hadoop综合大作业
1.准备本次数据分析的数据(以下为爬虫大作业获取的CSV文件)

2.(1)将CSV文件上传到hdfs上

(2)查看文件中前10条信息,即可证明是否上传成功。

3.预处理文件,将CSV文件生成txt文件
(1)先删除第一行字段

(2)将文本文件上传的hdfs上并查看

5.启动hdfs并启动MySQL服务

6.创建数据库:

7.创建player表b

8.查看前十条数据

9.分析数据
9.1查看nba中的法国籍球员(select * from b where country='France';)

9.2查看nba中的加拿大球员(select * from b where country='Canada';)

虽然今年nba冠军猛龙队位置在多伦多,但是看一看本土加拿大nba球员好少哦..
9.3查看nba球员身高超过2米的人数有134人(select count(*) from b where height > 2;)

9.4查看在nba打球超过15年的球员数量(select count(*) from b where experience > 15;)

9.5查看在nba打球超过15年的球员都有谁

9.6查看号码是15的多少个

9.7查看2018年选秀有谁

9.8 查看湖人队球员有谁

浙公网安备 33010602011771号