06 2021 档案

摘要:1.选择使用什么数据,有哪些字段,多大数据量。 选用美国新冠数据集,变量有日期(date),县(county), 国家、州(state),确诊情况(cases),死亡人数(deaths),共158981条数据。 2.准备分析哪些问题?(8个以上) (1) 统计美国截止每日的累计确诊人数和累计死亡人数 阅读全文
posted @ 2021-06-18 14:35 Fk020306 阅读(48) 评论(0) 推荐(0)
摘要:spark连接mysql数据库 1.安装启动检查Mysql服务。netstat -tunlp (3306) 2.spark 连接mysql驱动程序。–cp /usr/local/hive/lib/mysql-connector-java-5.1.40-bin.jar /usr/local/spark 阅读全文
posted @ 2021-06-02 19:44 Fk020306 阅读(107) 评论(0) 推荐(0)