夜的独白

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理
上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 20 下一页

2021年7月7日

摘要: 一、CDA简介 CDA(Certified Data Analyst),亦称“CDA数据分析师 ”,指在互联网、零售、金融、电信、医学、旅游等行业专门从事数据的采集、清洗、处理、分析并能制作业务报告、提供决策的新型数据分析人才。CDA秉承着总结凝练最先进的商业数据分析实践为使命,明晰各类数据分析从业 阅读全文
posted @ 2021-07-07 10:31 夜的独白 阅读(366) 评论(0) 推荐(0)

摘要: google play store app数据源 提取码: 38jk google play store的app数据分析 1. 加载数据 加载数据分析使用的库 加载数据前,先用文本编辑器简单浏览一下数据 加载好数据之后,第一步先分别使用shape、head、count、describe和info方法 阅读全文
posted @ 2021-07-07 10:18 夜的独白 阅读(636) 评论(0) 推荐(0)

摘要: 数据源地址:http://pan.baidu.com/s/1cKsrKi 1.准备数据源 打开 上牌数--商用车销量数据样例.xlsx,另存为car.txt文件,打开car.txt,设置编码格式为UTF-8,保存并上传至master节点。 2.创建car 数据库,建立car表,并上传数据 creat 阅读全文
posted @ 2021-07-07 10:17 夜的独白 阅读(806) 评论(0) 推荐(0)

摘要: ![](https://imgconvert.csdnimg.cn/aHR0cHM6Ly9tbWJpei5xcGljLmNuL21tYml6X3BuZy9hNENBY3JTUWw5ZmliUG1xbWZ6YTl1OW5WdHZzZTFCYWg0amsxS3o5Q2FwdXJzMGNtdmQ2MlBh 阅读全文
posted @ 2021-07-07 10:15 夜的独白 阅读(1444) 评论(0) 推荐(0)

摘要: PUBG数据集分析报告 数据集分为两个部分 数据集1: agg数据: 15 字段 date: 时间 game_size:队伍数量 match_id:比赛 match_mode: 对局模式(第一人称还是第三人称) party_size:组队模式(单人赛、双人赛、四人赛) player_assists: 阅读全文
posted @ 2021-07-07 10:14 夜的独白 阅读(789) 评论(0) 推荐(0)

摘要: 数据来自kaggle上tmdb5000电影数据集,本次数据分析主要包括电影数据可视化和简单的电影推荐模型,如: 1.电影类型分配及其随时间的变化 2.利润、评分、受欢迎程度直接的关系 3.哪些导演的电影卖座或较好 4.最勤劳的演职人员 5.电影关键字分析 6.电影相似性推荐 数据分析 import 阅读全文
posted @ 2021-07-07 10:12 夜的独白 阅读(682) 评论(0) 推荐(0)

摘要: ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习 ,不错过 Datawhale干货 作者:陈锴,中山大学,Datawhale成员 最近有很多读者留言,希望能有一个完整的数据分析项目练手,这几天收集了组织成员们的推荐。其中泰坦尼克号生存预测作为最经典的启蒙数据分析项目,对于初学者来说 阅读全文
posted @ 2021-07-07 10:09 夜的独白 阅读(842) 评论(0) 推荐(0)

摘要: 本文是针对kaggle上的数据集TMDB 5000 Movie Dataset进行数据分析。 数据集在以下链接就可下载 https://www.kaggle.com/tmdb/tmdb-movie-metadata ![](https://img- blog.csdn.net/20180716161 阅读全文
posted @ 2021-07-07 10:07 夜的独白 阅读(812) 评论(0) 推荐(0)

摘要: 安装环境:Cent os 7 软件:Anaconda3-4.4.0-Linux-x86_64.sh 汉化文件:messages.mo 1.首先需要在linux下安装Anaconda, 直接在anaconda软件目录下使用 bash Anaconda3-4.4.0-Linux-x86_64.sh 安装 阅读全文
posted @ 2021-07-07 10:04 夜的独白 阅读(443) 评论(0) 推荐(0)

摘要: MapReduce之气象数据分析 问题描述 通过获取的气象数据来分析气温最大值 样例输入 数据集地址: 天气数据集 样例输出 表示1901年最大温度为239,可能是他们使用的温度单位和咱们不一样吧 mapper阶段任务 map阶段主要是对文本进行切割,提取时间和温度形成 <时间,<温度,,温度,温度 阅读全文
posted @ 2021-07-07 10:03 夜的独白 阅读(511) 评论(0) 推荐(0)

上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 20 下一页