摘要: Introduction to R programming, 吴明昊 https://www.youtube.com/watch?v=rPj5FsTRboE&t=3s 1. 基本介绍 2. 数据集,主要变量 3. Operators, control flow, user define functi 阅读全文
posted @ 2020-01-18 03:02 EpicDriver 阅读(202) 评论(0) 推荐(0)
摘要: 数据透视表 -刘伟教程 https://www.youtube.com/watch?v=db4ZwDPVEf0&index=5&list=PLg9Jp6NyfGgFZEDhIIAY7ESYHmtnLTbMr 0203 数据透视术语及结构 数据透视表创建 经典及最新界面切换 行标签,列表前,报表筛选, 阅读全文
posted @ 2020-01-18 02:55 EpicDriver 阅读(344) 评论(0) 推荐(0)
摘要: 快捷键 Excel的快捷键很多,以下主要是能提高效率。 Ctrl+方向键,对单元格光标快速移动,移动到数据边缘(空格位置)。 Ctrl+Shift+方向键,对单元格快读框选,选择到数据边缘(空格位置)。 Ctrl+空格键,选定整列。 Shift+空格键,选定整行。 Ctrl+A,选择整张表。 Alt 阅读全文
posted @ 2020-01-18 02:53 EpicDriver 阅读(288) 评论(0) 推荐(0)
摘要: 清洗处理类 主要是文本、格式以及脏数据的清洗和转换。很多数据并不是直接拿来就能用的,需要经过数据分析人员的清理。数据越多,这个步骤花费的时间越长。 Trim 清除掉字符串两边的空格。 MySQL有同名函数,Python有近似函数strip。 Concatenate =Concatenate(单元格1 阅读全文
posted @ 2020-01-18 02:52 EpicDriver 阅读(262) 评论(0) 推荐(0)
摘要: 开发环境:R STUDIO 数据样本:美国城市人口及2000-2013年的人口增长率 格式:txt 1. 首先,基于对数据的观察,提出的几个问题: 2013年,人口排在前五的城市是哪些? 2013年,人口增长率排在前五的城市是哪些? 2013年,人口负增长率排在前五的城市是哪些? 2000年,各个城 阅读全文
posted @ 2020-01-18 02:51 EpicDriver 阅读(465) 评论(0) 推荐(0)
摘要: In this report, I will use python to analyse the trend in movie market. Packages: Pandas, Numpy, Matplotlib, Seaborn, Json IDE: Pycharm Major question 阅读全文
posted @ 2020-01-18 02:48 EpicDriver 阅读(317) 评论(0) 推荐(0)
摘要: 环境: R 研究对象: 1. 二手房数据的区域特征 2. 二手房数据的面积特征 1. 导入原始数据 setwd("/Users/mac/Desktop/lianjia/") d = read.csv("/Users/mac/Desktop/lianjia/Lianjia.csv") 2. 数据清洗 阅读全文
posted @ 2020-01-04 06:30 EpicDriver 阅读(1612) 评论(0) 推荐(0)