随笔分类 - 数据分析
利用R语言、python进行数据清洗、数据标准化、可视化。
摘要:library(ggplot2) #fortify() library(dplyr) #full_join() windowsFonts(font1=windowsFont('Book Antiqua'), font2=windowsFont('Cambria'), font3=windowsFon
阅读全文
摘要:import pandas as pd import numpy as np from sklearn import linear_model import matplotlib.pyplot as plt import time vacc = pd.read_excel(r'C:\Users\..
阅读全文
摘要:import pandas as pd import os os.chdir("C:/Users/.../Desktop/googleTrends/美国/") file_chdir = os.getcwd() filecsv_list = [] for root,dirs,files in os.w
阅读全文
摘要:把以前在swirl课程学的基础数据清洗操作重新整理一遍,主要包括: dplyr包中的select、filter、arrange、mutate、group_by、summarize函数,以及%>% 管道操算符(pip operation),“then”的意思。 tidyr包中的gather、seper
阅读全文
摘要:问题:如何在一张图上面绘制多组散点图和折线图?例如在下面的评分数据中,每轮数据绘制散点图,平均值绘制折线图。 数据(excel):营业厅评分数据 做法:R语言ggplot函数 library(readxl) library(ggplot2) data<-read_excel("C:\\...\\数据
阅读全文