随笔分类 -  数据分析

利用R语言、python进行数据清洗、数据标准化、可视化。
摘要:library(ggplot2) #fortify() library(dplyr) #full_join() windowsFonts(font1=windowsFont('Book Antiqua'), font2=windowsFont('Cambria'), font3=windowsFon 阅读全文
posted @ 2021-04-27 13:32 unuliha 阅读(816) 评论(0) 推荐(0)
摘要:import pandas as pd import numpy as np from sklearn import linear_model import matplotlib.pyplot as plt import time vacc = pd.read_excel(r'C:\Users\.. 阅读全文
posted @ 2021-03-31 16:12 unuliha 阅读(488) 评论(0) 推荐(0)
摘要:import pandas as pd import os os.chdir("C:/Users/.../Desktop/googleTrends/美国/") file_chdir = os.getcwd() filecsv_list = [] for root,dirs,files in os.w 阅读全文
posted @ 2021-03-23 21:00 unuliha 阅读(811) 评论(0) 推荐(0)
摘要:把以前在swirl课程学的基础数据清洗操作重新整理一遍,主要包括: dplyr包中的select、filter、arrange、mutate、group_by、summarize函数,以及%>% 管道操算符(pip operation),“then”的意思。 tidyr包中的gather、seper 阅读全文
posted @ 2019-08-04 13:08 unuliha 阅读(3599) 评论(0) 推荐(1)
摘要:问题:如何在一张图上面绘制多组散点图和折线图?例如在下面的评分数据中,每轮数据绘制散点图,平均值绘制折线图。 数据(excel):营业厅评分数据 做法:R语言ggplot函数 library(readxl) library(ggplot2) data<-read_excel("C:\\...\\数据 阅读全文
posted @ 2019-05-01 10:41 unuliha 阅读(31463) 评论(0) 推荐(0)