随笔分类 - 数据分析
摘要:数据预处理 # 代码12-1 评论去重的代码 import pandas as pd import re #正则匹配 import jieba.posseg as psg import numpy as np # 去重,去除完全重复的数据 reviews = pd.read_csv("D:/人工智能
阅读全文
摘要:连接数据库 # 代码11-1 import os import pandas as pd # 修改工作路径到指定文件夹 os.chdir("D:/人工智能&软件工程/数据挖掘与分析/tmp") # 第一种连接方式 from sqlalchemy import create_engine engine
阅读全文
摘要:显示数据 import pandas as pd import numpy as np data = pd.read_excel('D:/人工智能&软件工程/数据挖掘与分析/data/original_data.xls') data[u'发生时间'] = pd.to_datetime(data[u'
阅读全文
摘要:查看数据特征 import numpy as np import pandas as pd inputfile = 'D:/人工智能&软件工程/数据挖掘与分析/data/GoodsOrder.csv' # 输入的数据文件 data = pd.read_csv(inputfile,encoding =
阅读全文
摘要:对数据进行基本的探索 #对数据进行基本的探索 #返回缺失值个数以及最大最小值 import pandas as pd datafile = 'D:/人工智能&软件工程/数据挖掘与分析/data/air_data.csv'#读取数据 resultfile = 'D:/人工智能&软件工程/数据挖掘与分析
阅读全文
摘要:描述性统计分析 # 代码6-1 import numpy as np import pandas as pd inputfile = 'D:/人工智能&软件工程/数据挖掘与分析/data/data.csv' # 输入的数据文件 data = pd.read_csv(inputfile) # 读取数据
阅读全文
摘要:分析数据,将数据可视化 import pandas as pd catering_sale = 'D:/人工智能&软件工程/数据挖掘与分析/data/catering_sale.xls' # 餐饮数据 data = pd.read_excel(catering_sale, index_col = u
阅读全文
浙公网安备 33010602011771号