随笔分类 -  数据分析

摘要:数据预处理 # 代码12-1 评论去重的代码 import pandas as pd import re #正则匹配 import jieba.posseg as psg import numpy as np # 去重,去除完全重复的数据 reviews = pd.read_csv("D:/人工智能 阅读全文
posted @ 2023-04-03 16:14 Binnie 阅读(78) 评论(0) 推荐(0)
摘要:连接数据库 # 代码11-1 import os import pandas as pd # 修改工作路径到指定文件夹 os.chdir("D:/人工智能&软件工程/数据挖掘与分析/tmp") # 第一种连接方式 from sqlalchemy import create_engine engine 阅读全文
posted @ 2023-04-03 00:45 Binnie 阅读(338) 评论(0) 推荐(0)
摘要:显示数据 import pandas as pd import numpy as np data = pd.read_excel('D:/人工智能&软件工程/数据挖掘与分析/data/original_data.xls') data[u'发生时间'] = pd.to_datetime(data[u' 阅读全文
posted @ 2023-03-27 20:43 Binnie 阅读(140) 评论(0) 推荐(0)
摘要:查看数据特征 import numpy as np import pandas as pd inputfile = 'D:/人工智能&软件工程/数据挖掘与分析/data/GoodsOrder.csv' # 输入的数据文件 data = pd.read_csv(inputfile,encoding = 阅读全文
posted @ 2023-03-19 23:37 Binnie 阅读(142) 评论(0) 推荐(0)
摘要:对数据进行基本的探索 #对数据进行基本的探索 #返回缺失值个数以及最大最小值 import pandas as pd datafile = 'D:/人工智能&软件工程/数据挖掘与分析/data/air_data.csv'#读取数据 resultfile = 'D:/人工智能&软件工程/数据挖掘与分析 阅读全文
posted @ 2023-03-12 21:49 Binnie 阅读(155) 评论(0) 推荐(0)
摘要:描述性统计分析 # 代码6-1 import numpy as np import pandas as pd inputfile = 'D:/人工智能&软件工程/数据挖掘与分析/data/data.csv' # 输入的数据文件 data = pd.read_csv(inputfile) # 读取数据 阅读全文
posted @ 2023-03-04 00:18 Binnie 阅读(59) 评论(0) 推荐(0)
摘要:分析数据,将数据可视化 import pandas as pd catering_sale = 'D:/人工智能&软件工程/数据挖掘与分析/data/catering_sale.xls' # 餐饮数据 data = pd.read_excel(catering_sale, index_col = u 阅读全文
posted @ 2023-02-26 19:54 Binnie 阅读(175) 评论(0) 推荐(0)