随笔分类 -  python&数据分析

摘要:对一个表格类数据集进行数据分析,常常有以下几个步骤: 1.数据总览 读取数据集并了解数据集大小,原始特征维度 查看特征的数据类型和基本统计量 2.缺失值和唯一值 查看数据缺失情况 查看唯一值特征情况 3.深入数据 类别型数据 数值型数据(离散型、连续型) 4.数据间相关关系 特征与特征之间 特征与目 阅读全文
posted @ 2022-01-27 09:12 May酱的blog 阅读(2490) 评论(0) 推荐(0)
摘要:seaborn是建立matplotlib基础上,便于处理pandas数据结构的可视化库。 import pandas as pd pd.plotting.register_matplotlib_converters() import matplotlib.pyplot as plt %matplot 阅读全文
posted @ 2022-01-25 16:45 May酱的blog 阅读(556) 评论(0) 推荐(0)