随笔分类 - python&数据分析
摘要:对一个表格类数据集进行数据分析,常常有以下几个步骤: 1.数据总览 读取数据集并了解数据集大小,原始特征维度 查看特征的数据类型和基本统计量 2.缺失值和唯一值 查看数据缺失情况 查看唯一值特征情况 3.深入数据 类别型数据 数值型数据(离散型、连续型) 4.数据间相关关系 特征与特征之间 特征与目
阅读全文
摘要:seaborn是建立matplotlib基础上,便于处理pandas数据结构的可视化库。 import pandas as pd pd.plotting.register_matplotlib_converters() import matplotlib.pyplot as plt %matplot
阅读全文