python查询数据信息,分析前了解表格结构

import pandas as pd                                      #导包并设置别名为pd
file_path = r'C:\Users\admin\BMW sales data.csv'         #文件绝对路径
df= pd.read_csv(file_path)                               #读取文件
print(df.describe())                                     #查询各列基本信息:计数、均值、标准差等
print(df.info())                                         #查询表格信息,返回序号#、列名、非空值数量、字段类型
print(df.isnull().sum())                                 #查询每列空值数量并返回求和值
print(df.nunique())                                      #查询每列中唯一值数量

'''查询重复行并返回求和值,默认所有列值重复才记。可以使用df.duplicated(subset=['列名1', '列名2']).sum()修改重复数据判定'''
print(df.duplicated().sum())
print(df.columns)                                        #查询并返回列名
print(df.head())                                         #查询前n行数据,n默认为5
print(df.tail())                                         #查询后n行数据,n默认为5
print(df.sample(n=5))                                    #查询随机n行数据,n默认为1
'''
sample参数:
n:要抽取的行数
frac:按比例抽取,如 frac=0.1 抽取10%的数据
replace:是否放回抽样,默认为False
random_state:随机种子,用于重现结果
weights:抽样权重
'''
``
posted @ 2025-10-09 16:34  风向玩家  阅读(4)  评论(0)    收藏  举报