import pandas as pd #导包并设置别名为pd
file_path = r'C:\Users\admin\BMW sales data.csv' #文件绝对路径
df= pd.read_csv(file_path) #读取文件
print(df.describe()) #查询各列基本信息:计数、均值、标准差等
print(df.info()) #查询表格信息,返回序号#、列名、非空值数量、字段类型
print(df.isnull().sum()) #查询每列空值数量并返回求和值
print(df.nunique()) #查询每列中唯一值数量
'''查询重复行并返回求和值,默认所有列值重复才记。可以使用df.duplicated(subset=['列名1', '列名2']).sum()修改重复数据判定'''
print(df.duplicated().sum())
print(df.columns) #查询并返回列名
print(df.head()) #查询前n行数据,n默认为5
print(df.tail()) #查询后n行数据,n默认为5
print(df.sample(n=5)) #查询随机n行数据,n默认为1
'''
sample参数:
n:要抽取的行数
frac:按比例抽取,如 frac=0.1 抽取10%的数据
replace:是否放回抽样,默认为False
random_state:随机种子,用于重现结果
weights:抽样权重
'''
``