python | pandas.DataFrame 基础用法1

📌 关于“是否自动去掉第一行”?

  • pd.read_excel(file_path) 默认会把 Excel 文件的第一行当作列名(header)
  • 所以:第一行数据会被当作列标题,不会作为数据行参与统计

✅ 举例说明:

假设你的 Excel 内容如下(A1 单元格开始):

Material Thickness
Steel 5.0
Steel 6.0
Aluminum 3.0

那么 pd.read_excel() 读进来后,data 的内容是:

   Material  Thickness
0     Steel        5.0
1     Steel        6.0
2  Aluminum        3.0

→ 第一行("Material", "Thickness")变成了列名,不是数据

如果你的 Excel 第一行就是数据,没有表头,你应该这样读:

data = pd.read_excel(file_path, header=None)

这样第一行就会被当作数据行(列名会变成 0, 1, 2...)。


`data['列名'].value_counts()

  • data.value_counts()(适用于整个 DataFrame 或 Series,统计行的组合频次
  • 或者对某一列使用:data['列名'].value_counts()(统计该列各个值的出现次数)

正确写法示例:

# 统计某列(比如 'Grade')中每个值的出现次数
print(data['Grade'].value_counts())

# 或者统计所有行的唯一组合及其频次(较少用)
print(data.value_counts())

✅ 总结

  • 如果你确实想统计整个文件有多少数据行(不包括表头),可以用:
    print(len(data))  # 数据行数
    
  • 如果你想知道整个 DataFrame 中所有单元格的非空值总数:
    print(data.count().sum())
    
posted @ 2025-11-18 14:42  山风拂水弦  阅读(3)  评论(0)    收藏  举报