python | pandas.DataFrame 基础用法1
📌 关于“是否自动去掉第一行”?
pd.read_excel(file_path)默认会把 Excel 文件的第一行当作列名(header)。- 所以:第一行数据会被当作列标题,不会作为数据行参与统计。
✅ 举例说明:
假设你的 Excel 内容如下(A1 单元格开始):
| Material | Thickness |
|---|---|
| Steel | 5.0 |
| Steel | 6.0 |
| Aluminum | 3.0 |
那么 pd.read_excel() 读进来后,data 的内容是:
Material Thickness
0 Steel 5.0
1 Steel 6.0
2 Aluminum 3.0
→ 第一行("Material", "Thickness")变成了列名,不是数据。
如果你的 Excel 第一行就是数据,没有表头,你应该这样读:
data = pd.read_excel(file_path, header=None)
这样第一行就会被当作数据行(列名会变成 0, 1, 2...)。
`data['列名'].value_counts()
data.value_counts()(适用于整个 DataFrame 或 Series,统计行的组合频次)- 或者对某一列使用:
data['列名'].value_counts()(统计该列各个值的出现次数)
正确写法示例:
# 统计某列(比如 'Grade')中每个值的出现次数
print(data['Grade'].value_counts())
# 或者统计所有行的唯一组合及其频次(较少用)
print(data.value_counts())
✅ 总结
- 如果你确实想统计整个文件有多少数据行(不包括表头),可以用:
print(len(data)) # 数据行数 - 如果你想知道整个 DataFrame 中所有单元格的非空值总数:
print(data.count().sum())
浙公网安备 33010602011771号