pandas - .shape[0] 返回匹配条件的行数

# df = pd.read_excel(r"D:\PyCharm\年度数据处理\1月设备离线01.xlsx", sheet_name='Sheet1')
# 将日期列转换成 pandas 的 datetime 类型
# df['解除时间'] = pd.to_datetime(df['解除时间'])
# # 统计固定日期出现的次数
# target_date = pd.to_datetime('2025-01-01').strftime('%Y-%m-%d')
# counts = df[df['解除时间'] == target_date].shape[0]
这段代码的目的是读取一个Excel文件中的数据,并对日期列进行处理,统计特定日期出现的次数。

首先,通过 pd.read_excel() 方法读取Excel文件。r"D:\PyCharm\年度数据处理\1月设备离线01.xlsx" 是文件的路径,sheet_name='Sheet1' 指定要读取的工作表。

接下来,使用 pd.to_datetime() 方法将"解除时间"列转换为pandas的datetime类型,以便后续的日期比较和处理。

然后,通过 pd.to_datetime('2025-01-01').strftime('%Y-%m-%d') 将目标日期转换为字符串格式,并赋值给 target_date 变量。

最后,通过 df[df['解除时间'] == target_date].shape[0] 统计"解除时间"列中等于目标日期的行数。.shape[0] 返回匹配条件的行数,因此 counts 变量将保存特定日期出现的次数。

这段代码的功能是读取Excel文件中的数据,并统计特定日期在"解除时间"列中出现的次数。
.shape[0] 是一个属性,用于获取DataFrame或数组的行数。在这段代码中,df[df['解除时间'] == target_date] 是一个用于筛选出"解除时间"列等于目标日期的子数据框。接着,.shape[0] 返回该子数据框的行数,也就是满足条件的行数,即特定日期出现的次数。

所以,counts 变量将保存特定日期在"解除时间"列中出现的次数。

 

posted @ 2024-02-01 16:39  徐俊112  阅读(211)  评论(0)    收藏  举报