pandas - .shape[0] 返回匹配条件的行数

# df = pd.read_excel(r"D:\PyCharm\年度数据处理\1月设备离线01.xlsx", sheet_name='Sheet1')
# 将日期列转换成 pandas 的 datetime 类型
# df['解除时间'] = pd.to_datetime(df['解除时间'])
# # 统计固定日期出现的次数
# target_date = pd.to_datetime('2025-01-01').strftime('%Y-%m-%d')
# counts = df[df['解除时间'] == target_date].shape[0]

这段代码的目的是读取一个Excel文件中的数据，并对日期列进行处理，统计特定日期出现的次数。

首先，通过 pd.read_excel() 方法读取Excel文件。r"D:\PyCharm\年度数据处理\1月设备离线01.xlsx" 是文件的路径，sheet_name='Sheet1' 指定要读取的工作表。

接下来，使用 pd.to_datetime() 方法将"解除时间"列转换为pandas的datetime类型，以便后续的日期比较和处理。

然后，通过 pd.to_datetime('2025-01-01').strftime('%Y-%m-%d') 将目标日期转换为字符串格式，并赋值给 target_date 变量。

最后，通过 df[df['解除时间'] == target_date].shape[0] 统计"解除时间"列中等于目标日期的行数。.shape[0] 返回匹配条件的行数，因此 counts 变量将保存特定日期出现的次数。

这段代码的功能是读取Excel文件中的数据，并统计特定日期在"解除时间"列中出现的次数。

.shape[0] 是一个属性，用于获取DataFrame或数组的行数。在这段代码中，df[df['解除时间'] == target_date] 是一个用于筛选出"解除时间"列等于目标日期的子数据框。接着，.shape[0] 返回该子数据框的行数，也就是满足条件的行数，即特定日期出现的次数。

所以，counts 变量将保存特定日期在"解除时间"列中出现的次数。

posted @ 2024-02-01 16:39 徐俊112 阅读(224) 评论(0) 收藏举报

刷新页面返回顶部

xujunhui

pandas - .shape[0] 返回匹配条件的行数

公告