Pandas - 随笔分类 - 里斯斯里

如何用pandas求时间序列中每一年中特定要求的月份？

摘要：这里记录一个思路：假设有一个dataframe，索引为时间（格式为年-月—日时:分:秒），要求每一年中符合特定要求（如气温最热）的时间。就是需要先按照年份进行分组，再求组中的对应值。思路一将时间索引中的年份单独提出来当成一列，再使用groupby()和apply()方法来求对应值。这是实阅读全文

posted @ 2021-03-26 15:17 里斯斯里阅读(584) 评论(0) 推荐(0)

使用pandas计算“夏季通风室外计算相对湿度”？

摘要：目标要求：根据气温和相对湿度来计算夏季通风室外计算相对湿度。思路定义根据《民用建筑供暖通风与空气调节设计规范GB50736-2012》其中的“4.1.9 夏季通风室外计算相对湿度，应采用历年最热月14时的月平均相对湿度的平均值。” 计算过程需要先计算温度，找出各年温度最高所对应的月份，再求阅读全文

posted @ 2021-03-11 14:53 里斯斯里阅读(458) 评论(0) 推荐(0)

dataframe中如何筛选包含特定字符串（单个字符串、字符串列表）的列？

摘要：问题描述 dataframe的某一列均为字符串格式，想筛选出含有特定字符串的行，具体实现代码如下： df[df['地址'].str.contains('北京') 这样就可以筛选出‘地址’这一列中含有‘北京’所对应的行了。问题升级但如果需要筛选不止一个地名，比如包含‘北京’、‘天津’、‘上海’.. 阅读全文

posted @ 2021-02-09 13:31 里斯斯里阅读(2739) 评论(0) 推荐(0)

如何去除xlsx中读取的字符串末尾字符“_x0000_”

摘要：问题描述从excel文件（xlsx）中使用pandas读取，最终导出一个字符串列表，元素包含一系列的_x0000_，如何去除？代码如下： import pandas as pd df = pd.read_excel('地名.xlsx') a = df.iloc[:,0].values.tolis 阅读全文

posted @ 2021-02-09 13:19 里斯斯里阅读(675) 评论(0) 推荐(0)

有空值的两个series（字符串类型）如何拼接？

摘要：使用pandas在处理excel数据的时候碰到一个问题：需要将dataframe中两列字符串进行合并拼接，其中两列中的部分值都存在缺测值的情况，这样相加就会因为其中一个为缺测值导致最终结果变为缺测值。实例代码如下： import pandas as pd import numpy as np S 阅读全文

posted @ 2021-02-07 23:11 里斯斯里阅读(559) 评论(0) 推荐(0)

笔记 | pandas之时间序列学习随笔1

摘要：自己准备学习python的数据分析，开个随笔，记录自己的学习过程。有输入，也有输出。 1. 时间序列自动生成 ts = pd.Series(np.arange(1, 901), index=pd.date_range('2010-1-1', periods=900)) 最终生成了从2010-01- 阅读全文

posted @ 2021-01-25 19:05 里斯斯里阅读(128) 评论(0) 推荐(0)

随笔分类 - Pandas