随笔分类 -  Pandas

如何用pandas求时间序列中每一年中特定要求的月份?
摘要:这里记录一个思路: 假设有一个dataframe,索引为时间(格式为年-月—日 时:分:秒),要求每一年中符合特定要求(如气温最热)的时间。 就是需要先按照年份进行分组,再求组中的对应值。 思路一 将时间索引中的年份单独提出来当成一列,再使用groupby()和apply()方法来求对应值。 这是实 阅读全文

posted @ 2021-03-26 15:17 里斯斯里 阅读(584) 评论(0) 推荐(0)

使用pandas计算“夏季通风室外计算相对湿度”?
摘要:目标 要求:根据气温和相对湿度来计算夏季通风室外计算相对湿度。 思路 定义 根据《民用建筑供暖通风与空气调节设计规范GB50736-2012》其中的“4.1.9 夏季通风室外计算相对湿度,应采用历年最热月14时的月平均相对湿度的平均值。” 计算过程 需要先计算温度,找出各年温度最高所对应的月份,再求 阅读全文

posted @ 2021-03-11 14:53 里斯斯里 阅读(458) 评论(0) 推荐(0)

dataframe中如何筛选包含特定字符串(单个字符串、字符串列表)的列?
摘要:问题描述 dataframe的某一列均为字符串格式,想筛选出含有特定字符串的行,具体实现代码如下: df[df['地址'].str.contains('北京') 这样就可以筛选出‘地址’这一列中含有‘北京’所对应的行了。 问题升级 但如果需要筛选不止一个地名,比如包含‘北京’、‘天津’、‘上海’.. 阅读全文

posted @ 2021-02-09 13:31 里斯斯里 阅读(2739) 评论(0) 推荐(0)

如何去除xlsx中读取的字符串末尾字符“_x0000_”
摘要:问题描述 从excel文件(xlsx)中使用pandas读取,最终导出一个字符串列表,元素包含一系列的_x0000_,如何去除? 代码如下: import pandas as pd df = pd.read_excel('地名.xlsx') a = df.iloc[:,0].values.tolis 阅读全文

posted @ 2021-02-09 13:19 里斯斯里 阅读(675) 评论(0) 推荐(0)

有空值的两个series(字符串类型)如何拼接?
摘要:使用pandas在处理excel数据的时候碰到一个问题: 需要将dataframe中两列字符串进行合并拼接,其中两列中的部分值都存在缺测值的情况,这样相加就会因为其中一个为缺测值导致最终结果变为缺测值。 实例代码如下: import pandas as pd import numpy as np S 阅读全文

posted @ 2021-02-07 23:11 里斯斯里 阅读(559) 评论(0) 推荐(0)

笔记 | pandas之时间序列学习随笔1
摘要:自己准备学习python的数据分析,开个随笔,记录自己的学习过程。 有输入,也有输出。 1. 时间序列自动生成 ts = pd.Series(np.arange(1, 901), index=pd.date_range('2010-1-1', periods=900)) 最终生成了从2010-01- 阅读全文

posted @ 2021-01-25 19:05 里斯斯里 阅读(128) 评论(0) 推荐(0)

导航