摘要:这里记录一个思路: 假设有一个dataframe,索引为时间(格式为年-月—日 时:分:秒),要求每一年中符合特定要求(如气温最热)的时间。 就是需要先按照年份进行分组,再求组中的对应值。 思路一 将时间索引中的年份单独提出来当成一列,再使用groupby()和apply()方法来求对应值。 这是实
阅读全文
摘要:目标 要求:根据气温和相对湿度来计算夏季通风室外计算相对湿度。 思路 定义 根据《民用建筑供暖通风与空气调节设计规范GB50736-2012》其中的“4.1.9 夏季通风室外计算相对湿度,应采用历年最热月14时的月平均相对湿度的平均值。” 计算过程 需要先计算温度,找出各年温度最高所对应的月份,再求
阅读全文
摘要:问题描述 dataframe的某一列均为字符串格式,想筛选出含有特定字符串的行,具体实现代码如下: df[df['地址'].str.contains('北京') 这样就可以筛选出‘地址’这一列中含有‘北京’所对应的行了。 问题升级 但如果需要筛选不止一个地名,比如包含‘北京’、‘天津’、‘上海’..
阅读全文
摘要:问题描述 从excel文件(xlsx)中使用pandas读取,最终导出一个字符串列表,元素包含一系列的_x0000_,如何去除? 代码如下: import pandas as pd df = pd.read_excel('地名.xlsx') a = df.iloc[:,0].values.tolis
阅读全文
摘要:使用pandas在处理excel数据的时候碰到一个问题: 需要将dataframe中两列字符串进行合并拼接,其中两列中的部分值都存在缺测值的情况,这样相加就会因为其中一个为缺测值导致最终结果变为缺测值。 实例代码如下: import pandas as pd import numpy as np S
阅读全文
摘要:自己准备学习python的数据分析,开个随笔,记录自己的学习过程。 有输入,也有输出。 1. 时间序列自动生成 ts = pd.Series(np.arange(1, 901), index=pd.date_range('2010-1-1', periods=900)) 最终生成了从2010-01-
阅读全文