摘要: EX1 1.使用正则表达式提取出所需信息: df1提取模型的状态,精度和模型名称 df2提取模型训练时间 import pandas as pd df=pd.read_table(r'C:\Users\lxh\Downloads/benchmark.txt', header=None) pat1=' 阅读全文
posted @ 2021-01-13 22:27 爱睡觉的皮卡丘 阅读(49) 评论(1) 推荐(0) 编辑
摘要: 一、时间戳 1. Timestamp的构造和属性 由pd.Timestamp实现,可以通过year, month, day, hour, min, second 可以获取具体的数值: ts = pd.Timestamp('2020-1-1 08:10:30') ts Out[6]: Timestam 阅读全文
posted @ 2021-01-10 14:15 爱睡觉的皮卡丘 阅读(54) 评论(0) 推荐(0) 编辑
摘要: 一、Cat对象 cat对象的属性 使用astype将普通序列转换为分类变量,例如: s = pd.Series(['man','woman','child','man','child']) s = s.astype('category') s Out[49]: 0 man 1 woman 2 chi 阅读全文
posted @ 2021-01-07 23:42 爱睡觉的皮卡丘 阅读(53) 评论(0) 推荐(0) 编辑
摘要: 一、str对象 pandas的str对象将字符串序列化,可以通过[]取出某个位置的元素。 例如,返回的是每个位置的元素,如果缺失返回Nan: import pandas as pd s = pd.Series(['abcd', 'efg', 'hi']) s.str[0] Out[10]: 0 a 阅读全文
posted @ 2021-01-06 23:16 爱睡觉的皮卡丘 阅读(44) 评论(0) 推荐(0) 编辑
摘要: 一、缺失值的统计和删除 统计 使用isna函数,返回值为每个位置是否缺失的逻辑变量。 查看某一列缺失的行,可以根据isna的返回值进行索引,例如: df[df.Height.isna()].head() 如果要查看多个列的情况,可以使用any和all。 例如,isna+all查看三个列同时缺失: s 阅读全文
posted @ 2021-01-02 23:08 爱睡觉的皮卡丘 阅读(29) 评论(0) 推荐(0) 编辑
摘要: EX1. 数据预处理: 将df2的日期格式转换为年份表示: df2['日期'] = df2['日期'].apply(lambda x:x.split('/')[0]) 将df1的证券代码提取出: df1['证券代码'] = df1['证券代码'].apply(lambda x:int(x[1:-1] 阅读全文
posted @ 2021-01-01 23:49 爱睡觉的皮卡丘 阅读(60) 评论(0) 推荐(0) 编辑
摘要: 一、关系连接 键连接 ​ 在 pandas 中的关系型连接函数 merge 和 join 中提供了 how 参数来代表连接形式,分为左连接 left 、右连接 right 、内连接 inner 、外连接 outer 。现有如下两个表格,下面基于这两个表格展示左右连接,内外连接的形式。 df1 = p 阅读全文
posted @ 2020-12-29 19:10 爱睡觉的皮卡丘 阅读(24) 评论(0) 推荐(0) 编辑
摘要: 一、长宽表变形 pivot 将长表变换为宽表,输入有三个参数: index:变形后的行索引 columns:需要转换到列索引的列 values:列和行索引对应的值 例如,先生成一个表: df = pd.DataFrame({'Class':[1,1,2,2], 'Name':['San Zhang' 阅读全文
posted @ 2020-12-27 20:48 爱睡觉的皮卡丘 阅读(69) 评论(0) 推荐(0) 编辑
摘要: 一、分组Groupby 使用方式:df.groupby([分组的依据])[分组的数据] 例如,对不同学校和性别的学生身高分组: df.groupby(['School', 'Gender'])['Height'] **练一练:**请根据上下四分位数分割,将体重分为high、normal、low三组, 阅读全文
posted @ 2020-12-25 23:23 爱睡觉的皮卡丘 阅读(116) 评论(0) 推荐(0) 编辑
摘要: 一、层序遍历 1.使用队列实现 输入根节点,使用队列来遍历。先进的节点会先出去,出去时将自己的子节点放到队列中。 def level(root): if not root: return None queue=[root] res=[] while queue: node = queue.pop(0 阅读全文
posted @ 2020-12-23 22:44 爱睡觉的皮卡丘 阅读(216) 评论(0) 推荐(0) 编辑