随笔分类 -  Pandas

摘要:今天在使用dropna函时候,感觉有点混乱,不明白为什么为何下面两个代码,how和参数选择all和选择any都是同样的结果。当时想的是 对A列进行删除,如果A列全部是Na那么选择All才会生效。 实际原理如下: 1:axis=0为按照行删除, axis=1为按照列删除。 2:如果不设置subset参 阅读全文
posted @ 2024-06-14 19:45 脱离低级趣味 阅读(197) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2023-11-28 14:11 脱离低级趣味 阅读(14) 评论(0) 推荐(0)
摘要:意思是: 在0.12版本中, pandas分组之后内部会按照组进行排序,取.head()即可看到, 但是0.13之后不再有排序,而是按照本来的顺序进行排序的。所以在0.13之后如果要取分组之后的前N行数据,就必须要先分组之后用apply函数之后才会讲组排序,然后取.head(N)才能取到想要的数据。 阅读全文
posted @ 2021-11-20 22:13 脱离低级趣味 阅读(227) 评论(0) 推荐(0)
摘要:原始数据如下: (图是从 excel 截的,最左1行不是数据,是 excel 自带的行号,为了方便说明截进来的) 除去首行是标题外,有效数据为 28行 x 4列 目前的需求是根据 partition 分组,然后取每组的前 2 行,如果不考虑排序,代码如下:(把head()里面的数字改成 n 就可以取 阅读全文
posted @ 2021-11-20 21:02 脱离低级趣味 阅读(1740) 评论(0) 推荐(0)
摘要:需求:Pandas一个需求:存在一个列表,需要在一个DataFrame中取到以该列表为索引的数据 这里有一个坑, In [103]: s = pd.Series([1, 2, 3]) In [104]: s Out[104]: 0 1 1 2 2 3 dtype: int64当loc[]中的列表包含 阅读全文
posted @ 2021-05-24 08:39 脱离低级趣味 阅读(404) 评论(0) 推荐(0)
摘要:在日常的数据处理中,经常会对一个DataFrame进行逐行、逐列和逐元素的操作,对应这些操作,Pandas中的map、apply和applymap可以解决绝大部分这样的数据处理需求。这篇文章就以案例附带图解的方式,为大家详细介绍一下这三个方法的实现原理,相信读完本文后,不论是小白还是Pandas的进 阅读全文
posted @ 2021-04-28 18:47 脱离低级趣味 阅读(145) 评论(0) 推荐(0)
摘要:pandas.read_csv 1.filepath_or_buffer:设置需要访问的文件的有效路径. 2.sep:str, default ','. 指定读取文件的分隔符.支持自定义分隔符. 3.delimiter:str, default None 定界符.备选分隔符(如果指定该参数,则sep 阅读全文
posted @ 2021-03-26 20:39 脱离低级趣味 阅读(220) 评论(0) 推荐(0)
摘要:如代码所示,判断如果城市名中含有ing字段且年份为2016,则新列test值赋为1,否则为0. import numpy as np import pandas as pd data = {'city': ['Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen' 阅读全文
posted @ 2020-12-10 16:07 脱离低级趣味 阅读(1716) 评论(0) 推荐(0)
摘要:group by: 当groupby接收一个函数为参数的时候,默认会将改DataFrame的索引值作为参数传递到改函数内部,然后函数得到的结果为分组键进行分组: 该分组即根据名字的长度来进行分组。其中len函数为python内置函数,也可以自己构造函数。 dropna DataFrame.dropn 阅读全文
posted @ 2020-04-26 15:00 脱离低级趣味 阅读(481) 评论(0) 推荐(0)
摘要:读取excel:Pandas库read_excel()参数详解 pandas.read_excel(io,sheet_name = 0,header = 0,names = None,index_col = None,usecols = None,squeeze = False,dtype = No 阅读全文
posted @ 2019-12-06 15:03 脱离低级趣味 阅读(4626) 评论(0) 推荐(0)