随笔分类 -  Python函数

dropna()函数
摘要:参数: axis: default 0指行,1为列 how: {‘any’, ‘all’}, default ‘any’指带缺失值的所有行;'all’指清除全是缺失值的 thresh: int,保留含有int个非空值的行 subset: 对特定的列进行缺失值删除处理 inplace: 这个很常见,T 阅读全文

posted @ 2019-06-17 12:58 吃我一枪 阅读(7909) 评论(0) 推荐(2)

value_counts()函数
摘要:value_counts函数用于统计dataframe或series中不同数或字符串出现的次数 ascending=True时,按升序排列. normalize=True时,可计算出不同字符出现的频率,画柱状图统计时可以用到. a b 0 3 2 1 4 4 2 5 5 3 6 6 4 2 5 5 阅读全文

posted @ 2019-06-14 13:27 吃我一枪 阅读(10126) 评论(0) 推荐(0)

stack() unstack()函数
摘要:总结: 1.stack: 将数据的列索引转换为行索引(列索引可以简单理解为列名) 2.unstack:将数据的行索引转换为列索引 3.stack和unstack默认操作为最内层,可以用level参数指定操作层. 4.stack和unstack默认旋转轴的级别将会成果结果中的最低级别(最内层) 5.s 阅读全文

posted @ 2019-06-13 18:38 吃我一枪 阅读(4758) 评论(0) 推荐(0)

loc() iloc() at() iat()函数
摘要:1 四个函数都是用于dataframe的定位 []用于直接定位. loc()函数是用真实索引,iloc()函数是用索引序号. loc()函数切片是左闭右闭,iloc()函数切片是左闭右开. at(),iat()的关系同上. import pandas as pd import numpy as np 阅读全文

posted @ 2019-06-13 12:34 吃我一枪 阅读(1039) 评论(0) 推荐(0)

unique()与nunique()
摘要:1 unique() 统计list中的不同值时,返回的是array.它有三个参数,可分别统计不同的量,返回的都是array. 当list中的元素也是list时,尽量不要用这种方法. import numpy as np a = [1,5,4,2,3,3,5] # 返回一个array print(np 阅读全文

posted @ 2019-06-12 13:26 吃我一枪 阅读(6237) 评论(0) 推荐(0)

set_index()与reset_index()函数
摘要:一 set_index()函数 1 主要是理解drop和append参数,注意与reset_index()参数的不同. import pandas as pd df = pd.DataFrame({'a': range(4), 'b': range(4, 0, -1), 'c': ['one', ' 阅读全文

posted @ 2019-06-10 14:19 吃我一枪 阅读(7636) 评论(0) 推荐(0)

drop_duplicates()函数
摘要:1dataframe删除某一列的重复元素,默认只留下第一次出现的 inplace参数设置为true时直接在原数据上修改,为False时,生成副本. 注意所有函数中inplace一旦设置为True,此时后面不能再跟任何函数,因为它整体已经是None.想要再跟函数只能再写一行. 且此时在前面也不能赋值, 阅读全文

posted @ 2019-06-07 21:48 吃我一枪 阅读(8289) 评论(0) 推荐(0)

astype()函数
摘要:1astype()函数可用于转化dateframe某一列的数据类型 如下将dateframe某列的str类型转为int,注意astype()没有replace=True的用法,想要在原数据上修改,要写成如下形式。 注意只有当该列的字符串全是由纯数字构成时才可以这样写,如果混有字母,会报错:Value 阅读全文

posted @ 2019-06-07 21:20 吃我一枪 阅读(38733) 评论(0) 推荐(1)

sort_values()和sort_index()函数
摘要:sort_values() 1 可用于对dateframe的多列同时进行排序 True是升序,False是降序,默认是升序 https://blog.csdn.net/m0_37637511/article/details/79901071 sort_index() 1用于对索引列排序,有两个参数, 阅读全文

posted @ 2019-06-06 21:27 吃我一枪 阅读(4698) 评论(0) 推荐(0)

zip()函数
摘要:zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的列表。 https://www.runoob.com/python/python-func-zip.html 阅读全文

posted @ 2019-05-14 19:19 吃我一枪 阅读(121) 评论(0) 推荐(0)

unique()函数
摘要:unique()函数可输出列表,元组和series中的不同元素。 且只能输出dataframe的某一列series中的不同元素,不能同时输出。 返回的都是一个ndarry,但不能输出ndarry中的不同元素,即对ndarry无效。 参考: https://blog.csdn.net/yangyuwe 阅读全文

posted @ 2019-05-14 13:03 吃我一枪 阅读(1406) 评论(0) 推荐(0)

sorted()与sort()函数
摘要:一 sorted()函数 有三个参数: 第一个是iterable,必选,待排序的集合,可以是list,tuple,set,dict等 第二个是reverse,可选,默认为False按升序排列,True按降序排列 第三个是key,可选,这是一个函数,返回一个key,可以看做是排序的标准,注意这里的ke 阅读全文

posted @ 2019-05-14 12:29 吃我一枪 阅读(330) 评论(0) 推荐(0)

truncate()函数
摘要:1 truncate()方法用于截断文件,如果指定了可选参数 size,则表示截断文件为 size 个字符,截断之后 size 后面的所有字符被删除。 参考: https://www.runoob.com/python/file-truncate.html 2 可以筛选时间 先要将日期用to_dat 阅读全文

posted @ 2019-05-11 12:32 吃我一枪 阅读(5535) 评论(0) 推荐(0)

fillna()函数
摘要:method: pad/ffill:用前一个非缺失值去填充该缺失值,用左边的非缺失值去填充该缺失值 backfill/bfill:用下一个非缺失值填充该缺失值,用右边的非缺失值去填充该缺失值 None:指定一个值去替换缺失值(默认这种方式) limit参数:限制填充个数 axis参数:修改填充方向, 阅读全文

posted @ 2019-05-08 13:11 吃我一枪 阅读(2597) 评论(0) 推荐(0)

shift()函数
摘要:用于对dataframe中的数整体上移或下移, 当为正数时,向下移。 当为负数时,向上移。 缺少的会填充NaN 参考: https://blog.csdn.net/kizgel/article/details/78333833 阅读全文

posted @ 2019-05-08 12:45 吃我一枪 阅读(2007) 评论(0) 推荐(0)

tail()函数
摘要:与head()函数类似,默认是取dataframe中的最后五行。 函数源码: 在pycharm中按Ctrl用鼠标点击函数名即可找到 在用groupby()函数时,可用tail()函数选择融合的行 当tail()的参数为1时,此时实际上没有融合,直接是选择的要groupby的最后一行 阅读全文

posted @ 2019-05-07 19:51 吃我一枪 阅读(1065) 评论(0) 推荐(0)

merge()函数
摘要:1 用于融合的函数 https://blog.csdn.net/brucewong0516/article/details/82707492 pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_i 阅读全文

posted @ 2019-04-22 18:39 吃我一枪 阅读(5562) 评论(0) 推荐(0)

导航