摘要:
pandas 22 数据去重处理 数据去重可以使用duplicated()和drop_duplicates()两个方法。 DataFrame.duplicated(subset = None,keep =‘first’ )返回boolean Series表示重复行 参数: subset:列标签或标签 阅读全文
posted @ 2019-07-26 20:59
道理我都懂Zz
阅读(4023)
评论(0)
推荐(0)
摘要:
pandas 21 Series和Dataframe的画图方法 前言 在pandas中,无论是series还是dataframe都内置了.plot()方法,可以结合plt.show()进行很方便的画图。 Series.plot() 和 Dataframe.plot()参数 data : Series 阅读全文
posted @ 2019-07-26 20:57
道理我都懂Zz
阅读(4838)
评论(0)
推荐(1)
摘要:
pandas 20 DataFrame()的基本操作 感觉上pandas的DataFrame就像numpy中的矩阵,不过它拥有列名和索引名,实际操作起来会更方便一些。 如: df = pd.read_clipboard() df.columns df.Ratings 阅读全文
posted @ 2019-07-26 20:54
道理我都懂Zz
阅读(392)
评论(0)
推荐(0)
摘要:
pandas 19 DataFrame读取写入文件的方法 DataFrame有非常丰富的IO方法,比如DataFrame读写csv文件excel文件等等,操作很简单。下面在代码中标记出来一些常用的读写操作方法,需要的时候查询一下该方法就可以了。 df1.to_csv(‘df1.csv’) 默认会把 阅读全文
posted @ 2019-07-26 20:52
道理我都懂Zz
阅读(1793)
评论(0)
推荐(0)
摘要:
pandas 18 reindex用法 pandas中的reindex方法可以为series和dataframe添加或者删除索引。 方法:serise.reindex()、dataframe.reindex() 如果新添加的索引没有对应的值,则默认为nan。如果减少索引,就相当于一个切片操作。 阅读全文
posted @ 2019-07-26 20:52
道理我都懂Zz
阅读(1132)
评论(0)
推荐(0)
摘要:
pandas 17 关于nan的处理 在pandas中有个另类的存在就是nan,解释是:not a number,不是一个数字,但是它的类型确是一个float类型。numpy中也存在关于nan的方法,如:np.nan 对于pandas中nan的处理,简单的说有以下几个方法。 查看是否是nan, s1 阅读全文
posted @ 2019-07-26 20:51
道理我都懂Zz
阅读(698)
评论(0)
推荐(0)
摘要:
pandas 16 pd.merge()的用法 使用过sql语言的话,一定对join,left join, right join等非常熟悉,在pandas中,merge的作用也非常类似。 如:pd.merge(df1, df2) 找到一个外键,然后将两条数据合并成一条。 直接上例子: 阅读全文
posted @ 2019-07-26 20:50
道理我都懂Zz
阅读(2453)
评论(0)
推荐(0)
摘要:
pandas 15 df['one_col'].apply()方法的用法 apply有点像map的用法,可以传入一个函数。 如:df[‘A’].apply(str.upper) 阅读全文
posted @ 2019-07-26 20:48
道理我都懂Zz
阅读(414)
评论(0)
推荐(0)
摘要:
pandas 14 concatenate和combine_first的用法 concatenate主要作用是拼接series和dataframe的数据。 combine_first可以做来填充数据。 其中numpy和panads中都有concatenate()方法,如:np.concatenate 阅读全文
posted @ 2019-07-26 20:47
道理我都懂Zz
阅读(1026)
评论(0)
推荐(0)
摘要:
pandas 13 时间序列操作方法pd.date_range() 在pandas中拥有强大的时间序列操作方法。 使用 pd.date_range() 生成 ‘pandas.core.indexes.datetimes.DatetimeIndex’ 对象。 直接上demo: 阅读全文
posted @ 2019-07-26 20:46
道理我都懂Zz
阅读(2711)
评论(0)
推荐(0)
摘要:
pandas 12 数学计算操作df.sum()、df.min()、df.max()、df.decribe() 常用的数学计算无非就是加减,最大值最小值,方差等等,pandas已经内置了很多方法来解决这些问题。如:df.sum()、df.min()、df.max()、df.decribe()等。 阅读全文
posted @ 2019-07-26 20:44
道理我都懂Zz
阅读(2952)
评论(0)
推荐(0)
摘要:
pandas 11 TypeError: ufunc 'isnan' not supported for the input types, and the inputs could not be safely错误解决方法 将一个list矩阵转化为numpy数组之后,使用np.isnan()方法,报出 阅读全文
posted @ 2019-07-26 20:43
道理我都懂Zz
阅读(9911)
评论(0)
推荐(0)
摘要:
pandas 10 pd.pivot_table()透视表功能 和excel一样,pandas也有一个透视表的功能,具体demo如下: 阅读全文
posted @ 2019-07-26 20:42
道理我都懂Zz
阅读(416)
评论(0)
推荐(0)
摘要:
pandas 09 pd.groupby()的用法 在pandas中的groupby和在sql语句中的groupby有异曲同工之妙,不过也难怪,毕竟关系数据库中的存放数据的结构也是一张大表罢了,与dataframe的形式相似。 阅读全文
posted @ 2019-07-26 20:40
道理我都懂Zz
阅读(1323)
评论(0)
推荐(0)
摘要:
pandas 08 pd.cut()的功能和作用 pd.cut()的作用,有点类似给成绩设定优良中差,比如:0 59分为差,60 70分为中,71 80分为优秀等等,在pandas中,也提供了这样一个方法来处理这些事儿。直接上代码: python import numpy as np import 阅读全文
posted @ 2019-07-26 20:39
道理我都懂Zz
阅读(1701)
评论(0)
推荐(0)
摘要:
pandas 07 DataFrame修改index、columns名的方法 一般常用的有两个方法: 1、使用DataFrame.index = [newName],DataFrame.columns = [newName],这两种方法可以轻松实现。 2、使用rename方法(推荐): DataFr 阅读全文
posted @ 2019-07-26 20:35
道理我都懂Zz
阅读(11852)
评论(0)
推荐(0)
摘要:
pandas 06 Series和Dataframe的排序操作 对pandas中的Series和Dataframe进行排序,主要使用sort_values()和sort_index()。 DataFrame.sort_values(by, axis=0, ascending=True, inplac 阅读全文
posted @ 2019-07-26 20:34
道理我都懂Zz
阅读(2696)
评论(0)
推荐(1)
摘要:
pandas 05 map和replace操作 map可以做一个映射,对于操作大型的dataframe来说就非常方便了,而且也不容易出错。replace的作用是替换,这个很好理解。 map可以做一个映射,对于操作大型的dataframe来说就非常方便了,而且也不容易出错。replace的作用是替换, 阅读全文
posted @ 2019-07-26 20:33
道理我都懂Zz
阅读(1024)
评论(0)
推荐(0)
摘要:
pandas 04 多级index操作 在pandas中可以为series和dataframe设置多个index,也就是说可以有多级index和column。这样可以对pandas的操作更加灵活。 阅读全文
posted @ 2019-07-26 20:32
道理我都懂Zz
阅读(1434)
评论(0)
推荐(0)
摘要:
pandas 03 DataFrame()中的iloc和loc用法 简单的说: iloc,即index locate 用index索引进行定位,所以参数是整型,如:df.iloc[10:20, 3:5] loc,则可以使用column名和index名进行定位,如: df.loc[‘image1’:‘ 阅读全文
posted @ 2019-07-26 20:30
道理我都懂Zz
阅读(3449)
评论(0)
推荐(0)

浙公网安备 33010602011771号