pandas 排序和排名 —— sort_index、sort_values、rank

Series和DataFrame可以按照索引进行排序,也可以按照值来排序,对值也可以进行排名。

一,按照索引排序(sort by index)

对于一个Series或DataFrame,可以按照索引进行排序,使用sort_index()函数来实现索引的排序:

DataFrame.sort_index(axis=0, level=None, ascending=True, inplace=False, kind='quicksort', na_position='last', sort_remaining=True, ignore_index=False, key=None)

参数axis用于指定用于排序的轴,默认值是0(行),也可以设置为1(列)。

举个例子,有如下的序列:

obj = Series([1,2,3,4],index=['d','a','b','c'])
print(obj.sort_index())

 

对于一个DataFrame,列索引和行索引都是索引,既可以按照行索引排序,也可以按照列索引排序。

二,按照值排序 ( sort by values)

DataFrame 和Series也可以使用sort_values()函数对数据值进行排序:

DataFrame.sort_values(by, axis=0, ascending=True, inplace=False, kind='quicksort', na_position='last', ignore_index=False, key=None)

参数axis用于指定用于排序的轴,默认值是0(行),也可以设置为1(列)。如果axis=0,那么参数by用于指定某一个行索引的名称;如果axis=1,那么参数by用于指定某一个列名。

obj = Series([1,4,3,2],index=['d','a','b','c'])
print(obj.sort_values())

三,排名(rank)

排名是指为数据进行一个排名,排名的顺序从1开始,依次加1递增。

DataFrame.rank(axis=0, method='average', numeric_only=NoDefault.no_default, na_option='keep', ascending=True, pct=False)

举个例子,按照Number_legs对数据进行排序:

df = pd.DataFrame(data={'Animal': ['cat', 'penguin', 'dog',
                                   'spider', 'snake'],
                        'Number_legs': [4, 2, 4, 8, np.nan]})

df['default_rank'] = df['Number_legs'].rank(method='dense')

 

 

参考文档:

 

posted @ 2022-08-10 16:35  悦光阴  阅读(1468)  评论(0编辑  收藏  举报