hhh_ml

导航

pandas库loc和iloc函数解释

oc与iloc函数

  • loc函数
import pandas as pd
import numpy
# 导入数据
df = pd.read_csv(filepath_or_buffer="D://movie.csv")
df_new = df.set_index(["country"])
df_new.loc[list(["Canada"])] # 1
df_new.loc[df_new["duration"]>160] # 2
df_new.loc[((df_new["duration"] > 200) & (df_new["director_facebook_likes"] > 300 )),"flage"] =1 # 3
df_new.loc[df_new["duration"].isin([100])] # 4
df_new.query("duration > 100 & index == 'UK'") # 5

1:根据列中的元素,选取对应元素的数据集 
2:根据元素的选取条件来选取对应的数据集 
3:根据元素的选取条件来来选取对应的数据集,并在符合条件的数据行添加flage标签 
4:isin函数是series用来判断值是否在目标值是否在series 
5:query函数中用来判断条件符合的数据集并返回

  • iloc函数
df_new.iloc[0:4]

 

iloc比较简单,它是基于索引位来选取数据集,0:4就是选取 0,1,2,3这四行,需要注意的是这里是前闭后开集合


 

使用标签选取数据:

  1.  
    df.loc[行标签,列标签]
  2.  
    df.loc['a':'b']#选取ab两行数据
  3.  
    df.loc[:,'one']#选取one列的数据

df.loc的第一个参数是行标签,第二个参数为列标签(可选参数,默认为所有列标签),两个参数既可以是列表也可以是单个字符,如果两个参数都为列表则返回的是DataFrame,否则,则为Series。

posted on 2021-02-04 20:46  hhh_ml  阅读(467)  评论(0编辑  收藏  举报