python 用 pandas 执行向量化字符串操作

1、extract()  # 对每个元素调用 re.match(), 返回匹配的字符串组

示例:

提取其中的汉字

df_p['支付单位'].str.extract('(\w+)\(', expand=False).head()

 

 

 2、contains()     # 对每个元素调用 re.search(), 返回布尔类型的值

 筛选出企业支付的订单

df['支付类型'].str.contains('企业').head(7)

idx = df['支付类型'].str.contains('企业')
df['支付类型'][idx].head()

 

3、replace()    # 用正则模式替换字符串

 

 

 将括号内的数字替换为指定的字符

 

df_p['支付单位'].str.replace('\d', 'x_').head()

 

 

 

 

 

 

posted @ 2020-06-18 21:30  赏尔  阅读(759)  评论(0编辑  收藏  举报