python Pandas修改csv文件某一列的值

将作者单位名称中的邮编去掉
1. 通过pandas读取csv文件
2. 获取某一列的值并进行类型转换
3. 通过apply方法中的匿名函数进行数据的处理
4. 输出到原始文件中

 

 

import pandas as pd
file = "2019/万网2019.csv"
data = pd.read_csv(file,encoding='utf-8')
data[u'作者单位名称'] = data[u'作者单位名称'].astype(str)
data[u'作者单位名称'] = data[u'作者单位名称'].apply(lambda x :re.sub('\d+','',x))
data.to_csv(file,index=False, encoding='utf-8')

  

posted @ 2020-10-12 19:42  我忘不掉  阅读(14717)  评论(0)    收藏  举报