python使用正则表达式文本替换

2D客户端编程从某种意义上来讲就是素材组织，所以，图片素材组织经常需要批量处理,python一定是最佳选择，不管是win/linux/mac都有一个简单的运行环境

举两个应用场景：

如果不是在某个文件夹里面则将文件夹名称插入前面
所有的文件名名称加上一个前缀

直接看代码吧

# encoding: UTF-8
import re

# 将正则表达式编译成Pattern对象
p = re.compile(r'(?P<folder>(\w+/)*)(?P<filename>\w+\.png)')

# 使用Pattern匹配文本，获得匹配结果，无法匹配时将返回None
#match = pattern.match('<key>xxx/duobaojiemian_L/yangpizi.png</key>')

the_str = """<key>XXXX/duobaojiemian2222_L/duobaojiemian_L/yangpizi.png</key>  
  <key>yangpizi2.png</key>  
  <key>yangpizi3.png</key> """

for m in p.finditer(the_str):
  # 使用Match获得分组信息
  print m.groupdict()

print '-------------------------------'

#f = lambda m: m.group().find('XXXX/') == -1 and 'XXXX/'+m.group() or m.group() 
def f(m):
  s = m.group()
  return s.find('XXXX/') == -1 and 'XXXX/'+s or s

def f2(m2):
  d = m2.groupdict()
  return d['folder']+'the_'+d['filename']

print p.sub(f2, the_str)

关于正则表达式有几个需要交代的

python的正则表达式如果捕获需要分组则使用这个语法(?P<命名>匹配的正则表达式)
re.compile用于编译正则表达式并返回对象
p.finditer返回所有匹配的迭代器
p.sub将匹配项传入回调函数，并且用返回值替换文本
m.groupdict，可以使用则的分组命名取相应的值

posted @ 2015-02-24 17:24 冷侃阅读(58918) 评论(0) 收藏举报

刷新页面返回顶部

linbc

让自己经常和自己聊天。。。。

python使用正则表达式文本替换

公告