python2 正则表达式匹配中文的问题

写了一个正则表达式要匹配字符串中的两个中文,代码如下:

# coding=utf8
import re
s = '张三一'
r = re.search('[\u4e00-\u9fa5]{2}', s)
print r
结果发现不管怎么测试,r都是None。
后来发现是编码问题。
此处需要将字符串s和正则表达式都变成unicode编码方式才行,如下:
# coding=utf8
import re
s = u'张三一'
r = re.search(u'[\u4e00-\u9fa5]{2}', s)
print r
此时结果正常。估计在python3里边不用这么转换。
posted @ 2019-11-21 10:45  老萌新码客  阅读(1652)  评论(0编辑  收藏  举报