python re 正则提取中文

  需求: 提取文本中的中文和数字字母(大小写都要),即相当于删除所有标点符号。

  其中new是原字符串

news = re.findall(r'[\u4e00-\u9fa5a-zA-Z0-9]',new)

 

posted @ 2017-09-07 16:34  安阳小栈-客官歇会吧  阅读(7092)  评论(0)    收藏  举报