正则表达式

元字符

pip Beautiful Soup 美汤

import re 导入

正则的功能：抓取，判断，过滤

. 就是匹配所有all 除了（\n）转义（/.)用于中间有点的时候

[1-9] [1,2,3] [A,B,C] [548932] [9876543210] 匹配范围区间

\d 匹配所有数字0-9

\D 除去所有数字

\w 匹配单词字符 a-z, A-Z ,0-9, 下划线用于匹配邮箱

\W 除去所有的字母数字剩（#%）

\s 匹配空白即空格，tab键

\S匹配非空白

str.strip()自动去除前后空格

(163|QQ|) 配置表达式 | 是或者的意思

(?= ) 向前查找

ret=re.match("^(?=.*[a-z])(?=.*[A-Z])(?=.*[0-9])[\w]{6}$",password)

修饰元字符

greed 贪婪 * +

lazy 懒惰？

^a 定制必须是以a开头的

a$ 定制必须以a结尾

[^a] 排除a

(1) 不是元组是数字1

(1,) 元组必须有逗号

@qq163|QQ|

(163|QQ|) 配置表达式 | 是或者的意思

import re

ret=re.match("163","163.com") ##163是想要找的内容，从163.com里找想要的内容

print(ret.group())

match 是从头开始匹配否则报错

str=" "

a= re.compile(" ")

print(a.findall(str))

 1 import re
 2 # 键盘录入
 3 n=input("请输入网址：")
 4 ret=re.match(r"^(https://www)\.[0-9a-zA-Z]+\.(com)$",n)
 5 
 6 if ret:
 7     print("%s输入正确"%(ret.group()))
 8 
 9 else:
10     print("输入网址有误%s"%n)

# 匹配所有汉字
print(re.findall('[\u4e00-\u9fa5]', data))

# 匹配所有单字符，英文，数字，特殊符号
print(re.findall('[\x00-\xff]', data))

# 匹配所有非单字符，如汉字和省略号
print(re.findall('[^\x00-\xff]', data))

posted @ 2018-12-04 16:22 寒风孤影，江湖故人阅读(128) 评论(0) 收藏举报

刷新页面返回顶部

花有重开日，人无再少年

正则表达式

公告