正则表达式
元字符
pip  Beautiful  Soup  美汤
import  re  导入
正则的功能:抓取,判断,过滤
.   就是匹配所有all 除了(\n)     转义(/.)用于中间有点的时候
[1-9]   [1,2,3]   [A,B,C]   [548932]   [9876543210]  匹配范围 区间
\d 匹配所有数字0-9 
\D 除去所有数字
\w 匹配单词字符 a-z, A-Z ,0-9, 下划线       用于匹配邮箱
\W 除去所有的字母数字 剩(#%)
\s 匹配空白 即空格,tab键
\S匹配非空白
str.strip()自动去除前后空格 
(163|QQ|) 配置表达式 | 是或者的意思
(?=  ) 向前查找
ret=re.match("^(?=.*[a-z])(?=.*[A-Z])(?=.*[0-9])[\w]{6}$",password)
修饰元字符
greed 贪婪 *  +
lazy  懒惰   ?
^a 定制必须是以a开头的
a$ 定制必须以a结尾
[^a] 排除a
(1) 不是元组 是数字1
(1,) 元组必须有逗号
@qq163|QQ|
(163|QQ|) 配置表达式 | 是或者的意思
 import  re
 print(ret.group())
match 是从头开始匹配 否则报错
str=" "
a= re.compile(" ")
print(a.findall(str))
1 import re 2 # 键盘录入 3 n=input("请输入网址:") 4 ret=re.match(r"^(https://www)\.[0-9a-zA-Z]+\.(com)$",n) 5 6 if ret: 7 print("%s输入正确"%(ret.group())) 8 9 else: 10 print("输入网址有误%s"%n)
# 匹配所有汉字
print(re.findall('[\u4e00-\u9fa5]', data))
# 匹配所有单字符,英文,数字,特殊符号
print(re.findall('[\x00-\xff]', data))
# 匹配所有非单字符,如汉字和省略号
print(re.findall('[^\x00-\xff]', data))
 
                    
                     
                    
                 
                    
                
 
                
            
         
         浙公网安备 33010602011771号
浙公网安备 33010602011771号