正则表达式的实例

正则可视化:https://jex.im/regulex

案例一:

"""
实例1:使用sub提取招聘数据(去除所有标签)
"""
import re
job_text = """
<div>
岗位职责: 
<p><br>1. 负责音乐教育产品服务端应用开发 </p>
<br>2. 负责开发服务端的音乐数据处理工具(音频、视频、MIDI、曲谱等) 
<br>3. 负责大数据相关的采集、预处理、后处理的开发 
<br>岗位要求: 
<br>1. 熟悉基于Python的服务端应用开发,掌握至少一种Python服务端框架(Flask/Django/FastAPI等) 
<br>2. 有良好的的编码习惯,命名规范、逻辑清晰、代码冗余率低 
<br>3. 有音视频等媒体相关编程经验者优先 
<br>4. 有tensorflow或基础机器学习开发经验的优先</div> 
"""
result = re.sub("</?.+?>","",job_text)
print(result)

"""
输出结果:
岗位职责: 
1. 负责音乐教育产品服务端应用开发 
2. 负责开发服务端的音乐数据处理工具(音频、视频、MIDI、曲谱等) 
3. 负责大数据相关的采集、预处理、后处理的开发 
岗位要求: 
1. 熟悉基于Python的服务端应用开发,掌握至少一种Python服务端框架(Flask/Django/FastAPI等) 
2. 有良好的的编码习惯,命名规范、逻辑清晰、代码冗余率低 
3. 有音视频等媒体相关编程经验者优先 
4. 有tensorflow或基础机器学习开发经验的优先 
"""

案例二:

"""
作业2:提取网址
原网址:
https://v.huya.com/cat/51
https://699pic.com/tupian-501366475.html
http://www.xye.vip/?wd=999
http://www.test.xy/?wd=1244&u=4

替换后为:
https://v.huya.com/
https://699pic.com/
http://www.xye.vip
http://www.test.xy/
"""
import re

str1 = "https://v.huya.com/cat/51"
str2 = "https://699pic.com/tupian-501366475.html"
str3 = "http://www.xye.vip"
str4 = "http://www.test.xy/?wd=1244&u=4"

result1 = re.sub("(https?://.+?/).*",lambda x:x.group(1),str1)
result2 = re.sub("(https?://.+?/).*",lambda x:x.group(1),str2)
result3 = re.sub("(https?://.+?/).*",lambda x:x.group(1),str3)
result4 = re.sub("(https?://.+?/).*",lambda x:x.group(1),str4)

print(result1)
print(result2)
print(result3)
print(result4)

"""
输出结果:
https://v.huya.com/
https://699pic.com/
http://www.xye.vip
http://www.test.xy/
"""

案例三:

"""
作业3:提取出文本中所有的英文单词以及数字
熟悉基于Python的服务端应用开发,掌握至少一种Python服务端框架(Flask/Django/FastAPI等),薪水100000
"""
import re
str = "熟悉基于Python的服务端应用开发,掌握至少一种Python服务端框架(Flask/Django/FastAPI等),薪水100000"
result = re.findall("[a-zA-Z0-9]+",str)
print(result)
# 输出结果:['Python', 'Python', 'Flask', 'Django', 'FastAPI', '100000']
posted @ 2022-04-18 14:42  猪腩飞了天  阅读(83)  评论(0)    收藏  举报