摘要: 本文主要是介绍从前程无忧上爬取岗位为数据分析的职位,主要是五个字段,职位名称、公司名称、工作地点、薪资和发布时间。同时把爬取下来的数据保存到mysql数据库中。 1 import requests 2 import pymysql 3 import re 4 5 6 # 连接数据库并创建数据表 7 阅读全文
posted @ 2019-11-11 20:55 小卫哥 阅读(966) 评论(0) 推荐(0)
摘要: 本章的内容主要是为讲解在正则表达式中常用的.*?和re.S! 在正则表达式中有贪婪匹配和最小匹配:如下为贪婪匹配(.*) 1 import re 2 match = re.search(r'PY.*', 'PYANBNCNDN') 3 print(match.group(0)) 如上的代码显示的结果 阅读全文
posted @ 2019-11-11 16:25 小卫哥 阅读(1090) 评论(0) 推荐(0)