会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
xiao688
博客园
首页
新随笔
联系
订阅
管理
2023年2月28日
爬虫自学
摘要: 爬虫自学 解析网页数据: 解析纯文本,可以选择正则表达式,(re模块) 解析HTML或XML格式的数据,则可以选择正则表达式、XPath、BeautifulSoup(lxml库和bs4库) 解析JSON格式的数据,则可以选择JSONPath(jsonpath模块) 正则表达式语法: 元字符 .——匹
阅读全文
posted @ 2023-02-28 21:58 潇洒哥001
阅读(51)
评论(0)
推荐(0)
公告