摘要: 爬虫自学 解析网页数据: 解析纯文本,可以选择正则表达式,(re模块) 解析HTML或XML格式的数据,则可以选择正则表达式、XPath、BeautifulSoup(lxml库和bs4库) 解析JSON格式的数据,则可以选择JSONPath(jsonpath模块) 正则表达式语法: 元字符 .——匹 阅读全文
posted @ 2023-02-28 21:58 潇洒哥001 阅读(51) 评论(0) 推荐(0)