摘要: 使用requests直接访问页面url返回的信息与页面信息不匹配 import requests headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like 阅读全文
posted @ 2021-07-31 15:36 fly_bk 阅读(107) 评论(0) 推荐(0)
摘要: 之前已经对爬虫基本知识点用一篇博客总结过来,因为xpath实在太重要了,单独放一篇 """ xpath使用 参考:https://www.w3school.com.cn/xpath/index.asp """ from lxml import etree text = ''' <div> <ul> 阅读全文
posted @ 2021-07-31 10:10 fly_bk 阅读(48) 评论(0) 推荐(0)