随笔分类 - 爬虫
摘要:普通情况可以用 r.raw,在初始请求中设置 stream=True,来获取服务器的原始套接字响应 r = requests.get(url, stream=True) r.raw.read(10) 当流下载时,用Response.iter_content或许更方便些。requests.get(ur
阅读全文
摘要:查看源代码 面对这种禁止看页面源码的初级手段,一个优雅的通用解决办法是,在连接前加个view-source: view-source:https://www.dmzj.com/view/yaoshenji/41917.html BUT使用view-source:方法,就是看页面源码,并不管动态加载的
阅读全文
摘要:beautiful soup的基本元素 基于BS4的html内容遍历方法 像parents的就需要,for in 去循环遍历; 总结
阅读全文

浙公网安备 33010602011771号