随笔分类 -  网络爬虫

摘要:响应状态码汇总 状态码 内容 详细内容 1xx(临时响应)表示临时响应并需要请求者继续执行操作的状态代码 100 继续 请求者应当继续提出请求。 服务器返回此代码表示已收到请求的第一部分,正在等待其余部分 101 切换协议 请求者已要求服务器切换协议,服务器已确认并准备切换 2xx(成功)表示成功处 阅读全文
posted @ 2020-06-19 15:53 Quark_L 阅读(140) 评论(0) 推荐(0)
摘要:#基本使用 ##声明浏览器对象 from selenium import webdriver browser = webdriver.Chrome() browser = webdriver.Firefox() browser = webdriver.Firefox() browser = webd 阅读全文
posted @ 2020-06-18 15:16 Quark_L 阅读(156) 评论(0) 推荐(0)
摘要:#selenium功能介绍 我们在写爬虫的时候,偶尔会遇到一些内容是通过js获取,或者加密等一些情况,那么这种情况就需要使用selenium了。 Selenium是一个web自动化测试工具,简单理解就是通过指令模拟在浏览器中的点击、拖拽、输入、执行js脚本等功能。现在很多网页中包含大量js脚本,分析 阅读全文
posted @ 2020-06-18 13:05 Quark_L 阅读(179) 评论(0) 推荐(0)