爬虫 - 随笔分类 - jiuchen

scrapy 使用

摘要：scrapy框架安装使用 xpath 参考https://www.jianshu.com/p/85a3004b5c06 注意 1.win10 python 【scrapy crawl chouti --nolog 】 cmd 命令不执行parse函数（没有内容输出）原因设置settings. 阅读全文

posted @ 2019-10-07 14:22 jiuchen 阅读(127) 评论(0) 推荐(0)

爬虫 urllib

摘要：内置http请求库模块 urllib.request 请求模块 urllib.error 异常处理模块 urllib.parse url解析模块 urllib.robotparser robots.txt解析模块阅读全文

posted @ 2019-08-09 10:36 jiuchen 阅读(114) 评论(0) 推荐(0)

爬虫流程

摘要：1.发请求 2.获取内容 3.解析 4.结构化存储阅读全文

posted @ 2019-08-08 17:13 jiuchen 阅读(132) 评论(0) 推荐(0)

爬虫常用模块

摘要：请求库 urllib requests 安装 get请求数据 selenium 1.驱动浏览器的 2.自动化测试 chromedriver https://chromedriver.chromium.org/ http://chromedriver.storage.googleapis.com/i 阅读全文

posted @ 2019-08-08 14:33 jiuchen 阅读(274) 评论(0) 推荐(0)

九尘

随笔分类 - 爬虫

公告