摘要: selenium+phantomjs/Chrome/Firefox 一selenium 1.定义 2.安装 二phantomjs浏览器 1.定义 无界面浏览器(又称无头浏览器),在内存中进行页面加载,高效 2.安装(phantomjs、chromedriver、geckodriver) Window 阅读全文
posted @ 2019-08-15 20:52 maplethefox 阅读(332) 评论(0) 推荐(0)
摘要: json.loads(json) 作用:把json格式的字符串转为Python数据类型 示例:html_json = json.loads(res.text) json.dumps(python) 作用:把 python 类型 转为 json 类型 示例: json.load(f) 作用:将json 阅读全文
posted @ 2019-08-15 20:44 maplethefox 阅读(414) 评论(0) 推荐(0)
摘要: cookie模拟登录 1.适用网站几场景 抓取需要登录才能访问的页面 2.cookie和session机制 人人网登录案例 方法一.登录网站手动抓取Cookie import requests class RenRenLogin(object): def __init__(self): # url为 阅读全文
posted @ 2019-08-15 20:28 maplethefox 阅读(1142) 评论(0) 推荐(0)