随笔分类 -  爬虫系列

摘要:一 介绍 Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式. Beautiful Soup会帮你节省数小时甚至数天的工作时间.你可能在寻找 Beautiful Soup3 的文档,Beautif 阅读全文
posted @ 2018-01-12 17:17 选择远方,风雨兼程。 阅读(329) 评论(0) 推荐(0)
摘要:介绍 官网:http://selenium-python.readthedocs.io 安装 #安装:selenium+chromedriver pip3 install selenium 下载chromdriver.exe放到python安装路径的scripts目录中即可,注意最新版本 国内镜像网 阅读全文
posted @ 2018-01-11 17:02 选择远方,风雨兼程。 阅读(222) 评论(0) 推荐(0)
摘要:介绍 基于GET请求 1. 基本请求 2. 参数 :params 添加URL里的GET数据 #在请求头内将自己伪装成浏览器,否则百度不会正常返回页面内容 import requests response=requests.get('https://www.baidu.com/s?wd=python& 阅读全文
posted @ 2018-01-09 19:33 选择远方,风雨兼程。 阅读(717) 评论(0) 推荐(0)